KR20210126061A - 미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법 - Google Patents
미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법 Download PDFInfo
- Publication number
- KR20210126061A KR20210126061A KR1020217028541A KR20217028541A KR20210126061A KR 20210126061 A KR20210126061 A KR 20210126061A KR 1020217028541 A KR1020217028541 A KR 1020217028541A KR 20217028541 A KR20217028541 A KR 20217028541A KR 20210126061 A KR20210126061 A KR 20210126061A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- seq
- activity
- polypeptide
- nucleic acid
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
- C12N15/81—Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/02—Oxygen as only ring hetero atoms
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/60—Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0036—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
- C12N9/0038—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12N9/0042—NADPH-cytochrome P450 reductase (1.6.2.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0073—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/445—The saccharide radical is condensed with a heterocyclic radical, e.g. everninomycin, papulacandin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01133—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1) dTDP-4-dehydrorhamnose reductase (1.1.1.133)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y106/00—Oxidoreductases acting on NADH or NADPH (1.6)
- C12Y106/02—Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
- C12Y106/02004—NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/11—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
- C12Y114/11022—Flavone synthase (1.14.11.22)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/13—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
- C12Y114/13011—Trans-cinnamate 4-monooxygenase (1.14.13.11)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/14—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01159—Flavonol-3-O-glucoside L-rhamnosyltransferase (2.4.1.159)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/0117—Isoflavone 7-O-glucosyltransferase (2.4.1.170)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01185—Flavanone 7-O-beta-glucosyltransferase (2.4.1.185)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01006—Methionine adenosyltransferase (2.5.1.6), i.e. adenosylmethionine synthetase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y402/00—Carbon-oxygen lyases (4.2)
- C12Y402/01—Hydro-lyases (4.2.1)
- C12Y402/01076—UDP-glucose 4,6-dehydratase (4.2.1.76)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y403/00—Carbon-nitrogen lyases (4.3)
- C12Y403/01—Ammonia-lyases (4.3.1)
- C12Y403/01023—Tyrosine ammonia-lyase (4.3.1.23)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y403/00—Carbon-nitrogen lyases (4.3)
- C12Y403/01—Ammonia-lyases (4.3.1)
- C12Y403/01024—Phenylalanine ammonia-lyase (4.3.1.24)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y501/00—Racemaces and epimerases (5.1)
- C12Y501/03—Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
- C12Y501/03013—Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3) dTDP-4-dehydrorhamnose 3,5-epimerase (5.1.3.13)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y505/00—Intramolecular lyases (5.5)
- C12Y505/01—Intramolecular lyases (5.5.1)
- C12Y505/01006—Chalcone isomerase (5.5.1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01012—4-Coumarate-CoA ligase (6.2.1.12)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Mycology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 디오스민 및 헤스페리딘을 생산할 수 있도록 변형된 재조합 미생물 및 디오스민 및/또는 헤스페리딘을 생산하기 위한 이의 용도에 관한 것이다.
Description
본 발명은 디오스민 및 헤스페리딘의 생산 방법에 관한 것이다.
다플론은 혈관긴장 및 혈관 보호 효과를 지닌 플라보노이드의 혼합물이다. 당해 혼합물은 주로 ~85%의 디오스민, ~8%의 헤스페리딘 및 미량의 다양한 플라본 및 이의 각각의 산화된 형태로 구성된다.
의약을 생산하는 현재의 방법은, 작은 오렌지의 껍질로부터의, 헤스페리딘(94%) 및 이소나린긴(~3%), 네오폰시린(~2%) 및 헤스페레틴(<1%)을 주로 함유하는 플라보노이드의 혼합물의 산/염기 추출이다. 이후에 이러한 혼합물은 화학적 공정을 통해 제어된 산화를 겪고, 약 90%의 헤스페리딘을 디오스민, 및 이의 산화된 형태의 소량의 플라보노이드로 전환시킨다.
따라서, 다플론의 생산은 오렌지 플라보노이드의 정제된 추출물의 공급과 관련되어 있으며, 이는 기후 변화, 통화 이동의 변동 및 수개의 나라(주로, 멕시코, 지중해 분지의 국가 및 중국)의 수십개 지역으로부터의 공급 곤란성의 결과로 변할 수 있다.
따라서, 오렌지 플라보노이드의 정제된 추출물을 공급하는 날씨 변화(vagary)에 의존하지 않는 다플론의 대안적인 생산 방법이 이용가능하도록 하는 것이 가치있을 수 있다. 따라서, 디오스민 및 헤스페리딘의 생성성 공정에 대한 불만족스러운 요구가 존재한다.
발명의 요약
본 발명자는 재조합 미생물에서 디오스민 및 헤스페리딘의 생합성 방법을 개발하였다.
따라서, 본 발명은:
- 헤스페레틴 및/또는 디오스메틴의 7번 위치에서 글루코스를 첨가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열; 및
- 람노즈를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치내로 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열; 및
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함하는 재조합 미생물에 관한 것이다.
바람직하게는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)는 시트러스 시넨시스(Citrus sinensis), 시트러스 클레멘티나(Citrus clementina), 아라비돕시스 탈리아나(Arabidopsis thaliana), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis) 또는 호모 사피엔스(Homo sapiens)로부터의 효소이다. 특히, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)는 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스, 바람직하게는 아라비돕시스 탈리아나(Arabidopsis thaliana) 또는 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터의 효소이다. 바람직하게는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터 유래된다.
플라보논 7-O-베타-D-글루코실트랜스퍼라제는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 폴리펩타이드로부터 선택될 수 있다. 특히, 이는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖는 서열을 포함하고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 폴리펩타이드로부터 선택될 수 있고, 바람직하게는 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 바람직하게는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직하게는, 6"-O-람노실트랜스퍼라제(RhaT)는 바람직하게는 시트러스 속(genus Citrus) 또는 페튜니아 하이브리다(Petunia hybrida), 바람직하게는 시트러스 시넨시스(Citrus sinensis), 시트러스 막시마(Citrus maxima), 또는 시트러스 클레멘티나(Citrus clementina), 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 식물 효소이다. 바람직하게는, 6"-O-람노실트랜스퍼라제는 서열 번호: 103, 105로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 보다 특히 바람직하게는, 6"-O-람노실트랜스퍼라제는 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)는 바람직하게는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터 선택된 식물 효소이다. 바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 보다 특히 바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제는 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
일 구현예에서, 본 발명에 다른 미생물은 또한:
- 타이로신 암모니아 리아제(TAL)를 암호화하는 이종 핵산 서열; 및/또는 페닐알라닌 암모니아 리아제(PAL)를 암호화하는 이종 핵산 서열 및 신나메이트 4-하이드록실라제(C4H)를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 리가제(4CL)를 암호화하는 이종 핵산 서열;
- 나린게닌-찰콘 신타제(CHS)를 암호화하는 이종 핵산 서열;
- 찰콘 이소머라제(CHI)를 암호화하는 이종 핵산 서열;
- 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열;
- O-메틸-트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열을 포함하고, 및
- 임의로, 타이로신을 L-DOPA으로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있는 4-메톡시벤조에이트 O-데메틸라제를 암호화하는 이종 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있는 p-쿠마레이트 3-하이드록실라제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은:
- 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 123, 125, 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및 특히 서열 번호: 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53으로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 칼리스테푸스 키넨시스(Callistephus chinensis), 페릴라 프루테스센스 바르. 크리스파(Perilla frutescens var. crispa), 페투니아 엑스 하이브리다(Petunia x hybrida), 게르베라 하이브리다(Gerbera hybrida), 시트러스 시넨시스(Citrus sinensis), 아라비돕시스 탈리아나(Arabidopsis thaliana), 피로셀라 오피시나룸(Pilosella officinarum), 오스테오스페르뭄 하이브리드 쿨티바르(Osteospermum hybrid cultivar), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 시트러스 클레멘티나 또는 스트렙토마이세스 아베르미틸리스(Streptomyces avermitilis)로부터, 특히 칼리스테푸스 키넨시스, 페릴라 프루테스센스 바르. 크리스파, 페튜니아 엑스 하이브리다, 헤르베라 하이브리다, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 피로셀라 오피시나룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 7, 1, 3, 5, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 11, 17 및 121을 갖는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
보다 특히 바람직하게는, 미생물은 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제 (F3'H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 시트러스, 특히 시트러스 클레멘티나 또는 시트러스 시넨시스로부터, 호모 사피엔스(Homo sapiens)로부터 또는 아라비돕시스 탈리아나로부터의 O-메틸-트랜스퍼라제(OMT), 바람직하게는 서열 번호: 119, 117, 87 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다. 보다 특히 바람직하게는, 이는 서열 번호: 119, 117 및 89로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 119 및 117로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은:
- 페닐알라닌 암모니아 리아제(PAL)를, 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H), 특히 C4H, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드; 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
미생물은 또한 에리오딕티올로부터, 바람직하게는 아라비돕시스 탈리아나, 페트로셀리눔 크리스품(Petroselinum crispum), 제아 마이스(Zea mays), 로니세라 자포니카(Lonicera japonica), 로니세라 마크란토이데스(Lonicera macranthoides), 칼리스테푸스 키넨시스(Callistephus chinensis), 아피움 그라베올렌스(Apium graveolens), 메디카고 트룬카툴라(Medicago truncatula), 쿠미눔 시미눔(Cuminum cyminum), 아에투사 시나피움(Aethusa cynapium), 안젤리카 아르칸젤리카(Angelica archangelica), 코니움 마쿨라툼(Conium maculatum), 카멜리아 시넨시스(Camellia sinensis), 시나라 카르둔쿨루스 바르 시콜리무스(Cynara cardunculus var scolymus), 사우쑤레아 메두사(Saussurea medusa), 플렉트란투스 바르바투스(Plectranthus barbatus), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis), 도르코세라스 하이그로메트리쿰(Dorcoceras hygrometricum), 안티리눔 마주스(Antirrhinum majus), 페릴라 프루테스센스 바르 크리스파(Perilla frutescens var crispa), 다흘리아 핀나타(Dahlia pinnata) 또는 에리트란테 레위시이(Erythranthe lewisii)로부터 루테올린을 생산할 수 있는 플라본 신타제(FNS), 특히 플라본 신타제를 암호화하는 이종 핵산 서열을 포함할 수 있다. 플라본 신타제(FNS)는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다. 특히, FNS는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드일 수 있다.
더욱이, 이는 또한:
- 시토크롬 P450 리덕타제(CPR)를 암호화하는 이종 핵산 서열; 및/또는
- S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
바람직하게는, CPR은 서열 번호: 25, 23, 27, 29 및 31로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
바람직하게는, 미생물은 효모 또는 세균, 바람직하게는 사카라마이세스 속(genus Saccharomyces), 특히 사카로마이세스 세레비지아에(Saccharomyces cerevisiae), 또는 세균, 예를 들면, 에스케리키아 콜라이(Escherichia coli)이다.
본 발명은 또한 디오스민 및/또는 헤스페리딘을 생산하기 위한 본 문서에 기술된 바와 같은 미생물의 용도에 관한 것이다.
또한, 본 발명은 본 문서에 기술된 바와 같은 미생물을을 배양하고, 임의로 디오스민 및/또는 헤스페리딘을 수거함을 포함하는 디오스민 및/또는 헤스페리딘의 생산 방법에 관한 것이다.
바람직하게는, 디오스민 및/또는 헤스페리딘을 생산하기 위한 본 발명에 따른 미생물의 사용 동안, 배양 배지에 공급된 나린게닌, 아피게닌, 에리도딕티올, 루테올린, 헤스페레틴 및/또는 디오스메틴은 존재하지 않는다.
발명의 상세한 설명
작은 오렌지의 껍질 속에서 헤스페레틴의 생합성을 위한 경로는 불완전하게 이해되어 있다. 따라서, 본 발명자는 수개의 생합성 경로를 탐구하고 재조합 미생물 속에서 디오스민 및 헤스페리딘의 생합성을 개발하는데 성공하였다.
정의
용어 "미생물"은 단세포 유기체를 지칭한다. 바람직하게는, 미생물은 세균 또는 효모이다.
용어 "재조합 미생물"은 천연에서 발견되지 않고 하나 이상의 이종 유전자 성분의 삽입, 변형 또는 결실 후 변형된 게놈을 함유하는 미생물을 지칭한다.
용어 "재조합 핵산"은 변형되지 않고 천연 미생물 속에 존재하지 않는 핵산을 지칭한다. 예를 들면, 당해 용어는 천연 프로모터가 아닌 프로모터에 작동적으로 연결된 암호화 서열 또는 유전자를 나타낼 수 있다. 이는 또한 인트론이 엑손 및 인트론을 포함하는 유전자에 대해 결실된 암호화 서열을 나타낼 수 있다.
용어 "이종"은 유전자가 유전 가공에 의해 세포내로 도입됨을 의미한다. 이는 세포내에서 에피소옴 또는 염색체 형태로 존재할 수 있다. 유전자의 기원은 이것이 도입된 세포의 것과는 상이할 수 있다. 그러나, 유전자는 또한 이것이 도입된 세포와 동일한 종으로부터 유래될 수 있지만, 이는 이의 비천연 환경을 고려할 때 이종으로 고려된다. 예를 들면, 유전자 또는 핵산 서열은 이의 천연 프로모터 이외의 프로모터의 제어 하게 있으므로 이종이며, 이는 이것이 천연적으로 위치하는 것과는 상이한 위치에 도입된다. 숙주 세포는 이종 유전자의 도입 전에 내인성 유전자의 카피(copy)를 함유할 수 있거나 내인성 카피를 함유하지 않을 수 있다. 더욱이, 핵산 서열은 암호화 서열이 숙주 미생물내 발현에 대해 최적화되었다는 의미에서 이종일 수 있다. 바람직하게는, 본 문서에서, 이종 핵산 서열은 숙주 세포에 대해 이종인, 즉, 효모내에 천연적으로 존재하지 않는 단백질을 암호화한다.
숙주 미생물과 관련하여, 본원에 사용된 바와 같은, 용어 "천연의" 또는 "내인성"은 상기 미생물 내에 천연적으로 존재하는 유전 성분 또는 단백질을 지칭한다.
용어 "유전자"는 단백질을 암호화하는 임의의 핵산을 나타낸다. 용어 "유전자"는 DNA, 예를 들면, cDNA 또는 gDNA, 및 또한 RNA를 포함한다. 유전자는 우선 재조합적, 효소적 및/또는 화학적 기술을 통해 제조할 수 있고, 후속적으로 시험관내에서 숙주 세포 또는 시스템 내에서 복제될 수 있다. 유전자는 전형적으로 목적한 단백질을 암호화하는 개방 판독 프레임을 포함한다. 유전자는 전사 종결인자 또는 신호 펩타이드와 같은 추가의 서열을 함유할 수 있다.
유전 코드의 축퇴(degeneracy)의 결과로서, 수개의 핵산은 특수한 폴리펩타이드를 암호화할 수 있다. 따라서, 주어진 폴리펩타이드에 대한 암호화 서열내 코돈을 변형시켜 특수한 미생물내 최적의 발현을 예를 들면, 이러한 미생물에 대해 적합한 코돈 해독 표를 사용하여 수득할 수 있다. 핵산은 또한 특수한 효모에 대해 바람직한 GC 함량에 따라서 및/또는 반복 서열의 수를 감소시키기 위해 최적화시킬 수 있다. 특정의 구현예에서, 이종 핵산은 관련된 미생물내 발현에 대해 코돈-최적화되었다. 코돈 최적화는 당해 분야에 공지된 통상의 공정을 통해 수행될 수 있다(참고: 예를 들면, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66).
용어 "작동적으로 연결된"은 제어 서열이 암호화 서열에 대하여 적합한 위치에 위치함으로써, 제어 서열이 암호화 서열의 발현을 제어함을 나타낸다.
용어 "제어 서열"은 유전자의 발현에 필요한 핵산 서열을 나타낸다. 제어 서열은 천연 또는 이종일 수 있다. 당해 분야의 기술자에게 잘 공지되고 현재 사용된 제어 서열이 바람직할 것이다. 이러한 제어 서열은 리더(leader), 폴리아데닐화 서열, 프로펩타이드 서열, 프로모터, 신호 펩타이드 서열 및 전사 터미네이터를 포함하나, 이에 한정되지 않는다. 바람직하게는, 제어 서열을 프로모터 및 전사 터미네이터를 포함한다.
용어 "발현 카세트"는 암호화 영역, 즉, 유전자, 및 조절 영역, 즉, 작동적으로 연결된, 하나 이상의 제어 서열을 포함하는 영역을 포함하는 핵산 작제물을 나타낸다. 바람직하게는, 제어 서열은 숙주 미생물에서 사용하기에 적합하다.
본원에 사용된 바와 같은, 용어 "발현 벡터"는 발현 카세트를 포함하는 DNA 또는 RNA 분자를 나타낸다. 바람직하게는, 발현 벡터는 선형 또는 환형 이중 가닥 DNA 분자이다. 벡터는 또한 복제 오리진(origin of replication), 선택 마커 등을 포함할 수 있다.
본 발명의 목적을 위해서, 2개의 핵산 서열 또는 아미노산 서열 사이의 "동일성 퍼센트"라는 용어는 가장 우수한 정렬 후 수득된, 비교될 2개의 서열 사이에 동일한 뉴클레오타이드 또는 아미노산 잔기의 퍼센트를 나타내는 것으로 의도되고, 이러한 퍼센트는 순수하게 통계적이고 2개의 서열 사이의 차이는 무작위적으로 및 이의 전체 길이에 걸쳐 존재한다. 가장 우수한 정렬 또는 최적의 정렬은 하기 계산된 바와 같이, 비교될 2개의 서열 사이의 동일성 퍼센트가 가장 높은 정렬이다. 2개의 핵산 또는 아미노산 서열 사이의 서열 비교는 이들이 최적으로 정렬된 후 이러한 서열을 비교함으로써 편리하게 수행되며, 상기 비교는 분절(segment) 또는 비교 윈도우(window)에 의해 수행되어 서열 유사성을 지닌 국소 영역을 확인하고 비교한다. 아미노산 서열 동일성의 퍼센트를 측정할 목적의 정렬은 당해 분야에 잘 공지된 다양한 방식으로, 예를 들면, 인터넷, 예를 들면, http: //blast.ncbi.nlm. Nih.gov/ 또는 http://www.ebi.ac.uk/Tools/emboss/) 상에서 이용가능한 컴퓨터 소프트웨어를 사용함으로써 수행할 수 있다. 당해 분야의 기술자는 비교된 서열의 전체 길이에 걸쳐 최대의 정렬을 수득하는데 필요한 임의의 알고리즘을 포함한, 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 본 발명의 목적을 위해, 아미노산 서열 동일성의 퍼센트의 값은 Needleman-Wunsch 알고리즘의 수단으로 2개 서열의 최적의 정렬을 생성하는 EMBOSS Needle 쌍 서열 정렬을 사용하여 생성된 값을 지칭하며, 여기서 모든 조사 매개변수는 디폴트 표기 매트릭스(default Notation matrix) = BLOSUM62, 개방 갭(Open gap) = 10, 연장된 갭(Extended gap) = 0.5, 말단 갭 패널티(end gap penalty) = 거짓(false), 개방 말단 갭(open end gap) = 10 및 연장된 말단 갭(extended end gap) = 0.5로 정의된다. 특정의 구현예에서, 본 특허원에서 언급된 동일성의 퍼센트 모두는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 바람직하게는 적어도 90% 동일성, 보다 바람직하게는 적어도 95% 동일성으로 설정될 수 있다. 특히, 효소의 서열 동일성의 퍼센트 모두가 적어도 80% 또는 적어도 85%, 바람직하게는 적어도 90% 또는 적어도 95% 서열 동일성인 구현예가 기술된 바와 같이 고려된다.
일 구현예에서, 폴리펩타이드는 서열 번호에 기술된 서열과 관련하여 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 첨가, 치환 또는 결실을 함유할 수 있다. 특히 이러한 첨가, 치환 또는 결실은 N-말단 끝, C-말단 끝 또는 말단 둘 다에서 도입된다.
폴리펩타이드는 임의로 융합 단백질의 형태일 수 있다.
본원에 사용된 바와 같은 용어 "과발현" 및 "증가된 발현"은 상호교환적으로 사용되고 유전자 또는 효소의 발현은 변형되지 않은 미생물, 예를 들면, 야생형 미생물 또는 본원에 기술된 유전적 변형을 포함하지 않는 미생물과 관련하여 증가됨을 의미한다. 용어 "야생형"은 천연에 존재하는 변형되지 않은 미생물을 지칭한다. 효소의 증가된 발현은 일반적으로 상기 효소를 암호화하는 유전자의 발현을 증가시킴으로써 수득된다. 유전자 또는 효소가 본 발명의 미생물 속에 천연적으로 존재하지 않는 구현예, 즉 이종 유전자 또는 효소에서, 용어 "과발현" 및 "발현"은 상호교환적으로 사용될 수 있다. 유전자의 발현을 증가시키기 위해, 당해 분야의 기술자는 유전자의 고 수준의 발현을 유도하는 프로모터, 즉, 강력한 프로모터를 사용함으로써, 상응하는 전령 RNA를 안정화시키는 성분 또는 리보소옴 결합 부위(RBS)를 봉쇄하는 서열 및 이를 둘어싼 서열을 사용함으로써, 임의의 공지된 기술, 예를 들면, 미생물 속의 유전자의 카피의 수를 증가시키는 것을 사용할 수 있다. 특히, 과발현은 미생물 속의 유전자의 카피 수를 증가시킴으로써 수득할 수 있따. 유전자의 하나 이상의 카피는 당해 분야의 기술자에게 공지된 재조합 공정, 예를 들면, 유전자의 교체 또는 다중-카피 통합(참고: 예를 들면, 국제 특허원 제WO 2015/092013호)을 통해 게놈내로 도입시킬 수 있다. 바람직하게는, 바람직하게는 강력한 프로모터의 제어 하에 위치하는, 유전자는 포함하는 발현 카세트는 게놈내로 통합된다. 변이체로서, 유전자는 바람직하게는 강력한 프로모터의 제어 하에 위치한, 목적한 유전자를 지닌 발현 카세트를 포함하는, 발현 벡터, 바람직하게는 플라스미드에 의해 수반될 수 있다. 발현 벡터는 복제 오리진의 특성에 따라서, 하나 이상의 카피로 미생물 속에 존재할 수 있다. 유전자의 과발현은 유전자의 고 수준의 발현을 유도하는 프로모터를 사용하여 수득할 수 있다. 예를 들면, 내인성 유전자의 프로모터는 강력한 프로모터, 즉, 보다 높은 발현 수준을 유도하는 프로모터로 대체될 수 있다. 천연의 프로모터가 아닌 프로모터의 제어하에 내인성 유전자는 이종 핵산으로 명명된다. 본 발명에서 사용하기에 적합한 프로모터는 당해 분야의 기술자에게 공지되어 있고 구성적 또는 유도성일 수 있고, 내인성 또는 이종일 수 있다.
용어 "포함하는"은 또한 "로 이루어진" 또는 "로 필수적으로 이루어진"을 의미한다. 용어 "로 필수적으로 이루어진"은 서열이 서열 번호로 기술된 서열과 관련하여 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 첨가, 치환 또는 결실을 함유할 수 있다.
재조합 미생물
본 발명에 따른 미생물은 진핵 또는 원핵세포 미생물일 수 있다.
제1 구현예에서, 미생물은 진핵세포이다. 바람직하게는, 이는 사카로마이세테탈레스(Saccharomycetales), 스포리디오볼라레스(Sporidiobolales) 및 스키조사카로마이세탈레스(SchizoSaccharomycetales) 목의 효모이다. 효모는 예를 들면, 피키아(Pichia), 클루이베로마이세스(Kluyveromyces), 사카로마이세스(Saccharomyces), 스키조사카로마이세스(Schizosaccharomyces), 칸디다(Candida), 피로마이세스(Lipomyces), 로도토룰라(Rhodotorula), 로도스포리디움(Rhodosporidium), 야로위아(Yarrowia), 또는 다바리오마이세스(Debaryomyces)로부터 선택될 수 있다. 일 구현예에서, 효모는 피키아 파스토리스(Pichia pastoris), 클루이베로마이세스 락티스(Kluyveromyces lactis), 클루이베로마이세스 마륵시아누스(Kluyveromyces marxianus), 사카로마이세스 세레비지아에(Saccharomyces cerevisiae),사카로마이세스 카를스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 도우글라시이(Saccharomyces douglasii), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로마이세스 오비포르미스(Saccharomyces oviformis), 스키조사카로마이세스 폼베(Schizosaccharomyces pombe), 칸디다 알비칸스(Candida albicans), 칸디다 트로피칼리스(Candida tropicalis), 로도토룰라 글루티니스(Rhodotorula glutinis), 로도스포리디움 토룰로이데스(Rhodosporidium toruloides), 야로위아 리폴리티카(Yarrowia lipolytica), 데바리오마이세스 한세니이(Debaryomyces hansenii) 및 리포마이세스 스타케이이(Lipomyces starkeyi)로부터 선택된다. 바람직한 구현예에서, 미생물은 사카로마이세스 효모, 바람직하게는 사카로마이세스 세레비지아에(Saccharomyces cerevisiae) 효모이다. 대안적으로, 미생물은 진균, 바람직하게는 사상균(filamentous fungus)이다. 바람직하게는, 이는 아스퍼길러스(Aspergillus), 트리코데르마(Trichoderma), 뉴로스포라(Neurospora), 포도스포라(Podospora), 엔도티아(Endothia), 무코르(Mucor), 코키오볼루스(Cochiobolus) 또는 피리쿨라리아(Pyricularia)로부터 선택된다. 우선적으로, 진균은 아스퍼길러스 니둘란스(Aspergillus nidulans), 아스퍼길러스 나이거(Aspergillus niger), 아스퍼길러스 아와마리(Aspergillus awomari), 아스퍼길러스 오리자에(Aspergillus oryzae), 아스퍼길러스 테레우스(Aspergillus terreus), 뉴로스포라 크라싸(Neurospora crassa), 트리코데르마 레에세이(Trichoderma reesei) 및 트리코데르마 비리데(Trichoderma viride)로부터 선택된다.
제2의 구현예에서, 미생물은 원핵 세포이다. 바람직하게는, 이는 특히 필룸 악시도박테리아(phylum Acidobacteria), 악티노박테리아(Actinobacteria), 아퀴피카에(Aquificae), 박테리오이데테스(Bacterioidetes), 클라미디아에(Chlamydiae), 클로로비(Chlorobi), 클로로플렉시(Chloroflexi), 크리시오게네테스(Chrysiogenetes), 시아노박테리아(Cyanobacteria), 데페리박테레스(Deferribacteres), 데이노코쿠스-써무스(Deinococcus-Thermus), 딕티오글로미(Dictyoglomi), 피브로박테레스(Fibrobacteres), 피르미쿠테스(Firmicutes), 푸소박테리아(Fusobacteria), 겜마티모나데테스(Gemmatimonadetes), 니트로스피라에(Nitrospirae), 플란크토마이세테스(Planctomycetes), 프로테오박테리아(Proteobacteria), 스피로카에테스(Spirochaetes), 서모데설포박테리아(Thermodesulfobacteria), 서모미크로비아(Thermomicrobia), 써모토가에(Thermotogae) 또는 베루코미크로비아(Verrucomicrobia)로부터 선택된다. 바람직하게는, 세균은 아카리오클로리스(Acaryochloris), 아세토박터(Acetobacter), 악티노바실러스(Actinobacillus), 아그로박테리움(Agrobacterium), 알리사이클로바실러스(Alicyclobacillus), 아나바에나(Anabaena), 아나시스티스(Anacystis), 아나에로비오스피릴룸(Anaerobiospirillum), 아퀴펙스(Aquifex), 아르트로박터(Arthrobacter), 아르트로스피라(Arthrospira), 아조박터(Azobacter), 바실러스(Bacillus), 브레비박테리움(Brevibacterium), 브루콜데리아(Burkholderia), 클로로비움(Chlorobium), 크로마티움(Chromatium), 클로로바쿨룸(Chlorobaculum), 클로스트리디움(Clostridium), 코리네박테리움(Corynebacterium), 쿠프리아비두스(Cupriavidus), 시아노테세(Cyanothece), 엔테로박터(Enterobacter), 데이노코쿠스(Deinococcus), 에르위니아(Erwinia), 에스케리키아(Escherichia), 게오박터(Geobacter), 글로에박터(Gloeobacter), 글루코노박터(Gluconobacter), 하이드로게노박터(Hydrogenobacter), 클렙시엘라(Klebsiella), 락토바실러스(Lactobacillus), 락토코쿠스(Lactococcus), 만하이미아(Mannheimia), 메소리조비움(Mesorhizobium) 메틸로박테리움(Methylobacterium), 마이크로박테리움(Microbacterium), 마이코시스티스(Microcystis), 니트로박터(Nitrobacter), 니트로소모나스(Nitrosomonas), 니트로스피나(Nitrospina), 니트로스피라(Nitrospira), 노스톡(Nostoc), 포르미디움(Phormidium), 프로클로로코쿠스(Prochlorococcus), 슈도모나스(Pseudomonas), 랄스토니아(Ralstonia), 리조비움(Rhizobium), 로도박터(Rhodobacter), 로도코쿠스(Rhodococcus), 로돕세우도모나스(Rhodopseudomonas), 로도스피릴룸(Rhodospirillum), 살모넬라(Salmonella), 스케네데스문(Scenedesmun), 세라티아(Serratia), 시겔라(Shigella), 스타필로코쿠스(Staphylococcus), 스트렙토마이세스(Streptomyces), 시네콕쿠스(Synechoccus), 시네코시스티스(Synechocystis), 써모시텍초코쿠스(Thermosynechococcus), 트리초데스미움(Trichodesmium) 또는 자이모모나스(Zymomonas) 속에 속한다. 보다 바람직하게는, 세균은 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens), 아나에로비오스피릴룸 석시니시프로두센스(Anaerobiospirillum succiniciproducens), 악티노바실러스 석시노게네스(Actinobacillus succinogenes), 아퀴펙스 아에올리쿠스(Aquifex aeolicus), 아퀴펙스 피로필루스(Aquifex pyrophilus), 바실러스 서브틸리스(Bacillus subtilis), 바실러스 아밀로리퀴파시네스(Bacillus amyloliquefacines), 브레비박테리움 암모니아게네스(Brevibacterium ammoniagenes), 브레비박테리움 임마리오필룸(Brevibacterium immariophilum), 클로스트리디움 파스테우리아눔(Clostridium pasteurianum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리디움 베이게린키이(Clostridium beigerinckii), 코리네박테리움 글루타미쿰(Corynebacterium glutamicum), 쿠프리아비두스 네카토르(Cupriavidus necator), 쿠프리아비두스 메탈리두란스(Cupriavidus metallidurans), 엔테로박터 사카자키이(Enterobacter sakazakii), 에스케리키아 콜라이(Escherichia coli), 클루코노박터 옥시단스(Gluconobacter oxydans), 하이드로게노박터 써모필루스(Hydrogenobacter thermophilus), 클렙시엘라 옥시토카(Klebsiella oxytoca), 락토코쿠스 락티스(Lactococcus lactis), 락토바실러스 플란타룸(Lactobacillus plantarum), 만하이미아 석시니키프로두센스(Mannheimia succiniciproducens), 메소리조비움 로티(Mesorhizobium loti), 슈도모나스 아에루기노사(Pseudomonas aeruginosa), 슈도모나스 메발로니이(Pseudomonas mevalonii), 슈도모나스 푸디카(Pseudomonas pudica), 슈도모나스 푸티다(Pseudomonas putida), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 리조비움 에틀리이(Rhizobium etli), 로도박터 캅술라투스(Rhodobacter capsulatus), 로도박터 스파에로이데스(Rhodobacter sphaeroides), 로도스피릴룸 로브룸(Rhodospirillum rubrum), 살모넬라 엔테리카(Salmonella enterica), 살모넬라 파이피(Salmonella typhi), 살모넬라 타이피무리움(Salmonella typhimurium), 시겔라 다이센테리아데(Shigella dysenteriae), 시겔라 플렉스네리(Shigella flexneri), 시겔라 손네이(Shigella sonnei), 스타필로코쿠스 아우레우스(Staphylococcus aureus), 스트렙토마이세스 코엘리콜로르(Streptomyces coelicolor), 자이모모나스 모빌리스(Zymomonas mobilis), 아카리오클로리스 마리나(Acaryochloris marina), 아나바에나 바리아빌리스(Anabaena variabilis), 아르쓰로스피라 플라텐시스(Arthrospira platensis), 아르쓰로스피라 막시마(Arthrospira maxima), 클로로비움 테피둠(Chlorobium tepidum), 클로로바쿨룸 종(Chlorobaculum sp.), 시아노테세 종(Cyanothece sp.), 글로에오박터 비올라세우스(Gloeobacter violaceus), 미크로시스티스 아에루기노사(Microcystis aeruginosa), 노스톡 푼쿠티포르메(Nostoc punctiforme), 프로클로로코쿠스 마리누스(Prochlorococcus marinus), 시네초코쿠스 엘롱가투스(Synechococcus elongatus), 시네초시스티스 종(Synechocystis sp.), 써모시네초코쿠스 엘롱가투스(Thermosynechococcus elongatus), 트리초데스미움 에리쓰라에움(Trichodesmium erythraeum) 및 로돕세우도모나스 팔루스트리스(Rhodopseudomonas palustris) 종으로부터 선택된다. 바람직한 구현예에서, 미생물은 에스케리키아 콜라이(Escherichia coli) 세균, 예를 들면, 이. 콜라이(E. coli) BL21, 이. 콜라이 BL21(DE3), 이. 콜라이 MG1655 또는 이. 콜라이 W31 10 종 및 이의 유도체로부터 선택된다. 대안적인 구현예에서, 미생물은 스트렙토마이세스 속, 특히 스트렙토마이세스 베네주엘라에(Streptomyces venezuelae)이다.
미생물을 변형시켜 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신의 생산을 증가시킬 수 있다. 특히, 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신의 생산의 피드백 억제(feedback inhibition)에 관여하는 유전자는 불활성화될 수 있다. 대안적으로 또는 누적적으로, 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신의 생합성 경로는 타이로신 및/또는 페닐알라닌, 바람직하게는 타이로신에 경로를 향한 다른 대사 경로로부터 탄소의 유동을 재지시함으로써 최적화시킬 수 있다. 이러한 변형 및 이러한 유전자는 당해 분야의 기술자에게 잘 공지되어 있다(참고: US 8,809,028; Pandey et al., 2016, Biotechnol. Adv., 34, 634-662).
따라서, 일 구현예에서, 미생물은 특히 글루코스와 같은 단순한 탄소원으로부터 다량의 타이로신 및/또는 페닐알라닌을 생산한다.
헤스페리딘 및/또는 디오스민의 생산을 가능하도록 하는 변형
본 발명에 따른 재조합 미생물을 변형시켜 헤스페리딘 및/또는 디오스민을 생산하였다. 특히, 미생물이 헤스페레틴 및/또는 디오스메틴 각각으로부터 헤스페리딘 및/또는 디오스민을 생산하도록 하기 위하여, 미생물을 변형시켜 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 7번 위치에서 헤스페리틴 및/또는 디오스메틴의 글리코실화 및 6번 위치에서 람노스의 전달에 필요한 효소를 도입시켰다.
제1 구현에에서, 재조합 미생물은 헤스페레틴 및/또는 디오스메틴을 생산할 수 있고: 특히, 이는 이러한 목적으로 변형되었다. 대안의 구현예에서, 헤스페레틴 및/또는 디오스메틴은 예를 들면, 이러한 화합물을 배양 배지에 가함으로써, 미생물에 제공될 수 있다.
하나의 특수한 구현에에서, 미생물은 헤스페리딘을 생산한다. 이후에, 디오스민은 화학적 전환에 의해, 특히 산화에 의해 헤스페리딘으로부터 제조될 수 있다.
바람직한 구현예에서, 미생물은 헤스페리딘 및 디오스민을 생산한다.
따라서, 재조합 미생물은:
a. 헤스페레틴 및/또는 디오스메틴의 7번 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열;
b. 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치로 람노스를 전달할 수 있는 6-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열; 및
c. UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함한다.
일 구현예에서, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 6"-O-람노실트랜스퍼라제(RhaT) 및 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)는 미생물에 대해 이종인 효소이다.
UGT: 플라보논 7-O-베타-글루코실트랜스퍼라제
UGT는 헤스페레틴 및/또는 디오스메틴의 7번 위치로 글루코스의 전달을 수행하는 효소이다. UGT의 명칭은 UDP-글루코스: 플라보논 7-O-베타-D-글루코실트랜스퍼라제 또는 플라보논 7-O-베타-D-글루코실트랜스퍼라제이다. 다음의 명칭으로도 또한 지칭된다: 우리딘 디포스포글루코스-플라보논 7-O-글루코실트랜스퍼라제, 나린게닌 7-O-글루코실트랜스퍼라제, 및 헤스페레틴 7-O-글루코실-트랜스퍼라제. 당해 효소는 EC 2.4.1.185 부류에 속한다.
본 발명자는 기질로서 헤스페레틴 및/또는 디오스메틴을 수용할 수 있고 이러한 화합물의 7번 위치내에 글루코스를 가할 수 있는 효소를 확인하여 선택하였다. 바람직하게는, 헤스페레틴 및/또는 디오스메틴의 7번 위치에 글리코실화에 대한 선호도를 가지도록 효소를 선택하여야 했다. 바람직한 구현예에서, 효소는 헤스페레틴 및/또는 디오스메틴의 7번 위치에 대해 특이적이다.
따라서, 미생물은 헤스페레틴 및 디오스메틴의 7번 위치내에 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열을 포함한다.
용어 "7-O-베타-글리코실트랜스퍼라제 활성"은 플라보노이드의 7번 위치에 글루코스를 가할 수 있는 UGT 효소를 지칭한다. 7-O-베타-글리코실트랜스퍼라제 활성이 있는지를 측정하기 위하여, 플라보논 7-O-베타-D-글루코실트랜스퍼라제 효소를 NAD(P)H, O2, 및 플라보노이드의 존재하에, 최적의 조건(pH, 이온 등) 하에서 시험관내 항온처리하고, UPLC-MS로 관찰하고, 7번 위치에서 추가의 글루코스를 함유하는 플라보노이드의 출현에 대해 예측된 표준과 비교하는 것으로 이루어진 효소 시험을 수행할 수 있다. 바람직하게는, 플라보노이드는 헤스페레틴 또는 디오스메틴이고 7번 위치에서 추가의 글루코스를 함유하는 플라보노이드는 7번 위치에서 추가의 글루코스를 지닌 이의 형태, 즉, 헤스페레틴 7-O-글루코시드 및 디오스메틴 7-O-글루코시드이다.
당해 효소는 보다 고등의 진핵세포, 특히 식물에서만 존재한다. 예를 들면, 효소는 시트러스 속, 특히 시트러스 막시마(Citrus maxima), 시트러스 시넨시스(Citrus sinensis), 시트러스 클레멘티나(Citrus clementina), 시트러스 미티스(Citrus mitis) 및 시트러스 엑스 파라디시(Citrus x paradisi), 라이시움(Lysium), 특히 라이시움 바르바룸(Lysium barbarum), 페투니아(Petunia), 특히 페투니아 엑스 하이브리다(Petunia x hybrida), 아라비돕시스(Arabidopsis), 특히 아라비돕시스 탈리아나(Arabidopsis thaliana), 또는 스쿠텔라리아(Scutellaria), 특히 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터의 효소이다.
일 구현예에서, UGT는 아리비돕시스 탈리아나, 크쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터의 효소이다. 바람직하게는, UGT는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 효소이다.
바람직한 구현예에서, UGT는 시트러스 시넨시스, 시트러스 클레멘티나, 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터의 효소이다.
특수한 구현예에서, UGT는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 특히 기질로서 헤스페레틴 및/또는 디오스메틴을 사용하여 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, UGT는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 보다 특히 바람직하게는, UGT는 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
따라서, UGT는 아라비돕시스 탈리아나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_119576 및 NP_567995.1 하에 기술되어 있고, 보다 특히 서열 번호: 91에 기술되어 있다. 단백질은 또한 UniProtKB/Swiss Prot에 참고 번호 UGT73B1 하에 기술되어 있다.
대안적으로, UGT는 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터 유래된다. 제1 양태에서, 제1의 UGT 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU712253 및 AMK52071.1 하에, 및 보다 특히 서열 번호: 93으로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140DPB7 하에 기술되어 있다. 제2 양태에서, 제2의 UGT 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU712254 및 AMK52072.1 하에 기술되어 있고, 보다 특히 서열 번호: 95로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140DPB8 하에 기술되어 있다. 제3 양태에서, 제3의 UGT 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU712255 및 AMK52073.1 하에 기술되어 있고, 보다 특히 서열 번호: 97로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140DPB9 하에 기술되어 있다.
더욱이, UGT는 호모 사피엔스로부터 유래될 수 있다. 제1 양태에서, UGT는 UGT1A6(UDP 글루쿠로노실트랜스퍼라제 계열 1 구성원 A6)이다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P19224 하에 기술되어 있다. 컨센서스(consensus) 암호화 서열은 NCBI에 번호 CCDS2507.1 하에 기술되어 있다. 당해 효소의 서열은 서열 번호: 99로 기술되어 있다. 제2 양태에서, UGT는 UGT1A7(UDP 글루쿠로노실트랜스퍼라제 계열 1 구성원 A7)이다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9HAW7 하에 기술되어 있다. 컨센서스 암호화 서열은 NCBI에 번호 CCDS2506.1 하에 기술되어 있다. 당해 효소의 서열은 서열 번호: 101에 기술되어 있다.
UGT는 또한 시트러스, 특히 시트러스, 시넨시스 또는 시트러스 클레멘티나로부터 유래될 수 있다. 특히, 시트러스 시넨시스로부터의 UGT는 서열 번호: 113에 기술되어 있다. 당해 효소를 암호화하는 뉴클레오타이드 서열은 서열 번호: 114에 기술되어 있다. 시트러스 클레민티나로부터의 UGT는 서열 번호: 115에 기술되어 있다. 당해 효소를 암호화하는 뉴클레오타이드 서열은 서열 번호: 116에 기술되어 있다.
바람직한 구현예에서, UGT는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 당해 효소와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
RhaT: 6-O-람노실트랜스퍼라제
RhaT는 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치내로 람노스의 전달을 수행하는 효소이다. RhaT는 6-O-람노실트랜스퍼라제이다. 당해 효소는 EC 2.4.1.B53 부류에 속한다.
본 발명자는 기질로서 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드를 허용할 수 있고 이러한 화합물의 글루코스의 6번 위치에서 람노스를 첨가할 수 있는 효소를 확인하고 선택하여야 한다.
따라서, 미생물은 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6번 위치로 전달할 수 있는 6-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열을 포함한다. 이러한 효소는 보다 고등 진핵세포, 특히 식물에만 존재한다.
용어 "6-O-람노실트랜스퍼라제 활성"은 효소 RhaT에 의한 글루코스의 6번 위치에서 람노스의 첨가를 의미한다. 6-O-람노실트랜스퍼라제 활성이 존재하는지를 시험하기 위하여, 6-O-람노실트랜스퍼라제 효소를 NAD(P)H, O2, 및 플라보노이드의 존재 하에, 최적의 조건(pH, 이온 등)에서 시험관내(in vitro) 항온처리하고, UPLC-MS로 관찰하고 람노스가 글루코스의 6번 위치에 가해진 플라보노이드의 출현에 대해 예측된 표준과 비교하는 것으로 이루어진, 효소 시험을 수행할 수 있다. 바람직하게는, 플라보노이드는 헤스페레틴 7-O-글루코시드 또는 디오스메틴 7-O-글루코시드 및 람노스가 헤스페리딘 및 디오스민의 글루코스의 6번 위치에 가해진 플라보노이드이다.
바람직하게는, 당해 효소는 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나 종의 식물에 의해 생산된 효소이다. 바람직하게는, 효소는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터 유래되는 효소이다.
특수한 구현예에서, 6-O-람노실트랜스퍼라제는 서열 번호: 103, 105로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
따라서, RhaT는 시트러스 클레멘티나로부터 유래될 수 있다. 이는 핵산 서열의 경우 NCBI로부터의 GenBank 데이타베이스에 번호 XM_006420965 및 단백질 서열의 경우 번호 XP_006421028 하에, 및 보다 특히 서열 번호: 103에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 V4RJL6 하에 기술되어 있다.
RhaT는 또한 시트러스 시넨시스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 DQ119035 하에 및 단백질 서열의 경우 번호 ABA18631.1 하에, 및 보다 특히 서열 번호: 105로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A7ISD3 하에 기술되어 있다.
특수한 구현예에서, RhaT는 시트러스 시넨시스로부터 유래되고 서열 번호: 105의 서열 또는 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함하는 효소로부터 선택된다.
바람직한 구현예에서, RhaT는 서열 번호: 103로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
RHM: UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제
RHM은 삼기능성 효소 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제이다.이러한 효소는 UDP-글루코스로부터 UDP-람노스를 생산할 수 있다. 이러한 효소는 EC 4.2.1.76 부류에 속한다. UDP-람노스는 6-O-람노실트랜스퍼라제(RhaT) 활성에 필수적이다.
따라서, 미생물은 UDP-람노즈를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함한다. 이러한 효소는 보다 고등 진핵세포, 특히 식물에서만 존재한다.
용어 "UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성"은 UDP-람노스로 UDP-글루코스의 형질전환을 의미한다. UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성이 존재하는지를 측정하기 위하여, UDP-글루코스 효소, NAD(P)H 및 O2를 최적의 조건(pH, 이온 등) 하에서 시험관내 항온처리하고, UPLC-MS로 관찰하고 UDP-람노스의 출현에 대해 예측된 표준과 비교하는 것으로 이루어진 효소 시험을 수행할 수 있다.
바람직하게는, 이러한 효소는 시트러스 속의 식물, 특히 시트러스 시넨시스, 또는 아라비돕시스 탈리아나에 의해 생산된 효소이다.
특수한 구현예에서, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
RHM은 시트러스 시넨시스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 XM_006477756 및 단백질 서열의 경우 번호 XP_006477819.1 하에, 및 보다 특히 서열 번호: 107로 기술되어 있다.
RHM은 또한 아라비돕시스 탈리아나로부터 유래될 수 있다. 제1 양태에서, 단백질은 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 AY081471 하에 및 단백질 서열의 경우 번호 AAM10033.1 하에, 및 보다 특히 서열 번호: 109로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9SYM5 하에 기술되어 있다. 제2 양태에서, 단백질은 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 AJ565874 하에 및 단백질 서열의 경우 번호 CAD92667.1 하에, 및 보다 특히 서열 번호: 111에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9LPG6 하에 기술되어 있다.
특수한 구현예에서, RHM은 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, RHM은 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
효소의 조합
특수한 구현예에서, 재조합 미생물은:
- 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 6-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 103으로부터 선택된 서열을 포함하는 RhaT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 (RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은 6-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열 및 선행 구현예에서 정의된 바와 같은 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열 및 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비옵시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열, 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
바람직한 구현예에서, 미생물은:
- 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 바람직하게는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 보다 특히 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 103로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 암호화하는 이종 핵산 서열을 포함한다. 특수한 구현예에서, 상기 기술된 효소는 보다 높은 진핵 세포, 바람직하게는 식물 세포로부터의 효소이다. 특수한 구현예에서, 효소는 동일한 속, 예를 들면, 동일한 종의 식물로부터 유래된다.
헤스페레틴 및/또는 디오스메틴의 생산을 가능하도록 하는 변형
앞서 나타낸 바와 같이, 헤스페레틴 및/또는 디오스메틴은 미생물에 적용되거나, 미생물은 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다. 특히, 미생물은 헤스페레틴 및/또는 디오스메틴을 생산할 수 있거나 생산할 수 있도록 변형되었다. 따라서, 본 발명자는 또한 미생물이 헤스페레틴 및/또는 디오스메틴을 생산하도록 하는 생합성 경로를 개발하였다.
나린게닌/아피게닌으로부터 헤스페레틴/디오스메틴까지
헤스페레틴 및/또는 디오스메틴은 나린게닌 및 아피게닌으로부터 수득될 수 있다.
수개의 생합성 전략이 가능하였다. 헤스페레틴 및/또는 디오스메틴을 제조하기 위하여, 2개의 변형: 4' 위치에서 하이드록실의 메틸화 및 3' 위치에서 하이드록실화를 만드는데 필수적이다. 따라서, 4' 위치에서 하이드록실의 메틸화의 특이성을 증가시키기 위하여, 이는 3' 위치에서 제2의 하이드록실 그룹을 가하기 전에 이미 존재하는 하이드록실 그룹의 메틸화를 우선 수행하는 것이 타당한 것으로 여겨진다. 대조적으로, 본 발명자는 제2의 하이드록실의 도입으로 인하여 메틸화 특이성 문제의 위험성에도 불구하고, 우선 하이드록실화에 이어 메틸화를 수행하는 것이 필수적이라는 결론에 도달하였다.
F3'H: 플라보노이드 3'-모노옥시게나제
플라보노이드 3'-모노옥시게나제(F3'H)는 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실 그룹의 첨가를 수행하는 효소이다. 당해 효소는 EC 1.14.14.82 부류에 속한다. 이는 또한 플라본 3'-하이드록실라제로서 공지되어 있다.
본 발명자는 기질로서 나린게닌 및/또는 아피게닌을 수용할 수 있고 이러한 화합물의 3' 위치에서 하이드록실 그룹을 가할 수 있는 효소를 확인하고 선택하였다. 바람직하게는, 효소는 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실화에 대한 선호도를 가지도록 선택된다. 바람직한 구현예에서, 효소는 나린게닌 및/또는 아피게닌의 3' 위치에 대해, 특히 5' 위치와 관련하여 특이적이어서 3' 및 5' 위치에서 이중 하이드록실화를 피하고, 바람직하게는 또한 5' 위치에서 하이드록실화를 피한다.
플라보노이드 3'-모노옥시게나제(F3'H)는 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실 그룹의 첨가를 수행하는 효소이다. 이러한 효소는 EC 1.14.14.82 부류에 속한다. 이는 또한 플라보노이드 3'-하이드록실라제로 공지되어 있다.
용어 "플라보노이드 3'-모노옥시게나제 활성"은 CPR-의존성 F3'H 효소에 의한 3'-하이드록실화된 플라보노이드로 플라보노이드의 형질전환을 의미한다. 플라보노이드 3'-모노옥시게나제 활성이 존재하는지를 측정하기 위해, 플라보노이드 3'-모노옥시게나제 효소를 NAD(P)H, O2, 및 플라보노이드의 존재하에, 최적 조건(pH, 이온 등) 하에 시험관내 항온처리하고, UPLC-MS로 관찰하고 3'-하이드록실화된 플라보노이드의 출현에 대해 예측된 표준물과 비교하는 것으로 이루어진 효소 시험을 수행할 수 있다. 바람직하게는, 플라보노이드는 나린게닌 또는 아피게닌이고 3'-하이드록실화된 플라보노이드는 이의 3'-하이드록실화된 형태, 즉, 에리오딕티올 또는 루테올린이다.
따라서, 미생물은 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실을 가할 수 있는 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 를 암호화하는 이종 핵산 서열을 포함한다.
일 구현예에서, F3'H는 알리움(Allium), 아라비돕시스, 브라씨카(Brassica), 칼리스테푸스(Callistephus), 콜룸네아(Columnea), 시트러스, 디안투스(Dianthus), 겐티아나(Gentiana), 게르베라(Gerbera), 글리시네(Glycine), 프라가리아(Fragaria), 이포모에아(Ipomoea), 말루스(Malus), 마티올라(Matthiola), 오스테오스페르뭄(Osteospermum), 오리자(Oryza), 파네로차에테(Phanerochaete), 페릴라(Perilla), 페트로셀리눔(Petroselinum), 펠라르고니움(Pelargonium), 피로셀라(Pilosella), 페투니아(Petunia), 신닌기아(Sinningia), 소르굼(Sorghum), 토레니아(Torenia), 비티스(Vitis) 또는 제아(Zea), 예를 들면 알리움 세파(Allium cepa), 아라비돕시스 탈리아나(Arabidopsis thaliana), 브라씨카 나푸스(Brassica napus), 콜룸네아 하이브리다(Columnea hybrida), 칼리스테푸스 키넨시스(Callistephus chinensis), 시트러스 신넨시스(Citrus sinensis), 시트러스 클레멘티나(Citrus clementina), 디안투스 카리오필루스(Dianthus caryophyllus), 프라가리아 베스카(Fragaria vesca), 프라가리아 엑스 아나나싸(Fragaria x ananassa), 게르베라 하이브리다(Gerbera hybrida), 글리신 막스(Glycine max), 겐티아나 트리플로라(Gentiana triflora), 이포모에아 닐(Ipomoea nil), 이포모에아 푸르푸레아(Ipomoea purpurea), 이포모에아 트리콜로르(Ipomoea tricolor), 마티올라 인카나(Matthiola incana), 말루스 도메스티카(Malus domestica), 오스테오스페르뭄 하이브리드 쿨티바르( Osteospermum hybrid cultivar), 오리자 사티바(Oryza sativa), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 피로셀라 오피시날룸(Pilosella officinarum), 페트로셀리눔 크리스품(Petroselinum crispum), 펠라르고니움 엑스 호르토룸(Pelargonium x hortorum), 페릴라 프루테스센스 바르. 크리스파(Perilla frutescens var. crispa), 페투니아 엑스 하이브리다(Petunia x hybrida), 신닌기아 카르디날리스(Sinningia cardinalis), 소르굼 비콜로르(Sorghum bicolor), 토레니아 종(Torenia sp), 토레니아 하이브리드 쿨티바르(Torenia hybrid cultivar), 비티스 비니페라(Vitis vinifera) 또는 제아 마이스(Zea mays) 속의 식물로부터의 식물 효소이다. 보다 특이적인 구현예에서, F3'H는 알리움, 브라씨카, 칼리스테푸스, 콜룸네아, 시트러스, 디안투스, 겐티아나, 게르베라, 글리시네, 프라가리아, 이포모에아, 말루스, 마티올라, 오스테오스페르뭄, 오리자, 파네로차에테, 페릴라, 페트로셀리눔, 펠라르고니움, 피로셀라, 페투니아, 신닌기아, 소르굼, 토레니아, 비티스 또는 제아, 예를 들면 알리움 세파, 브라씨카 나푸스, 콜룸네아 하이브리다, 칼리스테푸스 키넨시스, 시트러스 신넨시스, 시트러스 클레멘티나, 디안투스 카리오필루스, 프라가리아 베스카, 프라가리아 엑스 아나나싸, 게르베라 하이브리다, 글리신 막스, 겐티아나 트리플로라, 이포모에아 닐, 이포모에아 푸르푸레아, 이포모에아 트리콜로르, 마티올라 인카나, 말루스 도메스티카, 오스테오스페르뭄 하이브리드 쿨티바르, 오리자 사티바, 파네로차에테 크리소스포리움, 피로셀라 오피시날룸, 페트로셀리눔 크리스품, 펠라르고니움 엑스 호르토룸, 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 신닌기아 카르디날리스, 소르굼 비콜로르, 토레니아 종, 토레니아 하이브리드 쿨티바르, 비티스 비니페라 또는 제아 마이스 속의 식물로부터의 효소이다.
바람직하게는, F3'H는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 피로셀라 오피시나룸으로부터의 효소이다. 특히, F3'H는 페릴라 푸루테스센스 바르.(var.) 크리스파, 페투니아 엑스(x) 하이브리다, 칼리스테푸스 치넨시스, 게르베라 하이브리다, 시트루스 시넨시스 및 필로셀라 오피시아눔으로부터의 효소일 수 있다.
특수한 구현예에서, F3'H는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 및 121로부터, 특히 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 1, 5, 7, 11, 17, 19 및 121로부터, 특히 서열 번호: 1, 5, 7, 11, 17 및 19선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 특히 기질로서 나린게닌 및/또는 아피게닌을 사용하여 및 3' 위치에서 하이드록실화와 함께 플라보노이드 3'-모노옥시게나제 활성을 갖는, 서열을 포함하는 폴리펩타이드로부터 선택된다. 특수한 구현예에서, F3'H는 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
바람직한 구현예에서, F3'H는 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 75, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다. 가장 특히 바람직하게는, F3'H는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 75, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드일 수 있다.
따라서, F3'H는 페릴라 프루테스센스 바르. 크리스파로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB045593.1 및 BAB59005.1 하에, 및 보다 특히 서열 번호: 2 및 1로 기술되어 있다.
F3'H는 파네로차에테 크리소스포리움으로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB597870.1 및 BAL05157.1 하에, 및 보다 특히 서열 번호: 4 및 3에 기술되어 있다.
F3'H는 페투니아 엑스 하이브리다로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF155332.1 및 AAD56282.1 하에, 및 보다 특히 서열 번호: 6 및 5로 기술되어 있다.
F3'H는 칼리스테푸스 키넨시스로부터 유래될 수 있다. 일 구현예에서, 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF313488.1 및 AAG49298.1 하에, 및 보다 특히 서열 번호: 8 및 7로 기술되어 있다. 다른 구현예에서, 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF313489.1 및 AAG49299.1 하에, 및 보다 특히 서열 번호: 10 및 9로 기술되어 있다.
F3'H는 게르베라 하이브리다로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ218417.1 및 ABA64468.1 하에, 및 보다 특히 서열 번호: 12 및 11로 기술되어 있다.
F3'H는 오스테오스페르뭄 하이브리드 쿨티바르로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ250711.1 및 ABB29899.1 하에, 및 보다 특히 서열 번호: 14 및 13로 기술되어 있다.
F3'H는 시트러스 클레멘티나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 XM_006440673.1 및 XP_006440736.1 하에, 및 보다 특히 서열 번호: 16 및 15로 기술되어 있다.
F3'H는 시트러스 시넨시스로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 XM_006477592.2 및 XP_006477655.1 하에, 및 보다 특히 서열 번호: 18 및 17로 기술되어 있다.
F3'H는 피로셀라 오피시날룸로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ319866.2 및 ABC47161.1 하에, 및 보다 특히 서열 번호: 20 및 19로 기술되어 있다.
F3'H는 스트렙토마이세스 아베르미틸리스로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 SAV_4539 및 WP_010985964.1 하에, 및 보다 특히 서열 번호: 22 및 21로 기술되어 있다.
F3'H는 아라비돕시스 탈리아나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_120881.2 및 NP_196416.1 하에, 및 보다 특히 서열 번호: 122 및 121로 기술되어 있다.
바람직하게는, F3'H는 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다. 가장 특히 바람직하게는, F3'H는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
바람직한 구현예에 따라서, F3'H는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
다른 특수한 구현예에 따라서, F3'H는 서열 번호: 17로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
다른 특수한 구현예에 따라서, F3'H는 서열 번호: 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
다른 특수한 구현예에 따라서, F3'H는 서열 번호: 11로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
CPR: 시토크롬 P450 리덕타제
플라보노이드 3'-모노옥시게나제(F3'H)는 하이드록실 그룹의 첨가를 수행할 NADPH의 존재를 필요로 한다.
따라서, 바람직한 구현예에서, 미생물은 시토크롬 P450 리덕타제, NADPH-시토크롬 P450 리덕타제를 암호화하는 이종 핵산을 포함한다. 이러한 효소는 EC 1.6.2.4 부류에 속한다.
시토크롬 P450 리덕타제는 진핵세포로부터, 특히 효모로부터, 예를 들면, 사카로마이세테탈레스 속으로부터, 또는 아라비돕시스, 암미(Ammi), 아비센니아(Avicennia), 카멜리아(Camellia), 캄프토테카(Camptotheca), 카타란투스(Catharanthus), 시트러스(Citrus), 글리신(Glycine), 헬리안투스(Helianthus), 로투스(Lotus), 메셈브리안테뭄(Mesembryanthemum), 파세올루스(Phaseolus), 피스코미트렐라(Physcomitrella), 피누스(Pinus), 포풀루스(Populus), 루타(Ruta), 사카룸(Saccharum), 솔라눔(Solanum), 비그나(Vigna), 비티스(Vitis) 또는 제아(Zea) 속으로부터 유래된다.
바람직한 구현예에서, 시토크롬 P450 리덕타제는 진핵세포로부터, 예를 들면, 효모로부터, 특히 사카로마세스 세레비지아에로부터, 또는 식물, 예를 들면, 칸타란투스 로세우스(Catharanthus roseus) 또는 아라비돕시스 탈리아나로부터 유래된다.
특수한 구현예에서, 시토크롬 P450 리덕타제는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다. 매우 특수한 구현예에서, 시토크롬 P450 리덕타제는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다.
예를 들면, 시토크롬 P450 리덕타제는 카타란투스 로세우스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 번호 X69791.1 하에 및 단백질 서열의 경우 번호 CAA49446.1 하에, 및 보다 특히 각각 서열 번호: 24 및 23으로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q05001 하에 기술되어 있다.
시토크롬 P450 리덕타제는 사카로마이세스 세레비지아에로부터 유래될 수 있는 이는 이는 NCBI로부터의 GenBank 데이타베이스에 핵선 서열의 경우 번호 NM_001179172.1 하에 및 단백질 서열의 경우 번호 NP_011908.1 하에, 및 보다 특히 각각 서열 번호: 26 및 25로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P16603 하에 기술되어 있다.
시토크롬 P450 리덕타제는 키메라일 수 있다. 이는 아이그라인(Aigrain) 등의 문헌(2009, EMBO Reports, 10, 742-747)에 기술되어 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열는 각각 서열 번호: 28 및 27에 기술되어 있다.
더욱이, 시토크롬 P450 리덕타제는 아라비돕시스 탈리아나로부터 유래될 수 있다. 시토크롬 P450이 아라비돕시스 탈리아나로부터 유래된 경우, 이는 ATR로 명명될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 NM_118585.4 및 단백질 서열의 경우 번호 NP_194183.1 하에, 및 보다 특히 각각 서열 번호: 30 및 29로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9SB48 하에 기술되어 있다.
또한, 시토크롬 P450 리덕타제는 아라비돕시스 탈리아나로부터 유래될 수 있고, NCBI로부터의 GenBank에 핵산 서열의 경우 NM_179141.2 및 단백질 서열의 경우 번호 NP_849472.2 하에, 및 보다 특히 각각 서열 번호: 32 및 31로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q9SUM3 하에 기술되어 있다.
일 구현예에서, 상술한 바와 같은 CRP을 암호화하는 서열의 신규 카피는 효모내로 도입된다. 다른 구현예에서, 효모가 사카로마이세스 세레비지아에이고 CPR이 동일한 효모로부터 유래된 경우, CPR을 암호화하는 내인성 유전자는 강력한 프로모터로 대체된다. 따라서, CPR의 발현은 야생형 효모와 관련하여 증가되며; 따라서 CPR은 변형된 효모내에서 과발현된다.
하나의 특수한 구현예에서, F3'H 및 CPR은 동일한 기원, 동일한 종으로부터 유래된다.
OMT: O-메틸트랜스퍼라제
O-메틸트랜스퍼라제(OMT)는 정의하기에 어려운 표적을 갖는 효소의 매우 큰 게열이다. 본 발명자는 4' 위치(파라 위치)에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제를 확인하고 선택하여야 한다.
바람직하게는, 효소는 에리오딕티올 및/또는 푸테올린의 4' 위치에서 메틸화에 대한 선호도를 갖도록 선택되었다. 바람직한 구현예에서, 효소는 에리오딕티올 및/또는 루테올린의 4' 위치에 대해 특이적이다. 용어 "특이적인"은 효소에 의해 에리오딕티올 및/또는 루테올린 상에 도입된 메틸 그룹이 경우들의 60%, 바람직하게는 경우의 70%, 및 심지어 보다 바람직하게는 경우의 80%는 4' 위치에서 발견되고, 나머지가 3' 위치내로 도입됨을 의미한다.
용어 "4'-O-메틸트랜스퍼라제 활성"은 4'-O-메틸트랜스퍼라제 효소에 의한 4'-하이드록시플라보노이드의 4'-메톡시플라보노이드로의 전환을 의미한다. 4'-O-메틸트랜스퍼라제 활성의 존재하는지의 여부를 측정하기 위하여, 4'-O-메틸트랜스퍼라제 효소, 4'-하이드록시플라보노이드 및 S-아데노실-L-메티오닌으로 구성된 혼합물을 최적의 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 4'-메톡시플라보노이드의 출현을 예측된 표준과 비교하여 UPLC-MS에서 관찰한다.
본 경우에, 4'-하이드록시플라보노이드는 에리오딕티올 또는 루테올린이며, 이는 각각 이의 4'-메톡시플라보노이드 형태, 즉, 헤스페레틴 또는 디오스메틴으로 전환된다.
따라서, 미생물은 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열을 포함할 수 있다.
효소는 보다 고등 원핵세포, 특히 식물에만 존재한다.
일 구현예에서, O-메틸트랜스퍼라제(OMT)는 아라비돕시스 탈리아나로부터의 효소이다. 다른 구현예에서, O-메틸트랜스퍼라제(OMT)는 보다 고등 진핵세포, 바람직하게는 포유동물로부터 기원한다. 특히, O-메틸트랜스퍼라제(OMT)는 사람 기원(호모 사피엔스)이다.
특수한 구현예에서, OMT는 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
일 구현예에서, OMT는 서열 번호: 89 로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
다른 구현예에서, OMT는 서열 번호: 87로부터 선택된 서열을 포함하는 효소 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
따라서, OMT는 아라비돕시스 탈리아나로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_118755.4 및 NP_567739.1로 기술되어 있다. 단백질은 또한 UniProtKB/Swiss Prot에 참고 번호 Q9C5D7 하에, 및 보다 특히 서열 번호: 87로 기술되어 있다.
대안적으로, OMT는 호모 사피엔스로부터 유래된다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NM_007310.2 및 NP_009294.1로 기술되어 있다. 단백질은 또한 UniProtKB/Swiss Prot에 참고 번호 P21964 하에, 및 보다 특히 서열 번호: 89로 기술되어 있다.
호모 사피엔스로부터의 OMT는 메틸화용 기질로서 에리오딕티올 및 루테올린을 수용하는 장점을 갖는 반면, 아라비돕시스 탈리아나로부터의 OMT는 에리오딕티올에 대해 강한 선호도를 갖는다. 역으로, 헤스페레틴의 합성이 디오스메틴의 것과 비교하여 선호되어야 하는 경우, 아라비돕시스 탈리아나로부터의 OMT가 장점을 가질 수 있다.
바람직한 구현예에서, OMT는 시트러스, 특히 시트러스 클레멘티나 또는 시트러스 시넨시스로부터의 OMT이다. 특히 바람직한 구현예에서, OMT는 서열 번호 117 및 119로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직하게는, OMT는 서열 번호: 117로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
대안적으로, OMT는 서열 번호: 119로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
상술한 시트러스로부터 및 아라비돕시스 탈리아나로부터의 OMT는 4' 위치에서 에리오딕티올을 특이적으로 메틸화하는 장점을 갖는다.
미생물의 설계 동안에, 본 발명자는 이러한 메틸화 단계가 제한된 단계 중 하나로 구성됨을 관찰하였다. 놀랍게도, 미생물, 특히 효소에서 보조인자 S-아데노실-L-메티오닌의 존재에도 불구하고, 이러한 보조인자의 합성을 증가시키는 효소의 첨가는 당해 단계의 제한 양태를 없애는 것을 가능하도록 한다. 따라서, 바람직한 구현예에서, 미생물은 또한 S-아데노실-L-메티오닌을 합성하는 효소, S-아데노실메티오닌 신타제(SAMT)를 암호화하는 이종 또는 내인성 서열을 포함한다. 이러한 효소는 EC 2.5.1.6 부류에 속한다.
일 구현예에서, 미생물은 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 암호화할 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열 및 S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
일 구현예에서, SAMT는 가장 특히 미생물이 효소인 경우, 효모, 특히 사카로마이세스 세레비지아에로부터 유래된다.
특수한 구현예에서, S-아데노실메티오닌 신테타제는 서열 번호: 81로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드이다.
예를 들면, S-아데노실메티오닌 신타제는 사카로마이세스 세레비지아에로부터 유래될 수 있다. 이는 핵산 서열의 경우 NCBI로부터의 GenBank 데이타베이스에 NM_001180810.3 및 단백질 서열의 경우 번호 NP_010790.3에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P19358로 기술되어 있다.
일 구현예에서, 상기 정의된 바와 같은 SMAT를 암호화하는 서열의 신규 카피가 미생물내로 도입된다. 다른 구현예에서, 미생물이 사카로마이세스 세레비지아에인 경우, SMAT를 암호화하는 내인성 유전자의 프로모터는 강한 프로모터로 대체된다. 따라서, SAMT의 발현은 야생형 미생물과 비교하여 증가되며; 따라서 SAMT는 변형된 미생물에서 과발현된다.
따라서, 바람직한 구현예에서, 미생물은 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열 및 S-아데노실-L-메티오닌을 생산할 수 있는 S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
FNS: 플라본 신타제
디오스메틴은 루테올린으로부터 생산될 수 있다. 이는 또한 이를 루테올린 내로 형질전환시킨 다음 루테올린으로부터 디오스메틴을 제조하거나, 이를 헤스페레틴내로 형질전환시킨 다음 헤스페레틴으로부터 디오스메틴을 제조함으로써, 에리오딕티올로부터 수득할 수 있다. 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있는 효소는 플라본 신타제(FNS)이다. 특수한 구현예에서, 플라본 신타제는 또한 에리오딕티올을 루테올린으로 전환시킬 수 있다.
따라서, 미생물은 서열 플라본 신타제, 특히 에리오딕티올로부터 루테올린 및/또는 헤스페레틴으로부터 디오스메틴을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산을 포함할 수 있다.
용어 "플라본 신타제 활성"은 FNSI 효소(CPR-독립적인) 또는 FNSII 효소(CPR-의존적인)에 의해 플라보논을 플라본으로 전환시킴을 의미한다.
플라본 신타제 활성이 존재하는지를 측정하기 위해, 플라본 신타제 효소(FNSI), 플라보논, 2-옥소글루타레이트 및 O2로 구성된 혼합물의 FNSI의 경우에 최적 조건(pH, 온도, 이온 등) 하에서 및 효소 FNSII, 플라보논, NAD(P)H 및 O2로 구성된 혼합물의 FNSII의 경우에 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 플라보논에 상응하는 플라본의 출현은 예측된 표준과 비교하여 UPLC-MS에서 관찰된다. 바람직하게는, 플라보논은 에리오딕티올 또는 헤스페레틴이고, 이는 각각 이의 플라본 형태, 즉, 루테올린 또는 디오스메틴으로 전환될 것이다.
따라서, 특수한 구현예에서, 미생물은 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열; 에리오딕티올으로부터 루테올린 및/또는 헤스페레틴으로부터 디오스메틴을 생산할 수 있는 플라본 신타제, 특히 플라본 신타제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 플라본 신타제는 식물, 예를 들면, 아에투사(Aethusa), 안젤리카(Angelica), 안티리눔(Antirrhinum), 아피움(Apium), 아라비돕시스(Arabidopsis), 칼리스테푸스(Callistephus), 카멜리아(Camellia), 코니움(Conium), 쿠미눔(Cuminum), 시나라(Cynara), 다흘리아(Dahlia), 도르코세라스(Dorcoceras), 에리트란테(Erythranthe), 로이세라(Lonicera), 메디카고(Medicago), 오리자(Oryza), 페릴라(Perilla), 페트로셀리눔(Petroselinum), 플렉트란투스(Plectranthus), 포풀루스(Populus), 사우쑤레아(Saussurea), 스쿠텔라리아(Scutellaria) 또는 제아(Zea) 속, 특히 아라비돕시스, 로니세라, 메디카고(Medicago), 오리자, 페트로셀리눔, 포풀루스 또는 제아의 속, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이, 특히, 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터 유래된 효소이다.
특수한 구현예에서, 플라본 신타제(FNS)는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택될 수 있다. 특히, 플라본 신타제(FNS)는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 바람직하게는 FNS는 서열 번호: 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
플라본 신타제(FNS)의 2개 유형: 플라본 신타제 1(FNSI) 및 플라본 신타제 2(FNSII)가 존재한다. 플라보논 및 2-옥소글루타레이트로부터 출발하여, FNSI는 상응하는 플라본을 생산할 수 있다. 효소 FNSI는 EC 1.14.11.22 부류에 속한다. FNSII는 P450 그룹에 속하고 시토크롬 P450 리덕타제의 존재를 필요로 한다. 효소 FNSII는 EC 1.14.13 부류에 속한다.
일 구현예에서, FNS는 제I형 플라본 신타제이다. 다른 구현예에서, FNS는 제II형 플라본 신타제이다. 추가의 구현예에서, 미생물은 제I형 플라본 신타제 및 제II형 플라본 신타제를 포함한다.
바람직한 구현예에서, 미생물은 제I형 플라본 신타제(FNSI)를 암호화하는 이종 핵산 서열을 포함한다. FNSI의 장점은 이것이 시토크롬 P450 리덕타제의 부재하에 기능한다는 것이다.
FNSI는 식물, 예를 들면, 페트로셀리눔 크리스품, 오리자 사티바, 포풀루스 델토이데스, 메디카고 트룬카툴라, 아피움 그라베올렌스, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 또는 코니움 마쿨라툼으로부터, 특히 페트로셀리눔 크리스품, 오리자 사티바, 포풀루스 델토이데스 또는 메디카고 트룬카툴라로부터, 바람직하게는 페트로셀리눔 크리스품으로부터의 플라본 신타제일 수 있다.
FNSI는 서열 번호: 37, 127, 137, 141, 143 및 145로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드일 수 있다. 특수한 양태에서, FNSI는 서열 번호: 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 폴리펩타이드일 수 있다.
예를 들면, FNSI는 페트로셀리눔 크리스품으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 AY817680.1 및 단백질 서열의 경우 번호 AAX21541.1 하게 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q7XZQ8 하에 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 37 및 38로 기술되어 있다.
FNSI는 또한 안젤리카 아르칸젤리카로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683352.1 및 단백질 서열의 경우 번호 ABG78793.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 127 및 128로 기술되어 있다.
FNSI는 또한 아피움 그라베올렌스로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 AY817676.1 및 단백질 서열의 경우 번호 AAX21537.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 137 및 138로 기술되어 있다.
FNSI는 또한 쿠미눔 시미눔으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683349.1 및 단백질 서열의 경우 번호 ABG78790.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 141 및 142로 기술되어 있다.
FNSI는 또한 아에투사 시나피움으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683350.1 및 단백질 서열의 경우 번호 DQ683350.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 143 및 144로 기술되어 있다.
FNSI는 또한 코니움 마쿨라툼으로부터 유래될 수 있다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 DQ683354.1 및 단백질 서열의 경우 번호 ABG78795.1로 기술되어 있다. 아미노산 및 핵산 서열은 각각 서열 번호: 145 및 146로 기술되어 있다.
다른 구현예에서, 미생물은 제II형 플라본 신타제(FNSII)를 암호화하는 이종 핵산 서열을 포함한다.
FNSII는 식물, 예를 들면, 아라비돕시스 탈리아나, 제아 마이스, 예를 들면, 로니세라 속의 식물, 예를 들면, 로니세라 자포니카 및 로니세라 마크란토이데스, 칼리스테푸스 키넨시스, 메디카고 트루카툴라, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 스콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이드로메트리쿰, 안티리눔 마주스, 페릴라 플루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터의 플라본 신타제, 특히 아라비돕시스 탈리아나, 제아 마이스 또는 로니세라 속, 예를 들면, 로니세라 자포니카 및 로니세라 마크란토이데스로부터의 플라본 신타제일 수 있다.
특수한 구현예에서, 플라본 신타제(FNSII)는 서열 번호: 33, 35, 129, 131, 133, 135, 139, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33 및 35로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
일 구현예에서, 플라본 신타제 FNS는 로니세라 자포니카로부터 유래된 FNSII 이다. 당해 구현예에서, 효소는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 KU127576.1 및 단백질 서열의 경우 번호 AMQ91109.1로, 및 보다 특히 각각 서열 번호: 34 및 33로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 로니세라 마크란토이데스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KU127580.1 및 AMQ91113.1로, 및 보다 특히 각각 서열 번호: 36 및 35로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 시나라 세르둔쿨루스 바르 스콜리무스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 JN825735.1 및 AFG31000.1로, 및 보다 특히 각각 서열 번호: 130 및 129로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 페릴라 프루테스센스 바르 크리스파로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB045592.1 및 BAB59004.1로, 및 보다 특히 각각 서열 번호: 132 및 131로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 다흘리아 핀나타로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB769842.1 및 BAM72335.1로, 및 보다 특히 각각 서열 번호: 134 및 133으로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 칼리스테푸스 키넨시스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AF188612.1 및 AAF04115.1로, 및 보다 특히 각각 서열 번호: 136 및 135로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 메디카고 트루카툴라로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 DQ354373.1 및 ABC86159.1로, 및 보다 특히 각각 서열 번호: 140 및 139로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 카멜리아 시넨시스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 FJ169499.1 및 ACH99109.1로, 및 보다 특히 각각 서열 번호: 148 및 147로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 사우싸레아 메두사로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KF170286.1 및 AGV40781.1로, 및 보다 특히 각각 서열 번호: 150 및 149로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 플렉트란투스 바르바투스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KF606861.1 및 AHJ89438.1로, 및 보다 특히 각각 서열 번호: 152 및 151로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 스쿠텔라리아 바이텔라리아 바이칼렌시스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KT963454.1 및 AMW91729.1로, 및 보다 특히 각각 서열 번호: 154 및 153으로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 도르코세라스 하이그로메트리쿰으로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KV013332.1 및 KZV23934.1로, 및 보다 특히 각각 서열 번호: 156 및 155로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 안티리눔 마주스로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 AB028151.1 및 BAA84071.1로, 및 보다 특히 각각 서열 번호: 158 및 157로 기술되어 있다.
다른 구현예에서, 플라본 신타제 FNS는 에리트란테 레위시이로부터 유래된 FNSII이다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 KX710102.1 및 AOR81894.1로, 및 보다 특히 각각 서열 번호: 160 및 159로 기술되어 있다.
특수한 구현예에서, 미생물은 제II형 플라본 신타제(FNSII) 및 제I형 플라본 신타제를 암호화하는 이종 핵산 서열, 예를 들면 서열 번호: 33, 35, 129, 131, 133, 135, 139, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 서열 번호: 37, 127, 137, 141, 143 및 145로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33 및 35로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드 및 서열 번호: 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
제II형 FNS, FNSII는 시토크롬 P450 리덕타제(CPR)의 존재를 필요로 한다. 미생물이 시토크롬 P450 리덕타제를 포함하지 않는 경우, 이는 따라서 이종 시토크롬 P450 리덕타제를 필수적으로 도입할 것이다. 미생물이 이를 이미 포함하는 경우, 내인성 시토크롬 P450 리덕타제의 과발현(예를 들면, 프로모터를 강한 프로모터로 대체하거나 암호화 서열의 하나 이상의 카피를 가함으로써) 또는 이종 시토크롬 P450 리덕타제를 도입하는 것을 계상하는 것이 가능하다.
특수한 구현예에서, 제II형 FNS 및 CPR는 동일한 기원, 동일한 종으로부터 유래된다.
효소의 조합
따라서, 헤스페레틴 및/또는 디오스메틴 각각으로부터 헤스페리딘 및/또는 디오스민의 생합성에 필요한 효소 외에, 미생물은 바람직하게는 나린게닌 및/또는 아피게닌으로부터 헤스페레틴 및/또는 디오스메틴을 생산하기 위한 효소를 포함한다.
제1의 특수한 구현예에서, 재조합 미생물은:
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 아라비돕시스 탈리아나, 시트러스 시넨시스, 시트러스 클레멘티나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 특히 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제 (UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치내로 전달할 수 있는 를 암호화하는 이종 핵산 서열 6-O-람노실트랜스퍼라제(RhaT); 바람직하게는 시트러스 또는 페투니아 하이브리다 속, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 RhaT, 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제 (RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드;
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM); 바람직하게는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터의 RHM, 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 특히 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로카에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터 유래된 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17, 19 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터의 CPR, 또는 식물, 예를 들면 카타렌투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117, 119 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 및/또는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트루칸툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은:
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치로 전달할 수 있는 6-O-람노실트랜스퍼라제(RhaT); 바람직하게는 시트러스 또는 페투니아 하이브리다 속, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 RhaT, 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM); 바람직하게는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터의 RHM, 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 ㄱ자는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 특히 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 및 피로셀라 오피시나룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖고, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면, 카타란투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 서열 번호: 89를 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 OMT를 암호화하는 이종 핵산 서열; 및
- 임의로, 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 및/또는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬마툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직한 구현예에서, 미생물은:
- 효소 서열 번호: 113, 115 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 가장 특히 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제를 암호화하는 이종 핵산 서열;
- 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 당해 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있고, 서열 번호: 117, 119 및 89로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖고, 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 OMT를 암호화하는 이종 핵산 서열;
- 임의로, 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 및/또는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있고, 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 각각의 이러한 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은:
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열;
- 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치로 람노스를 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열;
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있는 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열; 및
- 플라보논으로부터 플라본을 생산할 수 있고, 특히 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전달할 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전달할 수 있는 플라본 신타제(FNS)를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 재조합 미생물은 또한 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
각각의 효소는 상술한 효소로부터 선택될 수 있다.
나린게닌 및 아피게닌까지
특히 글루코스, 타이로신 또는 페닐알라닌로부터 나린게닌 및 아피게닌의 생합성을 위한 다양한 경로는 식물에서 알려져 있다. 미생물, 특히, 이. 콜라이 및 사카로마이세스 세레비지아에는 변형되어 나린게닌 및/또는 아피게닌을 생산하여 왔다(Hwang EI, et al. 2003. Appl. Environ. Microbiol. 2003, 69(5): 2699-2706; Jiang H1, et al. 2005. Appl. Environ. Microbiol. 2005, 71(6): 2962-9; Pandey et al., 2016, Biotechnol. Adv., 34, 634-662).
예를 들면, 나린게닌 및 아피게닌의 생합성을 위한 경로는 도 1에 기술된 것일 수 있다.
제1 구현예에서, 미생물은 타이로신으로부터 나린게닌 및/또는 아피게닌의 합성에 필요한 효소를 포함한다.
제2 구현예에서, 미생물은 페닐알라닌으로부터 나린게닌 및/또는 아피게닌의 합성에 필요한 효소를 포함한다.
제3 구현예에서, 미생물은 타이로신 및 페닐알라닌으로부터 나린게닌 및/또는 아피게닌의 합성에 필요한 효소를 포함한다.
TAL: 타이로신 암모니아 리아제
TAL은 타이로신 암모니아 리아제이다. 이러한 효소는 타이로신으로부터 p-쿠마르산을 생산할 수 있다. 당해 효소는 EC 4.3.1.23 부류에 속한다.
용어 "페닐알라닌 암모니아 리아제 활성"은 효소 페닐알라닌 암모니아 리아제의 수단에 의하 트랜스-신남산으로 페닐알라닌의 전환을 의미한다. 페닐알라닌 암모니아 리아제 활성이 있는지의 여부를 측정하기 위해, 페닐알라닌 암모니아 리아제 효소 및 페닐알라닌으로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 트랜스-신남산의 출현이 예측된 표준과 비교하여 UPLC-MS에서 관찰된다.
타이로신 암모니아 리아제(TAL)는 또한 상기 정의된 바와 같은 페닐알라닌 암모니아 리아제(PAL) 활성 및/또는 디하이드록시페닐알라닌 암모니아-리아제 (DAL) 활성을 가질 수 있다.
따라서, 미생물은 타이로신 암모니아 리아제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 이러한 효소는 로도박터(Rhodobacter) 속의 세균 또는 플라보박테리아세아에(Flavobacteriaceae) 속의 세균에 의해 생산된 효소이다. 특수한 구현예에서, 이러한 효소는 로도박터 캅술라투스(Rhodobacter capsulatus) 또는 로도박터 스파에로이데스(Rhodobacter sphaeroides) 세균으로부터 생산된다. 다른 특수한 구현예에서, 이러한 효소는 플리보박테리움 존소니아에(Flavobacterium johnsoniae) 세균에 의해 생산된다. 다른 구현예에서, 이러한 효소는 효모, 특히 로도토룰라(Rhodotorula) 속의 효소, 예를 들면, 로도토룰라 글루티니스(Rhodotorula glutinis)에 의해 생산된 효소이다. 다른 유기체, 예를 들면, 카멜리아 시넨시스, 프라가리아 엑스 아나나싸, 랄스토니아 메탈리두란스 또는 제아 마이스 또한 이러한 효소를 생산한다.
특수한 구현예에서, 타이로신 암모니아 리아제는 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
일 구현예에서, TAL은 플라보박테리움 존소니아에로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 KR095306.1 및 단백질 서열의 경우 번호 AKE50827.1로, 및 보다 특히 서열 번호: 40 및 39로 기술되어 있다.
특히 바람직한 구현예에서, TAL은 로도토룰라 글루티니스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 KF765779.1 및 단백질 서열의 경우 번호 AGZ04575.1로, 및 보다 특히 각각 서열 번호: 42 및 41로 기술되어 있다.
특히 바람직한 구현예에서, 타이로신 암모니아 리아제는 서열 번호: 41로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
4CL: 4-쿠마레이트-CoA 리가제
4CL은 4-쿠마레이트-CoA 리가제이다. 이러한 효소는 p-쿠마르산 및 조효소 A로부터 4-쿠마로일-CoA 및 카페산 및 조효소 A로부터 카페오일-CoA를 생산할 수 있다. 이러한 효소는 EC 6.2.1.12 부류에 속한다.
용어 "4-쿠마레이트-CoA 리가제 활성"는 효소 4-쿠마레이트 CoA 리가제에 의해 p-쿠마르산을 p-쿠마로일-CoA로 또는 카페산을 카페오일-CoA로의 전환시킴을 의미한다. 4-쿠마레이트 CoA 리가제 활성이 있는지를 측정하기 위해, 4-쿠마레이트 CoA 리가제 효소, p-쿠마르산 또는 카페산, ATP 및 CoA로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온 시간 후, p-쿠마로일-CoA 또는 카페오일-CoA의 출현을 UV 분광광도계로 각각 333 nm 및 346 nm의 파장에서 예측된 표준과 비교하여, 관찰한다.
따라서, 미생물은 4-쿠마레이트-CoA 리가제를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 이러한 효소는 식물, 예를 들면, 아비에스(Abies), 아라비돕시스, 아가스타케(Agastache), 아모르파(Amorpha), 브라씨카(Brassica), 시트러스, 카타야(Cathaya), 세드루스(Cedrus), 크로쿠스(Crocus), 라릭스(Larix), 페스투카(Festuca), 글리신(Glycine), 주글란스(Juglans), 케텔레에리아(Keteleeria), 리토스페르뭄(Lithospermum), 롤리움(Lolium), 로투스(Lotus), 라이코페르시콘(Lycopersicon), 말루스(Malus), 메디카고(Medicago), 메심브리안테뭄(Mesembryanthemum), 니코티아나(Nicotiana), 노토트수가(Nothotsuga), 오리자(Oryza), 파세올루스(Phaseolus), 펠라르고니움(Pelargonium), 페트로셀리눔(Petroselinum), 피스코미트렐라(Physcomitrella), 피세아(Picea), 프루누스(Prunus), 슈도라릭스(Pseudolarix), 슈도트수가(Pseudotsuga), 로사(Rosa), 로부스(Rubus), 리자(Ryza), 사카룸(Saccharum), 수아에다(Suaeda), 피누스(Pinus), 포풀루스(Populus), 솔라눔(Solanum), 텔룬기엘라(Thellungiella), 트리티쿰(Triticum), 쓰가(Tsuga), 비티스(Vitis) 또는 제아(Zea)로부터 생산된 효소이다. 대안적으로, 이러한 효소는 미생물, 예를 들면, 아스퍼길러스(Aspergillus), 마이코스파에렐라(Mycosphaerella), 마이코박테리움(Mycobacterium), 나이쎄리아(Neisseria), 뉴로스포라(Neurospora), 스트렙토마이세스(Streptomyces), 로도박터(Rhodobacter) 또는 야로위아(Yarrowia)에 의해 생산된 효소이다.
바람직한 구현예에서, 이러한 효소는 식물, 바람직하게는 아라비돕시스 탈리아나(Arabidopsis thaliana), 시트러스 클레멘티나 또는 페트로셀리눔 크리스품, 특히 아라비돕시스 탈리아나 또는 페트로셀리눔 크리스품에 의해, 또는 바람직하게는 스트렙토마이세스 속의 세균, 특히 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)에 의해 생산된 효소이다.
특수한 구현예에서, 4-쿠마레이트-CoA 리가제는 서열 번호: 43, 45, 47, 49, 123 및 125로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
다른 특수한 구현예에서, 4-쿠마레이트-CoA 리가제는 서열 번호: 43, 45, 47 및 49, 바람직하게는 서열 번호: 45 및 49로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
제1의 특수한 구현예에서, 4CL은 아라비돕시스 탈리아나로부터 유래된다. 이는 NCBI로부터의 핵산 서열의 경우 GenBank 데이타베이스에 AY099747.1 및 단백질 서열의 경우 번호 AAM20598.1로, 및 보다 특히 각각 서열 번호: 44 및 43으로 기술되어 있다.
제2의 특수한 구현예에서, 4CL은 페트로셀리눔 크리스품으로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 X13324.1 또는 X13325.1 및 단백질 서열의 경우 각각 번호 CAA31696.1 또는 CAA31697.1로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 핵산 서열의 경우 참고 번호 P14912 및 P14913로, 및 보다 특히 각각 서열 번호: 46 및 45, 48 및 47로 기술되어 있다. 바람직하게는, 4CL은 페트로셀리눔 크리스품으로부터 유래되고 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 X13324.1 및 단백질 서열의 경우 번호 CAA31696.1로, 및 UniProtKB/Swiss Prot에 참고 번호 P14912, 및 보다 특히 각각 서열 번호: 46 및 45로 기술되어 있다.
제3의 특수한 구현예에서, 4CL은 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 CP016559.1 및 단백질 서열의 경우 번호 ANW18832.1로, 및 보다 특히 각각 서열 번호: 50 및 49로 기술되어 있다.
제4의 특수한 구현예에서, 4CL은 아라비돕시스 탈리아나로부터 유래된다. 이러한 효소의 뉴클레오타이드 서열 및 단백질 서열은 각각 서열 번호: 124 및 123으로 기술되어 있다.
제5의 특수한 구현예에서, 4CL은 시트러스 클레멘티나로부터 유래되고 이러한 효소의 뉴클레오타이드 서열 및 단백질 서열은 각각 서열 번호: 126 및 125에 기술되어 있다.
바람직한 구현예에서, 4CL은 서열 번호: 45, 123 및 125, 바람직하게는 서열 번호: 123 및 45로부터 선택된 서열을 포함하는 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드이다. 가장 특히 바람직하게는, 4CL은 서열 번호: 45로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
CHS: 찰콘 신타제
CHS는 찰콘 신타제이다. 이러한 효소는 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 및 카페오일-CoA로부터 및 말로닐-CoA로부터 에리오딕티올-찰콘을 생산할 수 있다. 이러한 효소는 EC 2.3.1.74 부류에 속한다.
용어 "찰콘 신타제 활성"은 찰콘 신타제 효소의 수단에 의한 p-쿠마로일-CoA 및 말로닐-CoA의 나린게닌 찰콘으로의 또는 카페오일-CoA 및 말로닐-CoA의 에리오딕티올 찰콘으로의 전환을 의미한다. 찰콘 신타제 활성이 있는지를 시험하기 위하여, 찰콘 신타제 효소, 쿠마로일-CoA 또는 카페오일-CoA 및 말로닐-CoA로 구성된 혼합물을, 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 나린게닌 찰콘 또는 에리오딕티올 찰콘 각각의 출현은 HPLC-MS에서 예측된 표준과 비교하여 관찰한다.
미생물은 따라서 찰콘 신타제를 암호화하는 이종 핵산 서열을 포함한다.
이러한 효소는 식물, 특히 아라비돕시스, 아베나(Avena), 코스모스(Cosmos), 시트러스, 다우쿠스(Daucus), 파고피룸(Fagopyrum), 프레에시아(Freesia), 글리신(Glycine), 글리시리자(Glycyrrhiza), 후물루스(Humulus), 하이페리쿰(Hypericum), 호르데움(Hordeum), 주글란스(Juglans), 메디카고(Medicago), 파세올루스(Phaseolus), 피스코미트렐라(Physcomitrella), 플라기오차스마(Plagiochasma), 페트로셀리눔(Petroselinum), 푸에라리아(Pueraria), 루부스(Rubus), 세칼레(Secale), 스쿠텔라리아(Scutellaria), 실레네(Silene), 시나피스(Sinapis), 스피나시아(Spinacia), 스텔라리아(Stellaria), 트리티쿰(Triticum), 툴리파(Tulipa), 베르베나(Verbena), 비티스(Vitis) 또는 크산티스마(Xanthisma) 속, 예를 들면, 아라비돕시스 탈리아나(Arabidopsis thaliana), 아베나 사티바(Avena sativa), 코스모스 술푸레우스(Cosmos sulphureus), 시트러스 시넨시스, 다우쿠스 카로타(Daucus carota), 파고피룸 에스쿨렌툼(Fagopyrum esculentum), 프레레시아 하이브리드 쿨티바르(Freesia hybrid cultivar), 글리신 막스(Glycine max), 글리시리자 에키나타(Glycyrrhiza echinata), 후물루스 루풀루스(Humulus lupulus), 하이페리쿰 안드로사에뭄(Hypericum androsaemum), 호르데움 불가레(Hordeum vulgare), 주글란스 종(Juglans sp.), 메디카고 사티바(Medicago sativa), 파세올루스 불가리스(Phaseolus vulgaris), 피스코미트렐라 파텐스(Physcomitrella patens), 플라기오차스마 압펜디쿨라툼(Plagiochasma appendiculatum), 페트로셀리눔 크리스품(Petroselinum crispum), 푸에라리아 몬타나 바르. 로바타(Pueraria montana var. lobata), 루부스 이다에우스(Rubus idaeus), 세칼레 세레알레(Secale cereale), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis), 실레네 종(Silene sp.), 시나피스 알바(Sinapis alba), 스피나시아 올레라세아(Spinacia oleracea), 스텔라리아 론기페스(Stellaria longipes), 트리티쿰 아에스티붐(Triticum aestivum), 툴리파 하이브리드 쿨티바르(Tulipa hybrid cultivar), 베르베나 종(Verbena sp.), 비티스 비니페라(Vitis vinifera) 또는 크산티스마 그라실레(Xanthisma gracile)에 의해 생산된 효소일 수 있다.
바람직하게는, 이러한 효소는 식물, 예를 들면 시트러스 속, 특히 시트러스 시넨시스, 또는 호르데움 불가레에 의해 또는 세균, 바람직하게는 스트렙토마이세스 속, 특히 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)에 의해 생산된 효소이다.
특수한 구현예에서, 찰콘 신타제는 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
특히 바람직한 구현예에서, 찰콘 신타제는 서열 번호: 53으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
제1의 특수한 구현예에서, CHS는 호르데움 불가레로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 Y09233.1 및 단백질 서열의 경우 번호 CAA70435.1로, 및 보다 특히 각각 서열 번호: 52 및 51로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q96562로 기술되어 있다.
제2의 특수한 구현예에서, CHS는 시트러스 시넨시스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 AB009351.1 및 단백질 서열의 경우 번호 BAA81664.1로, 및 보다 특히 각각 서열 번호: 54 및 53로 기술되어 있다.
제3의 특수한 구현예에서, CHS는 시트러스 시넨시스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 XM_006489733.1 및 단백질 서열의 경우 번호 XP_006489796.1로, 및 보다 특히 각각 서열 번호: 56 및 55로 기술되어 있다.
제4의 특수한 구현예에서, CHS는 스트렙토마이세스 클라불리게루스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 CP016559.1 및 단백질 서열의 경우 번호 ANW16917.1로, 및 보다 특히 각각 서열 번호: 58 및 57로 기술되어 있다.
찰콘 신타제에 의해 촉매된 반응은 말로닐-CoA의 존재를 필요로 하므로, 미생물을 변형시켜 말로닐-CoA의 합성을 증가시킬 수 있다.
CHI: 찰콘 이소머라제
CHI는 찰콘 이소머라제이다. 이는 나린게닌 찰콘으로부터 나린게닌을 및 에리오딕티올 찰콘으로부터 에리오딕티올을 생산할 수 있다. 이러한 효소는 EC 5.5.1.6 부류에 속한다.
용어 "찰콘 이소머라제 활성"은 찰콘 이소머라제 효소에 의한 나린게닌 찰콘 또는 에리오딕티올 찰콘의 나린게닌 또는 에리오딕티올로의 전환을 의미한다. 찰콘 이소머라제 활성이 있는지를 측정하기 위하여, 찰콘 이소머라제 효소, 나린게닌 찰콘 또는 에리오딕티올 찰콘으로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 나린게닌 또는 에리오딕티올 각각의 출현을 HPLC-MS에서 예측된 표준과 비교하여 관찰한다.
미생물은 따라서 찰콘 이소머라제를 암호화하는 이종 핵산 서열을 포함한다.
이러한 효소는 식물, 특히 아라비돕시스, 진코(Ginkgo), 온시디움(Oncidium), 페릴라(Perilla), 시트러스(Citrus) 또는 트리고넬라(Trigonella), 예를 들면, 아라비돕시스 탈리아나(Arabidopsis thaliana), 진코 빌로바(Ginkgo biloba), 온시디움 고워 람세이(Oncidium Gower Ramsey), 페릴라 프루테스센스(Perilla frutescens), 시트러스 시넨시스 또는 트리고넬라 포에눔-그라에쿰(Trigonella foenum-graecum)으로부터 기원한다.
바람직하게는, 이러한 효소는 식물, 예를 들면, 아라비돕시스 탈리아나에 의해 또는 세균, 바람직하게는 스트렙토마이세스 속, 특히 스트렙토마이세스 클라불리게루스에 의해 생산된 효소이다.
특수한 구현예에서, 찰콘 이소머라제는 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, 찰콘 이소머라제는 서열 번호: 61로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
제1의 특수한 구현예에서, CHI는 스트렙토마이세스 클라불리게루스로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 CP016559.1 및 단백질 서열의 경우 번호 ANW16918.1로, 및 보다 특히 각각 서열 번호: 60 및 59로 기술되어 있다.
제2의 특수한 구현예에서, CHI는 아라비돕시스 탈리아나로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 핵산 서열의 경우 NM_115370.4 및 단백질 서열의 경우 번호 NP_191072.1로, 및 보다 특히 각각 서열 번호: 62 및 61로 기술되어 있다.
FNS: 플라본 신타제
아피게닌은 나린게닌으로부터 플라본 신타제(FNS)를 사용하여 제조될 수 있다. 이는 나릴게닌으로부터 아피게닌을 생산할 수 있다.
미생물은 따라서 나린게닌으로부터 아피게닌을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산 서열 및/또는 에리오딕티올로부터 루테올린을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산 서열, 및/또는 헤스페리딘으로부터 디오스메틴을 생산할 수 있는 플라본 신타제를 암호화하는 이종 핵산 서열을 포함한다.
FNS는 앞서 기술한 것으로부터 선택될 수 있다.
페닐알라닌으로 출발
대안적으로 또는 추가로, 미생물은 또한 페닐알라닌으로부터 -쿠마르산의 합성에 필요한 효소를 포함할 수 있다.
이와 관련하여, 미생물은 페닐알라닌 암모니아 리아제(PAL)를 암호화하는 이종 핵산 서열 및 신나메이트 4-하이드록실라제(C4H)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
PAL은 EC 4.3.1.24 부류에 속한다. 이는 페닐알라닌으로부터 신남산을 생산할 수 있다.
용어 "페닐알라닌 암모니아 리아제 활성"은 효소 페닐알라닌 암모니아 리아제의 수단에 의한 페닐알라닌의 트랜스-신남산으로의 전환을 의미한다. 페닐알라닌 암모니아 리아제 활성이 있는지를 측정하기 위하여, 페닐알라닌 암모니아 리아제 효소 및 페닐알라닌으로 구성된 혼합물을, 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 트랜스-신남산의 출현이 UPLC-MS에서 예측된 표준과 비교하여 관찰된다.
수개의 효소가 이미 선행 분야에 기술되어 왔다. 바람직하게는, 효소는 식물, 예를 들면, 아라비돕시스, 아가스타체(Agastache), 아나나스(Ananas), 아스파라거스(Asparagus), 브라씨카(Brassica), 브롬헤아디아(Bromheadia), 밤부사(Bambusa), 베타(Beta), 베툴라(Betula), 시트러스(Citrus), 쿠쿠미스(Cucumis), 카멜리아(Camellia), 캅시쿰(Capsicum), 카씨아(Cassia), 카타란투스(Catharanthus), 시서(Cicer), 시트룰루스(Citrullus), 코페아(Coffea), 쿠쿠르비타(Cucurbita), 시노돈(Cynodon), 다우쿠스(Daucus), 덴드로비움(Dendrobium), 디안투스(Dianthus), 디기탈리스(Digitalis), 디오스코레아(Dioscorea), 에우칼립투스(Eucalyptus), 칼루스(Gallus), 진코, 글리신(Glycine), 호르데움(Hordeum), 헬리안투스(Helianthus), 이포모에아(Ipomoea), 락투카(Lactuca), 리토스페르뭄(Lithospermum), 로투스(Lotus), 라이코페르시콘(Lycopersicon), 메디카고(Medicago), 마루스(Malus), 마니호트(Manihot), 메디카고(Medicago), 메셈브리안테뭄(Mesembryanthemum), 니코티아나(Nicotiana), 올레아(Olea), 오리자(Oryza), 파세올루스(Phaseolus), 피누스(Pinus), 포풀루스(Populus), 피숨(Pisum), 페르세아(Persea), 페트로셀리눔(Petroselinum), 팔라에놉시스(Phalaenopsis), 필로스타키스(Phyllostachys), 피스코미트렐라(Physcomitrella), 피세아(Picea), 파이루스(Pyrus), 프루누스(Prunus), 쿼르쿠스(Quercus), 라파누스(Raphanus), 레흐만니아(Rehmannia), 루부스(Rubus), 솔라눔(Solanum), 소르굼(Sorghum), 스페노스틸리스(Sphenostylis), 스텔라리아(Stellaria), 스틸로산테스(Stylosanthes), 트리티쿰(Triticum), 트리폴리움(Trifolium), 박시니움(Vaccinium), 비그나(Vigna), 비티스(Vitis), 제아(Zea) 또는 진니아(Zinnia) 속으로부터 유래된다. 예를 들면, 아라비돕시스 탈리아나 또는 페트로셀리눔 크리스품으로부터의 것이 언급될 수 있다. 바람직한 구현예에서, PAL은 시트러스 시넨시스로부터 유래된다.
또한, 페닐알라닌 암모니아 리아제(PAL)는 또한 하기 정의된 바와 같은 타이로신 암모니아 리아제(TAL) 활성 및/또는 디하이드록시페닐알라닌 암모니아-리아제(DAL) 활성을 가질 수 있다.
특수한 구현예에서, 페닐알라닌 암모니아 리아제(PAL)는 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드ㄹ부터 선택된다.
바람직한 구현예에서, PAL은 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다. 가장 특히 바람직하게는, PAL은 서열 번호: 65로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
특수한 구현예에서, 시트러스 시넨시스로부터의 PAL은 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 XM_006481431.2 하에 및 단백질 서열의 경우 번호 XP_006481494.1로, 및 보다 특히 각각 서열 번호: 64 및 63에 기술되어 있다.
다른 특수한 구현예에서, 시트러스 시넨시스로부터의 PAL은 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 XM_006488000.2로 및 단백질 서열의 경우 번호 XP_006488063.1로, 및 보다 특히 각각 서열 번호: 66 및 65로 기술되어 있다.
다른 특수한 구현예에서, 아라비돕시스 탈리아나로부터의 PAL은 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_115186.4 및 단백질 서열의 경우 번호 NP_190894.1로, 및 보다 특히 각각 서열 번호: 78 및 77로 기술되어 있다.
임의로, 타이로신 및 페닐알라닌으로부터 출발하는 생합성이 고려되며, PAL 및 TAL은 페닐알라닌/타이로신 암모니아 리아제(PTAL)로 대체되거나 보충된다. PTAL은 EC 4.3.1.25 부류에 속한다.
C4H는 EC 1.14.13.11 부류에 속한다. 이는 신남산으로부터 p-쿠마르산을 생산할 수 있다.
용어 "트랜스-신나메이트 4-모노옥시게나제 활성"은 트랜스-신나메이트 4-모노옥시게나제 효소(CPR-의존성)에 의한 트랜스-신남산의 p-쿠마르산으로의 전환을 의미한다. 트랜스-신나메이트 4-모노옥시게나제 활성이 존재하는지를 측정하기 위하여, 트랜스-신나메이트 4-모노옥시게나제 효소, 신남산, NADPH, H+ 및 O2로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 4-하이드록시신나메이트(p-쿠마르산)의 출현은 UPLC-MS에서 예측된 표준과 비교하여 관찰한다.
수개의 효소가 당해 분야에 이미 기술되어 왔다. 바람직하게는, 효소는 식물, 예를 들면 아라비돕시스, 암미(Ammi), 아비센니아(Avicennia), 카멜리아(Camellia), 캄프토테카(Camptotheca), 카타란투스(Catharanthus), 시트러스, 글리신, 헬리안투스, 로투스, 메셈브리안테뭄, 피스코미트레일라(Physcomitreila), 파세올루스, 피누스(Pinus), 포풀루스, 루타(Ruta), 사카룸(Saccharum), 솔라눔, 비티스, 비그나 또는 제아 속의 식물로부터 유래된다. 바람직한 구현예에서, 신나메이트 4-하이드록실라제(C4H)는 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터 유래된다.
특수한 구현예에서, 신나메이트 4-하이드록실라제(C4H)는 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
바람직한 구현예에서, C4H는 서열 번호: 79로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
특수한 구현예에서, 시트러스 시넨시스로부터의 C4H는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_001288840.1 및 단백질 서열의 경우 번호 NP_001275769.1로, 및 보다 특히 각각 서열 번호: 68 및 67로 기술되어 있다.
다른 특수한 구현예에서, 시트러스 시넨시스로부터의 C4H는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_001288895.1 및 단백질 서열의 경우 번호 NP_001275824.1로, 및 보다 특히 각각 서열 번호: 70 및 69로 기술되어 있다.
다른 특수한 구현예에서, 아라비돕시스 탈리아나로부터의 C4H는 NCBI로부터의 GenBank에 핵산 서열의 경우 번호 NM_128601.3 및 단백질 서열의 경우 번호 NP_180607.1로, 및 보다 특히 각각 서열 번호: 80 및 79로 기술되어 있다.
카페산을 통한 진행
추가의 구현예에서, 에리오딕티올의 생합성은 또한 타이로신으로부터 L-DOPA (3,4-디하이드록시-L-페닐알라닌) 및 이후 L-DOPA (3,4-디하이드록시-L-페닐알라닌)으로부터 카페산의 합성을 포함할 수 있다. 이를 수행하기 위해, 다음의 효소가 필수적이다. 타이로신을 L-DOPA (3,4-디하이드록시-L-페닐알라닌)으로 전환시키기 위해, 2개의 서브단위, HpaB 및 HpaC가 필수적이다.
HpaB는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB)이다.
바람직하게는, 이러한 효소는 세균, 바람직하게는 에스케리키아 콜라이에 의해 생산된다.
특수한 구현예에서, 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제(HpaB)는 서열 번호: 83로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
특수한 구현예에서, HpaB는 에스케리키아 콜라이로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 단백질 서열의 경우 CAQ34705.1로, 및 보다 특히 서열 번호: 83으로 기술되어 있다. 이러한 효소를 암호화하는 핵산 서열은 서열 번호: 84에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140NG21로 기술되어 있다.
HpaC는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위이다. 미생물은 따라서 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
용어 "p-쿠마레이트 3-하이드록실라제 활성"은 HpaB (4-하이드록시페닐아세테이트 3-하이드록실라제 옥시다제) 및 HpaC (4-하이드록시페닐아세테이트 3-하이드록실라제 리덕타제)로 구성된 효소 복합체를 사용한 p-쿠마르산의 카페산으로 및/또는 L-타이로신의 L-DOPA로의 전환을 의미한다. p-쿠마레이트 3-하이드록실라제 활성이 있는지를 측정하기 위해, 효소 HpaB, HpaC, p-쿠마르산 또는 L-타이로신, FAD 및 NADH로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에서 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 카페산 또는 L-DOPA의 출현을 HPLC-MS에서 예측된 표준과 비교하여 관찰된다.
바람직하게는, 이러한 효소는 세균, 바람직하게는 에스케리키아 콜라이에 의해 생산된 효소이다.
특수한 구현예에서, 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제(HpaC)는 서열 번호: 85로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드이다.
특수한 구현예에서, HpaC는 에스케리키아 콜라이로부터 유래된다. 이는 NCBI로부터의 GenBank 데이타베이스에 단백질 서열의 경우 CAQ34704.1로, 및 보다 특히 서열 번호: 85로 기술되어 있다. 이러한 효소를 암호화하는 핵산 서열은 서열 번호: 86에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 A0A140NG67 하에 기술되어 있다.
이와 함께, HpaB 및 HpaC는 타이로신으로부터 L-DOPA (3,4-디하이드록시-L-페닐알라닌)을 생산할 수 있다.
따라서, 미생물은 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 (HpaB)를 암호화하는 이종 핵산 서열 및 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제(HpaC)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
더욱이, 이러한 경로는 또한 L-DOPA (3,4-디하이드록시-L-페닐알라닌), 디하이드록시페닐알라닌 암모니아-리아제(DAL)로부터 카페산을 합성할 수 있는 효소의 존재를 필요로 한다. 이러한 효소는 EC 4.3.1.11 부류에 속한다.
용어 "디하이드록시페닐알라닌 암모니아 리아제 활성"은 디하이드록시페닐알라닌 암모니아 리아제 효소에 의해 L-DOPA의 트랜스-카페산의 전환을 의미한다. 디하이드록시페닐알라닌 암모니아 리아제 활성이 있는지를 측정하기 위하여, 디하이드록시페닐알라닌 암모니아 리아제 효소 및 L-DOPA(레보도파)로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등) 하에 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 트랜스-카페산의 출현이 UPLC-MS에서 예측된 표준과 비교하여 관찰된다.
또한, 디하이드록시페닐알라닌 암모니아 리아제(DAL)는 또한 타이로신 암모니아 리아제(TAL) 활성 및/또는 페닐알라닌 암모니아-리아제(PAL) 활성을 가질 수 있다.
미생물은 따라서 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB)를 암호화하는 이종 핵산 서열, 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC)를 암호화하는 이종 핵산 서열 및 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
HpaB 및 HpaC의 사용에 대한 대안으로서 또는 이와 함께, 타이로신을 L-DOPA로 전환시키는 효소 및 p-쿠마르산을 카페산으로 전환시키는 효소를 사용하는 것이 가능하다.
이는 각각, L-타이로신 하이드록실라제 활성을 갖고, EC 1.14.99.15 부류에 속하는 4-메톡시벤조에이트 O-데메틸라제, 및 p-쿠마레이트 3-하이드록실라제 활성을 갖고, EC 1.14.13 부류에 속하는 p-쿠마레이트 3-하이드록실라제이다.
이러한 다양한 효소 둘 다는 시토크롬 P450(CYP) 계열의 부분을 형성한다.
용어 "L-타이로신 하이드록실라제 활성"은 p-쿠마레이트 3-하이드록실라제 효소(CPR-의존성)를 사용한 p-쿠마르산의 카페산으로 및/또는 L-타이로신의 L-DOPA로의 전환을 의미한다. L-타이로신 하이드록실라제 활성이 있는지를 측정하기 위하여, p-쿠마레이트 3-하이드록실라제 효소, p-쿠마르산 또는 L-타이로신 및 필수적인 보조인자로 구성된 혼합물을, 최적 조건(pH, 온도, 이온 등) 하에 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 카페산 또는 L-DOPA의 출현이 HPLC-MS에서 예측된 표준과 비교하여 관찰된다.
용어 "p-쿠마레이트 3-하이드록실라제 활성"은 p-쿠마레이트 3-하이드록실라제 효소(CPR-의존성)를 사용한 p-쿠마르산의 카페산으로 및/또는 L-타이로신의 L-DOPA로의 전환을 의미한다. p-쿠마레이트 3-하이드록실라제 활성이 있는지를 측정하기 위하여, p-쿠마레이트 3-하이드록실라제 효소, p-쿠마르산 또는 L-타이로신으로 구성된 혼합물을 최적 조건(pH, 온도, 이온 등)하에 시험관내 항온처리하는 것으로 이루어진 효소 시험을 수행할 수 있다. 특정의 항온처리 시간 후, 카페산 또는 L-DOPA의 출현이 HPLC-MS에서 예측된 표준과 비교하여 관찰된다.
따라서, 재조합 미생물은 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있는 4-메톡시벤조에이트 O-데메틸라제(CYP)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
일 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 특히 로돕세우도모나스 팔루스트리스(Rhodopseudomonas palustris), 슈도모나스 푸티다(Pseudomonas putida) 또는 에스케리키아 콜라이(Escherichia coli)로부터의 세균 효소, 특히 베타 불가리스로부터의 식물 효소, 특히 오릭톨라구스 쿠니쿨루스(Oryctolagus cuniculus)로부터의 포유동물 효소 또는 로도토룰라 글루티니스(Rhodotorula glutinis)로부터의 진균 효소이다. 특수한 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 로돕세우도모나스 팔루스트리스, 사카로트릭스 에스파나엔시스(Saccharothrix espanaensis) 또는 베타 불가리스로부터의 효소이다.
특수한 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드롤라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
4-메톡시벤조에이트 O-데메틸라제는 또한 베타 불가리스로부터 유래될 수 있다. 이러한 효소를 암호화하는 핵산 서열 및 단백질 서열은 각각 서열 번호: 74 및 73에 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 P0DKI2로 기술되어 있다.
또한, 4-메톡시벤조에이트 O-데메틸라제는 사카로트릭스 에스파나엔시스(Saccharothrix espanaensis)로부터 유래될 수 있다. 이러한 효소 및 단백질 서열을 암호화하는 핵산 서열은 NCBI에 각각 참고 번호 NC_005296.1 및 WP_011157377.1로, 및 보다 특히 각각 서열 번호: 76 및 75로 기술되어 있다. 단백질은 UniProtKB/Swiss Prot에 참고 번호 Q6N8N2 하에 기술되어 있다.
일 구현예에서, 미생물은 4-메톡시벤조에이트 O-데메틸라제를 암호화하는 이종 핵산 서열 및 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
따라서, 재조합 미생물은 p-쿠마르산을 카페산으로 전환시킬 수 있는 쿠마레이트 3-하이드록실라제(Coum3H)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
일 구현예에서, 쿠마레이트 3-하이드록실라제는 특히 사카로트릭스로부터의 세균 효소이다.
특수한 구현예에서, 4-메톡시벤조에이트 O-데메틸라제는 서열 번호: 71로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된다.
이러한 효소 및 단백질을 암호화하는 핵산 서열은 서열 NCBI에 각각 참고 번호 DQ357071.1 및 ABC88666.1 하에, 및 보다 특히 각각 서열 번호: 72 및 71로 기술되어 있다.
일 구현예에서, 미생물은 쿠마레이트 3-하이드록실라제를 암호화하는 이종 핵산 서열 및 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함할 수 있다.
효소의 추가의 조합
따라서, 앞서 기술한 바와 같이 나린게닌 및/또는 아피게닌으로부터 헤스페리딘 및/또는 디오스민의 생합성에 필요한 효소 외에, 미생물은 바람직하게는 타이로신 및/또는 페닐알라닌으로부터, 바람직하게는 타이로신으로부터 나린게닌 및/또는 아피게닌을 생산하기 위한 효소를 포함한다.
따라서, 특수한 구현예에 따라서, 미생물은
- 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열,
- 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치내로 람노스를 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열,
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열,
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열,
- F3'H 효소를 암호화하는 이종 핵산 서열,
- 및 임의로 FNS 효소를 암호화하는 이종 핵산 서열 및 CPR 효소를 암호화하는 이종 핵산 서열을 포함하고,
또한
- 타이로신 암모니아 리아제(TAL)를 암호화하는 이종 핵산 서열, 4-쿠마로일-CoA 리가제(4CL)를 암호화하는 이종 핵산 서열, 찰콘 신타제(CHS)를 암호화하는 이종 핵산 서열 및 찰콘 이소머라제(CHI)를 암호화하는 이종 핵산 서열을 포함한다.
일 구현예에서, 미생물은:
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 암호화하는 O-메틸트랜스퍼라제(OMT); 바람직하게는 시트러스 클레멘티나, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화를 지닌, 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 로도토룰라 글루티니스(Rhodotorula glutinis) 또는 플라보박테리움 존소니아에(Flavobacterium johnsoniae)로부터의 타이로신 암모니아 리아제(TAL), 특히 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 아라비돕시스 탈리아나, 시트러스 클레멘티나, 페트로셀리눔 크리스품 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 4-쿠마로일-CoA 리가제(4CL), 특히 서열 번호: 123, 125, 45, 43, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드; 가장 특히 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열 및
- 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 찰콘 신타제(CHS) 특히 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터의 찰콘 이소머라제(CHI), 특히 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 본 문서에서, 미생물은 상술한 효소 UGT, RhaT 및 RHM의 조합 중 하나, 특히
- 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제;
- 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 포함한다.
바람직하게는, 이러한 구현예에서, 미생물은 또한:
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 구현예에서, 미생물은:
- 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 암호화하는 이종 핵산 서열; 및
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 임의로, 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열 및
- 임의로, 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 보다 특히 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 53로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 이러한 구현예에서, 미생물은 상술한 효소 UGT, RhaT 및 RHM의 조합 중 하나, 특히
- 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제; 및
- 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 6"-O-람노실트랜스퍼라제; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제를 포함한다.
바람직하게는, 이러한 구현예에서, 미생물은 또한 선행 구현예에 기술된 바와 같은 페닐알라닌 암모니아 리아제(PAL)를 암호화하는 이종 핵산 서열 및 신나메이트 4-하이드록실라제(C4H)를 암호화하는 이종 핵산 서열을 포함한다.
임의로, 이러한 다양한 구현예에서, 미생물은 또한 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열, 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 포함한다.
다른 특수한 구현예에서, 미생물은:
- 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT); 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 113로부터 선택된 서열을 포함하는 UGT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터의 6"-O-람노실트랜스퍼라제 (RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 103로부터 선택된 서열을 포함하는 RhaT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화시킬 수 있는; 바람직하게는페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 엑스 하이브리다, 칼리스테푸스 키넨시스(Callistephus chinensis), 게르베라 하이브리다, 시트러스 시넨시스, 시트러스 클레멘티나, 오스테로스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터, 특히 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 또는 필로셀라 오피시날룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 보다 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면, 카테란투스 로세우스 또는 아라비돕시스 탈리아나로부터 선택된 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 CPR 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열; 및
- 임의로, 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로, 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라(Medicago truncatula), 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 메디카고 트루카툴라, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸겔리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이로부터, 바람직하게는 로이세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있는 타이로신 암모니아 리아제(TAL); 특히 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 TAL; 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 p-쿠마르산을 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 바람직하게는 아라비돕시스 탈리아나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터 유래된 4CL; 서열 번호: 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있는 찰콘 신타제(CHS), 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHS; 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있는 찰콘 이소머라제(CHI); 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHI; 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산을 포함한다.
다른 특수한 구현예에서, 미생물은 선행 구현예에 기술된 바와 같이, 효소 UGT, RhaT, RHM, F3'H, OMT, 4CL, CHS 및 CHI, 및 임의로 효소 CPR, FNS 및 SAMT를 암호화하는 이종 핵산 서열을 포함하고 또한:
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열 신나메이트 4-하이드록실라제(C4H), 특히 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
제3의 특수한 구현예에서, 미생물은 앞서의 구현예에서 기술된 바와 같은 효소 UGT, RhaT, RHM, F3'H, OMT, 4CL, CHS 및 CHI, 및 임의로 효소 CPR, FNS 및 SAMT를 암호화하는 이종 핵산 서열을 포함하고 또한:
- L-DOPA로부터 카페산을 생산할 수 있는, (3,4-디하이드록시-L-페닐알라닌)를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 미생물은 앞서의 구현예에서 기술한 바와 같은, 효소 UGT, RhaT, RHM, F3'H, OMT, 4CL, CHS 및 CHI, 및 임의로 효소 CPR, FNS 및 SAMT를 암호화하는 이종 핵산 서열을 포함하고 또한:
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고; 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된, 타이로신 암모니아 리아제(TAL); 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 각조 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 신나메이트 4-하이드록실라제(C4H), 특히 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, 바람직하게는 서열 번호: 83로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 타이로신을 L-DOPA로 및/또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드롤라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 임의로, L-DOPA(3,4-디하이드록시-L-페닐알라닌)로부터 카페산을 생산할 수 있는 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 이종 핵산 서열을 포함한다.
다른 특수한 구현예에서, 미생물은:
- 서열 번호: 113으로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제 (TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 45 또는 123으로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 7로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 서열 번호: 7 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 25로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있고 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
바람직하게는, 미생물은 또한 S-아데노실메티오닌 신테타제(SAMT), 특히 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열을 포함한다.
효소 또는 효소의 세트의 기원은 이러한 기원이 동일하거나 유사하도록 선택할 수 있다. 예를 들면, 효소 또는 효소의 세트는 세균, 예를 들면 동일한 속 또는 동일한 종의 세균으로부터 수득될 수 있다. 다른 예에서, 효소 또는 효소의 세트는 식물로부터, 예를 들면, 동일한 속 또는 동일한 종의 식물로부터 수득될 수 있다. 이에 대한 이유는 이러한 일반적인 기원이 효소가 최적으로 함께 기능하도록 할 수 있다는 것이다.
일 구현예에서, 미생물은 타이로신의 생합성을 위한 대사 경로를 포함한다. 특히, 미생물은 야생형 균주에 대해 타이로신의 생산이 증가되도록 변형되었다. 특히, 미생물은 탄소 유동이 타이로신 생합성에 대해 재시디되도록 변형될 수 있다. 또한, 미생물은 타이로신 생합성 피드백 억제를 감소시키거나 억제하도록 변형될 수 있다.
다른 구현예에서, 미생물은 페닐알라닌의 생합성을 위한 대사 경로를 포함한다. 특히, 미생물은 야생형 균주에 대해 페닐알라닌의 생산이 증가되도록 변형될 수 있다. 특히, 미생물은 탄소 유동이 페닐알라닌 생합성에 대해 재지시되도록 변형될 수 있다. 또한, 미생물은 페닐알라닌 생합성 피드백 억제를 감소시키거나 억제하도록 변형될 수 있다.
다른 구현예에서, 미생물은 페닐알라닌 및 타이로신의 생합성을 위한 대사 경로를 포함한다. 특히, 미생물은 야생형 균주에 대해 페닐알라닌 및 타이로신의 생산이 증가되도록 변형될 수 있다. 특히, 미생물은 탄소 유동이 페닐알라닌 및 타이로신 생합성에 대해 재지시되도록 변형될 수 있다. 또한, 미생물은 페닐알라닌 및 타이로신 생합성 피드백 억제를 감소시키거나 억제하도록 변형될 수 있다.
재조합 핵산 및 발현 카세트
앞서 기술된 바와 같은 효소를 암호화하는 각각의 핵산 서열이 발현 카세트내에 포함된다. 바람직하게는, 암호화 핵산 서열은 숙주 미생물내에서 발현을 위해 최적화된다. 암호화 핵산 서열은 유전자의 발현, 특히 전사 및 해독에 필요한 성분에 작동적으로 연결된다. 이러한 성분은 숙주 재조합 미생물에서 기능하도록 선택된다. 이러한 성분은, 예를 들면, 전사 프로모터, 전사 활성인자, 터미네이터 서열 및 종결 코돈을 포함할 수 있다. 발현이 요구되는 숙주 세포의 기능으로서 이러한 성분을 선택하는 방법은 당해 분야의 기술자에게 잘 공지되어 있다.
바람직하게는, 프로모터는 강한 프로모터이다. 프로모터는 임의로 유도성일 수 있다.
예를 들면, 미생물이 원핵세포인 경우, 프로모터는 다음의 프로모터로부터 선택될 수 있다: Lacl, LacZ, pLacT, ptac, pARA, pBAD, 박테리오파아지 T3 또는 T7의 RNA 폴리머라제 프로모터, 폴리헤드린 프로모터, 람다 파아지의 PR 또는 PL 프로모터. 하나의 특수한 구현예에서, 프로모터는 pLac이다. 미생물이 진핵세포 및 특히 효모인 경우, 프로모터는 다음의 프로모터로부터 선택될 수 있다: 프로모터 pTDH3, 프로모터 pTEF1, 프로모터 pTEF2, 프로모터 pCCW12, 프로모터 pHHF2, 프로모터 pHTB2 및 프로모터 pRPL18B. 효모에 사용될 수 있는 유도성 프로모터의 예는 프로모터 tetO-2, GAL10, GAL10-CYC1 및 PHO5이다.
기술된 바와 같은 또는 이중 일부의 조합을 암호화하는 핵산 서열을 포함하는 발현 카세트 중 모두 또는 부분은 일반적인 발현 벡터 또는 상이한 발현 벡터내에 포함될 수 있다.
따라서, 본 발명은 플라보논 7-O-베타-D-글루코실트랜스퍼라제 (UGT)를 암호화하는 이종 핵산 서열, 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열 및 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열로부터 선택된 2개의 핵산 서열을 포함하는 벡터에 관한 것이고; 바람직하게는, 벡터는 이러한 3개의 서열을 포함한다.
특히, 본 발명은 다음으로부터 선택된 2개의 핵산 서열을 포함하는 벡터에 관한 것이다:
(i) 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나로부터 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 113, 115, 91, 93, 95 및 97로부터 또는 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터의 6"-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 103으로부터 선택된 서열을 포함하는 RhaT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
특히, 벡터는 다음으로부터 선택된 2개의 핵산 서열을 포함할 수 있다:
(i) 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나로부터 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소인 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 91, 93, 95 및 97로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나로부터의 6"-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107 및 109로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
바람직하게는, 벡터는 다음으로부터 선택된 2개의 핵산 서열을 포함한다:
(i) 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 서열 번호: 107로부터 선택된 서열을 포함하는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
바람직한 구현예에서, 미생물은 3개 모두를 포함한다.
암호화 핵산 서열 및 효소 서열은 상기 기술된 바와 같다. 용어 "핵산 서열을 포함하는"은 또한 핵산 서열을 포함하는 발현 카세트를 포함함을 의미한다.
임의로, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다: 각각 상기 정의된 바와 같은, O-메틸트랜스퍼라제(OMT)를 암호화하는 핵산 서열, F3'H를 암호화하는 핵산 서열, CPR를 암호화하는 핵산 서열, FNS를 암호화하는 핵산 서열, SAMT를 암호화하는 핵산 서열, TAL를 암호화하는 핵산 서열, 4CL을 암호화하는 핵산 서열, CHS를 암호화하는 핵산 서열, CHI를 암호화하는 핵산 서열, PAL를 암호화하는 핵산 서열, C4H를 암호화하는 핵산 서열, HpaB를 암호화하는 핵산 서열, 및 DAL를 암호화하는 핵산 서열, 및 또한 이의 조합.
바람직하게는, 벡터는 또한 OMT를 암호화하는 핵산 서열, F3'H를 암호화하는 핵산 서열, CPR를 암호화하는 핵산 서열, FNS를 암호화하는 핵산 서열, TAL을 암호화하는 핵산 서열, 4CL을 암호화하는 핵산 서열, CHS를 암호화하는 핵산 서열, CHI를 암호화하는 핵산 서열, PAL을 암호화하는 핵산 서열 및 C4H를 암호화하는 핵산 서열로부터 선택된 하나 이상의 서열을 포함한다.
특히, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다:
- 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스, 아라비돕시스 탈리아나, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터, 특히 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 케르베라 하이브리다, 시트러스 시넨시스 또는 피로셀라 오피시나룸으로부터 유래된, 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화하고 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17, 19 및 121로부터 선택된 서열을 포함하는 효소로부터 선택된 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7, 17 및 121로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제 (CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면 카타란투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 CPR 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117, 119 및 89로부터 선택된 서열을 포함하는 효소로부터 선택된 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로, 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있는, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 메티카고 트룬카툴라, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸젤리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트루칸툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 특히 사카로마이세스 세레비니자에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고; 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 타이로신 암모니아 리아제(TAL); 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 아라비돕시스 탈리아나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터, p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 서열 번호: 43, 45, 47, 49, 123 및 125로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있는 찰콘 신타제(CHS), 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHS; 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소로부터의 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있는 찰콘 이소머라제(CHI); 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHI; 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드; 및 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83으로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함한다.
특히, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다:
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 및 피로셀라 오피시나룸으로부터 유래된 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 7, 11 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터의 CPR, 또는 식물, 예를 들면 카타렌투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이스로부터, 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고; 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된, 타이로신 암모니아 리아제(TAL), 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 바람직하게는 아라비돕시스 탈리아나, 페트로셀리눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터 유래된 4CL; 특히 서열 번호: 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생한할 수 있고; 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 찰콘 신타제(CHS), 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있고; 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 찰콘 이소머라제(CHI), 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드;
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83으로부터 선택된 서열을 포함하는, 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드을 암호화하는 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드롤라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 서열 번호: 71을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및
- 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 핵산 서열.
바람직하게는, 벡터는 또한 다음으로부터 선택된 하나 이상의 핵산 서열을 포함할 수 있다:
- 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 가진 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된 F3'H, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터 선택된 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 5' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있고 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 효소로부터 선택된 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 81로부터 선택된 서열을 포함하는 S-아데노실메티오닌 신테타제(SAMT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있고 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있고 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4-쿠마레이트-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있고 서열 번호: 53로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있고 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
특수한 구현예에서, 벡터는:
- 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제를 암호화하는 핵산 서열, 및 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실을 가할 수 있는, 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열; 또는
- 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 핵산 서열; 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실을 가할 수 있는, 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열; 및 시토크롬 P450 리덕타제를 암호화하는 이종 핵산 서열; 또는
- 특히 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열; 및 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS)를 암호화하는 이종 핵산 서열; 또는
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제를 암호화하는 이종 핵산 서열; 나린게닌 및/또는 아피게닌의 3' 위치에서 하이드록실화할 수 있는 플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열; 시토크롬 P450 리덕타제를 암호화하는 이종 핵산 서열; 및 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS)를 암호화하는 이종 핵산 서열을 포함한다.
따라서, 벡터는 이로부터 선택된 수개의 핵산 서열, 특히 이로부터 선택된 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 핵산 서열을 포함할 수 있다.
벡터는 특히 상술한 바와 같은 특수한 암호화 서열의 조합을 포함할 수 있다.
벡터는 암호화 서열이 숙주 미생물에 대해 최적화될 수 있고/있거나, 이종 프로모터의 제어 하에 있을 수 있고/있거나 동일한 기원의 미생물로부터 유래되지 않고/않거나 동일한 정렬로 존재하지 않는 암호화 서열과 조합될 수 있는 한 이종인 암호화 서열을 포함한다.
벡터는 임의의 DNA 서열일 수 있고 여기서 이는 외부 핵산, 즉, 숙주 미생물내로 외부 DNA를 도입시킬 수 있도록 하는 벡터를 삽입시키는 것이 가능하다. 예를 들면, 벡터는 플라스미드, 파지미드, 코스미드, 인공 염색체, 특히, YAC, 또는 BAC일 수 있다.
발현 벡터는 선택 마커를 암호화하는 핵산 서열을 포함할 수 있다. 선택 마커는 하나 이상의 항생제 또는 영양요구성 유전자에 대한 내성을 위한 유전자일 수 있다. 영양요구성 유전자는, 예를 들면, URA3, LEU2, HIS3 또는 TRP1일 수 있다. 항생제-내성 유전자는 바람직하게는, 예를 들면, 암피실린, 가나마이신, 하이그로마이신, 게네티신 및/또는 뉴로세트리신에 대한 내성을 위한 유전자일 수 있다.
숙주 미생물 내로의 벡터의 도입은 당해 분야의 기술자에게 널리 알려진 공정이다. 몇가지 방법이 특히 문헌: "Current Protocols in Molecular Biology", 13.7.1-13.7.10; 또는 in Ellis T. et al., Integrative Biology, 2011, 3(2), 109-118에 기술되어 있다.
숙주 미생물은 일시적으로 또는 안정하게 형질전환/형질감염될 수 있고 핵산, 카세트 또는 벡터가 에피소옴 형태 또는 숙주 미생물의 게놈내로 혼입된 형태로 내부에 함유될 수 있다.
발현 벡터는 또한 벡터, 발현 카세트 또는 핵산의 숙주 미생물 게놈내로의 표적화된 삽입을 허용하는 하나 이상의 서열을 포함할 수 있다.
상기 기술된 바와 같은 효소를 암호화하는 핵산 서열 또는 이들 중 일부의 조합을 포함하는 발현 카세트 모두 또는 부분은 재조합 미생물의 염색체내로 삽입될 수 있다.
역으로, 기술된 바와 같은 효소를 암호화하는 핵산 서열 또는 이들 중 일부의 조합을 포함하는 발현 카세트의 모두 또는 부분은 에피소옴 형태, 특히 플라스미드 형태로 보존될 수 있다.
임의로, 미생물은 앞서 기술한 바와 같은 효소를 암호화하는 핵산 서열의 수개의 카피를 포함할 수 있다. 특히, 이는 앞서 기술한 바와 같은 효소를 암호화하는 핵산 서열의 2 내지 10개의 카피, 예를 들면 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 카피를 포함할 수 있다.
본 발명은 특히 헤스페리틴 및 디오스페틴의 7 위치에서 글루코스를 가할 수 있는, 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 특히 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 6 위치에서 람노스를 전환시킬 수 있는 6"-O-람노실트랜스퍼라제 (RhaT); 및 특히 미생물에서 UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 핵산 서열을 미생물내로 도입시키는 단계; 및 이러한 핵산 서열을 포함하는 미생물을 선택하는 단계를 포함하는, 본 발명에 따른 미생물의 제조 방법에 관한 것이다.
이러한 방법은 또한 다음 중에서 선택된 하나 이상의 핵산 서열을 도입시키는 단계를 포함할 수 있다:
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화시킬 수 있고; 바람직하게는 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스, 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르, 파네로차에테 크리소스포리움, 스트렙토마이세스 아베르미틸리스 또는 피로셀라 오피시나룸으로부터, 특히 페릴라 프루테스센스 바르. 크리스파, 페투니아 엑스 하이브리다, 칼리스테푸스 키넨시스, 게르베라 하이브리다, 시트러스 시넨시스 또는 피로셀라 오피시날룸으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 및 21로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 1, 5, 7, 11, 17 및 19로부터 선택된 서열을 포함하는 효소로부터 선택된 F3'H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 5, 7 및 17로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시토크롬 P450 리덕타제(CPR); 바람직하게는 사카로마이세스 세레비지아에로부터, 또는 식물로부터, 예를 들면 카타란투스 로세우스 또는 아라비돕시스 탈리아나로부터의 CPR; 바람직하게는 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25, 29 및 31로부터 선택된 서열을 포함하는 효소로부터 선택된 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 CPR 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화시킬 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 아라비돕시스 탈리아나 또는 호모사피엔스로부터의 OMT, 바람직하게는 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4'에서 메틸화된, 서열 번호: 87 및 89로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85 eHSMS 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 89로부터 선택된 서열을 포함하는 효소로부터 선택된 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌을 아피게닌으로, 에리오딕티올을 루테올린으로, 및/또는 헤스페레틴을 디오스메틴으로 전환시킬 수 있고, 바람직하게는 에리오딕티올을 루테올린으로 전환시킬 수 있는 플라본 신타제(FNS); 바람직하게는 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스, 제아 마이스, 칼리스테푸스 키넨시스, 아피움 그라베올렌스, 메디카고 트루카툴라, 쿠미눔 시미눔, 아에투사 시나피움, 안젤리카 아르칸겔리카, 코니움 마쿨라툼, 카멜리아 시넨시스, 시나라 카르둔쿨루스 바르 시콜리무스, 사우쑤레아 메두사, 플렉트란투스 바르바투스, 스쿠텔라리아 바이칼렌시스, 도르코세라스 하이그로메트리쿰, 안티리눔 마주스, 페릴라 프루테스센스 바르 크리스파, 다흘리아 핀나타 또는 에리트란테 레위시이로부터, 특히 아라비돕시스 탈리아나, 로니세라 자포니카, 로니세라 마크란토이데스, 메디카고 트룬카툴라, 오리자 사티바, 페트로셀리눔 크리스품, 포풀루스 델토이데스 또는 제아 마이로부터, 바람직하게는 로이세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 FNS; 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소로부터의 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 특히 사카로마이세스 세레비지아에로부터의 S-아데노실메티오닌 신테타제(SAMT), 예를 들면, 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 이종 또는 내인성 핵산 서열;
- 타이로신으로부터 p-쿠마르산을 생산할 수 있는 타이로신 암모니아 리아제 (TAL); 바람직하게는 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 TAL; 특히 서열 번호: 39 및 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- p-쿠마르산 및 조효소 A로부터 쿠마릴-CoA를 생산할 수 있는 4-쿠마레이트-CoA 리가제(4CL); 바람직하게는 아라비돕시스 탈리아나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터 유래된 4CL; 서열 번호: 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 4-쿠마로일-CoA 및 말로닐-CoA로부터 나린게닌-찰콘을 생산할 수 있는 찰콘 신타제(CHS), 바람직하게는 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHS, 특히 서열 번호: 51, 53, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53 및 55로부터 선택된 서열을 포함하는 효소로부터의 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 53로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 나린게닌 찰콘으로부터 나린게닌을 생산할 수 있는 찰콘 이소머라제(CHI); 바람직하게는 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터 유래된 CHI, 특히 서열 번호: 59 및 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 65로부터 선택된 서열을 포함하는 PAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 신나메이트 4-하이드록실라제(C4H), 특히 페닐알라닌으로부터 p-쿠마르산을 생산할 수 있는, 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 79로부터 선택된 서열을 포함하는 C4H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 바람직하게는 서열 번호: 83으로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 소단위(HpaB) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열, 및 바람직하게는 서열 번호: 85로부터 선택된 서열을 포함하는 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 소단위(HpaC) 및 이와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-하이드록시페닐아세테이트 3-모노옥시게나제 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 타이로신을 L-DOPA로 및 또한 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 73 및 75로부터 선택된 서열을 포함하는 4-메톡시벤조에이트 O-데메틸라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 L-타이로신 하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 핵산 서열; 또는 p-쿠마르산을 카페산으로 전환시킬 수 있고, 바람직하게는 서열 번호: 71로부터 선택된 서열을 포함하는 p-쿠마레이트 3-하이드록실라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 p-쿠마레이트 3-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열, 및
- 디하이드록시페닐알라닌 암모니아-리아제(DAL)를 암호화하는 핵산 서열을 포함한다.
바람직한 구현예에 따라서, 방법은:
(i) 아라비돕시스 탈리아나, 스쿠텔라리아 바이칼렌시스 또는 호모 사피엔스로부터, 바람직하게는 아라비돕시스 탈리아나 또는 스쿠텔라리아 바이칼렌시스로부터의 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT), 바람직하게는 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소로부터 선택된 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 특히 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
(ii) 시트러스 속 또는 페투니아 하이브리다, 바람직하게는 시트러스 시넨시스, 시트러스 막시마, 또는 시트러스 클레멘티나, 심지어 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 6"-O-람노실트랜스퍼라제(RhaT), 바람직하게는 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 6-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제(RhaT) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
(iii) 시트러스 시넨시스로부터 또는 아라비돕시스 탈리아나로부터의 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM), 바람직하게는 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 RHM 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 특히 서열 번호: 107로부터 선택된 서열을 포함하는 RHM 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
다음으로부터 선택된 적어도 하나의 핵산 서열의 도입 단계를 포함한다:
- 4' 위치에서 에리오딕티올 및/또는 루테올린을 메틸화할 수 있는 O-메틸트랜스퍼라제(OMT); 바람직하게는 시트러스 클레멘티나, 시트러스 시넨시스, 아라비돕시스 탈리아나 또는 호모 사피엔스로부터의 OMT, 바람직하게는 서열 번호: 117, 119, 87 및 89로부터 선택된 서열을 포함하는 OMT 및 특히 기질로서 에리오딕티올 및/또는 루테올린을 사용하고 4' 위치에서 메틸화된, 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117 및 119로부터 선택된 서열을 포함하는 OMT 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 3' 위치에서 나린게닌 및/또는 아피게닌을 하이드록실화할 수 있고 서열 번호: 7, 11, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 23, 25, 27, 29 및 31로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드 및 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- S-아데노실메티오닌 신테타제(SAMT); 특히 사카로마이세스 세레비니자에로부터의 SAMT, 예를 들면 서열 번호: 81로부터 선택된 서열을 포함하는 SAMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 S-아데노실메티오닌 신테타제 활성을 갖는 폴리펩타이드를 암호화하는 핵산 서열; 및
- 로도토룰라 글루티니스 또는 플라보박테리움 존소니아에로부터 유래된 타이로신 암모니아 리아제(TAL); 특히 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 아라비돕시스 탈리아나, 시트러스 크레멘티나, 페트로셀눔 크리스품 또는 스트렙토마이세스 클라불리게루스로부터의 4-쿠마레이트-CoA 리가제(4CL); 특히 서열 번호: 123, 125, 45, 43, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드; 가장 특히 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 시트러스 시넨시스, 호르데움 불가레 또는 스트렙토마이세스 클라불리게루스로부터의 찰콘 신타제(CHS); 특히 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 53으로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 아라비돕시스 탈리아나 또는 스트렙토마이세스 클라불리게루스로부터의 찰콘 이소머라제(CHI); 특히 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드; 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열.
바람직하게는, 방법은 이러한 서열 모두의 도입 단계를 포함한다.
바람직하게는, 방법은 또한:
- 페닐알라닌 암모니아 리아제(PAL), 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 신나메이트 4-하이드록실라제(C4H), 특히 서열 번호: 67, 69 및 79 및 서열을 포함하는 C4H 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드, 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열의 도입 단계를 포함한다.
바람직하게는, 방법은 상술한 바와 같은 특수한 암호화 서열의 조합의 도입 단계를 포함한다.
디오스민 및/또는 헤스페리딘의 생산
본 발명은 디오스민 및/또는 헤스페리딘을 생산하기 위한 본 발명에 따른 미생물의 용도에 관한 것이다. 제1의 바람직한 구현예에서, 본 발명은 디오스민을 생산하기 위한 본 발명에 따른 미생물의 용도에 관한 것이다. 제2의 바람직한 구현예에서, 본 발명은 헤스페리딘을 생산하기 위한, 본 발명에 따른 미생물의 용도에 관한 것이다. 바람직한 구현예에서, 본 발명은 디오스민 및 헤스페리딘을 생산하기 위한 본 발명에 따른 미생물의 용도에 관한 것이다.
본 발명은 또한 특히 디오스민 및/또는 헤스페리딘의 생산을 허용하거나 이에 대해 유리한 조건 하에서, 본 발명에 따른 미생물의 배양 단계 및 임의로 생산된 디오스민 및/또는 헤스페리딘의 회수 및/또는 정제 단계를 포함하는 디오스민 및/또는 헤스페리딘의 생산 방법에 관한 것이다.
본 발명에 따른 미생물의 배양 조건은 당해 분야의 기술자에게 잘 공지된 통상의 기술에 따라 채택할 수 있다.
미생물은 적합한 배양 배지 속에서 배양된다. 용어 "적합한 배양 배지"는 일반적으로 상기 미생물의 유지 및/또는 성장에 필수적이거나 유리한 영양물, 예를 들면, 탄소원; 질소원, 예를 들면, 황산암모늄; 인원(phosphorus source), 예를 들면, 일염기성 인산칼륨; 미량 성분, 예를 들면, 구리, 요오드, 철, 마그네슘, 아연 또는 몰리브데이트 염; 비타민 및 다른 성장 인자, 예를 들면, 아미노산 또는 다른 성장 프로모터를 제공하는 배양 배지를 나타낸다. 소포제를 필요한 경우 가할 수 있다. 본 발명에 따라서, 이러한 적합한 배양 배지는 화학적으로 정의되거나 복잡할 수 있다. 따라서 배양 배지는 문헌: Verduyn et al., (Yeast. 1992. 8: 501-17)에 정의되거나, 비써(Visser) 등의 문헌(Biotechnology and Bioengineering. 2002. 79: 674-81)에 의해 채택된 합성 배지, 또는 상업적으로 이용가능한, 예를 들면, YNB 배지(Yeast Nitrogen Base, MP Biomedicals 또는 Sigma-Aldrich)와 동일하거나 유사할 수 있다. 특히, 배양 배지는 단순 탄소원, 예를 들면, 글루코스, 프럭토스, 크실로스, 에탄올, 글리세롤, 갈락토스, 슈크로스, 셀룰로스, 셀로비오스, 전분, 글루코스 중합체, 몰라세스, 또는 이러한 당의 부산물을 포함할 수 있다.
바람직하게는, 본 발명에 따른 미생물에 의한 디오스민 및/또는 헤스페리딘의 생산은 나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴 및/또는 디오스메틴을 배지에 공급하지 않고, 바람직하게는 나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴 및 디오스메틴을 배양 배지에 공급하지 않고 수득된다.
본 발명에 따라서, 목적한 분자의 산업 규모 생산을 위한 임의의 배양 방법이 고려될 수 있다. 유리하게는, 배양은 생물반응기, 특히, 배치(batch), 공급-배치(fed-batch), 케모스타트(chemostat) 및/또는 연속 배양 방식으로 수행된다. 공정 동안 비타민의 제어된 공급은 또한 생산성에 유리할 수 있다(Alfenore et al., Appl. Microbiol. Biotechnol. 2002. 60: 67-72).
배양은 일반적으로 생물반응기 속에서 적합한 배양 배지가 들어있는 에를렌마이어 플라스크(Erlenmeyer flask) 속에서 가능한 고체 및/또는 액체 예비배양 단계로 수행한다.
일반적으로, 본 발명에 따른 미생물의 배양 조건은 미생물의 기능으로서, 당해 분야의 기술자에 의해 용이하게 채택가능하다. 예를 들면, 배양 온도는 특히 효모의 경우 20℃ 내지 40℃, 바람직하게는 28 내지 35℃, 및 보다 특히 에스. 세레비지아에의 경우 약 30℃이다.
본 발명에 따른 미생물은 1 내지 30일, 및 바람직하게는 1 내지 10일 동안 배양될 수 있다.
본 발명에 따른 미생물은 디오스민 및/또는 헤스페리딘을 1 mg/l의 배양 배지, 바람직하게는 10, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100 mg/l의 배양 배지, 임의로 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900 또는 1000 mg/l의 배양 배지의 최소량으로 생산할 수 있다.
도 1: 헤스페리딘 및 디오스민을 생산하기 위한 대사 경로의 설명.
도 2: 균주 FL_405 (F3'H4 + CPR2)에 의한 나린게닌으로부터 에리오딕티올의 생산. 대조군 균주: CF235. 균주 fl-405에서 나린게닌 피크의 사라짐 및 에리오딕티올 피크의 출현의 관찰.
도 3: 균주 FL_405 (F3'H4 + CPR2)에 의한 아피게닌으로부터 루테올린의 생산. 대조군 균주: CF235. 균주 FL-405에서 아피게닌 피크의 사라짐 및 루테올린 피크의 출현의 관찰.
도 4: 균주 SC744 (FNSII1 + CPR2)에 의한 나린게닌으로부터 아피게닌의 생산. 대조군 균주: CF234. 균주에서 나린게닌 피크의 사라짐 및 아피게닌 피크의 출현의 관찰.
도 5: 에리오딕티올 SC744(FNSII1 + CPR2)로부터 루테올린의 생산. 대조군 균주: CF234. 균주에서 에리오딕티올 피크의 사라짐 및 루테올린 피크의 출현의 관찰.
도 6: 균주 SC1500에 의한 에리오딕티올 및 루테올린의 생산. 대조군 균주: CF237. 에리오딕티올 및 루테올린 피크의 관찰.
도 7: 균주 SC 1612(MET + SAM) 및 SC 1614(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: CF235. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 8: 균주 SC 1612(MET + SAM) 및 SC 1614(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: CF235. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 9: 균주 SC744(FNSII + CPR)에 의한 헤스페레틴으로부터 디오스메틴의 생산. 대조군 균주: CF234. 균주에서 헤스페레틴 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 10: 이. 콜라이 EC26(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 11: 이. 콜라이 EC26(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 12: 이. 콜라이 EC30(FNSII)에 의한 헤스페레틴으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 헤스페레틴 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 13: 균주 SC1508에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 14: 균주 FL 547(GT + RHM + RHAT)에 의한 헤스페레틴으로부터 헤스페리딘의 생산. 대조군 균주: CF 233. 헤스페레틴 피크의 사라짐 및 헤스페리딘 피크의 출현의 관찰.
도 15: 균주 FL 547(GT + RHM + RHAT)에 의한 디오스메틴으로부터 디오스민의 생산. 대조군 균주: CF 233. 디오스메틴 피크의 사라짐 및 디오스민 피크의 출현의 관찰.
도 16: 이. 콜라이 EC38, EC45 및 EC47(GT + RHM + RHAT)에 의한 헤스페레틴으로부터 헤스페리딘의 생산. 대조군 균주: 이. 콜라이 MH1. 헤스페레틴 피크의 사라짐 및 헤스페리딘 피크의 출현의 관찰.
도 17: 이. 콜라이 EC38, EC45 및 EC47(GT + RHM + RHAT)에 의한 디오스메틴으로부터 디오스민의 생산. 대조군 균주: 이. 콜라이 MH1. 디오스메틴 피크의 사라짐 및 디오스민 피크의 출현의 관찰.
도 18: 균주 SC1509, SC1530, SC1529, SC1568 및 SC2410에 의한 헤스페리딘 및 디오스민의 생산. 대조군 균주: CF237. 헤스페리딘 및 디오스민 피크의 관찰.
도 19: 균주 SC2424, SC2425, SC2426, SC2427, SC2428 및 SC1500에 의한 에리오딕티올 및 루테올린의 생산. 대조군 균주: CF237.
도 20: 균주 SC2147, SC2151, SC1612 및 SC1614에 의한 헤스페레틴 및 호모에리오딕티올의 생산. 대조군 균주: CF235.
도 21: 균주 SC2147, SC2151, SC1612 및 SC1614에 의한 디오스메틴 및 크리소에리올의 생산. 대조군 균주: CF235.
도 22: 이. 콜라이 EC41(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 23: 이. 콜라이 EC43(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 24: 이. 콜라이 EC43(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 25: 균주 SC2408에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 26: 균주 SC2409에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 27: 균주 SC2408, SC2409 및 SC1508에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237.
도 28: 균주 SC1579, SC1584, SC1621 및 SC1626에 의한 헤스페리딘 및 디오스민의 생산.
도 29: 균주 SC2429 내지 SC2434, SC2436 내지 SC2444, SC2446 내지 SC2454, SC2456 내지 SC2464 및 SC2466에 의한 나린게닌으로부터 디오스메틴의 생산.
[표 1]
도 2: 균주 FL_405 (F3'H4 + CPR2)에 의한 나린게닌으로부터 에리오딕티올의 생산. 대조군 균주: CF235. 균주 fl-405에서 나린게닌 피크의 사라짐 및 에리오딕티올 피크의 출현의 관찰.
도 3: 균주 FL_405 (F3'H4 + CPR2)에 의한 아피게닌으로부터 루테올린의 생산. 대조군 균주: CF235. 균주 FL-405에서 아피게닌 피크의 사라짐 및 루테올린 피크의 출현의 관찰.
도 4: 균주 SC744 (FNSII1 + CPR2)에 의한 나린게닌으로부터 아피게닌의 생산. 대조군 균주: CF234. 균주에서 나린게닌 피크의 사라짐 및 아피게닌 피크의 출현의 관찰.
도 5: 에리오딕티올 SC744(FNSII1 + CPR2)로부터 루테올린의 생산. 대조군 균주: CF234. 균주에서 에리오딕티올 피크의 사라짐 및 루테올린 피크의 출현의 관찰.
도 6: 균주 SC1500에 의한 에리오딕티올 및 루테올린의 생산. 대조군 균주: CF237. 에리오딕티올 및 루테올린 피크의 관찰.
도 7: 균주 SC 1612(MET + SAM) 및 SC 1614(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: CF235. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 8: 균주 SC 1612(MET + SAM) 및 SC 1614(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: CF235. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 9: 균주 SC744(FNSII + CPR)에 의한 헤스페레틴으로부터 디오스메틴의 생산. 대조군 균주: CF234. 균주에서 헤스페레틴 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 10: 이. 콜라이 EC26(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 11: 이. 콜라이 EC26(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 12: 이. 콜라이 EC30(FNSII)에 의한 헤스페레틴으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 헤스페레틴 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 13: 균주 SC1508에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 14: 균주 FL 547(GT + RHM + RHAT)에 의한 헤스페레틴으로부터 헤스페리딘의 생산. 대조군 균주: CF 233. 헤스페레틴 피크의 사라짐 및 헤스페리딘 피크의 출현의 관찰.
도 15: 균주 FL 547(GT + RHM + RHAT)에 의한 디오스메틴으로부터 디오스민의 생산. 대조군 균주: CF 233. 디오스메틴 피크의 사라짐 및 디오스민 피크의 출현의 관찰.
도 16: 이. 콜라이 EC38, EC45 및 EC47(GT + RHM + RHAT)에 의한 헤스페레틴으로부터 헤스페리딘의 생산. 대조군 균주: 이. 콜라이 MH1. 헤스페레틴 피크의 사라짐 및 헤스페리딘 피크의 출현의 관찰.
도 17: 이. 콜라이 EC38, EC45 및 EC47(GT + RHM + RHAT)에 의한 디오스메틴으로부터 디오스민의 생산. 대조군 균주: 이. 콜라이 MH1. 디오스메틴 피크의 사라짐 및 디오스민 피크의 출현의 관찰.
도 18: 균주 SC1509, SC1530, SC1529, SC1568 및 SC2410에 의한 헤스페리딘 및 디오스민의 생산. 대조군 균주: CF237. 헤스페리딘 및 디오스민 피크의 관찰.
도 19: 균주 SC2424, SC2425, SC2426, SC2427, SC2428 및 SC1500에 의한 에리오딕티올 및 루테올린의 생산. 대조군 균주: CF237.
도 20: 균주 SC2147, SC2151, SC1612 및 SC1614에 의한 헤스페레틴 및 호모에리오딕티올의 생산. 대조군 균주: CF235.
도 21: 균주 SC2147, SC2151, SC1612 및 SC1614에 의한 디오스메틴 및 크리소에리올의 생산. 대조군 균주: CF235.
도 22: 이. 콜라이 EC41(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 23: 이. 콜라이 EC43(MET + SAM)에 의한 에리오딕티올로부터 헤스페레틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 에리오딕티올 피크의 사라짐 및 헤스페레틴 피크의 출현의 관찰.
도 24: 이. 콜라이 EC43(MET + SAM)에 의한 루테올린으로부터 디오스메틴의 생산. 대조군 균주: 이. 콜라이 MH1. 균주에서 루테올린 피크의 사라짐 및 디오스메틴 피크의 출현의 관찰.
도 25: 균주 SC2408에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 26: 균주 SC2409에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237. 헤스페레틴 및 디오스메틴 피크의 관찰.
도 27: 균주 SC2408, SC2409 및 SC1508에 의한 헤스페레틴 및 디오스메틴의 생산. 대조군 균주: CF237.
도 28: 균주 SC1579, SC1584, SC1621 및 SC1626에 의한 헤스페리딘 및 디오스민의 생산.
도 29: 균주 SC2429 내지 SC2434, SC2436 내지 SC2444, SC2446 내지 SC2454, SC2456 내지 SC2464 및 SC2466에 의한 나린게닌으로부터 디오스메틴의 생산.
[표 1]
실시예
물질 및 방법
균주
실시예에 사용된 효모는 사카로마이세스 세레비지아에 FY1679-28A(Tettelin et al., 1995 https://doi.org/10.1016/S1067-2389(06)80008-7)로부터 수득하였다. 당해 효모는 우라실, 트립토판, 히스티딘 및 루이신에 대해 4배 영양요구성이었다. 실시예에 사용된 세균 균주는 에스케리키아 콜라이 MH1으로부터 수득하였다.
표준
표준은 프랑스 소재의 공급업자 Extrasynthese(나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴, 헤스페리딘, 디오스메틴 및 디오스민)로부터 입수하였다.
유전자 클로닝
효모에서 발현하도록 최적화된 유전자는 독일 에베르스버그 소재의 Eurofins Genomics 또는 캐나다 캠프릿지 소재의 Biomatik 또는 미국 샌프란시스코주 소재의 Twist Biosciences 또는 영국 던디 소재의 DC Biosciences에 의해 합성되었다. PCR로, 에스. 세레비지아에로부터의 유전자 cpr2(서열 번호: 26)를 게놈 DNA로부터 증폭시켰다.
합성 또는 PCR에 의해 수득한 유전자는 5' 및 3' 말단에서 BbsI(GAAGAC) 또는 BsaI(GGTCTC) 제한 부위를 포함한다.
모든 유전자, 프로모터 및 터미네이터를 효모 또는 벡터내에서 발현의 경우 벡터 pSBK내에서 또는 이. 콜라이내에서 발현의 경우 벡터 pSB1K3 내에서 제한-클로닝하였다. 프로모터 및 터미네이터(Wargner et al., 2015 DOI: 10.1016/j.fgb.2015.12.001)는 PCR에 의해 효모 에스. 세리비지아에 또는 이. 콜라이의 게놈 DNA로부터 회수하였다.
벡터 pSBK는 효모의 경우 URA 또는 LEU 또는 TRP 또는 HIS 선택 마커를 포함하고 벡터 pSB1K3은 가나마이신-내성 마커를 포함한다.
배양 조건
균주를 효모의 경우 글루코스가 20 g/l에서 보충된 1 ml의 최소 질소 기본 배지(Dutscher, 프랑스 브루마쓰 소재) 및 이. 콜라이의 경우 글루코스가 4 g.l-1에서 보충된 1 ml의 M9 속에 배양하였다. 특정의 경우에, 나린게닌 또는 아피게닌을 100 mg.l-1이 농도에서 가하여 F3'Hs의 활성을 측정하고, 나린게닌 또는 에리오딕티올을 100 mg.l-1의 농도에서 가하여 FNSIIs의 활성을 측정하고, 에리오딕티올 또는 루테올린을 100 mg.l-1의 농도로 가하여 MET의 활성을 측정하고, 헤스페레틴 또는 디오스메틴을 100 mg.l-1의 농도에서 가하여 GT의 활성을 측정하고, 헤스페레틴 7-O-글루코시드 및/또는 디오스메틴 7-O-글루코시드를 가하야 RHM 및 RHAT의 활성을 측정하였다.
각각의 균주를 0.2의 OD에서 동일한 조건 하에 배양한 24-시간 예비 배양물을 사용하여 접종하였다.
분석 방법
샘플의 제조: 1 mL의 배양물을 -80℃에서 동결시키고 12시간 동안 0.10 mbar에서 동결건조시켰다. 이후에, 샘플을 1 mL의 디메틸설폭사이드(DMSO)에 넣고, 30초 동안 1000 rpm에서 교반한 다음 5분 동안 3000 rpm에서 실온에서 원심분리하였다. 원심분리 후, 공지된 용적의 상층액을 메탄올 속에 용해된 공지된 용적의 내부 표준의 혼합물에 가한다.
내부 표준의 최종 농도는 다음과 같다:
* 디오스민 C13
0.5 mg/L
* 디오스메틴 C13
0.015 mg/L
UHPLC-TQ에 의한 분석: 샘플을 Quantis triple-quadrupole MS(Thermo)에 커플링된 Vanquish-H UHPLC machine(Thermo)을 사용하여 분석하였다. 컬럼은 HSST3 1.8 μm 2.1 X 5 mm 예비컬럼과 결합된 Waters Acquity UPLC@ USST3 컬럼(8 μm 2.1 X 100 mm)이다.
이동상 A는 LC/MS-등급 수 중 포름산의 0.1% 용액이고 이동상 B는 순수한 LC/MS-등급 아세토니트릴 중 포름산의 0.1% 용액이다. 컬럼 온도는 50℃이고 샘플 교환기의 온도는 10℃이다.
2개의 크로마토그래피 조건을 목적한 플라보노이드를 검출하는데 사용하였다:
모니터링된 이온 및 목적한 분자에 대한 단편화 조건은 다음과 같다:
F3'H
각각의 F3'H에 대한 작제물을 URA 선택 마커를 지닌 벡터 내에서 제조하였다(표 6). 각각의 SAM2 및 다양한 CPR 중 하나 만을 포함하는 작제물을 LEU 선택 마커를 지닌 벡터내에서 생성시켰다(표 7). URA 또는 LEU 선택 마커 만을 포함하는 2개의 벡터를 또한 대조군으로서 생성시켰다. 마커 유전자는 혼입된 목적한 유전자를 갖는 세포를 검출 및 선택하는 것을 가능하도록 한다.
수개의 균주를 각각 표 6에 나타낸 모든 F3'H을 사용하여 생성시킴으로써 이들이 표 7의 작제물로 각각 시험될 수 있도록 하였다.
이러한 다양한 조립은 F3'H의 효소 활성을 점검하는 것을 가능하게 하고 또한 가장 효율적인 F3'H-CPR 쌍을 측정할 수 있도록 한다.
예를 들면, 균주 FL 405는 작제물 FL 26 및 FL 401을 함유한다.
작제물 TT URA 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF235로 불린다.
FNSII
다음의 FNSII 각각의 경우, TRP 벡터에서 작제물을 제조하였다(표 8). 각각 SAM2 및 상이한 CPR를 함유하는 LEU 선택 마커를 지닌 동일한 벡터를 사용하여 FNSII를 시험하였다(표 9).
수개의 균주를 표 8에서 나타낸 FNSII의 작제물 각각 및 표 9의 CPR의 작제물 각각을 사용하여 생성시켰다.
이러한 다양한 조립체는 FNSII의 효소 활성을 점검할 수 있도록 하고 또한 가장 효율적인 FNSII를 측정할 수 있도록 한다.
예를 들면, 균주 SC 744는 작제물 FL 620 및 FL 401을 함유한다.
작제물 TT TRP 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF234로 불린다.
유사한 작제물을 제조하여 서열 번호: 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159의 FNSII를 시험하였다.
에리오딕티올/루테올린까지의 효모
에리오딕티올 및 루테올린까지의 경로를 포함하는 균주를 또한 사용하였다:
- FL 26, FL 602, FL 808 및 FL 822를 포함하는 균주 SC1500 작제물;
- 작제물 FL 1031 + FL 602 + FL 822 + TT HIS를 포함하는 균주 SC2424;
- 작제물 FL 26 + FL 602 + FL 822 + TT HIS를 포함하는 균주 SC2425;
- 작제물 FL 31 + FL 602 + FL 822 + TT HIS를 포함하는 균주 SC2426;
- 작제물 FL 1031, FL 602, FL 808 및 FL 822를 포함하는 균주 SC2427; 및
- 작제물 FL 31 + FL 602 + FL 808 + FL 822를 포함하는 균주 SC2428.
작제물 TT URA, TT TRP, TT HIS 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
MET:
각각의 MET를 시험하기 위하여, 작제물을 제조하고 표 11에 나타낸다. 마커 유전자는 혼입된 목적한 유전자를 갖는 세포를 검출 및 선택할 수 있도록 한다.
에리오딕티올의 헤스페레틴으로부터 전환에 대해 SC1612의 경우 FL 121 및 FL 266, SC1614의 경우 FL 121 및 FL 268, SC2147 및 FL 469의 경우 FL 475 및 FL 121 및 SC2151의 경우 FL 121을 사용하여 4개의 균주 SC1612, SC1614, SC2147 및 SC2151을 생성시킴으로써 어느 MET가 가장 효율적인지를 측정하였다.
작제물 TT LEU 및 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF235로 불린다.
F3'H, MET, FNS, CPR: 나린게닌으로부터 디오스메틴의 생산
다음의 균주를 작제하였다:
SC2429: FL 1111 + FL 1031 + FL 121
SC2430: FL 1112 + FL 1031 + FL 121
SC2431: FL 1113 + FL 1031 + FL 121
SC2432: FL 1114 + FL 1031 + FL 121
SC2433: FL 1115 + FL 1031 + FL 121
SC2439: FL 1111 + FL 1031 + TT LEU
SC2440: FL 1112 + FL 1031 + TT LEU
SC2441: FL 1113 + FL 1031 + TT LEU
SC2442: FL 1114 + FL 1031 + TT LEU
SC2443: FL 1115 + FL 1031 + TT LEU
SC2434: FL 1116 + FL 1031 + FL 121
SC2436: FL 1118 + FL 1031 + FL 121
SC2437: FL 1119 + FL 1031 + FL 121
SC2438: FL 1120+ FL 1031 + FL 121
SC2444: FL 1116 + FL 1031 + TT LEU
SC2446: FL 1118 + FL 1031 + TT LEU
SC2447: FL 1119 + FL 1031 + TT LEU
SC2448: FL 1120 + FL 1031 + TT LEU
SC2449: FL 1111 + FL 26 + FL 121
SC2450: FL 1112 + FL 26 + FL 121
SC2451: FL 1113 + FL 26 + FL 121
SC2452: FL 1114 + FL 26 + FL 121
SC2453: FL 1115 + FL 26 + FL 121
SC2459: FL 1111 + FL 26 + TT LEU
SC2460: FL 1112 + FL 26 + TT LEU
SC2461: FL 1113 + FL 26 + TT LEU
SC2462: FL 1114 + FL 26 + TT LEU
SC2463: FL 1115 + FL 26 + TT LEU
SC2454: FL 1116 + FL 26 + FL 121
SC2456: FL 1118 + FL 26 + FL 121
SC2457: FL 1119 + FL 26 + FL 121
SC2458: FL 1120+ FL 26 + FL 121
SC2464: FL 1116 + FL 26 + TT LEU
SC2466: FL 1118 + FL 26 + TT LEU
SC2467: FL 1119 + FL 26 + TT LEU
SC2468: FL 1120 + FL 26 + TT LEU
작제물 TT URA, TT TRP, TT HIS 및 TT LEU를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
헤스페레틴/디오스메틴까지의 이. 콜라이
헤스페레틴/디오스메틴까지의 효모
헤스페레틴/디오스메틴까지의 경로를 포함하는 3개의 균주를 또한 시험하였다. 균주 SC1508은 표 14의 작제물 FL 121 + FL 268 + FL 602 + FL 808을 포함한다. 균주 SC2408은 표 14의 작제물 FL 121 + FL 469 + FL 602 + FL 808을 포함한다. 균주 SC2409는 표 14의 작제물 FL 121 + FL 475 + FL 602 + FL 808을 포함한다.
작제물 TT LEU, TT URA, TT TRP 및 TT HIS를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
GT
각각의 GT를 시험하기 위하여, 작제물을 제조하고 표 15에 나타낸다. 마커 유전자는 혼입된 목적한 유전자를 갖는 세포를 검출 및 선택할 수 있도록 한다.
다양한 GT를 지닌 다양한 작제물은 GT의 효소 활성을 점검하는 것을 가능하도록 하고 또한 가장 효율적인 GT를 측정하는 것을 가능하도록 한다.
작제물 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF233으로 불린다.
RHM
각각의 RHM을 시험하기 위하여, 작제물을 제조하고 표 16에 나타낸다.
다양한 RHM을 지닌 다양한 작제물은 RHM의 효소 활성을 점검하는 것을 가능하도록 하고 또한 가장 효율적인 RHM을 측정하는 것을 가능하도록 한다.
작제물 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF233으로 불린다.
RHAT
각각의 RHAT를 시험하기 위하여, 작제물을 제조하고 표 17에 나타낸다.
다양한 RHAT를 사용하여 제조된 다양한 조립체는 RHAT의 효소 활성을 점검하는 것을 가능하도록 하고 또한 가장 효율적인 RHAT를 측정하는 것을 가능하도록 한다.
작제물 TT URA를 함유하는 대조군 균주(유전자 부재)는 CF233으로 불린다.
헤스페리딘/디오스민까지의 이. 콜라이
헤스페리딘/디오스민까지의 효모
전체 경로를 포함하는 9개의 균주를 또한 생성시켰다.
균주 SC1509는 작제물 FL 121 + FL 511 + FL 602 + FL 808을 포함한다.
균주 SC1530은 작제물 FL 121 + FL 603 + FL 602 + FL 808을 포함한다.
균주 SC1529는 작제물 FL 121 + FL 554 + FL 602 + FL 808을 포함한다.
균주 SC1568은 작제물 FL 121 + FL 556 + FL 602 + FL 808을 포함한다.
균주 SC2410은 작제물 FL 121 + FL 1100 + FL 602 + FL 808을 포함한다.
균주 SC1579는 작제물 FL 401 + FL 547 + FL 602 + FL 828을 포함한다.
균주 SC1584는 작제물 FL 401 + FL 554 + FL 602 + FL 828을 포함한다.
균주 SC1621은 작제물 FL 401 + FL 556 + FL 602 + FL 828을 포함한다.
균주 SC1626은 작제물 FL 401 + FL 603 + FL 602 + FL 828을 포함한다.
작제물 TT LEU, TT URA, TT TRP 및 TT HIS를 함유하는 대조군 균주(유전자 부재)는 CF237로 불린다.
결과
F3'H
하기 표 20 및 21은 표 6에 나타낸 F3'H 및 표 7의 작제물을 포함하는 균주를 나린게닌 및 아피게닌 각각의 존재하에 배양함으로써 수득된 에리오딕티올(표 20) 및 루테올린(표 21)의 생산을 나타낸다.
다양한 균주가 또한 사용된 F3'H 및 CPR에 따라 상이한 농도에서, 나린게닌으로부터 에리오딕티올을 생산할 수 있다.
다양한 균주가 또한 사용된 F3'H 및 CPR에 따라 상이한 농도에서, 아피게닌으로부터 루테올린을 생산할 수 있다(참고: 도 3).
FNS
하기 표 22 및 23운 표 8에 나타낸 FNSII 및 표 9의 작제물을 포함하는 균주를 나린게닌 및 에리오딕티올 각각의 존재하에서 배양함으로써 수득된 아피게닌(표 22) 및 루테올린(표 23)의 생산을 나타낸다.
다양한 균주가 또한 사용된 FNS에 따라 상이한 농도에서, 나린게닌 및 에리오딕티올로부터 아피게닌 및 루테올린을 생산할 수 있다(참고: 도 4 및 도 5).
유사한 결과가 서열 번호: 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159의 FNSII를 사용하여 수득되었다.
F3'H, MET, FNS, CPR: 나린게닌으로부터 디오스메틴의 생산
균주 SC2429 내지 SC2434, SC2436 내지 SC2444, SC2446 내지 SC2454, SC2456 내지 SC2464 및 SC2466 내지 SC2468에 의한 나린게닌으로부터 디오스메틴의 생산 결과를 도 29에 나타낸다.
모든 균주는 나린게닌으로부터 디오스메틴을 생산할 수 있다. 디오스메틴의 생산은 CPR를 첨가함에 의해 크게 증가된다.
에리오딕티올/루테올린까지의 효모
균주 SC2424, SC2425, SC2426, SC2427, SC1500 및 SC2428은 에리오딕티올 및 루테올린까지의 경로의 모든 효소를 함유하고 글루코스로부터 루테올린 및 에리오딕티올을 생산할 수 있다.
균주 SC1500에 대한 결과는 도 6에 상응하며, 여기서 에리오딕티올 및 루테올린 피크가 관찰된다. 유사한 결과가 균주 SC2424, SC2425, SC2426, SC2427 및 SC2428에 대해 관찰된다. 각각의 균주 SC2424, SC2425, SC2426, SC2427, SC1500 및 SC2428에 대한 에리오딕티올 및 루테올린의 생산은 도 19에 나타낸다.
생합성 경로에 효소 PAL 및 C4H의 첨가는 현저히 보다 높은 에리오딕티올 및 루테올린 농도를 수득하는 것을 가능하도록 함을 주목해야한다. 이러한 농도는 PAL 및 C4H를 제외한 동일한 효소를 함유하는 균주를 사용하여 수득된 농도보다 6배까지 더 높을 수 있다(참고: 도 19, 예를 들면 PAL/C4H가 없는 균주 SC2425 및 PAL/C4H를 지닌 균주 SC1500 또는 PAL/C4H이 없는 균주 SC2426 및 PAL/C4H를 지닌 균주 SC2428를 비교함으로써).
MET
균주 SC1612, SC1614, SC2147 및 SC2151에 의한 에리오딕티올 및 루테올린으로부터 헤스페레틴 및 디오스메틴의 생산을 각각 도 7, 8, 20 및 21에 나타낸다.
효모 균주 SC1612, SC1614, SC2147 및 SC2151은 실제로 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다.
에리오딕티올로 출발하여, 균주 SC2147, SC2151 및 SC1612는 헤스페레틴을 에리오딕티올의 4' 위치에서 하이드록실을 특이적으로 메틸화시킬 수 있다(도 20). 균주 SC1614는 이의 일부의 경우 헤스페레틴 및 호모에리오딕티올의 혼합물을 생산한다.
주목할만한 방식으로, 균주 SC2151은 또한 약 40 mg/L의 헤스페레틴을 생산할 수 있다(도 20). 이의 부분에 대해 균주 SC2147, SC1612 및 SC1614는 루테올린으로부터 디오스메틴을 생산할 수 있다(도 21).
FNSII
균주 SC744에 의한 헤스페레틴으로부터 디오스메틴의 생산 결과를 도 9에 나타낸다.
효모 균주 SC744는 또한 헤스페레틴으로부터 디오스메틴을 생산할 수 있다.
헤스페레틴/디오스메틴까지의 이. 콜라이
균주 EC26, EC41 및 EC43에 의한 에리오딕티올로부터 헤스페레틴의 생산 결과는 도 10, 22 및 23에 나타내고 균주 EC26 및 EC43에 의한 루테올린으로부터 디오스메틴의 생산은 도 11 및 24에 나타낸다.
이. 콜라이 균주 EC26, EC41 및 EC43은 실제로 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다.
균주 EC30에 의한 헤스페레틴으로부터 디오스메틴의 생산 결과는 도 12에 나타낸다.
이. 콜라이 균주 EC30은 실제로 헤스페레틴으로부터 디오스메틴을 생산할 수 있다.
헤스페레틴/디오스메틴까지의 효모
균주 SC1508, SC2408 및 SC2409에 의한 글루코스로부터 헤스페레틴 및 디오스메틴의 생산 결과는 도 13, 25 및 26에 나타낸다.
헤스페레틴 및 디오스메틴까지의 경로의 모든 효소를 함유하는 효모 균주 SC1508, SC2408 및 SC2409는 글루코스로부터 헤스페레틴 및/또는 디오스메틴을 생산할 수 있다(도 27). 주목할만한 방식으로, 균주 SC2408은 약 25 mg/L의 헤스페레틴 및 약 5 mg/L의 디오스메틴을 생산한다.
GT
다양한 균주가 실제로 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및/또는 디오스민을 사용된 GT에 따라 상이한 농도로 생산할 수 있다.
RHM
다양한 균주가 또한 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및 디오스민을 사용된 RHM에 따라 상이한 농도로 생산할 수 있다.
RHAT
다양한 균주가 실제로 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및 디오스민을 사용된 GT, RHM 및 RHAT에 따라 상이한 농도에서 생산할 수 있다.
균주 FL 547에 의한 헤스페레틴 및 디오스메틴으로부터 헤스페리딘 및 디오스민의 생산 결과는 도 14 및 15에 각각 나타낸다.
다양한 작제물로 시험된 효모가 실제로 헤스페리딘 및 디오스민을 생산할 수 있다.
헤스페리딘/디오스민까지의 이. 콜라이
균주 EC38, EC45 및 EC47에 의한 헤스페레틴으로부터 헤스페리딘의 생산 결과는 도 16에 나타낸다.
이러한 균주는 실제로 헤스페레틴으로부터 헤스페리딘을 생산할 수 있다.
균주 EC38, EC45 및 EC47에 의한 디오스메틴으로부터 디오스민의 생산 결과는 도 17에 나타낸다.
이러한 균주는 실제로 디오스메틴으로부터 디오스민을 생산할 수 있다.
헤스페리딘/디오스민까지의 효모
균주 SC1509, SC1530, SC1529, SC1568 및 SC2410에 의한 글루코스로부터 헤스페리딘 및 디오스민의 생산 결과는 도 18에 나타내다. 균주 SC1579, SC1584, SC1621 및 SC1626에 의한 디오스민으로부터 헤스페리딘의 생산 결과는 도 28에 나타낸다.
경로의 효소 모두를 함유하는 모든 균주는 헤스페리딘 및/또는 디오스민을 생산할 수 있다.
SEQUENCE LISTING
<110> LES LABORATOIRES SERVIER
<120> METHOD FOR THE BIOSYNTHESIS OF DIOSMIN AND/OR HESPERIDIN IN
A MICROORGANISM
<130> IP20214028/FR
<160> 160
<170> KopatentIn 2.0
<210> 1
<211> 524
<212> PRT
<213> Perilla frutescens
<400> 1
Met Ser Ile Ser Ala Ala Val Ser Leu Ile Ile Cys Thr Ser Ile Leu
1 5 10 15
Gly Val Leu Val Tyr Phe Leu Phe Leu Arg Arg Gly Gly Gly Ser Asn
20 25 30
Gly Arg Pro Leu Pro Pro Gly Pro Arg Pro Trp Pro Ile Val Gly Asn
35 40 45
Leu Pro Gln Leu Gly Pro Lys Pro His Gln Ser Met Ala Ala Leu Ala
50 55 60
Arg Val His Gly Pro Leu Met His Leu Lys Met Gly Phe Val His Val
65 70 75 80
Val Val Ala Ala Ser Ala Thr Val Ala Glu Lys Phe Leu Lys Val His
85 90 95
Asp Thr Asn Phe Leu Ser Arg Pro Pro Asn Ser Gly Ala Glu His Ile
100 105 110
Ala Tyr Asn Tyr Asn Asp Leu Val Phe Ala Pro His Gly Pro Arg Trp
115 120 125
Arg Leu Leu Arg Lys Ile Cys Ala Leu His Leu Phe Ser Ser Lys Ala
130 135 140
Leu Asp Asp Phe Arg His Val Arg Glu Glu Glu Val Gly Ile Leu Ile
145 150 155 160
Arg Asn Leu Ala Ser Val Gly Glu Met Pro Ala Ser Ile Gly Gln Met
165 170 175
Met Tyr Val Cys Ala Thr Asn Ala Ile Ser Arg Val Met Leu Gly Arg
180 185 190
His Val Leu Gly Asp Glu His Arg Gly Ala Ala Gly Gly Gly Asp Thr
195 200 205
Thr Ala Glu Glu Phe Lys Ala Met Val Val Glu Leu Met Ala Leu Ala
210 215 220
Gly Val Phe Asn Val Gly Asp Phe Ile Pro Pro Leu Lys Gly Leu Asp
225 230 235 240
Leu Gln Gly Val Val Ala Lys Met Lys Lys Leu His Gln Arg Phe Asp
245 250 255
Ala Phe Phe Ser Gly Ile Leu His Asp His Lys Ile Asn Gly Ser Asn
260 265 270
Ala Ala Glu Gly His Val Asp Leu Leu Thr Thr Leu Ile Ser Leu Lys
275 280 285
Asp Val Asp Asn Asn Gly Glu Gly Gly Lys Leu Thr Asp Thr Glu Ile
290 295 300
Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr Asp Thr Thr Ser
305 310 315 320
Ser Thr Val Glu Trp Ala Ile Thr Glu Leu Ile Arg Asn Pro Asn Ile
325 330 335
Leu Ala Arg Val Arg Lys Glu Leu Asp Leu Ile Val Gly Lys Asp Lys
340 345 350
Leu Val Lys Glu Ser Asp Leu Gly Gln Leu Thr Tyr Leu Gln Ala Val
355 360 365
Ile Lys Glu Asn Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro
370 375 380
Arg Val Ala Gln Glu Ser Cys Glu Ile Asn Gly Tyr Tyr Ile Pro Lys
385 390 395 400
Asp Ser Thr Leu Leu Val Asn Val Trp Ala Ile Gly Arg Asp Pro Asn
405 410 415
Val Trp Pro Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Met Gly
420 425 430
Gly Glu Lys Pro Asn Val Asp Val Arg Gly Asn Asp Phe Glu Leu Ile
435 440 445
Pro Phe Gly Ser Gly Arg Arg Ile Cys Ala Gly Met Asn Leu Gly Ile
450 455 460
Arg Met Val Gln Leu Leu Ile Ala Thr Met Val His Ala Phe Asp Phe
465 470 475 480
Glu Leu Ala Asn Gly Gln Leu Ala Lys Asp Leu Asn Met Glu Glu Ala
485 490 495
Tyr Gly Ile Thr Leu Gln Arg Ala Asp Pro Leu Val Val His Pro Arg
500 505 510
Pro Arg Leu Ala Arg His Val Tyr Gln Ala Gln Val
515 520
<210> 2
<211> 1575
<212> DNA
<213> artificial sequence
<220>
<223> coding sequence for SEQ ID NO: 1
<400> 2
atgtccatct ctgccgccgt ttctttgatc atctgtactt ccattttggg tgttttggtt 60
tacttcttgt tcttgagaag aggtggtggt tctaacggta gaccattgcc accaggtcca 120
agaccatggc caattgtcgg taacttgcca caattgggtc caaagccaca ccaatctatg 180
gctgccttgg ccagagttca cggtccattg atgcacttga agatgggttt cgttcacgtt 240
gttgttgccg cctccgccac cgttgctgaa aagttcttga aggttcacga caccaacttc 300
ttgtctagac caccaaactc cggtgccgaa cacattgctt acaactacaa cgacttggtt 360
ttcgctccac acggtccaag atggagattg ttgagaaaga tttgtgcctt gcacttgttc 420
tcctccaagg ccttggatga cttcagacac gttagagaag aagaagttgg tatcttgatt 480
agaaacttgg cttctgttgg tgaaatgcca gcttctatcg gtcaaatgat gtacgtttgt 540
gccactaacg ctatctctag agtcatgttg ggtagacacg ttttgggtga cgaacacaga 600
ggtgccgccg gtggtggtga taccactgct gaagaattca aggctatggt tgttgaattg 660
atggctttgg ccggtgtttt caacgttggt gatttcattc caccattgaa gggtttggac 720
ttgcaaggtg ttgttgctaa gatgaagaag ttgcaccaaa gattcgacgc tttcttctct 780
ggtatcttgc acgatcacaa gatcaacggt tctaacgccg ctgaaggtca cgttgacttg 840
ttgactactt tgatttcttt gaaggacgtt gacaacaacg gtgaaggtgg taagttgacc 900
gatactgaaa ttaaggcttt gttgttgaac ttgttcactg ctggtactga cactacttct 960
tctactgttg aatgggccat cactgaattg atcagaaacc caaacatttt ggctagagtt 1020
agaaaggaat tggacttgat cgttggtaag gataagttgg ttaaggaatc cgatttgggt 1080
caattgacct acttgcaagc cgttatcaag gaaaacttca gattgcaccc atctactcca 1140
ttgtctttgc caagagtcgc tcaagaatct tgtgaaatca acggttacta catcccaaag 1200
gattctacct tgttggtcaa cgtttgggcc atcggtagag atccaaacgt ttggccagat 1260
ccattggaat tcagaccaga aagattcttg atgggtggtg aaaagccaaa cgttgatgtt 1320
agaggtaacg atttcgaatt gattccattc ggttctggta gaagaatttg tgctggtatg 1380
aacttgggta ttagaatggt tcaattgttg attgctacta tggttcacgc tttcgatttc 1440
gaattggcta acggtcaatt ggccaaggac ttgaacatgg aagaagctta cggtattact 1500
ttgcaaagag ccgacccatt ggttgtccac ccaagaccaa gattggccag acacgtttac 1560
caagctcaag tttaa 1575
<210> 3
<211> 627
<212> PRT
<213> Phanerochaete chrysosporium
<400> 3
Met Ser Pro Leu Leu Ser Ala Val Pro Ala Ala Ala Leu Pro Leu Leu
1 5 10 15
Ala Ala Ala Met Tyr Val Leu Trp Thr Phe Leu Ala Leu Leu Val Arg
20 25 30
Gln Ala Arg Ser Pro Leu Arg His Leu Arg Gly Pro Pro Ser Pro Ser
35 40 45
Phe Leu Val Gly Asn Leu Arg Glu Met His Asp Gln Glu Asn Thr Ala
50 55 60
Leu Phe Ala Arg Trp Glu His Arg Tyr Gly Ser Thr Phe Val Tyr His
65 70 75 80
Gly Phe Leu Gly Gly Ala Arg Leu Leu Thr Thr Asp Pro Val Ala Val
85 90 95
Ala His Ile Leu Ala His Gly Tyr Asp Phe Pro Lys Pro Glu Phe Ile
100 105 110
Arg Asp Ala Leu Ala Ser Met Ala Ala Gly His Glu Gly Leu Leu Val
115 120 125
Val Glu Gly Asp Gly His Arg Arg Gln Arg Lys Ile Leu Ser Pro Ala
130 135 140
Phe Ala Thr Pro His Ile Lys Ser Leu Ser Pro Ile Ile Trp Ser Lys
145 150 155 160
Ala Thr Gln Leu Arg Asp Val Trp Ile Asp Leu Ala Ser Ser Pro Ser
165 170 175
Leu Thr Pro Ala Ala Thr Pro Ser Asp Pro Leu Ala His Ala Glu Glu
180 185 190
Gln Pro Ala Arg Ala Ser Gly Phe Leu Pro Asn Pro Phe Ser Ser Phe
195 200 205
Leu Ser Ser Lys Ala His Pro Arg Ser Ala Leu Pro Arg Ala Glu Ala
210 215 220
His Pro Glu Asp Arg Met Ser Ser Pro Gly Thr Lys Val Asp Val Leu
225 230 235 240
Ala Trp Leu Ala Arg Ala Thr Leu Asp Val Ile Gly Glu Ala Gly Phe
245 250 255
Gly Tyr Ala Phe Asn Ser Val Arg Ala Ala Ala Cys Pro Gly Asp Ala
260 265 270
Ala Glu Asp Glu Leu Ala Arg Ala Phe Ala Val Ile Phe Ser Thr Ala
275 280 285
Arg Lys Phe Arg Leu Ile Thr Val Leu Gln Val Trp Phe Pro Phe Leu
290 295 300
Arg Arg Phe Arg Arg Asn Ser Ala Ala Glu Asp His Ala Arg Ala Thr
305 310 315 320
Met Arg Arg Ile Gly Leu Ala Leu Ile Ala Glu Arg Arg Gln Glu Val
325 330 335
Leu Asp Asp Lys Ala His Ala Ser Gln Glu Ala Met Asp Gly Lys Asp
340 345 350
Leu Leu Thr Val Met Ile Lys Ser Ser Leu Ser Ser Asp Pro Ser Gln
355 360 365
Gln Leu Ser Thr Asn Glu Met Leu Cys Gln Ile Ala Thr Phe Leu Ala
370 375 380
Ala Gly His Glu Thr Ser Ala Ser Ala Leu Ser Trp Ala Leu Tyr Ala
385 390 395 400
Leu Ala Arg Ala Pro Ala Cys Gln His Thr Leu Arg Arg Glu Leu Arg
405 410 415
Ala Leu Thr Leu Pro Ala Asp Pro Ser Ala Ala Asp Leu Gln Ala Val
420 425 430
Leu Ala Leu Pro Tyr Leu Asp Ala Val Val Arg Glu Thr Leu Arg Val
435 440 445
His Ala Pro Val Thr Ser Thr Met Arg Val Ala Ala His Asp Ala Ala
450 455 460
Val Pro Val Gly Thr Pro Phe Arg Asp Ala His Gly Ala Gln His Ala
465 470 475 480
Ala Ile Arg Leu Arg Ala Gly Asp Val Val Thr Leu Pro Leu Gln Ala
485 490 495
Met Asn Lys Ala Arg Ala Leu Trp Gly Ala Asp Ala Ala Cys Phe Arg
500 505 510
Pro Glu Arg Trp Leu Ala His Gly Asp Ala Pro Arg Glu Pro Arg Gly
515 520 525
Leu Trp Gly Gly Val Met Thr Phe Gly Thr Gly Val Val Ala Asn Gly
530 535 540
Asn Arg Ser Cys Ile Gly Tyr Arg Phe Ala Val Asn Glu Ile Lys Leu
545 550 555 560
Phe Leu Tyr Ala Leu Val Arg Asp Ile Glu Phe Thr Ile Asp Pro Trp
565 570 575
Ile Glu Ile Glu Lys Arg Val Asn Val Val Thr Arg Pro Cys Val Lys
580 585 590
Ser Glu Pro His Leu Gly Asn Gln Met Pro Leu Arg Leu Arg Arg Val
595 600 605
Ala Val Glu Glu Thr Val Gly Asp Ser Ser Gly Asp Gly Ala Pro Arg
610 615 620
Thr Val Ser
625
<210> 4
<211> 1884
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 3
<400> 4
atgtccccat tgttgtctgc cgttccagcc gccgctttgc cattgttggc cgccgctatg 60
tacgttttgt ggactttctt ggctttgttg gttagacaag ccagatcccc attgagacac 120
ttgagaggtc caccatctcc atctttcttg gtcggtaact tgagagaaat gcacgaccaa 180
gaaaacaccg ctttgttcgc tagatgggaa cacagatacg gttctacctt cgtctaccac 240
ggtttcttgg gtggtgccag attgttgacc accgacccag tcgccgtcgc ccacatcttg 300
gcccacggtt acgacttccc aaagccagaa ttcatcagag atgccttggc ttctatggcc 360
gccggtcacg aaggtttgtt ggtcgtcgaa ggtgacggtc acaggagaca aagaaagatc 420
ttgtccccag ctttcgccac tccacacatc aagtctttgt ctccaatcat ctggtctaag 480
gctactcaat tgagagatgt ttggattgac ttggcctctt ctccatcctt gactccagct 540
gctaccccat ccgacccatt ggctcacgct gaagaacaac cagctagagc ttctggtttc 600
ttgccaaacc cattctcttc tttcttgtca tctaaggctc acccaagatc cgctttgcca 660
agagctgaag ctcacccaga agatagaatg tcctctccag gtaccaaggt cgacgttttg 720
gcttggttgg ctagagccac tttggacgtc atcggtgaag ccggtttcgg ttacgctttc 780
aactctgtca gagccgctgc ttgtccaggt gacgccgctg aagatgaatt ggctagagct 840
ttcgctgtca tcttctctac tgctagaaag ttcagattga tcactgtctt gcaagtttgg 900
ttcccattct tgagaagatt cagaagaaac tctgctgctg aagatcacgc tagagctact 960
atgagaagaa tcggtttggc tttgatcgct gaaaggagac aagaagtctt ggacgacaag 1020
gctcacgcct ctcaagaagc tatggatggt aaggacttgt tgactgtcat gatcaagtca 1080
tctttgtcat ccgatccatc tcaacaattg tctactaacg aaatgttgtg tcaaatcgct 1140
actttcttgg ctgctggtca cgaaacctct gcttctgctt tgtcttgggc cttgtacgcc 1200
ttggctagag ctccagcttg tcaacacact ttgagaagag aattgagagc tttgactttg 1260
ccagctgacc catctgccgc tgacttgcaa gctgttttgg ctttgccata cttggacgcc 1320
gtcgttagag aaactttgag agttcacgct ccagttactt ctactatgag agtcgctgct 1380
cacgacgccg ctgttccagt cggtactcca ttcagagatg ctcacggtgc tcaacacgcc 1440
gctatcagat tgagagctgg tgacgtcgtc actttgccat tgcaagctat gaacaaggcc 1500
agagctttgt ggggtgccga cgccgcttgt ttcagaccag aaagatggtt ggctcacggt 1560
gacgccccaa gagaaccaag aggtttgtgg ggtggtgtca tgactttcgg taccggtgtc 1620
gtcgctaacg gtaacagatc ttgtattggt tacagattcg ctgttaacga aatcaagttg 1680
ttcttgtacg ccttggttag agacatcgaa ttcactatcg acccatggat cgaaatcgaa 1740
aagagagtta acgtcgtcac cagaccatgt gtcaagtccg aaccacactt gggtaaccaa 1800
atgccattga gattgagaag agtcgctgtt gaagaaactg ttggtgattc ttctggtgac 1860
ggtgctccaa gaactgtttc ttaa 1884
<210> 5
<211> 513
<212> PRT
<213> Petunia x hybrida
<400> 5
Met Ser Glu Ile Leu Ser Leu Ile Leu Tyr Thr Val Ile Phe Ser Phe
1 5 10 15
Leu Leu Gln Phe Ile Leu Arg Ser Phe Phe Arg Lys Arg Tyr Pro Leu
20 25 30
Pro Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Ile Gly Asn Leu Val
35 40 45
His Leu Gly Pro Lys Pro His Gln Ser Thr Ala Ala Met Ala Gln Thr
50 55 60
Tyr Gly Pro Leu Met Tyr Leu Lys Met Gly Phe Val Asp Val Val Val
65 70 75 80
Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala
85 90 95
Asn Phe Ser Ser Arg Pro Pro Asn Ser Gly Ala Glu His Met Ala Tyr
100 105 110
Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met
115 120 125
Leu Arg Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp
130 135 140
Asp Phe Arg His Val Arg Gln Asp Glu Val Lys Thr Leu Thr Arg Ala
145 150 155 160
Leu Ala Ser Ala Gly Gln Lys Pro Val Lys Leu Gly Gln Leu Leu Asn
165 170 175
Val Cys Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val
180 185 190
Phe Ala Asp Gly Ser Gly Asp Val Asp Pro Gln Ala Ala Glu Phe Lys
195 200 205
Ser Met Val Val Glu Met Met Val Val Ala Gly Val Phe Asn Ile Gly
210 215 220
Asp Phe Ile Pro Gln Leu Asn Trp Leu Asp Ile Gln Gly Val Ala Ala
225 230 235 240
Lys Met Lys Lys Leu His Ala Arg Phe Asp Ala Phe Leu Thr Asp Ile
245 250 255
Leu Glu Glu His Lys Gly Lys Ile Phe Gly Glu Met Lys Asp Leu Leu
260 265 270
Ser Thr Leu Ile Ser Leu Lys Asn Asp Asp Ala Asp Asn Asp Gly Gly
275 280 285
Lys Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val
290 295 300
Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu
305 310 315 320
Leu Ile Arg Asn Pro Lys Ile Leu Ala Gln Ala Gln Gln Glu Ile Asp
325 330 335
Lys Val Val Gly Arg Asp Arg Leu Val Gly Glu Leu Asp Leu Ala Gln
340 345 350
Leu Thr Tyr Leu Glu Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro
355 360 365
Ser Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile
370 375 380
Asn Gly Tyr Phe Ile Pro Lys Gly Ser Thr Leu Leu Leu Asn Val Trp
385 390 395 400
Ala Ile Ala Arg Asp Pro Asn Ala Trp Ala Asp Pro Leu Glu Phe Arg
405 410 415
Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Pro Lys Val Asp Val Arg
420 425 430
Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys
435 440 445
Ala Gly Met Asn Leu Gly Ile Arg Met Val Gln Leu Met Ile Ala Thr
450 455 460
Leu Ile His Ala Phe Asn Trp Asp Leu Val Ser Gly Gln Leu Pro Glu
465 470 475 480
Met Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Asp
485 490 495
Pro Leu Val Val His Pro Arg Pro Arg Leu Glu Ala Gln Ala Tyr Ile
500 505 510
Gly
<210> 6
<211> 1542
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 5
<400> 6
atgtccgaaa tcttgtcttt gattttgtac accgtcattt tctctttctt gttgcaattc 60
attttgagat ctttcttcag aaagagatac ccattgccat tgccaccagg tccaaagcca 120
tggccaatta tcggtaactt ggtccacttg ggtccaaagc cacaccaatc tactgctgcc 180
atggctcaaa cttacggtcc attgatgtac ttgaagatgg gtttcgttga cgttgttgtt 240
gctgcctctg cttctgttgc tgctcaattc ttaaagactc acgatgctaa cttctcttct 300
agaccaccaa actctggtgc tgaacacatg gcttacaact accaagattt ggttttcgct 360
ccatacggtc caagatggag aatgttgaga aagatttgtt ctgttcactt gttctctacc 420
aaggctttgg atgacttcag acacgtcaga caagatgaag ttaagacttt gactagagct 480
ttggcttctg ctggtcaaaa gccagtcaag ttgggtcaat tgttgaacgt ttgtactact 540
aacgctttgg ctagagttat gttgggtaag agagttttcg ccgacggttc tggtgatgtt 600
gatccacaag ctgctgaatt caagtctatg gttgttgaaa tgatggttgt cgccggtgtt 660
ttcaacattg gtgatttcat tccacaattg aactggttgg atattcaagg tgttgccgct 720
aagatgaaga agttgcacgc tagattcgac gctttcttga ctgatatctt ggaagaacac 780
aagggtaaga ttttcggtga aatgaaggat ttgttgtcta ctttgatctc tttgaagaac 840
gatgatgctg ataacgatgg tggtaagttg actgatactg aaattaaggc tttgttgttg 900
aacttgttcg ttgctggtac tgacacttct tcttctactg ttgaatgggc cattgctgaa 960
ttgattagaa acccaaagat cttggcccaa gcccaacaag aaatcgacaa ggtcgttggt 1020
agagacagat tggttggtga attggacttg gcccaattga cttacttgga agctatcgtc 1080
aaggaaacct tcagattgca cccatctacc ccattgtctt tgccaagaat tgcttctgaa 1140
tcttgtgaaa tcaacggtta cttcattcca aagggttcta ctttgttgtt gaacgtttgg 1200
gccattgcta gagatccaaa cgcttgggct gatccattgg aattcagacc agaaagattc 1260
ttgccaggtg gtgaaaagcc aaaggttgat gtcagaggta acgacttcga agtcatccca 1320
ttcggtgctg gtagaagaat ttgtgctggt atgaacttgg gtatcagaat ggtccaattg 1380
atgattgcta ctttgatcca cgctttcaac tgggatttgg tatctggtca attgccagaa 1440
atgttgaaca tggaagaagc ttacggtttg accttgcaaa gagctgatcc attggttgtt 1500
cacccaagac caagattgga agcccaagct tacattggtt aa 1542
<210> 7
<211> 519
<212> PRT
<213> Callistephus chinensis
<400> 7
Met Ser Thr Ile Leu Pro Phe Ile Phe Tyr Thr Cys Ile Thr Ala Leu
1 5 10 15
Val Leu Tyr Val Leu Leu Asn Leu Leu Thr Arg Asn Pro Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu
35 40 45
Gly Met Ile Pro His His Ser Leu Ala Ala Leu Ala Gln Lys Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe
85 90 95
Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg
115 120 125
Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe
130 135 140
Arg His Val Arg Glu Glu Glu Val Ala Ile Leu Thr Arg Val Leu Val
145 150 155 160
His Ala Gly Glu Ser Ala Val Lys Leu Gly Gln Leu Leu Asn Val Cys
165 170 175
Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Ala
180 185 190
Asp Gly Ser Glu Gly Arg Gly Val Asp Pro Lys Ala Asp Glu Phe Lys
195 200 205
Asp Met Val Val Glu Leu Met Glu Leu Ala Gly Glu Phe Asn Ile Gly
210 215 220
Asp Phe Ile Pro Pro Leu Asp Cys Leu Asp Leu Gln Gly Ile Thr Lys
225 230 235 240
Lys Met Lys Lys Leu His Ala Arg Phe Asp Lys Phe Leu Asn Ile Ile
245 250 255
Leu Asp Asp His Lys Ile Glu Lys Gly Ala Ala Gly Arg Arg His Ser
260 265 270
Asp Leu Leu Thr Thr Leu Ile Ser Leu Lys Asp Val Asp Ala Ala Asp
275 280 285
Asp Asp Glu Glu Gly Lys Leu Ser Asp Ile Glu Ile Lys Ala Leu Leu
290 295 300
Leu Asn Leu Phe Ala Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu
305 310 315 320
Trp Ala Val Ala Glu Leu Ile Arg His Pro Glu Leu Leu Lys Gln Ala
325 330 335
Arg Glu Glu Met Asp Ile Val Val Gly Arg Asp Arg Leu Val Thr Glu
340 345 350
Leu Asp Leu Ser Arg Leu Thr Phe Leu Gln Ala Ile Val Lys Glu Thr
355 360 365
Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Met Ala Ser
370 375 380
Glu Ser Cys Glu Val Asp Gly Tyr Tyr Ile Pro Lys Gly Ser Thr Leu
385 390 395 400
Leu Val Asn Val Trp Ala Ile Ala Arg Asp Pro Lys Met Trp Thr Asn
405 410 415
Pro Leu Glu Phe Arg Pro Ser Arg Phe Leu Pro Gly Gly Glu Lys Pro
420 425 430
Asp Ala Asp Ile Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala
435 440 445
Gly Arg Arg Ile Cys Ala Gly Met Ser Leu Gly Met Arg Met Val Gln
450 455 460
Leu Leu Ile Ala Thr Leu Val Gln Thr Phe Asp Trp Glu Leu Ala Asn
465 470 475 480
Gly Leu Asp Pro Glu Lys Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr
485 490 495
Leu Gln Arg Ala Glu Pro Leu Met Val His Pro Arg Pro Arg Leu Ser
500 505 510
Pro His Val Tyr Glu Ser Arg
515
<210> 8
<211> 1560
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 7
<400> 8
atgtccacca ttttgccatt cattttctac acttgtatca ctgccttggt tttgtacgtt 60
ttgttgaact tgttgaccag aaacccaaac agattgccac caggtccaac cccatggcca 120
atcgttggta acttgccaca cttgggtatg atcccacacc actctttggc tgccttggcc 180
caaaagtacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt cgttgccgct 240
tctgcttccg ttgctgctca attcttaaag actcacgacg ctaacttcgc ttctagacca 300
ccaaactctg gtgccaagca cattgcctac aactaccaag atttggtttt cgctccatac 360
ggtccaagat ggagaatgtt gagaaagatt tgttctgttc acttgttctc cactaaggct 420
ttggacgact tcagacacgt tagagaagaa gaagttgcta tcttgactag agttttggtc 480
cacgctggtg aatctgctgt taagttgggt caattgttga acgtttgtac cactaacgct 540
ttggctagag ttatgttggg tagaagagtt ttcgctgacg gttctgaagg tagaggtgtc 600
gacccaaagg ctgatgaatt caaggacatg gttgttgaat tgatggaatt ggccggtgaa 660
ttcaacatcg gtgacttcat cccaccattg gactgtttgg atttgcaagg tatcaccaag 720
aagatgaaga agttgcacgc tagattcgac aagttcttga acatcatctt ggacgaccac 780
aagatcgaaa agggtgctgc cggtagaagg cactctgact tgttgaccac tttgatttct 840
ttgaaggatg ttgatgctgc tgatgatgat gaagaaggta agttgtctga cattgaaatc 900
aaggctttgt tgttgaactt gttcgctgct ggtactgaca cttcttcttc taccgttgaa 960
tgggctgttg ccgaattgat tagacaccca gaattgttga agcaagctag agaagaaatg 1020
gatatcgttg ttggtagaga cagattggtt accgaattgg acttgtctag attgactttc 1080
ttgcaagcca ttgttaagga aaccttcaga ttgcacccat ctactccatt gtccttgcca 1140
agaatggctt ctgaatcttg tgaagttgat ggttactaca ttccaaaggg ttccactttg 1200
ttggttaacg tttgggccat cgccagagat ccaaagatgt ggactaaccc attggaattc 1260
agaccatcta gattcttgcc aggtggtgaa aagccagatg ctgatatcaa gggtaacgat 1320
ttcgaagtca tcccattcgg tgccggtaga agaatctgtg ctggtatgtc tttgggtatg 1380
agaatggtcc aattgttgat tgctactttg gtccaaacct tcgattggga attggctaac 1440
ggtttggacc cagaaaagtt gaacatggaa gaagcttacg gtttgacctt gcaaagagct 1500
gaaccattga tggttcaccc aagaccaaga ttgtctccac acgtttacga atctagataa 1560
<210> 9
<211> 511
<212> PRT
<213> Callistephus chinensis
<400> 9
Met Ser Ser Ile Leu Ser Leu Leu Val Tyr Phe Cys Ile Ser Leu Leu
1 5 10 15
Val Ile Ile Ala Leu Val Asn Met Phe Ile Thr Arg His Thr Asn Arg
20 25 30
Leu Pro Pro Gly Pro Ala Pro Trp Pro Val Val Gly Asn Leu Pro His
35 40 45
Leu Gly Ala Ile Pro His His Thr Leu Ala Ala Leu Ala Thr Lys Tyr
50 55 60
Gly Pro Leu Val Tyr Leu Arg Leu Gly Phe Val His Val Val Val Ala
65 70 75 80
Ser Ser Pro Ser Val Ala Ala Gln Phe Leu Lys Val His Asp Leu Lys
85 90 95
Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn
100 105 110
Tyr Gln Asp Met Val Phe Ala Pro Tyr Gly Pro Gln Trp Thr Met Phe
115 120 125
Arg Lys Ile Cys Lys Asp His Leu Phe Ser Ser Lys Ala Leu Asp Asp
130 135 140
Phe Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Ala Arg Gly Leu
145 150 155 160
Ala Gly Ala Gly Arg Ser Lys Val Asn Leu Gly Gln Gln Leu Asn Met
165 170 175
Cys Thr Ala Asn Thr Leu Ala Arg Met Met Leu Asp Lys Arg Val Phe
180 185 190
Gly Asn Glu Ser Gly Gly Asp Asp Pro Lys Ala Asn Glu Phe Lys Glu
195 200 205
Met Ala Thr Glu Leu Met Phe Leu Ala Gly Gln Phe Asn Ile Gly Asp
210 215 220
Tyr Ile Pro Val Leu Asp Trp Leu Asp Leu Gln Gly Ile Val Lys Lys
225 230 235 240
Met Lys Lys Leu His Thr Arg Phe Asp Lys Phe Leu Asp Val Ile Leu
245 250 255
Asp Glu His Lys Val Ile Ala Ser Gly His Ile Asp Met Leu Ser Thr
260 265 270
Leu Ile Ser Leu Lys Asp Asp Thr Ser Val Asp Gly Arg Lys Pro Ser
275 280 285
Asp Ile Glu Ile Lys Ala Leu Leu Leu Glu Leu Phe Val Ala Gly Thr
290 295 300
Asp Thr Ser Ser Asn Thr Val Glu Trp Ala Ile Ala Glu Leu Ile Arg
305 310 315 320
Gln Pro His Leu Leu Lys Arg Ala Gln Glu Glu Met Asp Ser Val Val
325 330 335
Gly Gln Asn Arg Leu Val Thr Glu Met Asp Leu Ser Gln Leu Thr Phe
340 345 350
Leu Gln Ala Ile Val Lys Glu Ala Phe Arg Leu His Pro Ser Thr Pro
355 360 365
Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Val Asp Gly Tyr
370 375 380
Tyr Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Ile Trp Ala Ile Gly
385 390 395 400
Arg His Pro Glu Val Trp Thr Asp Pro Leu Glu Phe Arg Pro Thr Arg
405 410 415
Phe Leu Pro Gly Gly Glu Lys Pro Gly Ile Val Val Lys Val Asn Asp
420 425 430
Phe Glu Val Leu Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Met
435 440 445
Ser Leu Ala Leu Arg Thr Val Gln Leu Leu Met Gly Thr Leu Val Gln
450 455 460
Ala Phe Asp Trp Glu Leu Ala Asn Gly Ile Lys Pro Glu Lys Leu Asn
465 470 475 480
Met Asp Glu Ala Phe Gly Leu Ser Val Gln Arg Ala Glu Pro Leu Val
485 490 495
Val His Pro Arg Pro Arg Leu Pro Pro His Val Tyr Lys Ser Gly
500 505 510
<210> 10
<211> 1536
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 9
<400> 10
atgtcctcta ttttgtcttt gttggtctac ttctgtatct ctttgttggt tatcattgct 60
ttggttaaca tgttcatcac cagacacacc aacagattgc caccaggtcc agccccatgg 120
ccagtcgtcg gtaacttgcc acacttgggt gctattccac accacacttt ggctgctttg 180
gctactaagt acggtccatt ggtttacttg agattgggtt tcgttcacgt tgttgttgcc 240
tcttctccat ccgttgctgc tcaattcttg aaggttcacg acttgaagtt cgcctctaga 300
ccaccaaact ctggtgctaa gcacatcgct tacaactacc aagatatggt tttcgctcca 360
tacggtccac aatggactat gttcagaaag atttgtaagg atcacttgtt ctcttctaag 420
gctttggatg atttcagaca cgttagacaa gaagaagttg ctatcttggc tagaggtttg 480
gctggtgctg gtagatctaa ggttaacttg ggtcaacaat tgaacatgtg taccgctaac 540
actttggcta gaatgatgtt ggacaagaga gttttcggta acgaatctgg tggtgatgat 600
ccaaaggcta acgaattcaa ggaaatggct actgaattga tgttcttggc tggtcaattc 660
aacattggtg actacatccc agttttggac tggttggact tgcaaggtat tgttaagaag 720
atgaagaagt tgcacactag attcgataag ttcttggacg ttatcttgga tgaacacaag 780
gttatcgctt ctggtcacat cgacatgttg tctactttga tttctttgaa ggatgatacc 840
tctgttgacg gtagaaagcc atccgacatc gaaatcaagg ctttgttgtt ggaattgttc 900
gttgctggta ctgacacttc ttctaacacc gttgaatggg ctatcgctga attgattaga 960
caaccacact tgttgaagag agcccaagaa gaaatggact ctgttgttgg tcaaaacaga 1020
ttggttaccg aaatggactt gtctcaattg actttcttgc aagccattgt taaggaagcc 1080
ttcagattgc acccatctac tccattgtcc ttgccaagaa ttgcttccga atcttgtgaa 1140
gttgatggtt actacatccc aaagggttcc actttgttgg ttaacatctg ggccattggt 1200
agacacccag aagtttggac cgacccattg gaattcagac caactagatt cttgccaggt 1260
ggtgaaaagc caggtattgt cgtcaaggtt aacgatttcg aagtcttgcc attcggtgcc 1320
ggtagaagaa tctgtgctgg tatgtctttg gccttgagaa ctgtccaatt gttgatgggt 1380
actttggtcc aagccttcga ttgggaattg gctaacggta tcaagccaga aaagttgaac 1440
atggacgaag ccttcggttt gtctgttcaa agagctgaac cattggttgt tcacccaaga 1500
ccaagattgc caccacacgt ttacaagtct ggttaa 1536
<210> 11
<211> 513
<212> PRT
<213> Gerbera hybrida
<400> 11
Met Ser Thr Pro Leu Thr Leu Leu Ile Gly Thr Cys Val Thr Gly Leu
1 5 10 15
Phe Leu Tyr Val Leu Leu Asn Arg Cys Thr Arg Asn Pro Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Val Val Gly Asn Leu Pro His Leu
35 40 45
Gly Thr Ile Pro His His Ser Leu Ala Ala Met Ala Lys Lys Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe
85 90 95
Ala Asp Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg
115 120 125
Lys Ile Cys Ser Val His Leu Phe Ser Thr Lys Ala Leu Asp Asp Phe
130 135 140
Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Ala Arg Ala Leu Val
145 150 155 160
Gly Ala Gly Lys Ser Pro Val Lys Leu Gly Gln Leu Leu Asn Val Cys
165 170 175
Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Arg Arg Val Phe Asp
180 185 190
Ser Gly Asp Ala Gln Ala Asp Glu Phe Lys Asp Met Val Val Glu Leu
195 200 205
Met Val Leu Ala Gly Glu Phe Asn Ile Gly Asp Phe Ile Pro Val Leu
210 215 220
Asp Trp Leu Asp Leu Gln Gly Val Thr Lys Lys Met Lys Lys Leu His
225 230 235 240
Ala Lys Phe Asp Ser Phe Leu Asn Thr Ile Leu Glu Glu His Lys Thr
245 250 255
Gly Ala Gly Asp Gly Val Ala Ser Gly Lys Val Asp Leu Leu Ser Thr
260 265 270
Leu Ile Ser Leu Lys Asp Asp Ala Asp Gly Glu Gly Gly Lys Leu Ser
275 280 285
Asp Ile Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Thr Ala Gly Thr
290 295 300
Asp Thr Ser Ser Ser Thr Ile Glu Trp Ala Ile Ala Glu Leu Ile Arg
305 310 315 320
Asn Pro Gln Leu Leu Asn Gln Ala Arg Lys Glu Met Asp Thr Ile Val
325 330 335
Gly Gln Asp Arg Leu Val Thr Glu Ser Asp Leu Gly Gln Leu Thr Phe
340 345 350
Leu Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Ser Thr Pro
355 360 365
Leu Ser Leu Pro Arg Met Ala Leu Glu Ser Cys Glu Val Gly Gly Tyr
370 375 380
Tyr Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala Ile Ser
385 390 395 400
Arg Asp Pro Lys Ile Trp Ala Asp Pro Leu Glu Phe Gln Pro Thr Arg
405 410 415
Phe Leu Pro Gly Gly Glu Lys Pro Asn Thr Asp Ile Lys Gly Asn Asp
420 425 430
Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Val Gly Met
435 440 445
Ser Leu Gly Leu Arg Met Val Gln Leu Leu Thr Ala Thr Leu Ile His
450 455 460
Ala Phe Asp Trp Glu Leu Ala Asp Gly Leu Asn Pro Lys Lys Leu Asn
465 470 475 480
Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Val
485 490 495
Val His Pro Arg Pro Arg Leu Ala Pro His Val Tyr Glu Thr Thr Lys
500 505 510
Val
<210> 12
<211> 1542
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO:11
<400> 12
atgtccactc cattgacttt gttgatcggt acctgtgtca ctggtttgtt cttgtacgtt 60
ttgttgaaca gatgtaccag aaacccaaac agattgccac caggtccaac tccatggcca 120
gtcgtcggta acttgccaca cttgggtact atcccacacc actctttggc tgctatggct 180
aagaagtacg gtccattgat gcacttgaga ttgggtttcg tcgacgtcgt tgttgccgcc 240
tccgcctccg tcgccgctca attcttaaag actcacgacg ctaacttcgc cgatagacca 300
ccaaactccg gtgccaagca catcgcttac aactaccaag atttggtttt cgctccatac 360
ggtccaagat ggagaatgtt gagaaagatt tgttctgttc acttgttctc caccaaggct 420
ttggatgatt tcagacacgt cagacaagaa gaagttgcta tcttggctag agctttggtc 480
ggtgccggta agtctccagt taagttgggt caattgttga acgtttgtac cactaacgct 540
ttggctagag ttatgttggg tagaagagtt ttcgactccg gtgatgctca agctgatgaa 600
ttcaaggaca tggttgttga attgatggtt ttggccggtg aattcaacat cggtgacttc 660
atcccagttt tggactggtt ggacttgcaa ggtgttacta agaagatgaa gaagttgcac 720
gctaagttcg actctttctt gaacactatc ttggaagaac acaagaccgg tgccggtgac 780
ggtgtcgctt ctggtaaggt tgacttgttg tctactttga tttctttgaa ggatgacgct 840
gatggtgaag gtggtaagtt gtctgacatt gaaatcaagg ctttgttgtt gaacttgttc 900
actgctggta ctgacacttc ttcttctact attgaatggg ctatcgctga attgattaga 960
aacccacaat tgttgaacca agccagaaag gaaatggaca ccatcgttgg tcaagacaga 1020
ttggttaccg aatctgactt gggtcaattg actttcttgc aagccattat caaggaaact 1080
ttcagattgc acccatctac cccattgtct ttgccaagaa tggctttgga atcttgtgaa 1140
gttggtggtt actacatccc aaagggttcc actttgttgg ttaacgtttg ggccatttct 1200
agagatccaa agatttgggc cgatccattg gaattccaac caactagatt cttgccaggt 1260
ggtgaaaagc caaacactga tatcaagggt aacgatttcg aagtcatccc attcggtgcc 1320
ggtagaagaa tttgtgtcgg tatgtctttg ggtttgagaa tggtccaatt gttgactgct 1380
accttgatcc acgccttcga ttgggaattg gctgatggtt tgaacccaaa gaagttgaac 1440
atggaagaag cttacggttt gaccttgcaa agagccgctc cattggttgt tcacccaaga 1500
ccaagattgg ccccacacgt ttacgaaact actaaggtct aa 1542
<210> 13
<211> 515
<212> PRT
<213> Osteospermum hybrid cultivar
<400> 13
Met Ser Thr Ile Leu Pro Leu Val Leu Tyr Ser Cys Ile Thr Gly Leu
1 5 10 15
Val Ile Tyr Val Leu Leu Asn Leu Arg Thr Arg His Ser Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu
35 40 45
Gly Val Val Pro His His Ser Leu Ala Ala Met Ala Glu Lys Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ala Val Ala Ala Gln Phe Leu Lys Val His Asp Ala Asn Phe
85 90 95
Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Tyr Gly Pro Arg Trp Arg Met Leu
115 120 125
Arg Lys Ile Cys Ser Val His Leu Phe Ser Ser Lys Ala Leu Asp Asp
130 135 140
Phe Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Thr Arg Ala Leu
145 150 155 160
Ile Gly Ala Gly Asp Ser Pro Val Lys Leu Gly Gln Leu Leu Asn Val
165 170 175
Cys Thr Thr Asn Ala Leu Ala Arg Val Met Leu Gly Lys Arg Val Phe
180 185 190
Gly Asp Arg Ser Gly Gly Gly Asp Pro Lys Ala Asp Glu Phe Lys Asp
195 200 205
Met Val Val Glu Val Met Glu Leu Ala Gly Glu Phe Asn Ile Gly Asp
210 215 220
Phe Ile Pro Val Leu Asp Ser Leu Asp Leu Gln Gly Ile Ala Lys Lys
225 230 235 240
Met Lys Glu Leu His Val Arg Phe Asp Ser Phe Leu Gly Lys Ile Leu
245 250 255
Glu Glu His Lys Thr Gly Asn Gly Gly Ala Ser Ser Gln His Thr Asp
260 265 270
Leu Leu Thr Thr Leu Ile Ser Leu Lys Asp Asp Thr Asp Glu Glu Gly
275 280 285
Gly Lys Leu Ser Asp Ile Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe
290 295 300
Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala
305 310 315 320
Glu Leu Ile Arg His Pro Gln Leu Leu Lys Gln Ala Gln Glu Glu Ile
325 330 335
Asp Asn Val Val Gly Arg Asp His Leu Val Thr Glu Leu Asp Leu Thr
340 345 350
Gln Leu Pro Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg Leu His
355 360 365
Pro Ser Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu
370 375 380
Val Asn Gly Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val
385 390 395 400
Trp Ala Ile Ala Arg Asp Pro Lys Met Trp Ser Glu Pro Leu Glu Phe
405 410 415
Arg Pro Ala Arg Phe Leu Pro Gly Gly Glu Lys Pro Asp Ala Asp Val
420 425 430
Lys Gly Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ser
435 440 445
Cys Ala Gly Met Ser Leu Gly Leu Arg Met Val Gln Leu Leu Val Ala
450 455 460
Thr Leu Val Gln Thr Phe Asp Trp Glu Leu Ala Asn Gly Leu Lys Pro
465 470 475 480
Glu Lys Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala
485 490 495
Ala Pro Leu Leu Val His Pro Lys Pro Arg Leu Ala Pro His Val Tyr
500 505 510
Gly Ser Asn
515
<210> 14
<211> 1548
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 13
<400> 14
atgtccacca ttttgccatt ggttttgtac tcttgtatca ctggtttggt tatctacgtt 60
ttgttgaact tgagaaccag acactctaac agattgccac caggtccaac tccatggcca 120
atcgtcggta acttgccaca cttgggtgtt gttccacacc actctttggc tgctatggct 180
gaaaagtacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt tgttgctgct 240
tctgctgccg ttgctgctca attcttgaag gttcacgatg ctaacttcgc ttctagacca 300
ccaaactccg gtgctaagca catcgcttac aactaccaag acttggtttt cgctccatac 360
tacggtccaa gatggagaat gttgagaaag atttgttccg ttcacttgtt ctcttctaag 420
gctttggatg atttcagaca cgtcagacaa gaagaagttg ctatcttgac tagagctttg 480
atcggtgccg gtgactctcc agttaagttg ggtcaattgt tgaacgtttg tactactaac 540
gctttggcta gagttatgtt gggtaagaga gttttcggtg acagatctgg tggtggtgat 600
ccaaaggctg atgaattcaa ggatatggtt gttgaagtta tggaattggc cggtgaattc 660
aacatcggtg atttcatccc agttttggat tctttggatt tgcaaggtat cgctaagaag 720
atgaaggaat tgcacgttag attcgattct ttcttgggta agatcttgga agaacacaag 780
accggtaacg gtggtgcttc ttctcaacac actgacttgt tgactacctt gatttctttg 840
aaggatgata ctgatgaaga aggtggtaag ttgtctgaca ttgaaatcaa ggctttgttg 900
ttgaacttgt tcactgctgg tactgacact tcttcttcta ccgttgaatg ggctatcgcc 960
gaattgatta gacacccaca attgttgaag caagcccaag aagaaatcga caacgttgtt 1020
ggtagagatc acttggttac cgaattggac ttgacccaat tgccattctt gcaagccatt 1080
gttaaggaaa ccttcagatt gcacccatct actccattgt ctttgccaag aattgcttcc 1140
gaatcttgtg aagtcaacgg ttaccacatc ccaaagggtt ccactttgtt ggttaacgtt 1200
tgggccatcg ccagagatcc aaagatgtgg tccgaaccat tggaattcag accagccaga 1260
ttcttgccag gtggtgaaaa gccagatgct gatgttaagg gtaacgattt cgaagtcatc 1320
ccattcggtg ccggtagaag atcttgtgct ggtatgtctt tgggtttgag aatggttcaa 1380
ttgttggttg ctactttggt tcaaaccttc gactgggaat tggctaacgg tttgaagcca 1440
gaaaagttga acatggaaga agcttacggt ttgactttgc aaagagctgc tccattgttg 1500
gttcacccaa agccaagatt ggctccacac gtttacggtt ctaactaa 1548
<210> 15
<211> 539
<212> PRT
<213> Citrus clementina
<400> 15
Met Ser Gln Pro Leu Val Arg Leu Leu Val Pro Phe Leu Arg Phe Leu
1 5 10 15
Trp Glu Thr Lys Gln Arg Ala Met Ser Thr Leu Pro Leu Leu Ile Leu
20 25 30
Tyr Thr Ser Leu Leu Ala Ile Val Ile Ser Phe Leu Phe Ser Leu Leu
35 40 45
Arg Asn Arg Arg Arg His Ser Ser His Arg Leu Pro Pro Gly Pro Lys
50 55 60
Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu Gly Pro Met Pro His
65 70 75 80
Gln Ser Ile Ala Gly Leu Ala Arg Thr His Gly Pro Leu Met Tyr Leu
85 90 95
Arg Leu Gly Phe Val Asp Val Val Val Ala Ala Ser Ala Ser Val Ala
100 105 110
Ala Gln Phe Leu Lys Ile His Asp Ser Asn Phe Ser Asn Arg Pro Pro
115 120 125
Asn Ser Gly Ala Lys His Ile Ala Tyr Asn Tyr Gln Asp Ile Val Phe
130 135 140
Arg Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg Lys Ile Ser Ser Val
145 150 155 160
His Leu Phe Ser Gly Lys Ala Leu Asp Asp Tyr Arg His Val Arg Gln
165 170 175
Glu Glu Met Ala Val Leu Thr Arg Ala Leu Ala Ser Ala Gly Thr Glu
180 185 190
Pro Val Asn Leu Ala Gln Arg Leu Asn Leu Cys Val Val Asn Ala Leu
195 200 205
Gly Arg Val Met Leu Gly Phe Arg Val Phe Gly Asp Gly Thr Gly Gly
210 215 220
Ser Asp Pro Arg Ala Asp Glu Phe Lys Ser Met Val Val Glu Leu Met
225 230 235 240
Val Leu Ala Gly Val Phe Asn Val Gly Asp Phe Val Pro Ala Leu Glu
245 250 255
Arg Leu Asp Leu Gln Gly Val Ala Arg Lys Met Lys Lys Leu His Lys
260 265 270
Arg Phe Asp Val Phe Leu Ser Asp Ile Leu Glu Glu Arg Lys Met Asn
275 280 285
Gly Arg Asp Gly Gly Asn Lys Leu Thr Asp Leu Leu Gly Thr Leu Ile
290 295 300
Ser Leu Met Asp Asp Ala Asn Gly Glu Glu Lys Leu Thr Glu Thr Glu
305 310 315 320
Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly Thr Asp Thr Ser
325 330 335
Ser Ser Thr Ile Glu Trp Ala Ile Ala Glu Leu Ile Arg His Pro Lys
340 345 350
Val Trp Ala Gln Val Gln Gln Glu Leu Asp Ser Val Val Gly Arg Asp
355 360 365
Arg Leu Val Thr Glu Leu Asp Leu Pro Gln Leu Thr Tyr Leu Gln Ala
370 375 380
Val Ile Lys Glu Ile Phe Arg Leu His Pro Ser Thr Pro Leu Ser Leu
385 390 395 400
Pro Arg Ala Ala Ser Glu Ser Cys Lys Ile Asn Gly Tyr Asp Ile Pro
405 410 415
Lys Gly Ser Thr Leu Leu Val Asn Ile Trp Ala Ile Ala Arg Asp Pro
420 425 430
Asn Glu Trp Ala Asp Pro Leu Glu Phe Arg Pro Glu Arg Phe Leu Pro
435 440 445
Gly Gly Glu Lys Tyr Asn Val Asp Val Lys Gly Asn Asp Tyr Glu Leu
450 455 460
Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly Leu Ser Trp Gly
465 470 475 480
Leu Arg Met Val Gln Leu Gly Thr Ala Thr Leu Ala His Ala Phe Asn
485 490 495
Trp Glu Leu Pro Gly Gly Leu Lys Pro Glu Lys Leu Asn Met Asp Glu
500 505 510
Ala Tyr Gly Leu Thr Leu Gln Arg Ala Ala Pro Leu Val Val His Pro
515 520 525
Arg Pro Arg Leu Ser Pro Asn Ala Tyr Gln Ala
530 535
<210> 16
<211> 1620
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 15
<400> 16
atgtcccaac cattggttag attgttggtt ccattcttga gattcttgtg ggaaactaag 60
caaagagcta tgtctacttt gccattgttg atcttgtaca cttctttgtt ggctattgtc 120
atttctttct tgttctcttt gttgagaaac agaaggagac actcctccca cagattgcca 180
ccaggtccaa agccatggcc aatcgtcggt aacttgccac acttgggtcc aatgccacac 240
caatccatcg ctggtttggc cagaacccac ggtccattga tgtacttgag attgggtttc 300
gttgacgtcg tcgttgccgc ttccgcttcc gttgctgccc aattcttgaa gatccacgat 360
tccaacttct ccaacagacc accaaactcc ggtgccaagc acatcgctta caactaccaa 420
gacatcgttt tcagaccata cggtccaaga tggagaatgt tgagaaagat ctcttccgtt 480
cacttgttct ccggtaaggc cttggatgac tacagacacg ttagacaaga agaaatggct 540
gttttgacta gagctttggc ttctgctggt actgaaccag ttaacttggc tcaaagattg 600
aacttgtgtg ttgttaacgc cttgggtaga gttatgttgg gtttcagagt tttcggtgac 660
ggtaccggtg gttctgaccc aagagctgac gaattcaagt ctatggttgt tgaattgatg 720
gttttggctg gtgttttcaa cgtcggtgat ttcgtcccag ccttggaaag attggacttg 780
caaggtgttg ctagaaagat gaagaagttg cacaagagat tcgatgtttt cttgtctgat 840
atcttggaag aaagaaagat gaacggtaga gatggtggta acaagttgac tgacttgttg 900
ggtaccttga tttctttgat ggatgatgct aacggtgaag aaaagttgac tgaaactgaa 960
atcaaggctt tgttgttgaa catgttcact gctggtaccg acacttcttc ttctactatc 1020
gaatgggcca ttgctgaatt gatcagacac ccaaaggtct gggcccaagt ccaacaagaa 1080
ttggattctg ttgttggtag agatagattg gtcaccgaat tggacttgcc acaattgact 1140
tacttgcaag ccgttatcaa ggaaatcttc agattgcacc catctactcc attgtctttg 1200
ccaagagctg cttccgaatc ttgtaagatc aacggttacg atattccaaa gggttccact 1260
ttgttggtca acatctgggc cattgctaga gatccaaacg aatgggccga cccattggaa 1320
ttcagaccag aaagattctt gccaggtggt gaaaagtaca acgttgatgt taagggtaac 1380
gattacgaat tgatcccatt cggtgccggt agaagaattt gtgctggttt gtcttggggt 1440
ttgagaatgg ttcaattggg tactgctact ttggcccacg ctttcaactg ggaattgcca 1500
ggtggtttga agccagaaaa gttgaacatg gacgaagctt acggtttgac cttgcaaaga 1560
gctgctccat tggttgttca cccaagacca agattgtctc caaacgctta ccaagcttaa 1620
<210> 17
<211> 517
<212> PRT
<213> Citrus sinensis
<400> 17
Met Ser Ser Thr Leu Pro Leu Leu Ile Leu Tyr Thr Ser Leu Leu Ala
1 5 10 15
Ile Val Ile Ser Phe Leu Phe Ser Leu Leu Arg Asn Arg Arg Arg His
20 25 30
Ser Ser His Arg Leu Pro Pro Gly Pro Lys Pro Trp Pro Ile Val Gly
35 40 45
Asn Leu Pro His Leu Gly Pro Met Pro His Gln Ser Ile Ala Gly Leu
50 55 60
Ala Arg Thr His Gly Pro Leu Met Tyr Leu Arg Leu Gly Phe Val Asp
65 70 75 80
Val Val Val Ala Ala Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Ile
85 90 95
His Asp Ser Asn Phe Ser Asn Arg Pro Pro Asn Ser Gly Ala Lys His
100 105 110
Ile Ala Tyr Asn Tyr Gln Asp Ile Val Phe Arg Pro Tyr Gly Pro Arg
115 120 125
Trp Arg Met Leu Arg Lys Ile Ser Ser Val His Leu Phe Ser Gly Lys
130 135 140
Ala Leu Asp Asp Tyr Arg His Val Arg Gln Glu Glu Met Ala Val Leu
145 150 155 160
Ala Arg Ala Leu Ala Ser Ala Gly Thr Glu Pro Val Asn Leu Ala Gln
165 170 175
Arg Leu Asn Leu Cys Val Val Asn Ala Leu Gly Arg Val Met Leu Gly
180 185 190
Phe Arg Val Phe Gly Asp Gly Thr Gly Gly Ser Asp Pro Arg Ala Asp
195 200 205
Glu Phe Lys Ser Met Val Val Glu Leu Met Val Leu Ala Gly Val Phe
210 215 220
Asn Val Gly Asp Phe Val Pro Ala Leu Glu Arg Leu Asp Leu Gln Gly
225 230 235 240
Val Ala Arg Lys Met Lys Lys Leu His Lys Arg Phe Asp Val Phe Leu
245 250 255
Ser Asp Ile Leu Glu Glu Arg Lys Met Asn Gly Arg Asp Gly Gly Asn
260 265 270
Lys His Thr Asp Leu Leu Gly Thr Leu Ile Ser Leu Met Asp Asp Ala
275 280 285
Asn Gly Glu Glu Lys Leu Thr Glu Thr Glu Ile Lys Ala Leu Leu Leu
290 295 300
Asn Met Phe Thr Ala Gly Thr Asp Thr Ser Ser Ser Thr Ile Glu Trp
305 310 315 320
Ala Ile Ala Glu Leu Ile Arg His Pro Lys Val Arg Ala Gln Val Gln
325 330 335
Gln Glu Leu Asp Ser Val Val Gly Arg Asp Arg Leu Val Thr Glu Leu
340 345 350
Asp Leu Pro Gln Leu Thr Tyr Leu Gln Ala Val Ile Lys Glu Ile Phe
355 360 365
Arg Leu His Pro Ser Thr Pro Leu Ser Leu Pro Arg Ala Ala Ser Glu
370 375 380
Ser Cys Lys Ile Asn Gly Tyr Asp Ile Pro Lys Gly Ser Thr Leu Leu
385 390 395 400
Val Asn Ile Trp Ala Ile Ala Arg Asp Pro Asn Glu Trp Ala Asp Pro
405 410 415
Leu Glu Phe Arg Pro Glu Arg Phe Leu Pro Gly Gly Glu Lys Tyr Asn
420 425 430
Val Asp Val Lys Gly Asn Asp Tyr Glu Leu Ile Pro Phe Gly Ala Gly
435 440 445
Arg Arg Ile Cys Ala Gly Leu Ser Trp Gly Leu Arg Met Val Gln Leu
450 455 460
Gly Thr Ala Thr Leu Ala His Ala Phe Asn Trp Glu Leu Pro Gly Gly
465 470 475 480
Leu Lys Pro Glu Lys Leu Ser Met Asp Glu Ala Tyr Gly Leu Thr Leu
485 490 495
Gln Arg Ala Ala Pro Leu Val Val His Pro Arg Pro Arg Leu Ser Pro
500 505 510
Asn Ala Tyr Gln Ala
515
<210> 18
<211> 1554
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 17
<400> 18
atgtcctcta ctttgccatt gttgatcttg tacacttctt tgttggctat tgtcatttct 60
ttcttgttct ctttgttgag aaacagaagg agacactcct cccacagatt gccaccaggt 120
ccaaagccat ggccaatcgt cggtaacttg ccacacttgg gtccaatgcc acaccaatcc 180
atcgctggtt tggccagaac ccacggtcca ttgatgtact tgagattggg tttcgttgac 240
gtcgtcgttg ccgcttctgc ttccgttgct gcccaattct tgaagatcca cgattccaac 300
ttctccaaca gaccaccaaa ctccggtgcc aagcacatcg cttacaacta ccaagacatc 360
gttttcagac catacggtcc aagatggaga atgttgagaa agatctcttc cgttcacttg 420
ttctccggta aggccttgga tgactacaga cacgttagac aagaagaaat ggctgttttg 480
gctagagctt tggcttctgc tggtactgaa ccagttaact tggctcaaag attgaacttg 540
tgtgttgtta acgccttggg tagagttatg ttgggtttca gagttttcgg tgacggtacc 600
ggtggttctg acccaagagc tgacgaattc aagtctatgg ttgttgaatt gatggttttg 660
gctggtgttt tcaacgtcgg tgacttcgtc ccagccttgg aaagattgga cttgcaaggt 720
gttgctagaa agatgaagaa gttgcacaag agattcgatg ttttcttgtc tgatatcttg 780
gaagaaagaa agatgaacgg tagagatggt ggtaacaagc acactgactt gttgggtacc 840
ttgatttctt tgatggatga tgctaacggt gaagaaaagt tgactgaaac tgaaatcaag 900
gctttgttgt tgaacatgtt cactgctggt accgacactt cttcttctac tatcgaatgg 960
gccattgctg aattgatcag acacccaaag gtcagagccc aagtccaaca agaattggat 1020
tctgttgttg gtagagatag attggtcacc gaattggact tgccacaatt gacttacttg 1080
caagccgtta tcaaggaaat cttcagattg cacccatcta ctccattgtc tttgccaaga 1140
gctgcttccg aatcttgtaa gatcaacggt tacgatattc caaagggttc cactttgttg 1200
gtcaacatct gggccattgc tagagatcca aacgaatggg ccgacccatt ggaattcaga 1260
ccagaaagat tcttgccagg tggtgaaaag tacaacgttg atgttaaggg taacgattac 1320
gaattgatcc cattcggtgc cggtagaaga atttgtgctg gtttgtcttg gggtttgaga 1380
atggttcaat tgggtactgc tactttggcc cacgctttca actgggaatt gccaggtggt 1440
ttgaagccag aaaagttgtc tatggacgaa gcttacggtt tgaccttgca aagagctgct 1500
ccattggttg ttcacccaag accaagattg tctccaaacg cttaccaagc ttaa 1554
<210> 19
<211> 513
<212> PRT
<213> Pilosella officinarum
<400> 19
Met Ser Thr Leu Leu Ser Leu Ile Ile Tyr Leu Cys Ile Thr Gly Val
1 5 10 15
Thr Ala Tyr Val Leu Val Asn Leu Arg Thr Arg Arg Ala Asn Arg Leu
20 25 30
Pro Pro Gly Pro Thr Pro Trp Pro Ile Val Gly Asn Leu Pro His Leu
35 40 45
Gly Thr Ile Pro His His Ser Leu Ala Asp Leu Ala Thr Arg Tyr Gly
50 55 60
Pro Leu Met His Leu Arg Leu Gly Phe Val Asp Val Val Val Ala Ala
65 70 75 80
Ser Ala Ser Val Ala Ala Gln Phe Leu Lys Thr His Asp Ala Asn Phe
85 90 95
Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr Asn Tyr
100 105 110
Gln Asp Leu Val Phe Ala Pro Tyr Gly Pro Arg Trp Arg Met Leu Arg
115 120 125
Lys Ile Cys Ser Val His Leu Phe Ser Ala Lys Ser Leu Asp Asp Phe
130 135 140
Arg His Val Arg Gln Glu Glu Val Ala Ile Leu Thr Arg Ala Leu Val
145 150 155 160
Gly Ala Gly Lys Ser Thr Val Lys Leu Gly Gln Leu Leu His Val Cys
165 170 175
Thr Thr Asn Ala Leu Val Arg Val Met Leu Gly Arg Arg Val Phe Gly
180 185 190
Asp Gly Ser Gly Gly Gly Asp Pro Lys Ala Asp Glu Phe Lys Asn Met
195 200 205
Val Ile Glu Met Met Val Leu Ala Gly Glu Phe Asn Leu Gly Asp Phe
210 215 220
Ile Pro Val Leu Asp Leu Leu Asp Leu Gln Gly Val Thr Lys Lys Met
225 230 235 240
Lys Lys Leu His Thr Arg Phe Asp Ser Phe Leu Asn Ser Ile Leu Glu
245 250 255
Glu His Arg Thr Ser Ser Gly Gly Ala Ser Gly His Val Asp Leu Leu
260 265 270
Ser Thr Leu Ile Ser Leu Lys Asp Glu Ala Asp Gly Glu Gly Gly Lys
275 280 285
Leu Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Leu Phe Val Ala
290 295 300
Gly Thr Asp Thr Ser Ser Ser Thr Val Glu Trp Ala Ile Ala Glu Leu
305 310 315 320
Ile Arg Asn Pro Gln Leu Leu Lys Gln Ala Gln Gln Glu Leu Asp Thr
325 330 335
Val Val Gly Gln Gly Arg Leu Val Asn Glu Ser Asp Leu Ser Gln Leu
340 345 350
Thr Phe Leu Gln Ala Ile Val Lys Glu Thr Phe Arg Leu His Pro Ser
355 360 365
Thr Pro Leu Ser Leu Pro Arg Ile Ala Ser Glu Ser Cys Glu Ile Asn
370 375 380
Gly Tyr Asn Ile Pro Lys Gly Ser Thr Leu Leu Val Asn Val Trp Ala
385 390 395 400
Ile Ala Arg Asp Pro Lys Met Trp Thr Glu Pro Leu Glu Phe Arg Pro
405 410 415
Ser Arg Phe Leu Pro Asp Gly Glu Lys Pro Asn Ala Asp Val Lys Gly
420 425 430
Asn Asp Phe Glu Val Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala
435 440 445
Gly Met Ser Leu Gly Leu Arg Met Val Gln Leu Leu Thr Ala Thr Leu
450 455 460
Ile Gln Ala Phe Asp Trp Glu Leu Ala Asn Gly Leu Glu Pro Arg Asn
465 470 475 480
Leu Asn Met Glu Glu Ala Tyr Gly Leu Thr Leu Gln Arg Ala Gln Pro
485 490 495
Leu Met Val His Pro Arg Pro Arg Leu Ala Pro His Val Tyr Gly Thr
500 505 510
Gly
<210> 20
<211> 1542
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 19
<400> 20
atgtccacct tgttgtcctt gatcatctac ttgtgtatca ctggtgttac tgcctacgtt 60
ttggttaact tgagaactag aagagctaac agattgccac caggtccaac cccatggcca 120
atcgtcggta acttgccaca cttgggtact attccacacc actctttggc tgatttggct 180
actagatacg gtccattgat gcacttgaga ttgggtttcg ttgacgttgt tgttgccgcc 240
tctgcttccg tcgctgctca attcttaaag actcacgacg ctaacttcgc ttctagacca 300
ccaaactctg gtgctaagca catggcttac aactaccaag atttggtttt cgctccatac 360
ggtccaagat ggagaatgtt gagaaagatt tgttccgttc acttgttctc tgccaagtct 420
ttggatgatt tcagacacgt tagacaagaa gaagttgcta tcttgactag agctttggtc 480
ggtgccggta agtctactgt taagttgggt caattgttgc acgtttgtac cactaacgct 540
ttggttagag ttatgttggg tagaagagtt ttcggtgatg gttctggtgg tggtgatcca 600
aaggctgatg aattcaagaa catggttatt gaaatgatgg ttttggccgg tgaattcaac 660
ttgggtgatt tcatcccagt tttggatttg ttggacttgc aaggtgttac taagaagatg 720
aagaagttgc acactagatt cgattctttc ttgaactcta tcttggaaga acacagaact 780
tcttctggtg gtgcttctgg tcacgtcgat ttgttgtcta ctttgatttc tttgaaggat 840
gaagccgatg gtgaaggtgg taagttgact gacactgaaa ttaaggcttt gttgttgaac 900
ttgttcgttg ctggtactga cacttcttct tctaccgttg aatgggctat cgctgaattg 960
attagaaacc cacaattgtt gaagcaagcc caacaagaat tggacactgt tgttggtcaa 1020
ggtagattgg ttaacgaatc tgacttgtct caattgacct tcttgcaagc cattgttaag 1080
gaaactttca gattgcaccc atctactcca ttgtccttgc caagaatcgc ttccgaatct 1140
tgtgaaatca acggttacaa cattccaaag ggttccactt tgttggttaa cgtttgggcc 1200
atcgctagag atccaaagat gtggaccgaa ccattggaat tcagaccatc cagattcttg 1260
ccagacggtg aaaagccaaa cgctgatgtt aagggtaacg atttcgaagt catcccattc 1320
ggtgctggta gaagaatttg tgctggtatg tctttgggtt tgagaatggt ccaattgttg 1380
accgctactt tgattcaagc cttcgattgg gaattggcta acggtttgga accaagaaac 1440
ttgaacatgg aagaagccta cggtttgacc ttgcaaagag ctcaaccatt gatggttcac 1500
ccaagaccaa gattggcccc acacgtttac ggtactggtt aa 1542
<210> 21
<211> 406
<212> PRT
<213> Streptomyces avermitilis
<400> 21
Met Ser Ala Ala Ala Phe Asp Leu Ala Phe Asp Pro Trp Asp Pro Ala
1 5 10 15
Phe Leu Ala Asp Pro Tyr Pro Ala Tyr Ala Asp Leu Arg Ala Lys Gly
20 25 30
Arg Val His Tyr Tyr Glu Pro Thr Asn Gln Trp Leu Val Pro His His
35 40 45
Ala Asp Val Ser Ala Leu Leu Arg Asp Arg Arg Leu Gly Arg Ala Tyr
50 55 60
Gln His Arg Tyr Thr His Glu Asp Phe Gly Arg Thr Ala Pro Pro Ala
65 70 75 80
Glu His Glu Pro Phe His Thr Leu Asn Asp His Gly Met Leu Asp Leu
85 90 95
Glu Pro Pro Asp His Thr Arg Ile Arg Arg Leu Val Ser Lys Ala Phe
100 105 110
Thr Pro Arg Thr Val Glu Gln Leu Lys Pro Tyr Val Ala Lys Leu Ala
115 120 125
Gly Glu Leu Val Asp Arg Leu Val Ala Ala Gly Gly Gly Asp Leu Leu
130 135 140
Ala Asp Val Ala Glu Pro Leu Pro Val Ala Val Ile Ala Glu Met Leu
145 150 155 160
Gly Ile Pro Glu Ser Asp Arg Ala Pro Leu Arg Pro Trp Ser Ala Asp
165 170 175
Ile Cys Gly Met Tyr Glu Leu Asn Pro Pro Lys Asp Val Ala Ala Lys
180 185 190
Ala Val Arg Ala Ser Val Glu Phe Ser Asp Tyr Leu Arg Glu Leu Ile
195 200 205
Ala Glu Arg Arg Lys Glu Pro Gly Asp Asp Leu Ile Ser Gly Leu Ile
210 215 220
Ala Ala His Asp Glu Gly Asp Arg Leu Thr Glu Gln Glu Met Ile Ser
225 230 235 240
Thr Cys Val Leu Leu Leu Asn Ala Gly His Glu Ala Thr Val Asn Ala
245 250 255
Thr Val Asn Gly Trp Tyr Ala Leu Phe Arg Asn Pro Asp Gln Leu Ala
260 265 270
Ala Leu Arg Ala Asp His Ser Leu Val Pro Ala Ala Val Glu Glu Leu
275 280 285
Met Arg Tyr Asp Thr Pro Leu Gln Leu Phe Glu Arg Trp Val Leu Asp
290 295 300
Glu Ile Glu Ile Asp Gly Thr Thr Val Pro Arg Gly Ala Glu Ile Ala
305 310 315 320
Met Leu Phe Gly Ser Ala Asn His Asp Pro Glu Val Phe Arg Asn Pro
325 330 335
Glu Lys Leu Asp Leu Thr Arg Glu Asp Asn Pro His Ile Ser Phe Ser
340 345 350
Ala Gly Ile His Tyr Cys Ile Gly Ala Pro Leu Ala Arg Ile Glu Leu
355 360 365
Ala Ala Ser Met Thr Ala Leu Leu Glu Lys Ala Pro Thr Leu Gly Leu
370 375 380
Val Ala Glu Pro Lys Arg Lys Pro Asn Phe Val Ile Arg Gly Leu Glu
385 390 395 400
Gly Leu Ser Val Ala Val
405
<210> 22
<211> 1221
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 21
<400> 22
atgtccgctg ctgctttcga cttggccttc gacccatggg acccagcttt cttggccgac 60
ccatacccag cctacgccga tttgagagcc aagggtagag ttcactacta cgaaccaact 120
aaccaatggt tggttccaca ccacgctgac gtttctgctt tgttgagaga cagaagattg 180
ggtagagctt accaacacag atacactcac gaagatttcg gtagaaccgc tccaccagct 240
gaacacgaac cattccacac cttgaacgac cacggtatgt tggacttgga accaccagac 300
cacaccagaa tcagaagatt ggtttctaag gctttcactc caagaaccgt tgaacaattg 360
aagccatacg ttgccaagtt ggccggtgaa ttggttgaca gattggtcgc tgctggtggt 420
ggtgatttgt tggctgatgt cgccgaacca ttgccagttg ccgtcatcgc cgaaatgttg 480
ggtatcccag aatccgacag agccccatta agaccatggt ctgctgacat ctgtggtatg 540
tacgaattga acccaccaaa ggacgttgct gctaaggctg ttagagcttc tgttgaattc 600
tccgactact tgagagaatt gatcgccgaa agaagaaagg aaccaggtga cgatttgatc 660
tctggtttga tcgccgccca cgacgaaggt gacagattga ccgaacaaga aatgatctcc 720
acctgtgtct tgttgttgaa cgctggtcac gaagccaccg tcaacgccac tgtcaacggt 780
tggtacgcct tgttcagaaa cccagaccaa ttggccgcct tgagagccga ccactctttg 840
gttccagccg ccgttgaaga attgatgaga tacgacactc cattgcaatt gttcgaaaga 900
tgggtcttgg acgaaatcga aatcgacggt actactgtcc caagaggtgc tgaaatcgcc 960
atgttgttcg gttccgccaa ccacgaccca gaagttttca gaaacccaga aaagttggac 1020
ttgaccagag aagataaccc acacatttcc ttctctgctg gtatccacta ctgtatcggt 1080
gctccattgg ctagaatcga attggctgct tctatgactg ccttgttgga aaaggcccca 1140
actttgggtt tggttgctga accaaagaga aagccaaact tcgttatcag aggtttggaa 1200
ggtttgtctg tcgctgtcta a 1221
<210> 23
<211> 715
<212> PRT
<213> Catharanthus roseus
<400> 23
Met Ser Asp Ser Ser Ser Glu Lys Leu Ser Pro Phe Glu Leu Met Ser
1 5 10 15
Ala Ile Leu Lys Gly Ala Lys Leu Asp Gly Ser Asn Ser Ser Asp Ser
20 25 30
Gly Val Ala Val Ser Pro Ala Val Met Ala Met Leu Leu Glu Asn Lys
35 40 45
Glu Leu Val Met Ile Leu Thr Thr Ser Val Ala Val Leu Ile Gly Cys
50 55 60
Val Val Val Leu Ile Trp Arg Arg Ser Ser Gly Ser Gly Lys Lys Val
65 70 75 80
Val Glu Pro Pro Lys Leu Ile Val Pro Lys Ser Val Val Glu Pro Glu
85 90 95
Glu Ile Asp Glu Gly Lys Lys Lys Phe Thr Ile Phe Phe Gly Thr Gln
100 105 110
Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Ala Glu Glu Ala Lys
115 120 125
Ala Arg Tyr Glu Lys Ala Val Ile Lys Val Ile Asp Ile Asp Asp Tyr
130 135 140
Ala Ala Asp Asp Glu Glu Tyr Glu Glu Lys Phe Arg Lys Glu Thr Leu
145 150 155 160
Ala Phe Phe Ile Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn
165 170 175
Ala Ala Arg Phe Tyr Lys Trp Phe Val Glu Gly Asn Asp Arg Gly Asp
180 185 190
Trp Leu Lys Asn Leu Gln Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln
195 200 205
Tyr Glu His Phe Asn Lys Ile Ala Lys Val Val Asp Glu Lys Val Ala
210 215 220
Glu Gln Gly Gly Lys Arg Ile Val Pro Leu Val Leu Gly Asp Asp Asp
225 230 235 240
Gln Cys Ile Glu Asp Asp Phe Ala Ala Trp Arg Glu Asn Val Trp Pro
245 250 255
Glu Leu Asp Asn Leu Leu Arg Asp Glu Asp Asp Thr Thr Val Ser Thr
260 265 270
Thr Tyr Thr Ala Ala Ile Pro Glu Tyr Arg Val Val Phe Pro Asp Lys
275 280 285
Ser Asp Ser Leu Ile Ser Glu Ala Asn Gly His Ala Asn Gly Tyr Ala
290 295 300
Asn Gly Asn Thr Val Tyr Asp Ala Gln His Pro Cys Arg Ser Asn Val
305 310 315 320
Ala Val Arg Lys Glu Leu His Thr Pro Ala Ser Asp Arg Ser Cys Thr
325 330 335
His Leu Asp Phe Asp Ile Ala Gly Thr Gly Leu Ser Tyr Gly Thr Gly
340 345 350
Asp His Val Gly Val Tyr Cys Asp Asn Leu Ser Glu Thr Val Glu Glu
355 360 365
Ala Glu Arg Leu Leu Asn Leu Pro Pro Glu Thr Tyr Phe Ser Leu His
370 375 380
Ala Asp Lys Glu Asp Gly Thr Pro Leu Ala Gly Ser Ser Leu Pro Pro
385 390 395 400
Pro Phe Pro Pro Cys Thr Leu Arg Thr Ala Leu Thr Arg Tyr Ala Asp
405 410 415
Leu Leu Asn Thr Pro Lys Lys Ser Ala Leu Leu Ala Leu Ala Ala Tyr
420 425 430
Ala Ser Asp Pro Asn Glu Ala Asp Arg Leu Lys Tyr Leu Ala Ser Pro
435 440 445
Ala Gly Lys Asp Glu Tyr Ala Gln Ser Leu Val Ala Asn Gln Arg Ser
450 455 460
Leu Leu Glu Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly
465 470 475 480
Val Phe Phe Ala Ala Ile Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser
485 490 495
Ile Ser Ser Ser Pro Arg Met Ala Pro Ser Arg Ile His Val Thr Cys
500 505 510
Ala Leu Val Tyr Glu Lys Thr Pro Gly Gly Arg Ile His Lys Gly Val
515 520 525
Cys Ser Thr Trp Met Lys Asn Ala Ile Pro Leu Glu Glu Ser Arg Asp
530 535 540
Cys Ser Trp Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro
545 550 555 560
Ala Asp Pro Lys Val Pro Val Ile Met Ile Gly Pro Gly Thr Gly Leu
565 570 575
Ala Pro Phe Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Lys Glu Glu
580 585 590
Gly Ala Glu Leu Gly Thr Ala Val Phe Phe Phe Gly Cys Arg Asn Arg
595 600 605
Lys Met Asp Tyr Ile Tyr Glu Asp Glu Leu Asn His Phe Leu Glu Ile
610 615 620
Gly Ala Leu Ser Glu Leu Leu Val Ala Phe Ser Arg Glu Gly Pro Thr
625 630 635 640
Lys Gln Tyr Val Gln His Lys Met Ala Glu Lys Ala Ser Asp Ile Trp
645 650 655
Arg Met Ile Ser Asp Gly Ala Tyr Val Tyr Val Cys Gly Asp Ala Lys
660 665 670
Gly Met Ala Arg Asp Val His Arg Thr Leu His Thr Ile Ala Gln Glu
675 680 685
Gln Gly Ser Met Asp Ser Thr Gln Ala Glu Gly Phe Val Lys Asn Leu
690 695 700
Gln Met Thr Gly Arg Tyr Leu Arg Asp Val Trp
705 710 715
<210> 24
<211> 2148
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 23
<400> 24
atgtccgatt cttcttctga aaagttgtct ccattcgaat tgatgtctgc tatcttgaag 60
ggtgctaagt tggatggttc taactcttct gattctggtg ttgctgtttc tccagctgtt 120
atggctatgt tgttggaaaa caaggaattg gttatgattt tgactacttc tgttgctgtt 180
ttgatcggtt gtgtcgttgt tttgatctgg agaagatctt ccggttctgg taagaaggtc 240
gttgaaccac caaagttgat cgttccaaag tctgttgttg aaccagaaga aattgatgaa 300
ggtaagaaga agttcaccat cttcttcggt actcaaactg gtactgctga aggtttcgct 360
aaggctttgg ctgaagaagc caaggctaga tacgaaaagg ctgttatcaa ggttattgat 420
atcgatgatt acgctgctga tgatgaagaa tacgaagaaa agttcagaaa ggaaaccttg 480
gctttcttca tcttggccac ttacggtgat ggtgaaccaa ccgacaacgc tgctagattc 540
tacaagtggt tcgttgaagg taacgataga ggtgactggt tgaagaactt gcaatacggt 600
gttttcggtt tgggtaacag acaatacgaa cacttcaaca agattgctaa ggttgttgat 660
gaaaaggttg ctgaacaagg tggtaagaga attgttccat tggttttggg tgacgatgac 720
caatgtattg aagatgactt cgctgcttgg agagaaaacg tttggccaga attggataac 780
ttgttgagag atgaagatga tactactgtt tctactacct acactgctgc tattccagaa 840
tacagagttg ttttcccaga caagtctgat tctttgattt ctgaagctaa cggtcacgcc 900
aacggttacg ctaacggtaa caccgtttac gatgcccaac acccatgtag atctaacgtt 960
gctgttagaa aggaattgca cactccagct tctgatagat cttgtaccca cttggatttc 1020
gacattgctg gtactggttt gtcttacggt actggtgatc acgttggtgt ttactgtgat 1080
aacttgtctg aaaccgttga agaagctgaa agattgttga acttgccacc agaaacttac 1140
ttctctttgc acgctgataa ggaagatggt accccattgg ctggttcttc tttgccacca 1200
ccattcccac catgtacttt gagaaccgcc ttgactagat acgctgattt gttgaacact 1260
ccaaagaagt ctgctttgtt ggctttggct gcttacgctt ctgatccaaa cgaagccgat 1320
agattgaagt acttggcttc tccagccggt aaggatgaat acgctcaatc tttggttgct 1380
aaccaaagat ctttgttgga agtcatggct gaattcccat ctgctaagcc accattgggt 1440
gttttcttcg ctgctattgc tccaagattg caaccaagat tctactctat ctcttcttct 1500
ccaagaatgg ctccatctag aattcacgtc acttgtgctt tggtttacga aaagactcca 1560
ggtggtagaa ttcacaaggg tgtttgttct acttggatga agaacgccat tccattggaa 1620
gaatctagag actgttcttg ggctccaatc ttcgtcagac aatctaactt caagttgcca 1680
gccgatccaa aggttccagt tatcatgatc ggtccaggta ctggtttggc tccattcaga 1740
ggtttcttgc aagaaagatt ggctttgaag gaagaaggtg ctgaattggg tactgctgtt 1800
ttcttcttcg gttgtagaaa cagaaagatg gattacatct acgaagatga attgaaccac 1860
ttcttggaaa ttggtgcttt gtccgaattg ttggttgctt tctctagaga aggtccaact 1920
aagcaatacg ttcaacacaa gatggctgaa aaggcttctg atatttggag aatgatttct 1980
gatggtgctt acgtttacgt ctgtggtgat gccaagggta tggccagaga tgtccacaga 2040
actttgcaca ccattgctca agaacaaggt tctatggatt ctactcaagc tgaaggtttc 2100
gttaagaact tgcaaatgac cggtagatac ttgagagatg tctggtaa 2148
<210> 25
<211> 692
<212> PRT
<213> Saccharomyces cerevisiae
<400> 25
Met Ser Pro Phe Gly Ile Asp Asn Thr Asp Phe Thr Val Leu Ala Gly
1 5 10 15
Leu Val Leu Ala Val Leu Leu Tyr Val Lys Arg Asn Ser Ile Lys Glu
20 25 30
Leu Leu Met Ser Asp Asp Gly Asp Ile Thr Ala Val Ser Ser Gly Asn
35 40 45
Arg Asp Ile Ala Gln Val Val Thr Glu Asn Asn Lys Asn Tyr Leu Val
50 55 60
Leu Tyr Ala Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Lys Lys Phe
65 70 75 80
Ser Lys Glu Leu Val Ala Lys Phe Asn Leu Asn Val Met Cys Ala Asp
85 90 95
Val Glu Asn Tyr Asp Phe Glu Ser Leu Asn Asp Val Pro Val Ile Val
100 105 110
Ser Ile Phe Ile Ser Thr Tyr Gly Glu Gly Asp Phe Pro Asp Gly Ala
115 120 125
Val Asn Phe Glu Asp Phe Ile Cys Asn Ala Glu Ala Gly Ala Leu Ser
130 135 140
Asn Leu Arg Tyr Asn Met Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe
145 150 155 160
Phe Asn Gly Ala Ala Lys Lys Ala Glu Lys His Leu Ser Ala Ala Gly
165 170 175
Ala Ile Arg Leu Gly Lys Leu Gly Glu Ala Asp Asp Gly Ala Gly Thr
180 185 190
Thr Asp Glu Asp Tyr Met Ala Trp Lys Asp Ser Ile Leu Glu Val Leu
195 200 205
Lys Asp Glu Leu His Leu Asp Glu Gln Glu Ala Lys Phe Thr Ser Gln
210 215 220
Phe Gln Tyr Thr Val Leu Asn Glu Ile Thr Asp Ser Met Ser Leu Gly
225 230 235 240
Glu Pro Ser Ala His Tyr Leu Pro Ser His Gln Leu Asn Arg Asn Ala
245 250 255
Asp Gly Ile Gln Leu Gly Pro Phe Asp Leu Ser Gln Pro Tyr Ile Ala
260 265 270
Pro Ile Val Lys Ser Arg Glu Leu Phe Ser Ser Asn Asp Arg Asn Cys
275 280 285
Ile His Ser Glu Phe Asp Leu Ser Gly Ser Asn Ile Lys Tyr Ser Thr
290 295 300
Gly Asp His Leu Ala Val Trp Pro Ser Asn Pro Leu Glu Lys Val Glu
305 310 315 320
Gln Phe Leu Ser Ile Phe Asn Leu Asp Pro Glu Thr Ile Phe Asp Leu
325 330 335
Lys Pro Leu Asp Pro Thr Val Lys Val Pro Phe Pro Thr Pro Thr Thr
340 345 350
Ile Gly Ala Ala Ile Lys His Tyr Leu Glu Ile Thr Gly Pro Val Ser
355 360 365
Arg Gln Leu Phe Ser Ser Leu Ile Gln Phe Ala Pro Asn Ala Asp Val
370 375 380
Lys Glu Lys Leu Thr Leu Leu Ser Lys Asp Lys Asp Gln Phe Ala Val
385 390 395 400
Glu Ile Thr Ser Lys Tyr Phe Asn Ile Ala Asp Ala Leu Lys Tyr Leu
405 410 415
Ser Asp Gly Ala Lys Trp Asp Thr Val Pro Met Gln Phe Leu Val Glu
420 425 430
Ser Val Pro Gln Met Thr Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Ser
435 440 445
Leu Ser Glu Lys Gln Thr Val His Val Thr Ser Ile Val Glu Asn Phe
450 455 460
Pro Asn Pro Glu Leu Pro Asp Ala Pro Pro Val Val Gly Val Thr Thr
465 470 475 480
Asn Leu Leu Arg Asn Ile Gln Leu Ala Gln Asn Asn Val Asn Ile Ala
485 490 495
Glu Thr Asn Leu Pro Val His Tyr Asp Leu Asn Gly Pro Arg Lys Leu
500 505 510
Phe Ala Asn Tyr Lys Leu Pro Val His Val Arg Arg Ser Asn Phe Arg
515 520 525
Leu Pro Ser Asn Pro Ser Thr Pro Val Ile Met Ile Gly Pro Gly Thr
530 535 540
Gly Val Ala Pro Phe Arg Gly Phe Ile Arg Glu Arg Val Ala Phe Leu
545 550 555 560
Glu Ser Gln Lys Lys Gly Gly Asn Asn Val Ser Leu Gly Lys His Ile
565 570 575
Leu Phe Tyr Gly Ser Arg Asn Thr Asp Asp Phe Leu Tyr Gln Asp Glu
580 585 590
Trp Pro Glu Tyr Ala Lys Lys Leu Asp Gly Ser Phe Glu Met Val Val
595 600 605
Ala His Ser Arg Leu Pro Asn Thr Lys Lys Val Tyr Val Gln Asp Lys
610 615 620
Leu Lys Asp Tyr Glu Asp Gln Val Phe Glu Met Ile Asn Asn Gly Ala
625 630 635 640
Phe Ile Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Lys Gly Val Ser
645 650 655
Thr Ala Leu Val Gly Ile Leu Ser Arg Gly Lys Ser Ile Thr Thr Asp
660 665 670
Glu Ala Thr Glu Leu Ile Lys Met Leu Lys Thr Ser Gly Arg Tyr Gln
675 680 685
Glu Asp Val Trp
690
<210> 26
<211> 2079
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 25
<400> 26
atgtccccgt ttggaataga caacaccgac ttcactgtcc tggcggggct agtgcttgcc 60
gtgctactgt acgtaaagag aaactccatc aaggaactgc tgatgtccga tgacggagat 120
atcacagctg tcagctcggg caacagagac attgctcagg tggtgaccga aaacaacaag 180
aactacttgg tgttgtatgc gtcgcagact gggactgccg aggattacgc caaaaagttt 240
tccaaggagc tggtggccaa gttcaaccta aacgtgatgt gcgcagatgt tgagaactac 300
gactttgagt cgctaaacga tgtgcccgtc atagtctcga tttttatctc tacatatggt 360
gaaggagact tccccgacgg ggcggtcaac tttgaggact ttatttgtaa tgcggaagcg 420
ggtgcactat cgaacctgag gtataatatg tttggtctgg gaaattctac ttatgaattc 480
tttaatggtg ccgccaagaa ggccgagaag catctctccg ccgcgggcgc tatcagacta 540
ggcaagctcg gtgaagctga tgatggtgca ggaactacag acgaagatta catggcctgg 600
aaggactcca tcctggaggt tttgaaagac gaactgcatt tggacgaaca ggaagccaag 660
ttcacctctc aattccagta cactgtgttg aacgaaatca ctgactccat gtcgcttggt 720
gaaccctctg ctcactattt gccctcgcat cagttgaacc gcaacgcaga cggcatccaa 780
ttgggtccct tcgatttgtc tcaaccgtat attgcaccca tcgtgaaatc tcgcgaactg 840
ttctcttcca atgaccgtaa ttgcatccac tctgaatttg acttgtccgg ctctaacatc 900
aagtactcca ctggtgacca tcttgctgtt tggccttcca acccattgga aaaggtcgaa 960
cagttcttat ccatattcaa cctggaccct gaaaccattt ttgacttgaa gcccctggat 1020
cccaccgtca aagtgccctt cccaacgcca actactattg gcgctgctat taaacactat 1080
ttggaaatta caggacctgt ctccagacaa ttgttttcat ctttgattca gttcgccccc 1140
aacgctgacg tcaaggaaaa attgactctg ctttcgaaag acaaggacca attcgccgtc 1200
gagataacct ccaaatattt caacatcgca gatgctctga aatatttgtc tgatggcgcc 1260
aaatgggaca ccgtacccat gcaattcttg gtcgaatcag ttccccaaat gactcctcgt 1320
tactactcta tctcttcctc ttctctgtct gaaaagcaaa ccgtccatgt cacctccatt 1380
gtggaaaact ttcctaaccc agaattgcct gatgctcctc cagttgttgg tgttacgact 1440
aacttgttaa gaaacattca attggctcaa aacaatgtta acattgccga aactaaccta 1500
cctgttcact acgatttaaa tggcccacgt aaacttttcg ccaattacaa attgcccgtc 1560
cacgttcgtc gttctaactt cagattgcct tccaaccctt ccaccccagt tatcatgatc 1620
ggtccaggta ccggtgttgc cccattccgt gggtttatca gagagcgtgt cgcgttcctc 1680
gaatcacaaa agaagggcgg taacaacgtt tcgctaggta agcatatact gttttatgga 1740
tcccgtaaca ctgatgattt cttgtaccag gacgaatggc cagaatacgc caaaaaattg 1800
gatggttcgt tcgaaatggt cgtggcccat tccaggttgc caaacaccaa aaaagtttat 1860
gttcaagata aattaaagga ttacgaggac caagtatttg aaatgattaa caacggtgca 1920
tttatctacg tctgtggtga tgcaaagggt atggccaagg gtgtgtcaac cgcattggtt 1980
ggcatcttat cccgtggtaa atccattacc actgatgaag caacagagct aatcaagatg 2040
ctcaagactt caggtagata ccaagaagat gtctggtaa 2079
<210> 27
<211> 658
<212> PRT
<213> artificial
<220>
<223> chimeric cytochrome P450 reductase
<400> 27
Met Ser Pro Phe Gly Ile Asp Asn Thr Asp Phe Thr Val Leu Ala Gly
1 5 10 15
Leu Val Leu Ala Val Leu Leu Tyr Val Lys Arg Asn Ser Ile Lys Glu
20 25 30
Leu Leu Met Ser Asp Asp Gly Asp Ile Thr Ala Val Ser Ser Gly Asn
35 40 45
Arg Asp Ile Ala Gln Val Val Thr Glu Asn Asn Lys Asn Tyr Leu Val
50 55 60
Leu Tyr Ala Ser Gln Thr Gly Thr Ala Glu Asp Tyr Ala Lys Lys Phe
65 70 75 80
Ser Lys Glu Leu Val Ala Lys Phe Asn Leu Asn Val Met Cys Ala Asp
85 90 95
Val Glu Asn Tyr Asp Phe Glu Ser Leu Asn Asp Val Pro Val Ile Val
100 105 110
Ser Ile Phe Ile Ser Thr Tyr Gly Glu Gly Asp Phe Pro Asp Gly Ala
115 120 125
Val Asn Phe Glu Asp Phe Ile Cys Asn Ala Glu Ala Gly Ala Leu Ser
130 135 140
Asn Leu Arg Tyr Asn Met Phe Gly Leu Gly Asn Ser Thr Tyr Glu Phe
145 150 155 160
Phe Asn Gly Ala Ala Lys Lys Ala Glu Lys His Leu Ser Ala Ala Gly
165 170 175
Ala Ile Arg Leu Gly Lys Leu Gly Glu Ala Asp Asp Gly Ala Gly Thr
180 185 190
Thr Asp Glu Asp Tyr Met Ala Trp Lys Asp Ser Ile Leu Glu Val Leu
195 200 205
Lys Asp Glu Leu Gly Val Glu Ala Thr Gly Glu Glu Ser Ser Ile Arg
210 215 220
Gln Tyr Glu Leu Val Val His Thr Asp Ile Asp Ala Ala Lys Val Tyr
225 230 235 240
Met Gly Glu Met Gly Arg Leu Lys Ser Tyr Glu Asn Gln Lys Pro Pro
245 250 255
Phe Asp Ala Lys Asn Pro Phe Leu Ala Ala Val Thr Thr Asn Arg Lys
260 265 270
Leu Asn Gln Gly Thr Glu Arg His Leu Met His Leu Glu Leu Asp Ile
275 280 285
Ser Asp Ser Lys Ile Arg Tyr Glu Ser Gly Asp His Val Ala Val Tyr
290 295 300
Pro Ala Asn Asp Ser Ala Leu Val Asn Gln Leu Gly Lys Ile Leu Gly
305 310 315 320
Ala Asp Leu Asp Val Val Met Ser Leu Asn Asn Leu Asp Glu Glu Ser
325 330 335
Asn Lys Lys His Pro Phe Pro Cys Pro Thr Ser Tyr Arg Thr Ala Leu
340 345 350
Thr Tyr Tyr Leu Asp Ile Thr Asn Pro Pro Arg Thr Asn Val Leu Tyr
355 360 365
Glu Leu Ala Gln Tyr Ala Ser Glu Pro Ser Glu Gln Glu Leu Leu Arg
370 375 380
Lys Met Ala Ser Ser Ser Gly Glu Gly Lys Glu Leu Tyr Leu Ser Trp
385 390 395 400
Val Val Glu Ala Arg Arg His Ile Leu Ala Ile Leu Gln Asp Cys Pro
405 410 415
Ser Leu Arg Pro Pro Ile Asp His Leu Cys Glu Leu Leu Pro Arg Leu
420 425 430
Gln Ala Arg Tyr Tyr Ser Ile Ala Ser Ser Ser Lys Val His Pro Asn
435 440 445
Ser Val His Ile Cys Ala Val Val Val Glu Tyr Glu Thr Lys Ala Gly
450 455 460
Arg Ile Asn Lys Gly Val Ala Thr Asn Trp Leu Arg Ala Lys Glu Pro
465 470 475 480
Ala Gly Glu Asn Gly Gly Arg Ala Leu Val Pro Met Phe Val Arg Lys
485 490 495
Ser Gln Phe Arg Leu Pro Phe Lys Ala Thr Thr Pro Val Ile Met Val
500 505 510
Gly Pro Gly Thr Gly Val Ala Pro Phe Ile Gly Phe Ile Gln Glu Arg
515 520 525
Ala Trp Leu Arg Gln Gln Gly Lys Glu Val Gly Glu Thr Leu Leu Tyr
530 535 540
Tyr Gly Cys Arg Arg Ser Asp Glu Asp Tyr Leu Tyr Arg Glu Glu Leu
545 550 555 560
Ala Gln Phe His Arg Asp Gly Ala Leu Thr Gln Leu Asn Val Ala Phe
565 570 575
Ser Arg Glu Gln Ser His Lys Val Tyr Val Gln His Leu Leu Lys Gln
580 585 590
Asp Arg Glu His Leu Trp Lys Leu Ile Glu Gly Gly Ala His Ile Tyr
595 600 605
Val Cys Gly Asp Ala Arg Asn Met Ala Arg Asp Val Gln Asn Thr Phe
610 615 620
Tyr Asp Ile Val Ala Glu Leu Gly Ala Met Glu His Ala Gln Ala Val
625 630 635 640
Asp Tyr Ile Lys Lys Leu Met Thr Lys Gly Arg Tyr Ser Leu Asp Val
645 650 655
Trp Ser
<210> 28
<211> 1977
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 27
<400> 28
atgtccccat tcggtatcga caacaccgac ttcactgtct tggctggttt ggttttggcc 60
gttttgttgt acgttaagag aaactccatc aaggaattgt tgatgtccga tgacggtgat 120
atcactgctg tctcttctgg taacagagac attgctcaag ttgttaccga aaacaacaag 180
aactacttgg ttttgtacgc ttctcaaact ggtactgccg aagattacgc caagaagttc 240
tccaaggaat tggttgccaa gttcaacttg aacgttatgt gtgctgatgt tgaaaactac 300
gacttcgaat ctttgaacga tgttccagtc atcgtatcta ttttcatctc tacttacggt 360
gaaggtgact tcccagacgg tgctgtcaac ttcgaagatt tcatttgtaa cgctgaagct 420
ggtgctttgt ctaacttgag atacaacatg ttcggtttgg gtaactctac ttacgaattc 480
ttcaacggtg ccgccaagaa ggccgaaaag cacttgtccg ccgctggtgc tatcagattg 540
ggtaagttgg gtgaagctga tgatggtgct ggtactactg acgaagatta catggcctgg 600
aaggactcca tcttggaagt tttgaaggac gaattgggtg ttgaagccac tggtgaagaa 660
tcctctatta gacaatacga attggttgtc cacaccgaca tcgatgctgc caaggtttac 720
atgggtgaaa tgggtagatt gaagtcttac gaaaaccaaa agccaccatt cgatgccaag 780
aacccattct tggctgctgt caccaccaac agaaagttga accaaggtac cgaaagacac 840
ttgatgcact tggaattgga catctctgac tccaagatca gatacgaatc tggtgaccac 900
gttgctgttt acccagccaa cgactctgct ttggtcaacc aattgggtaa gatcttgggt 960
gccgacttgg acgtcgtcat gtccttgaac aacttggatg aagaatccaa caagaagcac 1020
ccattcccat gtccaacttc ctacagaact gccttgacct actacttgga catcaccaac 1080
ccaccaagaa ccaacgtttt gtacgaattg gctcaatacg cctctgaacc atctgaacaa 1140
gaattgttga gaaagatggc ctcctcctcc ggtgaaggta aggaattgta cttgtcttgg 1200
gttgttgaag ccaggagaca catcttggcc atcttgcaag actgtccatc cttaagacca 1260
ccaatcgacc acttgtgtga attgttgcca agattgcaag ccagatacta ctccatcgcc 1320
tcttcctcca aggtccaccc aaactctgtt cacatctgtg ctgttgttgt tgaatacgaa 1380
accaaggctg gtagaatcaa caagggtgtt gccaccaact ggttgagagc caaggaacca 1440
gccggtgaaa acggtggtag agctttggtt ccaatgttcg ttagaaagtc ccaattcaga 1500
ttgccattca aggccaccac tccagtcatc atggttggtc caggtaccgg tgttgctcca 1560
ttcatcggtt tcatccaaga aagagcctgg ttgagacaac aaggtaagga agttggtgaa 1620
actttgttgt actacggttg tagaagatct gatgaagatt acttgtacag agaagaattg 1680
gctcaattcc acagagatgg tgctttgacc caattgaacg ttgccttctc cagagaacaa 1740
tcccacaagg tctacgtcca acacttgttg aagcaagaca gagaacactt gtggaagttg 1800
atcgaaggtg gtgcccacat ctacgtctgt ggtgatgcta gaaacatggc cagagatgtt 1860
caaaacacct tctacgacat cgttgctgaa ttgggtgcca tggaacacgc tcaagctgtt 1920
gactacatca agaagttgat gaccaagggt agatactcct tggacgtttg gtcttaa 1977
<210> 29
<211> 693
<212> PRT
<213> Arabidopsis thaliana
<400> 29
Met Ser Thr Ser Ala Leu Tyr Ala Ser Asp Leu Phe Lys Gln Leu Lys
1 5 10 15
Ser Ile Met Gly Thr Asp Ser Leu Ser Asp Asp Val Val Leu Val Ile
20 25 30
Ala Thr Thr Ser Leu Ala Leu Val Ala Gly Phe Val Val Leu Leu Trp
35 40 45
Lys Lys Thr Thr Ala Asp Arg Ser Gly Glu Leu Lys Pro Leu Met Ile
50 55 60
Pro Lys Ser Leu Met Ala Lys Asp Glu Asp Asp Asp Leu Asp Leu Gly
65 70 75 80
Ser Gly Lys Thr Arg Val Ser Ile Phe Phe Gly Thr Gln Thr Gly Thr
85 90 95
Ala Glu Gly Phe Ala Lys Ala Leu Ser Glu Glu Ile Lys Ala Arg Tyr
100 105 110
Glu Lys Ala Ala Val Lys Val Ile Asp Leu Asp Asp Tyr Ala Ala Asp
115 120 125
Asp Asp Gln Tyr Glu Glu Lys Leu Lys Lys Glu Thr Leu Ala Phe Phe
130 135 140
Cys Val Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg
145 150 155 160
Phe Tyr Lys Trp Phe Thr Glu Glu Asn Glu Arg Asp Ile Lys Leu Gln
165 170 175
Gln Leu Ala Tyr Gly Val Phe Ala Leu Gly Asn Arg Gln Tyr Glu His
180 185 190
Phe Asn Lys Ile Gly Ile Val Leu Asp Glu Glu Leu Cys Lys Lys Gly
195 200 205
Ala Lys Arg Leu Ile Glu Val Gly Leu Gly Asp Asp Asp Gln Ser Ile
210 215 220
Glu Asp Asp Phe Asn Ala Trp Lys Glu Ser Leu Trp Ser Glu Leu Asp
225 230 235 240
Lys Leu Leu Lys Asp Glu Asp Asp Lys Ser Val Ala Thr Pro Tyr Thr
245 250 255
Ala Val Ile Pro Glu Tyr Arg Val Val Thr His Asp Pro Arg Phe Thr
260 265 270
Thr Gln Lys Ser Met Glu Ser Asn Val Ala Asn Gly Asn Thr Thr Ile
275 280 285
Asp Ile His His Pro Cys Arg Val Asp Val Ala Val Gln Lys Glu Leu
290 295 300
His Thr His Glu Ser Asp Arg Ser Cys Ile His Leu Glu Phe Asp Ile
305 310 315 320
Ser Arg Thr Gly Ile Thr Tyr Glu Thr Gly Asp His Val Gly Val Tyr
325 330 335
Ala Glu Asn His Val Glu Ile Val Glu Glu Ala Gly Lys Leu Leu Gly
340 345 350
His Ser Leu Asp Leu Val Phe Ser Ile His Ala Asp Lys Glu Asp Gly
355 360 365
Ser Pro Leu Glu Ser Ala Val Pro Pro Pro Phe Pro Gly Pro Cys Thr
370 375 380
Leu Gly Thr Gly Leu Ala Arg Tyr Ala Asp Leu Leu Asn Pro Pro Arg
385 390 395 400
Lys Ser Ala Leu Val Ala Leu Ala Ala Tyr Ala Thr Glu Pro Ser Glu
405 410 415
Ala Glu Lys Leu Lys His Leu Thr Ser Pro Asp Gly Lys Asp Glu Tyr
420 425 430
Ser Gln Trp Ile Val Ala Ser Gln Arg Ser Leu Leu Glu Val Met Ala
435 440 445
Ala Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe Ala Ala Ile
450 455 460
Ala Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Arg
465 470 475 480
Leu Ala Pro Ser Arg Val His Val Thr Ser Ala Leu Val Tyr Gly Pro
485 490 495
Thr Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr Trp Met Lys
500 505 510
Asn Ala Val Pro Ala Glu Lys Ser His Glu Cys Ser Gly Ala Pro Ile
515 520 525
Phe Ile Arg Ala Ser Asn Phe Lys Leu Pro Ser Asn Pro Ser Thr Pro
530 535 540
Ile Val Met Val Gly Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe
545 550 555 560
Leu Gln Glu Arg Met Ala Leu Lys Glu Asp Gly Glu Glu Leu Gly Ser
565 570 575
Ser Leu Leu Phe Phe Gly Cys Arg Asn Arg Gln Met Asp Phe Ile Tyr
580 585 590
Glu Asp Glu Leu Asn Asn Phe Val Asp Gln Gly Val Ile Ser Glu Leu
595 600 605
Ile Met Ala Phe Ser Arg Glu Gly Ala Gln Lys Glu Tyr Val Gln His
610 615 620
Lys Met Met Glu Lys Ala Ala Gln Val Trp Asp Leu Ile Lys Glu Glu
625 630 635 640
Gly Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala Arg Asp Val
645 650 655
His Arg Thr Leu His Thr Ile Val Gln Glu Gln Glu Gly Val Ser Ser
660 665 670
Ser Glu Ala Glu Ala Ile Val Lys Lys Leu Gln Thr Glu Gly Arg Tyr
675 680 685
Leu Arg Asp Val Trp
690
<210> 30
<211> 2082
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 29
<400> 30
atgtccactt ctgctttgta cgcttccgat ttgttcaagc aattgaagtc tattatgggt 60
actgattctt tgtccgacga tgttgttttg gttattgcta ctacttcttt ggctttggtt 120
gctggtttcg ttgttttgtt gtggaagaaa actactgctg atagatctgg tgaattgaag 180
ccattgatga tcccaaagtc tttgatggct aaggacgaag atgatgattt ggatttgggt 240
tccggtaaga ctagagtctc tatcttcttc ggtactcaaa ctggtactgc tgaaggtttc 300
gctaaggctt tgtccgaaga aatcaaggct agatacgaaa aggctgctgt caaggtcatt 360
gacttggatg actacgctgc cgatgatgac caatacgaag aaaagttgaa gaaggaaact 420
ttggctttct tctgtgttgc tacttacggt gatggtgaac caactgacaa cgctgccaga 480
ttctacaagt ggttcactga agaaaacgaa agagatatca agttgcaaca attggcttac 540
ggtgttttcg ctttgggtaa cagacaatac gaacacttca acaagatcgg tatcgttttg 600
gatgaagaat tgtgtaagaa gggtgctaag agattgattg aagtcggttt gggtgatgat 660
gatcaatcta ttgaagatga tttcaacgcc tggaaggaat ctttgtggtc tgaattggac 720
aagttgttga aggacgaaga tgataagtct gttgctactc catacactgc tgttattcca 780
gaatacagag ttgttactca cgatccaaga ttcactactc aaaagtctat ggaatctaac 840
gttgccaacg gtaacactac tattgacatt caccacccat gtagagttga tgttgctgtt 900
caaaaggaat tgcacactca cgaatctgat agatcttgta ttcacttgga attcgacatc 960
tccagaactg gtattactta cgaaactggt gaccacgttg gtgtttacgc tgaaaaccac 1020
gttgaaatcg ttgaagaagc tggtaagttg ttgggtcact ctttggattt ggttttctcc 1080
atccacgctg acaaggaaga tggttcccca ttggaatctg ctgttccacc accattccca 1140
ggtccatgta ctttgggtac tggtttggct agatacgctg acttgttgaa cccaccaaga 1200
aagtctgctt tggttgcctt ggctgcctac gccactgaac catctgaagc cgaaaagttg 1260
aagcacttga cttctccaga tggtaaggat gaatactctc aatggattgt tgcttctcaa 1320
agatctttgt tggaagttat ggctgctttc ccatctgcta agccaccatt gggtgttttc 1380
ttcgctgcta tcgctccaag attgcaacca agatactact ccatctcttc ctctccaaga 1440
ttggctccat ctagagttca cgttacttcc gctttggttt acggtccaac tccaactggt 1500
agaatccaca agggtgtttg ttctacttgg atgaagaacg ctgttccagc tgaaaagtct 1560
cacgaatgtt ctggtgcccc aatcttcatt agagcttcta acttcaagtt gccatccaac 1620
ccatctactc caatcgttat ggttggtcca ggtactggtt tggctccatt cagaggtttc 1680
ttgcaagaaa gaatggcttt gaaggaagat ggtgaagaat tgggttcttc tttgttgttc 1740
ttcggttgta gaaacagaca aatggacttc atctacgaag atgaattgaa caacttcgtt 1800
gatcaaggtg ttatctctga attgatcatg gctttctcca gagaaggtgc tcaaaaggaa 1860
tacgttcaac acaagatgat ggaaaaggct gctcaagttt gggatttgat caaggaagaa 1920
ggttacttgt acgtttgtgg tgatgctaag ggtatggcta gagatgtcca cagaactttg 1980
cacaccattg ttcaagaaca agaaggtgtt tcttcttctg aagctgaagc tatcgttaag 2040
aagttgcaaa ccgaaggtag atacttgaga gatgtctggt aa 2082
<210> 31
<211> 712
<212> PRT
<213> Arabidopsis thaliana
<400> 31
Met Ser Ser Ser Ser Ser Ser Ser Thr Ser Met Ile Asp Leu Met Ala
1 5 10 15
Ala Ile Ile Lys Gly Glu Pro Val Ile Val Ser Asp Pro Ala Asn Ala
20 25 30
Ser Ala Tyr Glu Ser Val Ala Ala Glu Leu Ser Ser Met Leu Ile Glu
35 40 45
Asn Arg Gln Phe Ala Met Ile Val Thr Thr Ser Ile Ala Val Leu Ile
50 55 60
Gly Cys Ile Val Met Leu Val Trp Arg Arg Ser Gly Ser Gly Asn Ser
65 70 75 80
Lys Arg Val Glu Pro Leu Lys Pro Leu Val Ile Lys Pro Arg Glu Glu
85 90 95
Glu Ile Asp Asp Gly Arg Lys Lys Val Thr Ile Phe Phe Gly Thr Gln
100 105 110
Thr Gly Thr Ala Glu Gly Phe Ala Lys Ala Leu Gly Glu Glu Ala Lys
115 120 125
Ala Arg Tyr Glu Lys Thr Arg Phe Lys Ile Val Asp Leu Asp Asp Tyr
130 135 140
Ala Ala Asp Asp Asp Glu Tyr Glu Glu Lys Leu Lys Lys Glu Asp Val
145 150 155 160
Ala Phe Phe Phe Leu Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn
165 170 175
Ala Ala Arg Phe Tyr Lys Trp Phe Thr Glu Gly Asn Asp Arg Gly Glu
180 185 190
Trp Leu Lys Asn Leu Lys Tyr Gly Val Phe Gly Leu Gly Asn Arg Gln
195 200 205
Tyr Glu His Phe Asn Lys Val Ala Lys Val Val Asp Asp Ile Leu Val
210 215 220
Glu Gln Gly Ala Gln Arg Leu Val Gln Val Gly Leu Gly Asp Asp Asp
225 230 235 240
Gln Cys Ile Glu Asp Asp Phe Thr Ala Trp Arg Glu Ala Leu Trp Pro
245 250 255
Glu Leu Asp Thr Ile Leu Arg Glu Glu Gly Asp Thr Ala Val Ala Thr
260 265 270
Pro Tyr Thr Ala Ala Val Leu Glu Tyr Arg Val Ser Ile His Asp Ser
275 280 285
Glu Asp Ala Lys Phe Asn Asp Ile Asn Met Ala Asn Gly Asn Gly Tyr
290 295 300
Thr Val Phe Asp Ala Gln His Pro Tyr Lys Ala Asn Val Ala Val Lys
305 310 315 320
Arg Glu Leu His Thr Pro Glu Ser Asp Arg Ser Cys Ile His Leu Glu
325 330 335
Phe Asp Ile Ala Gly Ser Gly Leu Thr Tyr Glu Thr Gly Asp His Val
340 345 350
Gly Val Leu Cys Asp Asn Leu Ser Glu Thr Val Asp Glu Ala Leu Arg
355 360 365
Leu Leu Asp Met Ser Pro Asp Thr Tyr Phe Ser Leu His Ala Glu Lys
370 375 380
Glu Asp Gly Thr Pro Ile Ser Ser Ser Leu Pro Pro Pro Phe Pro Pro
385 390 395 400
Cys Asn Leu Arg Thr Ala Leu Thr Arg Tyr Ala Cys Leu Leu Ser Ser
405 410 415
Pro Lys Lys Ser Ala Leu Val Ala Leu Ala Ala His Ala Ser Asp Pro
420 425 430
Thr Glu Ala Glu Arg Leu Lys His Leu Ala Ser Pro Ala Gly Lys Val
435 440 445
Asp Glu Tyr Ser Lys Trp Val Val Glu Ser Gln Arg Ser Leu Leu Glu
450 455 460
Val Met Ala Glu Phe Pro Ser Ala Lys Pro Pro Leu Gly Val Phe Phe
465 470 475 480
Ala Gly Val Ala Pro Arg Leu Gln Pro Arg Phe Tyr Ser Ile Ser Ser
485 490 495
Ser Pro Lys Ile Ala Glu Thr Arg Ile His Val Thr Cys Ala Leu Val
500 505 510
Tyr Glu Lys Met Pro Thr Gly Arg Ile His Lys Gly Val Cys Ser Thr
515 520 525
Trp Met Lys Asn Ala Val Pro Tyr Glu Lys Ser Glu Asn Cys Ser Ser
530 535 540
Ala Pro Ile Phe Val Arg Gln Ser Asn Phe Lys Leu Pro Ser Asp Ser
545 550 555 560
Lys Val Pro Ile Ile Met Ile Gly Pro Gly Thr Gly Leu Ala Pro Phe
565 570 575
Arg Gly Phe Leu Gln Glu Arg Leu Ala Leu Val Glu Ser Gly Val Glu
580 585 590
Leu Gly Pro Ser Val Leu Phe Phe Gly Cys Arg Asn Arg Arg Met Asp
595 600 605
Phe Ile Tyr Glu Glu Glu Leu Gln Arg Phe Val Glu Ser Gly Ala Leu
610 615 620
Ala Glu Leu Ser Val Ala Phe Ser Arg Glu Gly Pro Thr Lys Glu Tyr
625 630 635 640
Val Gln His Lys Met Met Asp Lys Ala Ser Asp Ile Trp Asn Met Ile
645 650 655
Ser Gln Gly Ala Tyr Leu Tyr Val Cys Gly Asp Ala Lys Gly Met Ala
660 665 670
Arg Asp Val His Arg Ser Leu His Thr Ile Ala Gln Glu Gln Gly Ser
675 680 685
Met Asp Ser Thr Lys Ala Glu Gly Phe Val Lys Asn Leu Gln Thr Ser
690 695 700
Gly Arg Tyr Leu Arg Asp Val Trp
705 710
<210> 32
<211> 2139
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 31
<400> 32
atgtcctctt cttcttcttc ttctacctcc atgatcgatt tgatggctgc tatcatcaag 60
ggtgaaccag ttattgtctc cgacccagct aacgcctccg cttacgaatc cgttgctgct 120
gaattgtcct ctatgttgat cgaaaacaga caattcgcca tgattgttac cacttccatt 180
gctgttttga ttggttgtat cgttatgttg gtttggagaa gatccggttc tggtaactct 240
aagagagtcg aaccattgaa gccattggtt attaagccaa gagaagaaga aattgatgat 300
ggtagaaaga aggttaccat cttcttcggt actcaaactg gtactgctga aggtttcgct 360
aaggctttgg gtgaagaagc taaggctaga tacgaaaaga ccagattcaa gatcgttgat 420
ttggatgatt acgctgctga tgatgatgaa tacgaagaaa agttgaagaa ggaagatgtt 480
gctttcttct tcttggccac ttacggtgat ggtgaaccaa ccgacaacgc tgctagattc 540
tacaagtggt tcaccgaagg taacgacaga ggtgaatggt tgaagaactt gaagtacggt 600
gttttcggtt tgggtaacag acaatacgaa cacttcaaca aggttgccaa ggttgttgat 660
gacattttgg tcgaacaagg tgctcaaaga ttggttcaag ttggtttggg tgatgatgac 720
caatgtattg aagatgactt caccgcttgg agagaagctt tgtggccaga attggatact 780
atcttgagag aagaaggtga tactgctgtt gccactccat acactgctgc tgttttggaa 840
tacagagttt ctattcacga ctctgaagat gccaagttca acgatatcaa catggctaac 900
ggtaacggtt acactgtttt cgatgctcaa cacccataca aggctaacgt cgctgttaag 960
agagaattgc acactccaga atctgataga tcttgtatcc acttggaatt cgacattgct 1020
ggttctggtt tgacttacga aactggtgat cacgttggtg ttttgtgtga taacttgtct 1080
gaaactgttg atgaagcttt gagattgttg gatatgtctc cagatactta cttctctttg 1140
cacgctgaaa aggaagatgg tactccaatc tcttcttctt tgccaccacc attcccacca 1200
tgtaacttga gaactgcttt gactagatac gcttgtttgt tgtcatctcc aaagaagtct 1260
gctttggttg ctttggctgc tcacgcttct gatccaaccg aagctgaaag attgaagcac 1320
ttggcttctc cagctggtaa ggttgatgaa tactctaagt gggttgttga atctcaaaga 1380
tctttgttgg aagttatggc cgaattccca tctgccaagc caccattggg tgttttcttc 1440
gctggtgttg ctccaagatt gcaaccaaga ttctactcta tctcttcttc tccaaagatt 1500
gctgaaacta gaattcacgt cacttgtgct ttggtttacg aaaagatgcc aactggtaga 1560
attcacaagg gtgtttgttc cacttggatg aagaacgctg ttccatacga aaagtctgaa 1620
aactgttcct ctgctccaat cttcgttaga caatccaact tcaagttgcc atctgattct 1680
aaggttccaa tcatcatgat cggtccaggt actggtttgg ctccattcag aggtttcttg 1740
caagaaagat tggctttggt tgaatctggt gttgaattgg gtccatctgt tttgttcttc 1800
ggttgtagaa acagaagaat ggatttcatc tacgaagaag aattgcaaag attcgttgaa 1860
tctggtgctt tggctgaatt gtctgtcgcc ttctctagag aaggtccaac caaggaatac 1920
gttcaacaca agatgatgga caaggcttct gatatctgga acatgatctc tcaaggtgct 1980
tacttgtacg tttgtggtga cgccaagggt atggctagag atgttcacag atctttgcac 2040
actatcgctc aagaacaagg ttctatggat tctactaagg ctgaaggttt cgttaagaac 2100
ttgcaaactt ctggtagata cttgagagat gtttggtaa 2139
<210> 33
<211> 522
<212> PRT
<213> Lonicera japonica
<400> 33
Met Ser Trp Ile Phe Asp Leu Thr Ile Ser Phe Thr Thr Leu Leu Phe
1 5 10 15
Leu Ile Phe Thr Thr Ala Leu Leu Leu Leu Leu Lys Val Phe Lys Lys
20 25 30
Asn His Lys Leu Arg Pro Pro Pro Ser Pro Phe Thr Leu Pro Ile Ile
35 40 45
Gly His Leu His Leu Leu Gly Pro Leu Ile His Gln Ser Phe His Arg
50 55 60
Leu Ser Thr Leu Tyr Gly Pro Leu Ile Gln Leu Lys Ile Gly Tyr Ile
65 70 75 80
Pro Cys Val Val Ala Ser Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys
85 90 95
Thr His Glu Leu Ala Phe Ser Ser Arg Lys His Ser Ala Ala Ile Lys
100 105 110
Leu Leu Thr Tyr Asp Val Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr
115 120 125
Trp Lys Phe Ile Lys Lys Thr Cys Thr Phe Glu Leu Leu Gly Thr Arg
130 135 140
Asn Met Asn His Phe Leu Pro Ile Arg Thr Asn Glu Ile Arg Arg Phe
145 150 155 160
Leu Gln Val Met Leu Glu Lys Ala Lys Ala Ser Glu Gly Val Asn Val
165 170 175
Thr Glu Glu Leu Ile Lys Leu Thr Asn Asn Val Ile Ser Gln Met Met
180 185 190
Phe Ser Thr Arg Ser Ser Gly Thr Glu Gly Glu Ala Glu Glu Met Arg
195 200 205
Thr Leu Val Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser
210 215 220
Asp Phe Ile Lys Leu Cys Lys Asn Ile Asp Ile Gly Gly Phe Lys Lys
225 230 235 240
Arg Ser Lys Asp Ile Gln Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile
245 250 255
Ile Ser Glu Arg Glu Ser Glu Arg Ala Arg Arg Gly Lys Asn Arg Glu
260 265 270
Thr Leu Gly Glu Glu Gly Gly Lys Asp Phe Leu Asp Met Met Leu Asp
275 280 285
Thr Met Glu Asp Gly Lys Cys Glu Val Glu Ile Thr Arg Asp His Ile
290 295 300
Lys Ala Leu Val Leu Asp Phe Leu Thr Ala Ala Thr Asp Thr Thr Ala
305 310 315 320
Ile Ala Val Glu Trp Thr Leu Ala Glu Leu Ile Ser Asn Pro Glu Val
325 330 335
Phe Asp Lys Ala Arg Glu Glu Ile Asp Lys Val Val Gly Lys His Arg
340 345 350
Leu Val Thr Glu Leu Asp Thr Pro Asn Leu Pro Tyr Ile His Ala Ile
355 360 365
Ile Lys Glu Ser Phe Arg Leu His Pro Pro Ile Pro Leu Leu Ile Arg
370 375 380
Lys Ser Val Gln Asp Cys Thr Val Gly Gly Tyr His Ile Ser Ala Asn
385 390 395 400
Thr Ile Leu Phe Val Asn Ile Trp Ala Ile Gly Arg Asn Pro Lys Tyr
405 410 415
Trp Glu Ser Pro Met Lys Phe Trp Pro Glu Arg Phe Leu Glu Ser Asn
420 425 430
Gly Pro Gly Pro Val Gly Ser Met Asp Ile Lys Gly His His Tyr Glu
435 440 445
Leu Leu Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Ala Leu
450 455 460
Ala Met Gln Glu Leu Pro Val Val Leu Ala Ala Met Ile Gln Cys Phe
465 470 475 480
Asn Trp Lys Pro Val Thr Leu Asp Gly Glu Glu Leu Asp Met Ser Glu
485 490 495
Arg Pro Gly Leu Thr Ala Pro Arg Ala His Asp Leu Val Cys Val Pro
500 505 510
Ser Ala Arg Ile Asn Ser Phe Asp Asn Phe
515 520
<210> 34
<211> 1569
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 33
<400> 34
atgtcctgga tcttcgactt gactatctct ttcaccactt tgttgttctt gatcttcacc 60
accgccttgt tgttgttgtt gaaggttttc aagaagaacc acaagttaag accaccacca 120
tctccattca ccttgccaat catcggtcac ttgcacttgt tgggtccatt gatccaccaa 180
tccttccaca gattgtccac cttgtacggt ccattgatcc aattgaagat cggttacatc 240
ccatgtgttg ttgcctctac tccagaattg gctaaggaat tcttaaagac tcacgaattg 300
gctttctcct ctagaaagca ctccgctgcc attaagttgt tgacctacga tgtttctttc 360
gctttctctc catacggtcc atactggaag ttcatcaaaa agacttgtac cttcgaattg 420
ttgggtacta gaaacatgaa ccacttcttg ccaattagaa ccaacgaaat tagaagattc 480
ttgcaagtta tgttggaaaa ggccaaggct tctgaaggtg ttaacgttac tgaagaattg 540
atcaagttga ctaacaacgt tatctctcaa atgatgttct ctactagatc ttctggtacc 600
gaaggtgaag ctgaagaaat gagaactttg gttagagaag ttactcaaat cttcggtgaa 660
ttcaacgttt ctgatttcat caagttgtgt aagaacattg atattggtgg tttcaagaag 720
agatctaagg atatccaaaa gagatacgat gctttgttgg aaaagatcat ctctgaaaga 780
gaatctgaaa gagctagaag aggtaagaac agagaaactt tgggtgaaga aggtggtaag 840
gatttcttgg atatgatgtt ggatactatg gaagatggta agtgtgaagt tgaaatcact 900
agagatcaca ttaaggcctt ggttttggat ttcttgactg ctgccactga tactactgct 960
attgctgttg aatggacttt ggccgaattg atctctaacc cagaagtttt cgataaggct 1020
agagaagaaa tcgataaggt cgttggtaag cacagattgg tcactgaatt ggacactcca 1080
aacttgccat acatccacgc tatcatcaag gaatctttca gattgcaccc accaattcca 1140
ttgttgatca gaaagtctgt ccaagattgt actgttggtg gttaccacat ctctgctaac 1200
accatcttgt tcgtcaacat ttgggccatc ggtagaaacc caaagtactg ggaatctcca 1260
atgaagttct ggccagaaag attcttggaa tccaacggtc caggtccagt tggttctatg 1320
gatattaagg gtcaccacta cgaattgttg ccattcggtt ctggtagaag aggttgtcca 1380
ggtatggctt tggccatgca agaattgcca gttgttttgg ccgccatgat ccaatgtttc 1440
aactggaagc cagttacttt ggacggtgaa gaattggata tgtctgaaag accaggtttg 1500
actgctccaa gagcccacga tttggtttgt gttccatccg ctagaattaa ctctttcgat 1560
aacttctaa 1569
<210> 35
<211> 520
<212> PRT
<213> Lonicera macranthoides
<400> 35
Met Ser Leu Ile Phe Asp Leu Thr Ile Ser Phe Thr Thr Leu Leu Phe
1 5 10 15
Leu Ile Phe Thr Thr Ala Leu Leu Leu Lys Val Phe Lys Lys Asn His
20 25 30
Lys Leu Gln Pro Pro Pro Ser Pro Phe Thr Leu Pro Ile Ile Gly His
35 40 45
Leu His Leu Leu Gly Pro Leu Ile His Gln Ser Phe His Arg Leu Ser
50 55 60
Thr Leu Tyr Gly Pro Leu Ile Gln Leu Lys Ile Gly Tyr Ile Pro Cys
65 70 75 80
Val Val Ala Ser Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys Thr His
85 90 95
Glu Leu Ala Phe Ser Ser Arg Lys His Ser Ala Ala Ile Lys Leu Leu
100 105 110
Thr Tyr Asp Val Ser Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys
115 120 125
Phe Ile Lys Lys Thr Cys Thr Phe Glu Leu Leu Gly Thr Arg Asn Met
130 135 140
Asn His Phe Leu Pro Ile Arg Thr Asn Glu Ile Arg Arg Phe Leu Gln
145 150 155 160
Val Met Leu Glu Lys Ala Lys Ala Ser Glu Gly Val Asn Val Thr Glu
165 170 175
Glu Leu Ile Lys Leu Thr Asn Asn Val Ile Ser Gln Met Met Phe Ser
180 185 190
Thr Arg Ser Ser Gly Thr Glu Gly Glu Ala Glu Glu Val Arg Thr Leu
195 200 205
Val Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe
210 215 220
Ile Lys Leu Cys Lys Asn Ile Asp Ile Gly Gly Phe Lys Lys Arg Ser
225 230 235 240
Glu Asp Ile Gln Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Ser
245 250 255
Glu Arg Glu Ser Glu Arg Ala Arg Arg Gly Lys Asn Arg Glu Thr Leu
260 265 270
Gly Glu Glu Gly Gly Lys Asp Phe Leu Asp Met Met Leu Asp Thr Met
275 280 285
Glu Asp Gly Lys Cys Glu Val Glu Ile Thr Arg Asp His Ile Lys Ala
290 295 300
Leu Val Leu Asp Phe Leu Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala
305 310 315 320
Val Glu Trp Thr Leu Ala Glu Leu Ile Ser Asn Pro Glu Val Phe Asp
325 330 335
Lys Ala Arg Glu Glu Ile Asp Lys Val Val Gly Lys His Arg Leu Val
340 345 350
Thr Glu Leu Asp Thr Pro Asn Leu Pro Tyr Ile His Ala Ile Ile Lys
355 360 365
Glu Ser Phe Arg Leu His Pro Pro Ile Pro Leu Val Ile Arg Lys Ser
370 375 380
Val Gln Asp Cys Thr Val Gly Gly Tyr His Ile Ser Ala Asn Thr Ile
385 390 395 400
Leu Phe Ile Asn Ile Trp Ala Ile Gly Arg Asn Pro Lys Tyr Trp Glu
405 410 415
Ser Pro Met Lys Phe Trp Pro Glu Arg Phe Leu Glu Ser Asn Glu Pro
420 425 430
Gly Ser Val Gly Ser Thr Asp Ile Lys Gly His His Tyr Glu Leu Leu
435 440 445
Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Ala Leu Ala Met
450 455 460
Gln Glu Leu Pro Val Val Leu Ala Ala Met Ile Gln Cys Phe Asn Trp
465 470 475 480
Lys Pro Val Thr Leu Asp Gly Glu Glu Leu Asp Met Ser Glu Arg Pro
485 490 495
Gly Leu Thr Ala Pro Arg Ala His Asp Leu Val Cys Val Pro Ser Ala
500 505 510
Arg Ile Asn Ser Phe Asp Asn Phe
515 520
<210> 36
<211> 1563
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 35
<400> 36
atgtccttga tcttcgactt gactatctct ttcaccactt tgttgttctt gatcttcacc 60
accgccttgt tgttgaaggt tttcaagaag aaccacaagt tgcaaccacc accatctcca 120
ttcaccttgc caatcatcgg tcacttgcac ttgttgggtc cattgatcca ccaatccttc 180
cacagattgt ccaccttgta cggtccattg atccaattga agatcggtta catcccatgt 240
gttgttgctt ctactccaga attggctaag gaattcttaa agactcacga attggctttc 300
tcctctagaa agcactccgc tgccattaag ttgttgacct acgatgtttc tttcgctttc 360
gctccatacg gtccatactg gaagttcatc aaaaagactt gtaccttcga attgttgggt 420
actagaaaca tgaaccactt cttgccaatt agaaccaacg aaattagaag attcttgcaa 480
gttatgttgg aaaaggccaa ggcttctgaa ggtgttaacg ttactgaaga attgatcaag 540
ttgactaaca acgttatctc tcaaatgatg ttctctacta gatcttctgg taccgaaggt 600
gaagctgaag aagttagaac tttggttaga gaagttactc aaatcttcgg tgaattcaac 660
gtttctgatt tcatcaagtt gtgtaagaac attgatattg gtggtttcaa gaagagatct 720
gaagatatcc aaaagagata cgatgctttg ttggaaaaga tcatctctga aagagaatct 780
gaaagagcta gaagaggtaa gaacagagaa actttgggtg aagaaggtgg taaggatttc 840
ttggacatga tgttggatac tatggaagat ggtaagtgtg aagttgaaat cactagagat 900
cacattaagg ccttggtttt ggatttcttg actgctgcca ctgatactac tgctattgct 960
gttgaatgga ctttggctga attgatctct aacccagaag ttttcgataa ggctagagaa 1020
gaaatcgata aggtcgttgg taagcacaga ttggtcactg aattggacac tccaaacttg 1080
ccatacatcc acgctatcat caaggaatct ttcagattgc acccaccaat tccattggtc 1140
atcagaaagt ctgtccaaga ttgtactgtt ggtggttacc acatctctgc taacactatc 1200
ttgttcatca acatttgggc catcggtaga aacccaaagt actgggaatc tccaatgaag 1260
ttctggccag aaagattctt ggaatccaac gaaccaggtt ctgttggttc tactgatatt 1320
aagggtcacc actacgaatt gttgccattc ggttctggta gaagaggttg tccaggtatg 1380
gctttggcca tgcaagaatt gccagttgtt ttggccgcca tgatccaatg tttcaactgg 1440
aagccagtta ctttggacgg tgaagaattg gatatgtctg aaagaccagg tttgactgct 1500
ccaagagccc acgatttggt ttgtgttcca tccgctagaa ttaactcttt cgataacttc 1560
taa 1563
<210> 37
<211> 366
<212> PRT
<213> Petroselinum crispum
<400> 37
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Lys Glu Lys Thr Leu
1 5 10 15
Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Leu Asp
35 40 45
Asp Asp Ser Asp Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Lys
50 55 60
Ala Cys Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Ser Gly Leu Ile Ser Glu Met Thr Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Glu Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr Val Leu Gln Gly Asp Asp Ala Met Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asn Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Lys Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Gly Asp Leu Thr Lys Ala Cys
180 185 190
Val Asp Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Gln Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Arg Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Cys Met Thr Lys His Ile Glu Val Ala
325 330 335
Thr Arg Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Lys Leu Glu Met Lys Ser Lys Ser Ala Asp Glu Asn Leu Ala
355 360 365
<210> 38
<211> 1101
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 37
<400> 38
atgtccgctc caactactat caccgctttg gccaaggaaa agactttgaa cttggacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaattcca 120
attatttctt tggccggttt ggatgacgat tctgatggta gaaggccaga aatctgtaga 180
aagatcgtta aggcttgtga agattggggt attttccaag ttgttgatca cggtattgac 240
tctggtttga tttccgaaat gactagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttgg aatacgatac tactggtggt aagagaggtg gtttcactat ctccactgtt 360
ttgcaaggtg acgacgctat ggattggaga gaattcgtta cttacttctc ttacccaatc 420
aacgctagag actactctag atggccaaag aagccagaag gttggagatc taccactgaa 480
gtttactctg aaaagttgat ggttttgggt gccaagttgt tggaagtttt gtctgaagcc 540
atgggtttgg aaaagggtga tttgactaag gcttgtgttg atatggaaca aaaggttttg 600
attaactact acccaacttg tccacaacca gacttgactt tgggtgtcag gagacacact 660
gatccaggta ctattaccat tttgttgcaa gacatggttg gtggtttgca agccaccaga 720
gatggtggta agacttggat tactgttcaa ccagttgaag gtgctttcgt tgtcaacttg 780
ggtgatcacg gtcactactt gtctaacggt agattcagaa acgctgacca ccaagctgtt 840
gttaactcta cctcttctag attgtctatt gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta ttttggatga agccatcacc 960
tacgctgaaa tgtacaagaa gtgtatgact aagcacattg aagttgctac tagaaagaag 1020
ttggccaagg aaaagagatt gcaagacgaa aaggccaagt tggaaatgaa gtccaagtct 1080
gctgatgaaa acttggctta a 1101
<210> 39
<211> 507
<212> PRT
<213> Flavobacterium johnsoniae
<400> 39
Met Ser Asn Thr Ile Asn Glu Tyr Leu Ser Leu Glu Glu Phe Glu Ala
1 5 10 15
Ile Ile Phe Gly Asn Gln Lys Val Thr Ile Ser Asp Val Val Val Asn
20 25 30
Arg Val Asn Glu Ser Phe Asn Phe Leu Lys Glu Phe Ser Gly Asn Lys
35 40 45
Val Ile Tyr Gly Val Asn Thr Gly Phe Gly Pro Met Ala Gln Tyr Arg
50 55 60
Ile Lys Glu Ser Asp Gln Ile Gln Leu Gln Tyr Asn Leu Ile Arg Ser
65 70 75 80
His Ser Ser Gly Thr Gly Lys Pro Leu Ser Pro Val Cys Ala Lys Ala
85 90 95
Ala Ile Leu Ala Arg Leu Asn Thr Leu Ser Leu Gly Asn Ser Gly Val
100 105 110
His Pro Ser Val Ile Asn Leu Met Ser Glu Leu Ile Asn Lys Asp Ile
115 120 125
Thr Pro Leu Ile Phe Glu His Gly Gly Val Gly Ala Ser Gly Asp Leu
130 135 140
Val Gln Leu Ser His Leu Ala Leu Val Leu Ile Gly Glu Gly Glu Val
145 150 155 160
Phe Tyr Lys Gly Glu Arg Arg Pro Thr Pro Glu Val Phe Glu Ile Glu
165 170 175
Gly Leu Lys Pro Ile Gln Val Glu Ile Arg Glu Gly Leu Ala Leu Ile
180 185 190
Asn Gly Thr Ser Val Met Thr Gly Ile Gly Val Val Asn Val Tyr His
195 200 205
Ala Lys Lys Leu Leu Asp Trp Ser Leu Lys Ser Ser Cys Ala Ile Asn
210 215 220
Glu Leu Val Gln Ala Tyr Asp Asp His Phe Ser Ala Glu Leu Asn Gln
225 230 235 240
Thr Lys Arg His Lys Gly Gln Gln Glu Ile Ala Leu Lys Met Arg Gln
245 250 255
Asn Leu Ser Asp Ser Thr Leu Ile Arg Lys Arg Glu Asp His Leu Tyr
260 265 270
Ser Gly Glu Asn Thr Glu Glu Ile Phe Lys Glu Lys Val Gln Glu Tyr
275 280 285
Tyr Ser Leu Arg Cys Val Pro Gln Ile Leu Gly Pro Val Leu Glu Thr
290 295 300
Ile Asn Asn Val Ala Ser Ile Leu Glu Asp Glu Phe Asn Ser Ala Asn
305 310 315 320
Asp Asn Pro Ile Ile Asp Val Lys Asn Gln His Val Tyr His Gly Gly
325 330 335
Asn Phe His Gly Asp Tyr Ile Ser Leu Glu Met Asp Lys Leu Lys Ile
340 345 350
Val Ile Thr Lys Leu Thr Met Leu Ala Glu Arg Gln Leu Asn Tyr Leu
355 360 365
Leu Asn Ser Lys Ile Asn Glu Leu Leu Pro Pro Phe Val Asn Leu Gly
370 375 380
Thr Leu Gly Phe Asn Phe Gly Met Gln Gly Val Gln Phe Thr Ala Thr
385 390 395 400
Ser Thr Thr Ala Glu Ser Gln Met Leu Ser Asn Pro Met Tyr Val His
405 410 415
Ser Ile Pro Asn Asn Asn Asp Asn Gln Asp Ile Val Ser Met Gly Thr
420 425 430
Asn Ser Ala Val Ile Thr Ser Lys Val Ile Glu Asn Ala Phe Glu Val
435 440 445
Leu Ala Ile Glu Met Ile Thr Ile Val Gln Ala Ile Asp Tyr Leu Gly
450 455 460
Gln Lys Asp Lys Ile Ser Ser Val Ser Lys Lys Trp Tyr Asp Glu Ile
465 470 475 480
Arg Asn Ile Ile Pro Thr Phe Lys Glu Asp Gln Val Met Tyr Pro Phe
485 490 495
Val Gln Lys Val Lys Asp His Leu Ile Asn Asn
500 505
<210> 40
<211> 1524
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 39
<400> 40
atgtccaaca ctattaacga atacttgtct ttggaagaat tcgaagccat catcttcggt 60
aaccaaaagg ttactatttc tgacgttgtc gttaacagag ttaacgaatc tttcaacttc 120
ttgaaggaat tctctggtaa caaggttatt tacggtgtta acactggttt cggtccaatg 180
gctcaataca gaattaagga atctgatcaa attcaattgc aatacaactt gattagatct 240
cactcttctg gtaccggtaa gccattgtct ccagtttgtg ctaaggctgc tattttggct 300
agattgaaca ctttgtcttt gggtaactct ggtgttcacc catctgttat caacttgatg 360
tctgaattga tcaacaagga tattacccca ttgatcttcg aacacggtgg tgttggtgcc 420
tctggtgact tggttcaatt gtctcacttg gctttggttt tgattggtga aggtgaagtt 480
ttctacaagg gtgaaagaag gccaactcca gaagttttcg aaattgaagg tttgaagcca 540
attcaagttg aaattagaga aggtttggct ttgattaacg gtacttctgt tatgactggt 600
attggtgttg ttaacgttta ccacgctaag aagttgttgg actggtcttt gaaatcttct 660
tgtgctatta acgaattggt tcaagcttac gacgatcact tctctgctga attgaaccaa 720
actaagagac acaagggtca acaagaaatt gctttgaaga tgagacaaaa cttgtctgac 780
tctactttga tcagaaagag agaagatcac ttgtactctg gtgaaaacac cgaagaaatc 840
ttcaaggaaa aggttcaaga atactactct ttgagatgtg ttccacaaat tttgggtcca 900
gttttggaaa ctattaacaa cgttgcttct attttggaag atgaattcaa ctctgctaac 960
gataacccaa ttatcgatgt taagaaccaa cacgtttacc acggtggtaa cttccacggt 1020
gattacattt ctttggaaat ggataagttg aagattgtta ttaccaagtt gactatgttg 1080
gctgaaagac aattgaacta cttgttgaac tctaagatca acgaattgtt gccaccattc 1140
gttaacttgg gtactttggg tttcaacttc ggtatgcaag gtgttcaatt cactgctact 1200
tctactactg ctgaatctca aatgttgtct aacccaatgt acgttcactc tattccaaac 1260
aacaacgaca accaagatat cgtttctatg ggtactaact ctgctgttat tacctctaag 1320
gttatcgaaa acgctttcga agttttggct atcgaaatga ttactatcgt tcaagctatt 1380
gattacttgg gtcaaaagga caagatttct tctgtttcta agaagtggta cgatgaaatt 1440
agaaacatca ttccaacttt caaggaagat caagttatgt acccattcgt tcaaaaggtt 1500
aaggatcact tgatcaacaa ctaa 1524
<210> 41
<211> 694
<212> PRT
<213> Rhodotorula glutinis
<400> 41
Met Ser Ala Pro Arg Pro Thr Ser Gln Ser Gln Ala Arg Thr Cys Pro
1 5 10 15
Thr Thr Gln Val Thr Gln Val Asp Ile Val Glu Lys Met Leu Ala Ala
20 25 30
Pro Thr Asp Ser Thr Leu Glu Leu Asp Gly Tyr Ser Leu Asn Leu Gly
35 40 45
Asp Val Val Ser Ala Ala Arg Lys Gly Arg Pro Val Arg Val Lys Asp
50 55 60
Ser Asp Glu Ile Arg Ser Lys Ile Asp Lys Ser Val Glu Phe Leu Arg
65 70 75 80
Ser Gln Leu Ser Met Ser Val Tyr Gly Val Thr Thr Gly Phe Gly Gly
85 90 95
Ser Ala Asp Thr Arg Thr Glu Asp Ala Ile Ser Leu Gln Lys Ala Leu
100 105 110
Leu Glu His Gln Leu Cys Gly Val Leu Pro Ser Ser Phe Asp Ser Phe
115 120 125
Arg Leu Gly Arg Gly Leu Glu Asn Ser Leu Pro Leu Glu Val Val Arg
130 135 140
Gly Ala Met Thr Ile Arg Val Asn Ser Leu Thr Arg Gly His Ser Ala
145 150 155 160
Val Arg Leu Val Val Leu Glu Ala Leu Thr Asn Phe Leu Asn His Gly
165 170 175
Ile Thr Pro Ile Val Pro Leu Arg Gly Thr Ile Ser Ala Ser Gly Asp
180 185 190
Leu Ser Pro Leu Ser Tyr Ile Ala Ala Ala Ile Ser Gly His Pro Asp
195 200 205
Ser Lys Val His Val Val His Glu Gly Lys Glu Lys Ile Leu Tyr Ala
210 215 220
Arg Glu Ala Met Ala Leu Phe Asn Leu Glu Pro Val Val Leu Gly Pro
225 230 235 240
Lys Glu Gly Leu Gly Leu Val Asn Gly Thr Ala Val Ser Ala Ser Met
245 250 255
Ala Thr Leu Ala Leu His Asp Ala His Met Leu Ser Leu Leu Ser Gln
260 265 270
Ser Leu Thr Ala Met Thr Val Glu Ala Met Val Gly His Ala Gly Ser
275 280 285
Phe His Pro Phe Leu His Asp Val Thr Arg Pro His Pro Thr Gln Ile
290 295 300
Glu Val Ala Gly Asn Ile Arg Lys Leu Leu Glu Gly Ser Arg Phe Ala
305 310 315 320
Val His His Glu Glu Glu Val Lys Val Lys Asp Asp Glu Gly Ile Leu
325 330 335
Arg Gln Asp Arg Tyr Pro Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro
340 345 350
Leu Val Ser Asp Leu Ile His Ala His Ala Val Leu Thr Ile Glu Ala
355 360 365
Gly Gln Ser Thr Thr Asp Asn Pro Leu Ile Asp Val Glu Asn Lys Thr
370 375 380
Ser His His Gly Gly Asn Phe Gln Ala Ala Ala Val Ala Asn Thr Met
385 390 395 400
Glu Lys Thr Arg Leu Gly Leu Ala Gln Ile Gly Lys Leu Asn Phe Thr
405 410 415
Gln Leu Thr Glu Met Leu Asn Ala Gly Met Asn Arg Gly Leu Pro Ser
420 425 430
Cys Leu Ala Ala Glu Asp Pro Ser Leu Ser Tyr His Cys Lys Gly Leu
435 440 445
Asp Ile Ala Ala Ala Ala Tyr Thr Ser Glu Leu Gly His Leu Ala Asn
450 455 460
Pro Val Thr Thr His Val Gln Pro Ala Glu Met Ala Asn Gln Ala Val
465 470 475 480
Asn Ser Leu Ala Leu Ile Ser Ala Arg Arg Thr Thr Glu Ser Asn Asp
485 490 495
Val Leu Ser Leu Leu Leu Ala Thr His Leu Tyr Cys Val Leu Gln Ala
500 505 510
Ile Asp Leu Arg Ala Ile Glu Phe Glu Phe Lys Lys Gln Phe Gly Pro
515 520 525
Ala Ile Val Ser Leu Ile Asp Gln His Phe Gly Ser Ala Met Thr Gly
530 535 540
Ser Asn Leu Arg Asp Glu Leu Val Glu Lys Val Asn Lys Thr Leu Ala
545 550 555 560
Lys Arg Leu Glu Gln Thr Asn Ser Tyr Asp Leu Val Pro Arg Trp His
565 570 575
Asp Ala Phe Ser Phe Ala Ala Gly Thr Val Val Glu Val Leu Ser Ser
580 585 590
Thr Ser Leu Ser Leu Ala Ala Val Asn Ala Trp Lys Val Ala Ala Ala
595 600 605
Glu Ser Ala Ile Ser Leu Thr Arg Gln Val Arg Glu Thr Phe Trp Ser
610 615 620
Ala Ala Ser Thr Ser Ser Pro Ala Leu Ser Tyr Leu Ser Pro Arg Thr
625 630 635 640
Gln Ile Leu Tyr Ala Phe Val Arg Glu Glu Leu Gly Val Lys Ala Arg
645 650 655
Arg Gly Asp Val Phe Leu Gly Lys Gln Glu Val Thr Ile Gly Ser Asn
660 665 670
Val Ser Lys Ile Tyr Glu Ala Ile Lys Ser Gly Arg Ile Asn Asn Val
675 680 685
Leu Leu Lys Met Leu Ala
690
<210> 42
<211> 2085
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 41
<400> 42
atgtccgctc caagaccaac ttctcaatct caagccagaa cttgtccaac cacccaagtt 60
acccaagttg atatcgttga aaagatgttg gctgctccaa ctgattctac cttggaattg 120
gacggttact ctttgaactt gggtgatgtt gtttctgctg ctagaaaggg tagaccagtt 180
agagttaagg attctgatga aatcagatct aagatcgaca agtctgttga attcttgaga 240
tctcaattgt ctatgtctgt ttacggtgtt accaccggtt tcggtggttc cgctgacacc 300
agaaccgaag atgctatttc tttgcaaaag gctttgttgg aacaccaatt gtgtggtgtt 360
ttgccatctt ctttcgactc tttcagattg ggtagaggtt tggaaaactc tttgccattg 420
gaagttgtta gaggtgctat gaccattaga gttaactctt tgaccagagg tcactctgct 480
gttagattgg ttgttttgga agctttgacc aacttcttga accacggtat taccccaatt 540
gttccattga gaggtaccat ctccgcttct ggtgatttgt ctccattgtc ttacattgct 600
gctgctattt ctggtcaccc agattctaag gttcacgttg ttcacgaagg taaggaaaag 660
atcttgtacg ctagagaagc tatggctttg ttcaacttgg aaccagttgt tttgggtcca 720
aaggaaggtt tgggtttggt taacggtacc gctgtttccg cttctatggc taccttggct 780
ttgcacgacg ctcacatgtt gtctttgttg tctcaatctt tgaccgctat gaccgttgaa 840
gctatggttg gtcacgctgg ttctttccac ccattcttgc acgatgttac cagaccacac 900
ccaacccaaa tcgaagttgc tggtaacatt agaaagttgt tggaaggttc tagattcgct 960
gttcaccacg aagaagaagt taaggttaag gatgatgaag gtattttgag acaagataga 1020
tacccattga gaacctctcc acaatggttg ggtccattgg tttccgactt gattcacgct 1080
cacgccgttt tgaccatcga agctggtcaa tctaccaccg ataacccatt gatcgatgtt 1140
gaaaacaaga cctctcacca cggtggtaac ttccaagctg ctgctgttgc caacactatg 1200
gaaaagacca gattgggttt ggcccaaatc ggtaagttga acttcaccca attgaccgaa 1260
atgttgaacg ctggtatgaa cagaggtttg ccatcttgtt tggctgctga agatccatcc 1320
ttgtcttacc actgtaaggg tttggacatt gctgctgctg cttacacctc tgaattgggt 1380
cacttggcta acccagttac cacccacgtt caaccagctg aaatggctaa ccaagctgtt 1440
aactctttgg ctttgatttc tgctagaaga accaccgaat ctaacgacgt tttgtccttg 1500
ttgttggcta cccacttgta ctgtgttttg caagctatcg acttgagagc tattgaattc 1560
gaattcaaga agcaattcgg tccagccatt gtttctttga tcgaccaaca cttcggttct 1620
gctatgaccg gttctaactt gagagatgaa ttggttgaaa aggttaacaa gactttggcc 1680
aagagattgg aacaaaccaa ctcttacgat ttggttccaa gatggcacga cgctttctct 1740
ttcgctgctg gtactgttgt tgaagttttg tcctctacct ctttgtcttt ggctgccgtt 1800
aacgcttgga aggttgctgc tgccgaatct gctatctcct tgaccagaca agttagagaa 1860
accttctggt ccgctgcttc tacctcctct ccagctttgt cttacttgtc tccaagaacc 1920
caaatcttgt acgctttcgt tagagaagaa ttgggtgtta aggccagaag aggtgacgtt 1980
ttcttgggta agcaagaagt taccatcggt tctaacgttt ctaagattta cgaagccatc 2040
aagtctggta gaatcaacaa cgttttgttg aagatgttgg cttaa 2085
<210> 43
<211> 562
<212> PRT
<213> Arabidopsis thaliana
<400> 43
Met Ser Ala Pro Gln Glu Gln Ala Val Ser Gln Val Met Glu Lys Gln
1 5 10 15
Ser Asn Asn Asn Asn Ser Asp Val Ile Phe Arg Ser Lys Leu Pro Asp
20 25 30
Ile Tyr Ile Pro Asn His Leu Ser Leu His Asp Tyr Ile Phe Gln Asn
35 40 45
Ile Ser Glu Phe Ala Thr Lys Pro Cys Leu Ile Asn Gly Pro Thr Gly
50 55 60
His Val Tyr Thr Tyr Ser Asp Val His Val Ile Ser Arg Gln Ile Ala
65 70 75 80
Ala Asn Phe His Lys Leu Gly Val Asn Gln Asn Asp Val Val Met Leu
85 90 95
Leu Leu Pro Asn Cys Pro Glu Phe Val Leu Ser Phe Leu Ala Ala Ser
100 105 110
Phe Arg Gly Ala Thr Ala Thr Ala Ala Asn Pro Phe Phe Thr Pro Ala
115 120 125
Glu Ile Ala Lys Gln Ala Lys Ala Ser Asn Thr Lys Leu Ile Ile Thr
130 135 140
Glu Ala Arg Tyr Val Asp Lys Ile Lys Pro Leu Gln Asn Asp Asp Gly
145 150 155 160
Val Val Ile Val Cys Ile Asp Asp Asn Glu Ser Val Pro Ile Pro Glu
165 170 175
Gly Cys Leu Arg Phe Thr Glu Leu Thr Gln Ser Thr Thr Glu Ala Ser
180 185 190
Glu Val Ile Asp Ser Val Glu Ile Ser Pro Asp Asp Val Val Ala Leu
195 200 205
Pro Tyr Ser Ser Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr
210 215 220
His Lys Gly Leu Val Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn
225 230 235 240
Pro Asn Leu Tyr Phe His Ser Asp Asp Val Ile Leu Cys Val Leu Pro
245 250 255
Met Phe His Ile Tyr Ala Leu Asn Ser Ile Met Leu Cys Gly Leu Arg
260 265 270
Val Gly Ala Ala Ile Leu Ile Met Pro Lys Phe Glu Ile Asn Leu Leu
275 280 285
Leu Glu Leu Ile Gln Arg Cys Lys Val Thr Val Ala Pro Met Val Pro
290 295 300
Pro Ile Val Leu Ala Ile Ala Lys Ser Ser Glu Thr Glu Lys Tyr Asp
305 310 315 320
Leu Ser Ser Ile Arg Val Val Lys Ser Gly Ala Ala Pro Leu Gly Lys
325 330 335
Glu Leu Glu Asp Ala Val Asn Ala Lys Phe Pro Asn Ala Lys Leu Gly
340 345 350
Gln Gly Tyr Gly Met Thr Glu Ala Gly Pro Val Leu Ala Met Ser Leu
355 360 365
Gly Phe Ala Lys Glu Pro Phe Pro Val Lys Ser Gly Ala Cys Gly Thr
370 375 380
Val Val Arg Asn Ala Glu Met Lys Ile Val Asp Pro Asp Thr Gly Asp
385 390 395 400
Ser Leu Ser Arg Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly His Gln
405 410 415
Ile Met Lys Gly Tyr Leu Asn Asn Pro Ala Ala Thr Ala Glu Thr Ile
420 425 430
Asp Lys Asp Gly Trp Leu His Thr Gly Asp Ile Gly Leu Ile Asp Asp
435 440 445
Asp Asp Glu Leu Phe Ile Val Asp Arg Leu Lys Glu Leu Ile Lys Tyr
450 455 460
Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Ile Gly
465 470 475 480
His Pro Asp Ile Thr Asp Val Ala Val Val Ala Met Lys Glu Glu Ala
485 490 495
Ala Gly Glu Val Pro Val Ala Phe Val Val Lys Ser Lys Asp Ser Glu
500 505 510
Leu Ser Glu Asp Asp Val Lys Gln Phe Val Ser Lys Gln Val Val Phe
515 520 525
Tyr Lys Arg Ile Asn Lys Val Phe Phe Thr Glu Ser Ile Pro Lys Ala
530 535 540
Pro Ser Gly Lys Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Asn
545 550 555 560
Gly Leu
<210> 44
<211> 1689
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 43
<400> 44
atgtccgctc cacaagaaca agctgtttct caagttatgg aaaagcaatc taacaacaac 60
aactctgacg tcattttcag atctaagttg ccagatattt acatcccaaa ccacttgtct 120
ttgcacgact acatcttcca aaacatctcc gaattcgcca ctaagccatg tttgatcaac 180
ggtccaaccg gtcacgttta cacttactcc gacgtccacg tcatctccag acaaatcgcc 240
gccaacttcc acaagttggg tgttaaccaa aacgacgtcg tcatgttgtt gttgccaaac 300
tgtccagaat tcgtcttgtc tttcttggcc gcctccttca gaggtgctac cgccaccgcc 360
gctaacccat tcttcactcc agctgaaatc gctaagcaag ccaaggcctc caacaccaag 420
ttgatcatca ccgaagctag atacgtcgac aagatcaagc cattgcaaaa cgacgacggt 480
gttgtcatcg tctgtatcga cgacaacgaa tccgttccaa tcccagaagg ttgtttgaga 540
ttcaccgaat tgactcaatc tactaccgaa gcttctgaag tcatcgactc tgttgaaatt 600
tctccagacg acgttgttgc tttgccatac tcctctggta ctactggttt gccaaagggt 660
gttatgttga ctcacaaggg tttggtcact tctgttgctc aacaagtcga cggtgaaaac 720
ccaaacttgt acttccactc tgatgacgtc atcttgtgtg ttttgccaat gttccacatc 780
tacgctttga actctatcat gttgtgtggt ttgagagttg gtgctgctat tttgatcatg 840
ccaaagttcg aaatcaactt gttgttggaa ttgatccaaa gatgtaaggt tactgttgct 900
ccaatggttc caccaattgt tttggccatt gctaaatctt ctgaaactga aaagtacgat 960
ttatcttcta tcagagttgt taagtctggt gctgctccat tgggtaagga attggaagat 1020
gccgttaacg ccaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1080
ggtccagttt tggctatgtc tttgggtttc gctaaggaac cattcccagt taagtctggt 1140
gcttgtggta ctgttgttag aaacgctgaa atgaagatcg ttgatccaga caccggtgat 1200
tctttgtcta gaaaccaacc aggtgaaatt tgtattagag gtcaccaaat catgaagggt 1260
tacttgaaca acccagctgc tactgctgaa accattgata aggacggttg gttgcacact 1320
ggtgatattg gtttgatcga tgacgatgac gaattgttca tcgttgatag attgaaggaa 1380
ttgatcaagt acaagggttt ccaagttgct ccagctgaat tggaagcttt gttgatcggt 1440
cacccagaca ttactgatgt tgctgttgtc gctatgaagg aagaagctgc tggtgaagtt 1500
ccagttgctt tcgttgttaa gtctaaggat tctgaattgt ctgaagatga tgttaagcaa 1560
ttcgtttcta agcaagttgt tttctacaag agaatcaaca aggttttctt cactgaatcc 1620
attccaaagg ctccatctgg taagatcttg agaaaggatt tgagagctaa gttggctaac 1680
ggtttgtaa 1689
<210> 45
<211> 545
<212> PRT
<213> Petroselinum crispum
<400> 45
Met Ser Gly Asp Cys Val Ala Pro Lys Glu Asp Leu Ile Phe Arg Ser
1 5 10 15
Lys Leu Pro Asp Ile Tyr Ile Pro Lys His Leu Pro Leu His Thr Tyr
20 25 30
Cys Phe Glu Asn Ile Ser Lys Val Gly Asp Lys Ser Cys Leu Ile Asn
35 40 45
Gly Ala Thr Gly Glu Thr Phe Thr Tyr Ser Gln Val Glu Leu Leu Ser
50 55 60
Arg Lys Val Ala Ser Gly Leu Asn Lys Leu Gly Ile Gln Gln Gly Asp
65 70 75 80
Thr Ile Met Leu Leu Leu Pro Asn Ser Pro Glu Tyr Phe Phe Ala Phe
85 90 95
Leu Gly Ala Ser Tyr Arg Gly Ala Ile Ser Thr Met Ala Asn Pro Phe
100 105 110
Phe Thr Ser Ala Glu Val Ile Lys Gln Leu Lys Ala Ser Gln Ala Lys
115 120 125
Leu Ile Ile Thr Gln Ala Cys Tyr Val Asp Lys Val Lys Asp Tyr Ala
130 135 140
Ala Glu Lys Asn Ile Gln Ile Ile Cys Ile Asp Asp Ala Pro Gln Asp
145 150 155 160
Cys Leu His Phe Ser Lys Leu Met Glu Ala Asp Glu Ser Glu Met Pro
165 170 175
Glu Val Val Ile Asn Ser Asp Asp Val Val Ala Leu Pro Tyr Ser Ser
180 185 190
Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His Lys Gly Leu
195 200 205
Val Thr Ser Val Ala Gln Gln Val Asp Gly Asp Asn Pro Asn Leu Tyr
210 215 220
Met His Ser Glu Asp Val Met Ile Cys Ile Leu Pro Leu Phe His Ile
225 230 235 240
Tyr Ser Leu Asn Ala Val Leu Cys Cys Gly Leu Arg Ala Gly Val Thr
245 250 255
Ile Leu Ile Met Gln Lys Phe Asp Ile Val Pro Phe Leu Glu Leu Ile
260 265 270
Gln Lys Tyr Lys Val Thr Ile Gly Pro Phe Val Pro Pro Ile Val Leu
275 280 285
Ala Ile Ala Lys Ser Pro Val Val Asp Lys Tyr Asp Leu Ser Ser Val
290 295 300
Arg Thr Val Met Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp
305 310 315 320
Ala Val Arg Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln Gly Tyr Gly
325 330 335
Met Thr Glu Ala Gly Pro Val Leu Ala Met Cys Leu Ala Phe Ala Lys
340 345 350
Glu Pro Tyr Glu Ile Lys Ser Gly Ala Cys Gly Thr Val Val Arg Asn
355 360 365
Ala Glu Met Lys Ile Val Asp Pro Glu Thr Asn Ala Ser Leu Pro Arg
370 375 380
Asn Gln Arg Gly Glu Ile Cys Ile Arg Gly Asp Gln Ile Met Lys Gly
385 390 395 400
Tyr Leu Asn Asp Pro Glu Ser Thr Arg Thr Thr Ile Asp Glu Glu Gly
405 410 415
Trp Leu His Thr Gly Asp Ile Gly Phe Ile Asp Asp Asp Asp Glu Leu
420 425 430
Phe Ile Val Asp Arg Leu Lys Glu Ile Ile Lys Tyr Lys Gly Phe Gln
435 440 445
Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His Pro Thr Ile
450 455 460
Ser Asp Ala Ala Val Val Pro Met Ile Asp Glu Lys Ala Gly Glu Val
465 470 475 480
Pro Val Ala Phe Val Val Arg Thr Asn Gly Phe Thr Thr Thr Glu Glu
485 490 495
Glu Ile Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr Lys Arg Ile
500 505 510
Phe Arg Val Phe Phe Val Asp Ala Ile Pro Lys Ser Pro Ser Gly Lys
515 520 525
Ile Leu Arg Lys Asp Leu Arg Ala Arg Ile Ala Ser Gly Asp Leu Pro
530 535 540
Lys
545
<210> 46
<211> 1638
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 45
<400> 46
atgtccggtg attgtgttgc tccaaaggaa gatttgattt tcagatctaa gttgccagat 60
atttacatcc caaagcactt gccattgcac acttactgtt tcgaaaacat ctctaaggtt 120
ggtgacaagt cctgtttgat caacggtgct actggtgaaa ctttcactta ctctcaagtt 180
gaattgttgt ccagaaaggt tgcttctggt ttgaacaagt tgggtattca acaaggtgat 240
accatcatgt tgttgttgcc aaactcccca gaatacttct tcgctttctt gggtgcttct 300
tacagaggtg ctatttctac tatggccaac ccattcttca cttctgctga agttatcaag 360
caattgaagg cttcccaagc taagttgatc attactcaag cttgttacgt tgacaaggtt 420
aaggactacg ctgctgaaaa gaacatccaa atcatttgta tcgatgatgc tccacaagat 480
tgtttgcact tctccaagtt gatggaagct gatgaatctg aaatgccaga agttgttatc 540
aactctgacg atgtcgtcgc tttgccatac tcttctggta ctactggttt gccaaagggt 600
gttatgttga ctcacaaggg tttggttact tctgttgctc aacaagttga tggtgacaac 660
ccaaacttgt acatgcactc tgaagatgtt atgatctgta tcttgccatt gttccacatt 720
tactctttga acgctgtttt gtgttgtggt ttgagagctg gtgttactat cttgattatg 780
caaaagttcg atattgttcc attcttggaa ttgatccaaa agtacaaggt tactattggt 840
ccattcgttc caccaattgt tttggctatt gctaagtctc cagttgttga taagtacgac 900
ttatcttctg ttagaactgt tatgtctggt gctgctccat tgggtaagga attggaagat 960
gctgttagag ctaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1020
ggtccagttt tggctatgtg tttggctttc gctaaggaac catacgaaat caagtctggt 1080
gcctgtggta ctgttgttag aaacgctgaa atgaagattg ttgatccaga aaccaacgcc 1140
tctttgccaa gaaaccaaag aggtgaaatt tgtattagag gtgaccaaat tatgaagggt 1200
tacttgaacg atccagaatc tactagaact actatcgacg aagaaggttg gttgcacact 1260
ggtgatatcg gtttcattga cgacgatgat gaattgttca ttgttgatag attgaaggaa 1320
atcatcaagt acaagggttt ccaagttgcc ccagctgaat tggaagcttt gttgttgact 1380
cacccaacca tttccgatgc tgctgttgtt ccaatgatcg atgaaaaggc tggtgaagtt 1440
ccagttgctt tcgttgttag aactaacggt ttcaccacca ctgaagaaga aatcaagcaa 1500
ttcgtttcta agcaagttgt tttctacaag agaatcttca gagttttctt cgttgatgct 1560
attccaaagt ctccatctgg taagattttg agaaaggact tgagagctag aatcgcttcc 1620
ggtgatttgc caaagtaa 1638
<210> 47
<211> 545
<212> PRT
<213> Petroselinum crispum
<400> 47
Met Ser Gly Asp Cys Val Ala Pro Lys Glu Asp Leu Ile Phe Arg Ser
1 5 10 15
Lys Leu Pro Asp Ile Tyr Ile Pro Lys His Leu Pro Leu His Thr Tyr
20 25 30
Cys Phe Glu Asn Ile Ser Lys Val Gly Asp Lys Ser Cys Leu Ile Asn
35 40 45
Gly Ala Thr Gly Glu Thr Phe Thr Tyr Ser Gln Val Glu Leu Leu Ser
50 55 60
Arg Lys Val Ala Ser Gly Leu Asn Lys Leu Gly Ile Gln Gln Gly Asp
65 70 75 80
Thr Ile Met Leu Leu Leu Pro Asn Ser Pro Glu Tyr Phe Phe Ala Phe
85 90 95
Leu Gly Ala Ser Tyr Arg Gly Ala Ile Ser Thr Met Ala Asn Pro Phe
100 105 110
Phe Thr Ser Ala Glu Val Ile Lys Gln Leu Lys Ala Ser Leu Ala Lys
115 120 125
Leu Ile Ile Thr Gln Ala Cys Tyr Val Asp Lys Val Lys Asp Tyr Ala
130 135 140
Ala Glu Lys Asn Ile Gln Ile Ile Cys Ile Asp Asp Ala Pro Gln Asp
145 150 155 160
Cys Leu His Phe Ser Lys Leu Met Glu Ala Asp Glu Ser Glu Met Pro
165 170 175
Glu Val Val Ile Asp Ser Asp Asp Val Val Ala Leu Pro Tyr Ser Ser
180 185 190
Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His Lys Gly Leu
195 200 205
Val Thr Ser Val Ala Gln Gln Val Asp Gly Asp Asn Pro Asn Leu Tyr
210 215 220
Met His Ser Glu Asp Val Met Ile Cys Ile Leu Pro Leu Phe His Ile
225 230 235 240
Tyr Ser Leu Asn Ala Val Leu Cys Cys Gly Leu Arg Ala Gly Val Thr
245 250 255
Ile Leu Ile Met Gln Lys Phe Asp Ile Val Pro Phe Leu Glu Leu Ile
260 265 270
Gln Lys Tyr Lys Val Thr Ile Gly Pro Phe Val Pro Pro Ile Val Leu
275 280 285
Ala Ile Ala Lys Ser Pro Val Val Asp Lys Tyr Asp Leu Ser Ser Val
290 295 300
Arg Thr Val Met Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp
305 310 315 320
Ala Val Arg Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln Gly Tyr Gly
325 330 335
Met Thr Glu Ala Gly Pro Val Leu Ala Met Cys Leu Ala Phe Ala Lys
340 345 350
Glu Pro Tyr Glu Ile Lys Ser Gly Ala Cys Gly Thr Val Val Arg Asn
355 360 365
Ala Glu Met Lys Ile Val Asp Pro Glu Thr Asn Ala Ser Leu Pro Arg
370 375 380
Asn Gln Arg Gly Glu Ile Cys Ile Arg Gly Asp Gln Ile Met Lys Gly
385 390 395 400
Tyr Leu Asn Asp Pro Glu Ser Thr Arg Thr Thr Ile Asp Glu Glu Gly
405 410 415
Trp Leu His Thr Gly Asp Ile Gly Phe Ile Asp Asp Asp Asp Glu Leu
420 425 430
Phe Ile Val Asp Arg Leu Lys Glu Ile Ile Lys Tyr Lys Gly Phe Gln
435 440 445
Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His Pro Thr Ile
450 455 460
Ser Asp Ala Ala Val Val Pro Met Ile Asp Glu Lys Ala Gly Glu Val
465 470 475 480
Pro Val Ala Phe Val Val Arg Thr Asn Gly Phe Thr Thr Thr Glu Glu
485 490 495
Glu Ile Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr Lys Arg Ile
500 505 510
Phe Arg Val Phe Phe Val Asp Ala Ile Pro Lys Ser Pro Ser Gly Lys
515 520 525
Ile Leu Arg Lys Asp Leu Arg Ala Lys Ile Ala Ser Gly Asp Leu Pro
530 535 540
Lys
545
<210> 48
<211> 1638
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 47
<400> 48
atgtccggtg actgtgttgc tccaaaggaa gatttgattt tcagatctaa gttgccagat 60
atttacatcc caaagcactt gccattgcac acttactgtt tcgaaaacat ctctaaggtt 120
ggtgacaagt cctgtttgat caacggtgct actggtgaaa ctttcactta ctctcaagtt 180
gaattgttgt ccagaaaggt tgcttctggt ttgaacaagt tgggtattca acaaggtgat 240
accatcatgt tgttgttgcc aaactcccca gaatacttct tcgctttctt gggtgcttct 300
tacagaggtg ctatttctac tatggccaac ccattcttca cttctgctga agttatcaag 360
caattgaagg cttccttggc taagttgatc attactcaag cttgttacgt tgacaaggtt 420
aaggactacg ctgctgaaaa gaacatccaa atcatttgta tcgatgatgc tccacaagat 480
tgtttgcact tctccaagtt gatggaagct gatgaatctg aaatgccaga agttgttatc 540
gattctgacg atgtcgtcgc tttgccatac tcttctggta ctactggttt gccaaagggt 600
gttatgttga cccacaaggg tttggttact tctgttgctc aacaagttga tggtgacaac 660
ccaaacttgt acatgcactc tgaagatgtt atgatctgta tcttgccatt gttccacatt 720
tactctttga acgctgtttt gtgttgtggt ttgagagctg gtgttactat cttgattatg 780
caaaagttcg atattgttcc attcttggaa ttgatccaaa agtacaaggt tactattggt 840
ccattcgttc caccaattgt tttggctatt gctaagtctc cagttgttga taagtacgac 900
ttatcttctg ttagaactgt tatgtctggt gctgctccat tgggtaagga attggaagat 960
gctgttagag ctaagttccc aaacgccaag ttgggtcaag gttacggtat gactgaagct 1020
ggtccagttt tggctatgtg tttggctttc gctaaggaac catacgaaat caagtctggt 1080
gcctgtggta ctgttgttag aaacgctgaa atgaagattg ttgatccaga aaccaacgcc 1140
tctttgccaa gaaaccaaag aggtgaaatt tgtattagag gtgaccaaat tatgaagggt 1200
tacttgaacg atccagaatc tactagaact actatcgacg aagaaggttg gttgcacact 1260
ggtgatatcg gtttcattga cgacgatgat gaattgttca ttgttgatag attgaaggaa 1320
atcatcaagt acaagggttt ccaagttgcc ccagctgaat tggaagcttt gttgttgact 1380
cacccaacca tttccgatgc tgctgttgtt ccaatgatcg atgaaaaggc tggtgaagtt 1440
ccagttgctt tcgttgttag aactaacggt ttcaccacca ctgaagaaga aatcaagcaa 1500
ttcgtttcta agcaagttgt tttctacaag agaatcttca gagttttctt cgttgatgct 1560
attccaaagt ctccatctgg taagattttg agaaaggact tgagagctaa gatcgcttcc 1620
ggtgatttgc caaagtaa 1638
<210> 49
<211> 579
<212> PRT
<213> Streptomyces clavuligerus
<400> 49
Met Ser Ala Ser Thr Pro Ser Pro Gly Pro Ser Gly Thr Pro Ser Gly
1 5 10 15
Thr Pro Pro Ser Gly Pro Ser Gly Thr Pro Ser Pro Gly Pro Ala Gly
20 25 30
Ala Gly Thr Ala Pro Val Phe Arg Ser Arg Tyr Pro Asp Ile Glu Pro
35 40 45
Val Ser Glu Pro Leu His Glu Ala Val Leu Gly Arg Ala Ala Gly Tyr
50 55 60
Gly Ser Glu Pro Ala Leu Val Asp Gly Leu Thr Gly Ala Val Val Ser
65 70 75 80
Tyr Ala Arg Leu Asp Arg Asp His Arg Arg Ile Ala Ala Ala Leu Ala
85 90 95
Ala Ala Gly Val Arg Lys Gly Asp Val Val Ala Leu His Ser Pro Asn
100 105 110
Ser Thr Gly Tyr Pro Ala Val Leu Tyr Gly Ala Leu Arg Ala Gly Ala
115 120 125
Thr Val Thr Thr Ala His Pro Leu Ala Thr Ala Glu Glu Leu Ala Arg
130 135 140
Gln Leu Arg Asp Ser Ala Ala Arg Trp Ile Val Thr Ala Ala Pro Cys
145 150 155 160
Leu Glu Thr Ala Arg Arg Ala Ala Glu Leu Thr Pro Gly Ile Gly Glu
165 170 175
Ile Phe Val Phe Asp Arg Ala Glu Gly His Thr Gly Val Ala Ala Met
180 185 190
Leu Asp Ser Thr Ala Pro Glu Pro Ala Val Pro Val Asp Pro Asp Gln
195 200 205
Asp Val Ala Leu Leu Pro Tyr Ser Ser Gly Thr Thr Gly Thr Pro Lys
210 215 220
Gly Val Met Leu Thr His Arg Ser Leu Val Thr Asn Leu Val Gln Ala
225 230 235 240
His Arg Leu Ile Pro Leu Arg Pro Gly Asp Arg Val Leu Ala Val Leu
245 250 255
Pro Phe Phe His Ile Tyr Gly Leu Val Gly Leu Met Ser Ala Pro Leu
260 265 270
Arg Asn Gly Ala Thr Val Val Val Leu Pro Arg Phe Asp Leu Glu Gly
275 280 285
Phe Leu Ala Ala Val Glu Lys His Arg Val Thr Thr Leu Tyr Val Ala
290 295 300
Pro Pro Ile Val Leu Ala Leu Ala Lys His Pro Ala Val Ala Arg Tyr
305 310 315 320
Asp Leu Ser Ser Val Arg His Val Phe Ser Ala Ala Ala Pro Leu Asp
325 330 335
Ala Glu Ile Ala Ala Ala Cys Ala Ala Arg Val Gly Val Pro Leu Val
340 345 350
Arg Gln Ala Tyr Gly Met Thr Glu Leu Ser Pro Gly Cys Tyr Ala Val
355 360 365
Pro Leu Asp Glu Pro Ala Pro Pro Pro Gly Thr Val Gly Leu Leu Phe
370 375 380
Pro Ser Thr Glu Met Arg Leu Leu Arg Leu Asp Asp Pro Gly Arg Cys
385 390 395 400
Val Gly Pro Gly Glu Asp Gly Glu Ile Ala Ile Arg Gly Pro Gln Val
405 410 415
Met Lys Gly Tyr Leu Gly Arg Pro Glu Ala Thr Ala Glu Met Ile Asp
420 425 430
Ala Asp Gly Trp Leu Arg Thr Gly Asp Val Gly Arg Val Asp Ala Asp
435 440 445
Gly Trp Leu His Val Val Asp Arg Val Lys Glu Leu Ile Lys Tyr Lys
450 455 460
Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Leu Thr His
465 470 475 480
Gly Gly Ile Ala Asp Ala Ala Val Ile Gly Val Tyr Asp Glu Asp Glu
485 490 495
Gly Thr Glu Ile Pro His Ala Phe Val Val Arg Arg Pro Gly Gly Ala
500 505 510
Gly Asp Ser Leu Thr Ala Ala Asp Val Ala Ala His Val Ala Ala Arg
515 520 525
Val Ser Pro Tyr Lys Lys Val Arg Arg Val Ser Phe Val Ser Gly Val
530 535 540
Pro Arg Ala Ala Ser Gly Lys Ile Leu Arg Arg Glu Leu Arg Ala Ala
545 550 555 560
Arg Arg Ser Pro Arg Gly Thr Asp Pro Gly Asp Glu Asp Arg Glu Gly
565 570 575
Ala Thr Pro
<210> 50
<211> 1740
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 49
<400> 50
atgtccgctt ctactccatc tccaggtcca tctggtaccc catccggtac tccaccatcc 60
ggtccatctg gtactccatc cccaggtcca gctggtgccg gtaccgctcc agtattcaga 120
tctagatacc cagacatcga accagtttct gaaccattgc acgaagctgt tttgggtaga 180
gccgccggtt acggttccga accagccttg gtcgacggtt tgaccggtgc cgtcgtatct 240
tacgctagat tggacagaga tcacagaaga atcgccgccg ccttggccgc cgctggtgtc 300
agaaagggtg acgtcgtcgc cttgcactct ccaaactcta ccggttaccc agccgtcttg 360
tacggtgcct tgagagccgg tgccaccgtt accactgctc acccattggc tactgctgaa 420
gaattggcca gacaattgag agactctgcc gccagatgga tcgttaccgc cgccccatgt 480
ttggaaaccg ccagaagagc cgccgaattg accccaggta tcggtgaaat cttcgtattc 540
gacagagccg aaggtcacac cggtgttgcc gctatgttgg actccaccgc tccagaacca 600
gccgtcccag tcgacccaga ccaagacgtc gctttgttgc catactcctc tggtaccacc 660
ggtaccccaa agggtgttat gttgactcac agatccttgg tcaccaactt ggtccaagcc 720
cacagattga tcccattgag gccaggtgac agagtcttgg ccgttttgcc attcttccac 780
atctacggtt tggtcggttt gatgtctgcc ccattgagaa acggtgctac cgtcgtcgtc 840
ttgccaagat tcgacttgga aggtttcttg gctgccgtcg aaaagcacag agtcaccact 900
ttgtacgttg ccccaccaat cgttttggct ttggccaagc acccagctgt tgccagatac 960
gacttgtcct ctgtcagaca cgtattctct gccgccgccc cattggacgc tgaaatcgct 1020
gctgcctgtg ccgccagagt cggtgttcca ttggtcagac aagcttacgg tatgaccgaa 1080
ttgtctccag gttgttacgc cgtcccattg gacgaaccag ccccaccacc aggtactgtc 1140
ggtttgttgt tcccatccac cgaaatgaga ttgttgagat tggacgaccc aggtagatgt 1200
gtcggtccag gtgaggacgg tgaaatcgcc atcagaggtc cacaagtcat gaagggttac 1260
ttgggtagac cagaagccac cgccgaaatg atcgacgctg atggttggtt gagaaccggt 1320
gacgtcggta gagtcgacgc tgacggttgg ttgcacgtcg ttgacagagt taaggaattg 1380
atcaagtaca agggtttcca agtcgctcca gccgaattgg aagctttgtt gttgacccac 1440
ggtggtatcg ctgacgccgc cgttatcggt gtttacgacg aggacgaagg tactgaaatc 1500
ccacacgctt tcgttgtcag aaggccaggt ggtgctggtg actccttgac cgccgccgac 1560
gtcgccgccc acgtcgccgc tagagtctcc ccatacaaga aggtcagaag agtctctttc 1620
gtatccggtg ttccaagagc cgcttctggt aagatcttga gaagagaatt gagagccgct 1680
agaagatccc caagaggtac tgacccaggt gacgaggaca gagaaggtgc cactccataa 1740
<210> 51
<211> 400
<212> PRT
<213> Hordeum vulgare
<400> 51
Met Ser Ala Ala Val Arg Leu Lys Glu Val Arg Met Ala Gln Arg Ala
1 5 10 15
Glu Gly Leu Ala Thr Val Leu Ala Ile Gly Thr Ala Val Pro Ala Asn
20 25 30
Cys Val Tyr Gln Ala Thr Tyr Pro Asp Tyr Tyr Phe Arg Val Thr Lys
35 40 45
Ser Glu His Leu Ala Asp Leu Lys Glu Lys Phe Gln Arg Met Cys Asp
50 55 60
Lys Ser Met Ile Arg Lys Arg His Met His Leu Thr Glu Glu Ile Leu
65 70 75 80
Ile Lys Asn Pro Lys Ile Cys Ala His Met Glu Thr Ser Leu Asp Ala
85 90 95
Arg His Ala Ile Ala Leu Val Glu Val Pro Lys Leu Gly Gln Gly Ala
100 105 110
Ala Glu Lys Ala Ile Lys Glu Trp Gly Gln Pro Leu Ser Lys Ile Thr
115 120 125
His Leu Val Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp
130 135 140
Tyr Gln Leu Thr Lys Leu Leu Gly Leu Ser Pro Thr Val Lys Arg Leu
145 150 155 160
Met Met Tyr Gln Gln Gly Cys Phe Gly Gly Ala Thr Val Leu Arg Leu
165 170 175
Ala Lys Asp Ile Ala Glu Asn Asn Arg Gly Ala Arg Val Leu Val Val
180 185 190
Cys Ser Glu Ile Thr Ala Met Ala Phe Arg Gly Pro Cys Lys Ser His
195 200 205
Leu Asp Ser Leu Val Gly His Ala Leu Phe Gly Asp Gly Ala Ala Ala
210 215 220
Ala Ile Ile Gly Ala Asp Pro Asp Gln Leu Asp Glu Gln Pro Val Phe
225 230 235 240
Gln Leu Val Ser Ala Ser Gln Thr Ile Leu Pro Glu Ser Glu Gly Ala
245 250 255
Ile Asp Gly His Leu Thr Glu Ala Gly Leu Thr Ile His Leu Leu Lys
260 265 270
Asp Val Pro Gly Leu Ile Ser Glu Asn Ile Glu Gln Ala Leu Glu Asp
275 280 285
Ala Phe Glu Pro Leu Gly Ile His Asn Trp Asn Ser Ile Phe Trp Ile
290 295 300
Ala His Pro Gly Gly Pro Ala Ile Leu Asp Arg Val Glu Asp Arg Val
305 310 315 320
Gly Leu Asp Lys Lys Arg Met Arg Ala Ser Arg Glu Val Leu Ser Glu
325 330 335
Tyr Gly Asn Met Ser Ser Ala Ser Val Leu Phe Val Leu Asp Val Met
340 345 350
Arg Lys Ser Ser Ala Lys Asp Gly Leu Ala Thr Thr Gly Glu Gly Lys
355 360 365
Asp Trp Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr
370 375 380
Leu Val Leu His Ser Val Pro Val Pro Val Pro Thr Ala Ala Ser Ala
385 390 395 400
<210> 52
<211> 1203
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 51
<400> 52
atgtccgctg ctgttagatt gaaggaagtt agaatggctc aaagagctga aggtttggct 60
actgttttgg ccattggtac cgccgttcca gccaactgtg tttaccaagc tacctaccca 120
gactactact tcagagtcac taagtctgaa cacttggctg acttgaagga aaagttccaa 180
agaatgtgtg acaagtccat gatcagaaag agacacatgc acttgaccga agaaatcttg 240
attaagaacc caaagatctg tgctcacatg gaaacctctt tggacgctag acacgccatt 300
gctttggtcg aagtcccaaa gttgggtcaa ggtgctgctg aaaaggctat caaggaatgg 360
ggtcaaccat tgtccaagat cacccacttg gttttctgta ctacctctgg tgtcgacatg 420
ccaggtgccg actaccaatt gaccaagttg ttgggtttgt ccccaactgt taagagattg 480
atgatgtacc aacaaggttg tttcggtggt gccactgttt tgagattggc caaggacatc 540
gctgaaaaca acagaggtgc tagagttttg gttgtctgtt ctgaaatcac cgccatggcc 600
ttcagaggtc catgtaagtc ccacttggac tctttggtcg gtcacgcttt gttcggtgat 660
ggtgctgctg ctgccatcat cggtgctgac ccagaccaat tggacgaaca accagttttc 720
caattggttt ctgcttctca aaccatcttg ccagaatctg aaggtgccat cgacggtcac 780
ttgactgaag ctggtttgac catccacttg ttgaaggacg ttccaggttt gatctctgaa 840
aacatcgaac aagctttgga agatgctttc gaaccattgg gtatccacaa ctggaactcc 900
atcttctgga ttgctcaccc aggtggtcca gccatcttgg acagagtcga agatagagtt 960
ggtttggaca agaagagaat gagagcttct agagaagttt tgtctgaata cggtaacatg 1020
tcctctgctt ctgttttgtt cgtcttggac gttatgagaa agtcatccgc caaggatggt 1080
ttggccacta ctggtgaagg taaggactgg ggtgtcttgt tcggtttcgg tccaggtttg 1140
accgtcgaaa ctttggtctt gcactctgtc ccagtcccag tcccaaccgc cgcttctgct 1200
taa 1203
<210> 53
<211> 392
<212> PRT
<213> Citrus sinensis
<400> 53
Met Ser Ala Thr Val Gln Glu Ile Arg Asn Ala Gln Arg Ala Asp Gly
1 5 10 15
Pro Ala Thr Val Leu Ala Ile Gly Thr Ala Thr Pro Ala His Ser Val
20 25 30
Asn Gln Ala Asp Tyr Pro Asp Tyr Tyr Phe Arg Ile Thr Lys Ser Glu
35 40 45
His Met Thr Glu Leu Lys Glu Lys Phe Lys Arg Met Cys Asp Lys Ser
50 55 60
Met Ile Lys Lys Arg Tyr Met Tyr Leu Thr Glu Glu Ile Leu Lys Glu
65 70 75 80
Asn Pro Asn Met Cys Ala Tyr Met Ala Pro Ser Leu Asp Ala Arg Gln
85 90 95
Asp Ile Val Val Val Glu Val Pro Lys Leu Gly Lys Glu Ala Ala Thr
100 105 110
Lys Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu
115 120 125
Ile Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp Tyr Gln
130 135 140
Leu Thr Lys Leu Ile Gly Leu Arg Pro Ser Val Lys Arg Phe Met Met
145 150 155 160
Tyr Gln Gln Gly Cys Phe Ala Gly Gly Thr Val Leu Arg Leu Ala Lys
165 170 175
Asp Leu Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Val Val Cys Ser
180 185 190
Glu Ile Thr Ala Val Thr Phe Arg Gly Pro Ala Asp Thr His Leu Asp
195 200 205
Ser Leu Val Gly Gln Ala Leu Phe Gly Asp Gly Ala Ala Ala Val Ile
210 215 220
Val Gly Ala Asp Pro Asp Thr Ser Val Glu Arg Pro Leu Tyr Gln Leu
225 230 235 240
Val Ser Thr Ser Gln Thr Ile Leu Pro Asp Ser Asp Gly Ala Ile Asp
245 250 255
Gly His Leu Arg Glu Val Gly Leu Thr Phe His Leu Leu Lys Asp Val
260 265 270
Pro Gly Leu Ile Ser Lys Asn Ile Glu Lys Ser Leu Ser Glu Ala Phe
275 280 285
Ala Pro Leu Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Ala His
290 295 300
Pro Gly Gly Pro Ala Ile Leu Asp Gln Val Glu Ser Lys Leu Gly Leu
305 310 315 320
Lys Gly Glu Lys Leu Lys Ala Thr Arg Gln Val Leu Ser Glu Tyr Gly
325 330 335
Asn Met Ser Ser Ala Cys Val Leu Phe Ile Leu Asp Glu Met Arg Lys
340 345 350
Lys Ser Val Glu Glu Ala Lys Ala Thr Thr Gly Glu Gly Leu Asp Trp
355 360 365
Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr Val Val
370 375 380
Leu His Ser Val Pro Ile Lys Ala
385 390
<210> 54
<211> 1179
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 53
<400> 54
atgtccgcta ccgttcaaga aatcagaaac gctcaaagag ccgacggtcc agccaccgtc 60
ttggccatcg gtactgccac tccagcccac tctgtcaacc aagctgatta cccagactac 120
tacttcagaa tcactaagtc tgaacacatg actgaattga aggaaaagtt caagagaatg 180
tgtgacaagt ctatgattaa gaagagatac atgtacttga ctgaagaaat tttgaaggaa 240
aacccaaaca tgtgtgctta catggctcca tctttggacg ctagacaaga cattgttgtt 300
gtcgaagttc caaagttggg taaggaagct gctactaagg ccatcaagga atggggtcaa 360
ccaaagtcta agatcaccca cttgatcttc tgtaccacct ccggtgtcga catgccaggt 420
gccgactacc aattgaccaa gttgatcggt ttaagaccat ccgtcaagag attcatgatg 480
taccaacaag gttgtttcgc cggtggtact gttttgagat tggctaagga cttggctgaa 540
aacaacaagg gtgctagagt tttggttgtc tgttctgaaa tcactgctgt cactttcaga 600
ggtccagccg atactcactt ggattctttg gttggtcaag ctttgttcgg tgatggtgct 660
gctgctgtta tcgttggtgc cgatccagac acttctgtcg aaagaccatt gtaccaattg 720
gtttctactt ctcaaactat cttgccagac tctgacggtg ctattgacgg tcacttgaga 780
gaagtcggtt tgactttcca cttgttgaag gacgtcccag gtttgatctc taagaacatc 840
gaaaagtctt tgtctgaagc tttcgcccca ttgggtatct ctgactggaa ctctatcttc 900
tggatcgctc acccaggtgg tccagctatt ttggaccaag ttgaatctaa gttgggtttg 960
aagggtgaaa agttgaaggc cactagacaa gttttgtctg aatacggtaa catgtcatct 1020
gcttgtgtct tgttcatctt ggacgaaatg agaaagaagt ctgttgaaga agctaaggcc 1080
accaccggtg aaggtttgga ttggggtgtt ttgttcggtt tcggtccagg tttgaccgtc 1140
gaaaccgttg ttttgcactc tgtcccaatc aaggcttaa 1179
<210> 55
<211> 391
<212> PRT
<213> Citrus sinensis
<400> 55
Met Ser Leu Thr Val Asp Glu Val Arg Lys Ala Gln Arg Ala Glu Gly
1 5 10 15
Pro Ala Thr Ile Met Ala Ile Gly Thr Ala Thr Pro Pro Asn Cys Val
20 25 30
Asp Gln Ser Thr Tyr Pro Asp Tyr Tyr Phe Arg Ile Thr Asn Ser Glu
35 40 45
His Met Thr Asp Leu Lys Glu Lys Phe Lys Arg Met Cys Asp Lys Ser
50 55 60
Met Ile Lys Lys Arg Tyr Met Tyr Leu Thr Glu Glu Ile Leu Lys Glu
65 70 75 80
Asn Pro Asn Val Cys Ala Tyr Met Ala Pro Ser Leu Asp Thr Arg Gln
85 90 95
Asp Met Val Val Val Glu Val Pro Arg Leu Gly Lys Glu Ala Ala Thr
100 105 110
Lys Ala Ile Lys Glu Trp Gly Gln Pro Lys Ser Lys Ile Thr His Leu
115 120 125
Val Phe Cys Thr Thr Ser Gly Val Asp Met Pro Gly Ala Asp Tyr Arg
130 135 140
Leu Thr Lys Leu Leu Gly Leu Arg Pro Ser Val Lys Arg Leu Met Met
145 150 155 160
Tyr Gln Gln Gly Cys Phe Ala Gly Gly Thr Val Leu Arg Leu Ala Lys
165 170 175
Asp Leu Ala Glu Asn Asn Lys Gly Ala Arg Val Leu Val Val Cys Ser
180 185 190
Glu Ile Thr Ala Val Thr Phe Arg Gly Pro Ser Asp Thr His Leu Asp
195 200 205
Ser Leu Val Gly Gln Ala Leu Phe Gly Asp Gly Ala Ala Ala Ile Ile
210 215 220
Ile Gly Ala Asp Pro Ile Pro Glu Ile Glu Lys Pro Met Phe Glu Leu
225 230 235 240
Val Ser Thr Ala Gln Thr Ile Leu Pro Asp Ser Asp Gly Ser Ile Asp
245 250 255
Gly His Leu Arg Glu Val Gly Leu Thr Phe His Leu Leu Lys Asp Val
260 265 270
Pro Gly Leu Ile Ser Lys Asn Ile Gln Lys Ser Leu Thr Glu Ala Phe
275 280 285
Lys Pro Leu Gly Ile Ser Asp Trp Asn Ser Ile Phe Trp Ile Ala His
290 295 300
Pro Gly Gly Pro Thr Ile Leu Asp Gln Val Glu Glu Lys Leu Gly Leu
305 310 315 320
Lys Pro Glu Lys Leu Arg Ala Thr Arg His Val Leu Ser Glu Tyr Gly
325 330 335
Asn Met Ser Ser Ala Cys Val Leu Phe Ile Leu Asp Glu Met Arg Lys
340 345 350
Lys Ser Ala Glu Asp Gly Leu Glu Thr Ala Gly Glu Gly Leu Glu Trp
355 360 365
Gly Val Leu Phe Gly Phe Gly Pro Gly Leu Thr Val Glu Thr Val Val
370 375 380
Leu His Ser Val Ala Ala Ala
385 390
<210> 56
<211> 1176
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 55
<400> 56
atgtccttga ccgtcgatga agttagaaag gctcaaagag ccgaaggtcc agccactatc 60
atggccattg gtactgctac cccaccaaac tgtgttgatc aatctactta cccagattac 120
tacttcagaa tcactaactc tgaacacatg actgatttga aggaaaagtt caagagaatg 180
tgtgacaagt ccatgatcaa gaagagatac atgtacttga ctgaagaaat cttgaaggaa 240
aacccaaacg tttgtgctta catggctcca tctttggata ctagacaaga tatggttgtt 300
gttgaagttc caagattggg taaggaagct gccaccaagg ccattaagga atggggtcaa 360
ccaaagtcca agatcaccca cttggtattc tgtaccactt ctggtgttga catgccaggt 420
gccgattaca gattgactaa gttgttgggt ttaagaccat ccgtcaagag attgatgatg 480
taccaacaag gttgtttcgc cggtggtact gttttgagat tggccaagga cttggccgaa 540
aacaacaagg gtgctagagt cttggttgtt tgttccgaaa tcaccgctgt tactttcaga 600
ggtccatctg acacccactt ggattctttg gttggtcaag ccttgttcgg tgatggtgct 660
gctgctatta tcattggtgc cgacccaatc ccagaaatcg aaaagccaat gttcgaattg 720
gtatctactg cccaaactat cttgccagat tctgatggtt ctatcgacgg tcacttgaga 780
gaagttggtt tgaccttcca cttgttgaag gatgttccag gtttgatttc taagaacatc 840
caaaagtctt tgaccgaagc tttcaagcca ttgggtatct ctgactggaa ctctattttc 900
tggatcgctc acccaggtgg tccaactatt ttggaccaag tcgaagaaaa gttgggtttg 960
aagccagaaa agttgagagc cactagacac gttttgtctg aatacggtaa catgtcatct 1020
gcttgtgttt tgttcatttt ggacgaaatg agaaagaagt ctgctgaaga tggtttggaa 1080
accgctggtg aaggtttgga atggggtgtc ttgttcggtt tcggtccagg tttgactgtt 1140
gaaaccgttg tcttgcactc tgttgccgct gcttaa 1176
<210> 57
<211> 352
<212> PRT
<213> Streptomyces clavuligerus
<400> 57
Met Ser Ala Val Leu Cys Lys Pro Ala Ile Ala Val Pro Asp His Ile
1 5 10 15
Ile Thr Asn Glu Glu Thr Leu Glu Leu Ala Arg Arg Leu His Ser Asp
20 25 30
His Pro Gln Leu Ala Leu Ala Cys Arg Leu Ile Glu His Thr Gly Val
35 40 45
Arg Lys Arg His Leu Ile Gln Pro Ile Asp Glu Val Leu Lys His Pro
50 55 60
Gly Leu Asp Ala Arg Ser Ala Thr Tyr Glu Thr Glu Ser Lys Ala Arg
65 70 75 80
Val Pro Ser Val Val Arg Arg Ala Leu Asp Gln Ala Glu Leu Glu Pro
85 90 95
Asp Gln Ile Asp Leu Ile Ile Tyr Val Ser Cys Thr Gly Phe Met Met
100 105 110
Pro Ser Leu Ala Ser Trp Leu Val Asn Thr Met Gly Phe Arg Ala Asp
115 120 125
Thr Arg Gln Leu Pro Ile Ala Gln Leu Gly Cys Ala Ala Gly Gly Ala
130 135 140
Ala Val Asn Arg Ala His Asp Phe Cys Thr Ala Tyr Pro Gly Thr Asn
145 150 155 160
Val Leu Ile Val Ala Cys Glu Phe Cys Ser Leu Cys Tyr Gln Pro Thr
165 170 175
Asp Leu Gly Ile Gly Ser Leu Leu Ser Asn Gly Leu Phe Gly Asp Gly
180 185 190
Ile Ala Ala Ala Val Val Arg Gly Glu Glu Gly Thr Gly Met Arg Leu
195 200 205
Glu Arg Asn Gly Thr Tyr Leu Ile Pro His Thr Glu Glu Trp Ile Ser
210 215 220
Tyr Ala Val Arg Ser Thr Gly Phe His Phe Gln Leu Asp Lys Arg Val
225 230 235 240
Pro Gly Thr Met Glu Pro Leu Ser Pro Ala Leu Arg Ala Leu Ala Glu
245 250 255
Gln His Gln Trp Asn Ala Gly Lys Leu Asp Phe Tyr Ile Ile His Ala
260 265 270
Gly Gly Pro Arg Ile Leu Asp Asp Leu Ser Arg Phe Leu Asp Val Pro
275 280 285
Pro Gly Ala Phe Arg His Ser Arg Ala Thr Leu Thr Glu Tyr Gly Asn
290 295 300
Ile Ala Ser Ala Val Val Leu Asp Ala Leu Gly Arg Leu Phe Asp Glu
305 310 315 320
Gln Ser Ala Leu Asp Gly His His Gly Met Leu Ala Gly Phe Gly Pro
325 330 335
Gly Ile Ile Ala Glu Met Ser Leu Gly Thr Trp Val Ser Pro Glu Ser
340 345 350
<210> 58
<211> 1059
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 57
<400> 58
atgtccgctg ttttgtgtaa gccagccatc gccgttccag accacatcat caccaacgaa 60
gaaaccttgg aattggctag aagattgcac tctgaccacc cacaattggc tttggcttgt 120
agattgatcg aacacactgg tgttagaaag agacacttga tccaaccaat cgacgaagtt 180
ttgaagcacc caggtttgga cgctagatct gccacctacg aaaccgaatc caaggctaga 240
gttccatctg ttgttagaag agctttggac caagctgaat tggaaccaga tcaaatcgac 300
ttgatcatct acgtatcctg taccggtttc atgatgccat ccttggcctc ctggttggtc 360
aacaccatgg gtttcagagc tgacaccaga caattgccaa tcgcccaatt gggttgtgct 420
gctggtggtg ctgccgtcaa cagagcccac gacttctgta ccgcctaccc aggtaccaac 480
gtcttgatcg ttgcctgtga attctgttct ttgtgttacc aaccaaccga tttgggtatc 540
ggttctttgt tgtccaacgg tttgttcggt gacggtatcg ccgccgctgt tgtcagaggt 600
gaagaaggta ccggtatgag attggaaaga aacggtacct acttgatccc acacaccgaa 660
gaatggatct cctacgctgt tagatccacc ggtttccact tccaattgga caagagagtc 720
ccaggtacca tggaaccatt gtctccagct ttgagagcct tggccgaaca acaccaatgg 780
aacgccggta agttggactt ctacatcatc cacgctggtg gtccaagaat cttggacgat 840
ttgtctagat tcttggacgt tccaccaggt gccttcagac actctagagc cactttgacc 900
gaatacggta acatcgcctc tgccgtcgtt ttggacgcct tgggtagatt gttcgacgaa 960
caatccgcct tggacggtca ccacggtatg ttggctggtt tcggtccagg tatcatcgcc 1020
gaaatgtcct tgggtacctg ggtttctcca gaatcctaa 1059
<210> 59
<211> 401
<212> PRT
<213> Streptomyces clavuligerus
<400> 59
Met Ser Ser Thr Gly Ser Ser Ala His Tyr Cys Pro Phe Asp Tyr Ala
1 5 10 15
Glu Ala Leu Glu Phe Asp Pro Thr Leu Arg Arg Phe Met Arg Glu Glu
20 25 30
Pro Val Ala Arg Ile Arg Leu Pro His Gly Ala Gly Glu Ala Trp Leu
35 40 45
Val Thr Gly Tyr Asp Asp Val Arg Thr Val Thr Thr Asp Arg Arg Phe
50 55 60
Ser Arg His Ala Val Val Gly Arg Asp Phe Pro Arg Met Thr Pro Glu
65 70 75 80
Pro Ile Val Gln Asp Glu Ala Ile Asn Val Met Asp Pro Pro Ala Ser
85 90 95
Ser Arg Leu Arg Ser Leu Val Ser Lys Gly Phe Ala Pro Glu Gln Ile
100 105 110
Glu Arg Met Arg Pro Tyr Ile Gln Arg Ala Val Asp Asp Leu Leu Asp
115 120 125
Arg Met Ala Glu Asp Ser Ser Ala Asp Leu Met Arg His Leu Ala Gly
130 135 140
Pro Leu Pro Leu Ile Thr Ile Cys Glu Val Leu Glu Ile Pro Pro Ala
145 150 155 160
Asp Gln Glu Thr Leu Arg Gly His Ala Arg Thr Met Met Asn Ile Ser
165 170 175
Val Asp Asn Lys Ala Ala Ala Val Arg Ala Lys Ala Asp Leu Arg Ala
180 185 190
Tyr Phe Ala Asp Leu Thr Ala Arg Arg Arg Ala Asp Pro Gly Glu Asp
195 200 205
Leu Ile Ser Val Leu Ala Thr Ala Arg Asp Gly Asp Glu Leu Leu Asp
210 215 220
Asp Gln Glu Leu Thr Val Met Ala Met Val Leu Leu Ile Thr Gly Gln
225 230 235 240
Asp Thr Thr Thr Tyr Glu Leu Gly Asn Leu Ser Tyr Thr Leu Leu Thr
245 250 255
Arg Pro Asp Val Arg Asp Leu Leu Arg Asp Arg Pro Glu Arg Leu Ala
260 265 270
Gln Thr Ile Asn Glu Leu Leu Arg Phe Ile Pro Phe Arg Lys Gly Val
275 280 285
Gly Ile Pro Arg Val Ala Thr Glu Asp Val Glu Leu Ser Gly Val Thr
290 295 300
Ile Pro Ala Gly Asp Ile Val His Val Ser Tyr Leu Thr Ala Asn Arg
305 310 315 320
Asp Gly Arg Lys Phe Asp Arg Pro Asp Glu Leu Asp Phe Asp Arg Thr
325 330 335
Ala Pro Ser His Met Thr Phe Gly Trp Gly Ala His His Cys Leu Gly
340 345 350
Ala Pro Leu Ala Gln Ala Glu Met Glu Thr Ala Phe Arg Thr Leu Leu
355 360 365
Glu Arg Phe Pro Gly Ile Ala Leu Ala Lys Pro Ala Glu Asp Val Glu
370 375 380
Trp Asn Thr Thr Ser Ile Trp Arg Tyr Pro Leu Ala Leu Pro Val Thr
385 390 395 400
Trp
<210> 60
<211> 1206
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 59
<400> 60
atgtcctcca ccggttcctc tgctcactac tgtccattcg actacgccga agccttggaa 60
ttcgacccaa ctttgagaag attcatgaga gaagaaccag tcgctagaat cagattgcca 120
cacggtgctg gtgaagcttg gttggtcacc ggttacgacg atgttagaac cgttaccacc 180
gacagaagat tctctagaca cgccgttgtc ggtagagact tcccaagaat gactccagaa 240
ccaatcgtcc aagacgaagc catcaacgtc atggacccac cagcttcttc tagattgaga 300
tctttggttt ccaagggttt cgccccagaa caaatcgaaa gaatgaggcc atacatccaa 360
agagccgttg acgacttgtt ggacagaatg gctgaggact cctccgccga cttgatgaga 420
cacttggctg gtccattgcc attgatcacc atctgtgaag tcttggaaat cccaccagcc 480
gaccaagaaa ccttgagagg tcacgccaga actatgatga acatctctgt tgacaacaag 540
gccgccgccg ttagagccaa ggccgatttg agagcctact tcgctgactt gactgccaga 600
agaagagctg acccaggtga ggacttgatc tctgttttgg ccactgccag ggacggtgac 660
gaattgttgg acgaccaaga attgaccgtc atggctatgg tcttgttgat caccggtcaa 720
gacaccacca cctacgaatt gggtaacttg tcctacacct tgttgaccag accagacgtc 780
agagatttgt tgagagacag accagaaaga ttggctcaaa ctatcaacga attgttgaga 840
ttcatcccat tcagaaaggg tgtcggtatc ccaagagttg ccaccgagga cgttgaattg 900
tctggtgtta ctatcccagc cggtgacatc gtccacgtat cctacttgac cgccaacaga 960
gatggtagaa agttcgacag accagacgaa ttggacttcg acagaaccgc cccatcccac 1020
atgaccttcg gttggggtgc tcaccactgt ttgggtgccc cattggctca agccgaaatg 1080
gaaaccgcct tcagaacttt gttggaaaga ttcccaggta tcgctttggc taagccagcc 1140
gaggacgttg aatggaacac cacctctatc tggagatacc cattggcttt gccagtcacc 1200
tggtaa 1206
<210> 61
<211> 246
<212> PRT
<213> Arabidopsis thaliana
<400> 61
Met Ser Ser Ser Asn Ala Cys Ala Ser Pro Ser Pro Phe Pro Ala Val
1 5 10 15
Thr Lys Leu His Val Asp Ser Val Thr Phe Val Pro Ser Val Lys Ser
20 25 30
Pro Ala Ser Ser Asn Pro Leu Phe Leu Gly Gly Ala Gly Val Arg Gly
35 40 45
Leu Asp Ile Gln Gly Lys Phe Val Ile Phe Thr Val Ile Gly Val Tyr
50 55 60
Leu Glu Gly Asn Ala Val Pro Ser Leu Ser Val Lys Trp Lys Gly Lys
65 70 75 80
Thr Thr Glu Glu Leu Thr Glu Ser Ile Pro Phe Phe Arg Glu Ile Val
85 90 95
Thr Gly Ala Phe Glu Lys Phe Ile Lys Val Thr Met Lys Leu Pro Leu
100 105 110
Thr Gly Gln Gln Tyr Ser Glu Lys Val Thr Glu Asn Cys Val Ala Ile
115 120 125
Trp Lys Gln Leu Gly Leu Tyr Thr Asp Cys Glu Ala Lys Ala Val Glu
130 135 140
Lys Phe Leu Glu Ile Phe Lys Glu Glu Thr Phe Pro Pro Gly Ser Ser
145 150 155 160
Ile Leu Phe Ala Leu Ser Pro Thr Gly Ser Leu Thr Val Ala Phe Ser
165 170 175
Lys Asp Asp Ser Ile Pro Glu Thr Gly Ile Ala Val Ile Glu Asn Lys
180 185 190
Leu Leu Ala Glu Ala Val Leu Glu Ser Ile Ile Gly Lys Asn Gly Val
195 200 205
Ser Pro Gly Thr Arg Leu Ser Val Ala Glu Arg Leu Ser Gln Leu Met
210 215 220
Met Lys Asn Lys Asp Glu Lys Glu Val Ser Asp His Ser Val Glu Glu
225 230 235 240
Lys Leu Ala Lys Glu Asn
245
<210> 62
<211> 741
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 61
<400> 62
atgtcctcta gcaatgcgtg tgcctccccg tccccgttcc cggctgttac gaagctgcat 60
gtcgattcag ttacctttgt cccgtccgtg aagtccccgg cgagcagcaa cccgctgttt 120
ctgggcggtg caggtgtccg tggtctggat attcagggca aatttgtgat tttcaccgtg 180
atcggcgttt atctggaagg caatgcggtc ccgtcactgt cggtgaaatg gaagggtaaa 240
accacggaag aactgaccga atctattccg tttttccgcg aaatcgttac gggcgcgttc 300
gaaaagttca tcaaggtcac catgaaactg ccgctgacgg gtcagcaata ttcagaaaag 360
gttaccgaaa actgcgtcgc catctggaaa caactgggcc tgtacacgga ctgtgaagcg 420
aaggccgtcg aaaagtttct ggaaattttc aaagaagaaa cctttccgcc gggcagttcc 480
atcctgttcg cactgagccc gaccggttct ctgacggttg ctttcagtaa agatgactcc 540
atcccggaaa ccggcattgc agtgatcgaa aacaagctgc tggcagaagc tgttctggaa 600
agcattatcg gcaaaaatgg tgtgtcaccg ggtacgcgtc tgtcggttgc ggaacgcctg 660
agccagctga tgatgaaaaa taaagatgaa aaggaagtgt cggaccacag cgttgaagaa 720
aaactggcaa aggaaaacta a 741
<210> 63
<211> 719
<212> PRT
<213> Citrus sinensis
<400> 63
Met Ser Glu Ile Gly Ala Thr Thr Glu Asn Gly His Gln Asn Gly Gly
1 5 10 15
Leu Glu Gly Leu Cys Lys Asn Asn Asn Tyr Asn Tyr Ser Ser Gly Asp
20 25 30
Ala Leu Asn Trp Gly Val Met Ala Glu Thr Leu Lys Gly Ser His Leu
35 40 45
Glu Glu Val Lys Arg Met Val Ala Glu Tyr Arg Lys Pro Val Val Asn
50 55 60
Leu Gly Gly Glu Thr Leu Thr Val Ala Gln Val Ala Ala Ile Ala Thr
65 70 75 80
Ser Ser Thr Asn Val Glu Leu Ser Glu Ser Ala Arg Glu Gly Val Lys
85 90 95
Ala Ser Ser Asp Trp Val Met Glu Ser Met Asn Lys Gly Thr Asp Ser
100 105 110
Tyr Gly Val Thr Thr Gly Phe Gly Ala Thr Ser His Arg Arg Thr Lys
115 120 125
Asn Gly Gly Ala Leu Gln Lys Glu Leu Ile Arg Phe Leu Asn Ala Gly
130 135 140
Ile Phe Gly Asn Gly Thr Glu Ser Ser His Thr Leu Pro His Ser Ala
145 150 155 160
Thr Arg Ala Ala Met Leu Val Arg Val Asn Thr Leu Leu Gln Gly Tyr
165 170 175
Ser Gly Ile Arg Phe Glu Ile Leu Glu Ala Ile Thr Lys Leu Leu Asn
180 185 190
His Asn Ile Thr Pro Cys Leu Pro Leu Arg Gly Thr Ile Thr Ala Ser
195 200 205
Gly Asp Leu Val Pro Leu Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg
210 215 220
Pro Asn Ser Lys Ala Thr Gly Pro Asn Gly Glu Ile Ile Asp Ala Gln
225 230 235 240
Glu Ala Ser Lys Gln Ala Gly Phe Gly Phe Phe Glu Leu Gln Pro Lys
245 250 255
Glu Gly Leu Ala Leu Val Asn Gly Thr Ala Val Gly Ser Gly Leu Ala
260 265 270
Ser Met Val Leu Phe Glu Ala Asn Asn Leu Ala Leu Leu Ser Glu Ile
275 280 285
Leu Ser Ala Ile Phe Ala Glu Val Met Gln Gly Lys Pro Glu Phe Thr
290 295 300
Asp His Leu Thr His Lys Leu Lys His His Pro Gly Gln Ile Glu Ala
305 310 315 320
Ala Ala Ile Met Glu His Ile Leu Asp Gly Ser Ser Tyr Val Asn Val
325 330 335
Ala Lys Lys Leu His Glu Ile Asp Pro Leu Gln Lys Pro Lys Gln Asp
340 345 350
Arg Tyr Ala Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ile Glu
355 360 365
Val Ile Arg Phe Ala Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val
370 375 380
Asn Asp Asn Pro Leu Ile Asp Val Ser Arg Asn Lys Ala Leu His Gly
385 390 395 400
Gly Asn Phe Gln Gly Thr Pro Ile Gly Val Ser Met Asp Asn Thr Arg
405 410 415
Leu Ala Ile Ala Ala Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu
420 425 430
Leu Val Asn Asp Phe Tyr Asn Asn Gly Leu Pro Ser Asn Leu Ser Gly
435 440 445
Gly Arg Asn Pro Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala
450 455 460
Met Ala Ser Tyr Cys Ser Glu Leu Gln Phe Leu Ala Asn Pro Val Thr
465 470 475 480
Asn His Val Gln Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu
485 490 495
Gly Leu Ile Ser Ser Arg Lys Thr Ala Glu Ala Val Asp Ile Leu Lys
500 505 510
Leu Met Ser Ser Thr Phe Leu Val Ala Leu Cys Gln Ala Ile Asp Leu
515 520 525
Arg His Leu Glu Glu Asn Leu Lys His Thr Val Lys Asn Thr Val Ser
530 535 540
Gln Val Ala Lys Lys Val Leu Thr Val Gly Ala Ser Gly Glu Leu His
545 550 555 560
Pro Ser Arg Phe Cys Glu Lys Asp Leu Leu Lys Ala Ala Asp Arg Glu
565 570 575
His Val Phe Ala Tyr Ile Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu
580 585 590
Met Gln Lys Leu Arg Gln Val Leu Val Glu His Ala Leu Asn Asn Gly
595 600 605
Glu Asn Glu Lys Thr Ala Asn Ser Ser Ile Phe Gln Lys Ile Ala Ala
610 615 620
Phe Glu Glu Glu Leu Lys Thr Val Leu Pro Lys Glu Val Glu Asn Ala
625 630 635 640
Arg Gln Thr Val Glu Asn Gly Ser Pro Thr Ile Pro Asn Arg Ile Lys
645 650 655
Glu Cys Arg Ser Tyr Pro Leu Tyr Arg Phe Val Arg Glu Gly Leu Gly
660 665 670
Ser Asn Phe Leu Thr Gly Glu Lys Val Thr Ser Pro Gly Glu Glu Phe
675 680 685
Asp Lys Val Phe Thr Ala Met Cys Gln Gly Lys Ile Ile Asp Pro Met
690 695 700
Leu Glu Cys Leu Arg Glu Trp Asn Gly Ala Pro Leu Pro Ile Cys
705 710 715
<210> 64
<211> 2160
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 63
<400> 64
atgtccgaaa tcggtgccac tactgaaaac ggtcaccaaa acggtggcct cgaaggcttg 60
tgtaagaaca ataactacaa ctactcttct ggtgatgctt tgaactgggg tgttatggct 120
gaaactttga agggttctca cttggaagaa gttaagagaa tggttgctga atacagaaag 180
ccagttgtca acttgggtgg tgaaactttg accgttgctc aagttgctgc cattgccact 240
tcctctacta acgttgaatt gtctgaatct gccagagaag gtgtcaaggc ctcttctgat 300
tgggttatgg aatctatgaa caagggtacc gactcttacg gtgttactac tggcttcggt 360
gccacttcgc acagaagaac caagaacggt ggtgctttgc aaaaggaatt gattagattc 420
ttgaacgctg gtatcttcgg taacggtact gaatcttctc acactttgcc acactctgct 480
actagagctg ccatgttggt tcgtgttaac acattgttgc aaggttactc cggtatcaga 540
ttcgaaatct tggaagctat cactaagttg ttgaaccaca acatcactcc atgtttgcca 600
ttgagaggta ctatcactgc ttctggtgat ttggttccat tgtcctacat agccggcttg 660
ttgaccggtc gtccaaactc taaggccacc ggtccaaacg gtgaaatcat tgatgcccaa 720
gaagcctcta agcaagctgg tttcggtttc ttcgaattgc aaccaaagga gggcttggct 780
ctcgtcaacg gtactgctgt tggttctggt ttggcttcta tggttttgtt cgaagctaac 840
aatctcgcgt tgttgtcgga aattttgtct gctattttcg ctgaagtcat gcaaggtaag 900
ccagaattca ccgatcactt gactcacaag ttgaagcacc acccaggtca aattgaagct 960
gctgctatca tggaacacat cttggatggt tcttcttacg ttaacgttgc taagaagttg 1020
cacgaaattg atccattgca aaagccaaag caagatagat acgccttgag aacttctcca 1080
caatggttgg gtccacaaat cgaagttatt agattcgcta ccaagtctat tgaaagagaa 1140
atcaactctg ttaacgacaa cccattgatc gacgtttcta gaaacaaggc cttgcacggt 1200
ggtaacttcc aaggtacccc aattggtgtc tctatggaca acaccagatt ggctattgct 1260
gctatcggta agttgatgtt cgcccaattc tctgaattgg tcaacgattt ctacaacaac 1320
ggtttgccat ctaacttgtc tggtggtaga aacccatctt tggattacgg tttcaagggt 1380
gctgaaattg ctatggcttc ctactgttct gaattgcaat tcttggccaa cccagttact 1440
aaccacgtcc aatctgctga acaacacaac caagatgtta actccttggg tttgatctct 1500
tccagaaaga ctgctgaagc tgtcgacatc ttgaagttga tgtcatccac tttcttggtt 1560
gctttgtgtc aagctattga tttgagacac ttggaagaaa acttgaagca cactgtcaag 1620
aacactgtct ctcaagttgc taagaaggtc ttgaccgtcg gtgcttctgg tgaattgcac 1680
ccatctagat tctgtgaaaa ggatttgttg aaggctgctg atagagaaca cgttttcgct 1740
tacattgatg acccatgttc tgctacctac ccattgatgc aaaagttgag acaagttttg 1800
gttgaacacg ctttgaacaa cggtgaaaac gaaaagactg ccaactcttc tatcttccaa 1860
aagattgctg ccttcgaaga agaattaaag accgttttgc caaaggaagt tgaaaacgcc 1920
agacaaactg ttgaaaacgg ttctccaact attccaaaca gaatcaagga atgtagatct 1980
tacccattgt acagattcgt tagagaaggt ttgggttcta acttcttgac tggtgaaaag 2040
gttacttctc caggtgaaga attcgacaag gttttcactg ctatgtgtca aggtaagatc 2100
attgatccaa tgttggaatg tttgagagaa tggaacggtg ccccattgcc aatttgttaa 2160
<210> 65
<211> 715
<212> PRT
<213> Citrus sinensis
<400> 65
Met Ser Glu Ala Ser His Glu Asn Gln Ser Gly Gly Asn Ile Pro Ser
1 5 10 15
Gly Lys Leu Cys Thr Asn Ile Asp Pro Leu Asn Trp Val Ser Ala Ser
20 25 30
Glu Ser Leu Lys Gly Ser His Leu Asp Glu Val Lys Arg Met Val Ser
35 40 45
Glu Tyr Arg Lys Gln Val Val Arg Leu Gly Gly Glu Thr Leu Thr Ile
50 55 60
Ala Gln Val Ala Ala Val Ala Ser Arg Asp Gly Gly Val Thr Val Glu
65 70 75 80
Leu Asn Glu Glu Ala Arg Ala Gly Val Lys Ala Ser Ser Asp Trp Val
85 90 95
Met Glu Ser Met Asn Lys Gly Thr Asp Ser Tyr Gly Ile Thr Thr Gly
100 105 110
Phe Gly Ala Thr Ser His Arg Arg Thr Lys Gln Gly Ala Ala Leu Gln
115 120 125
Lys Glu Leu Ile Arg Phe Leu Asn Ala Gly Ile Phe Gly Lys Gly Thr
130 135 140
Glu Ser Cys Gln Met Leu Pro His Thr Ala Thr Arg Ala Ala Met Leu
145 150 155 160
Val Arg Ile Asn Thr Leu Leu Gln Gly Tyr Ser Gly Ile Arg Phe Glu
165 170 175
Ile Leu Glu Ala Ile Thr Lys Phe Leu Asn Arg Asn Ile Thr Pro Cys
180 185 190
Leu Pro Leu Arg Ala Ser Ile Thr Ala Ser Gly Asp Leu Ile Pro Phe
195 200 205
Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg Leu Asn Ser Val Ala Val
210 215 220
Gly Pro Asn Gly Glu Ser Leu Asn Ala Ala Glu Ala Phe Ser Gln Ala
225 230 235 240
Gly Ile Asp Gly Gly Phe Phe Glu Leu Gln Pro Lys Glu Gly Leu Ala
245 250 255
Leu Val Asn Gly Thr Gly Val Gly Ala Gly Leu Ala Ser Ile Val Leu
260 265 270
Phe Glu Ala Asn Ile Leu Thr Val Leu Ser Glu Val Leu Ser Ala Ile
275 280 285
Phe Ala Glu Ala Met Leu Gly Lys Pro Glu Phe Thr Asp His Leu Thr
290 295 300
His Lys Leu Lys His His Pro Gly Gln Ile Glu Ala Ala Ala Ile Met
305 310 315 320
Glu His Ile Leu Asp Gly Ser Ser Tyr Val Lys Ala Ala Gln Lys Leu
325 330 335
His Glu Ile Asp Pro Leu Gln Lys Pro Lys Gln Asp Arg Tyr Ala Leu
340 345 350
Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ala Glu Val Ile Arg Ala
355 360 365
Ser Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val Asn Asp Asn Pro
370 375 380
Leu Ile Asp Val Ser Arg Asn Lys Ala Leu His Gly Gly Asn Phe Gln
385 390 395 400
Gly Thr Pro Ile Gly Val Ser Met Asp Asn Ser Arg Leu Ala Ile Ala
405 410 415
Ser Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu Leu Val Asn Asp
420 425 430
Phe Tyr Ser Asn Gly Leu Pro Ser Asn Leu Ser Gly Gly Arg Asn Pro
435 440 445
Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala Met Ala Ala Tyr
450 455 460
Cys Ser Glu Leu Gln Phe Leu Ala Asn Pro Val Thr Asn His Val Gln
465 470 475 480
Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu Gly Leu Ile Ser
485 490 495
Ala Arg Lys Thr Ala Glu Ala Val Asp Ile Leu Lys Leu Met Ser Ser
500 505 510
Thr Tyr Leu Ile Ala Leu Cys Gln Ala Ile Asp Leu Arg His Leu Glu
515 520 525
Glu Asn Leu Lys Ser Thr Val Lys Asn Thr Ile Ser Gln Val Val Lys
530 535 540
Lys Val Leu Thr Met Gly Val Asn Gly Glu Leu His Pro Ser Arg Phe
545 550 555 560
Cys Glu Lys Asp Leu Leu Lys Val Val Asp Arg Glu Tyr Val Phe Ser
565 570 575
Tyr Ala Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu Met Gln Lys Leu
580 585 590
Arg Gln Val Leu Val Asp His Ala Leu Thr Asn Asn Glu Asp Leu Lys
595 600 605
Asn Ala Asn Ala Ser Ile Phe Leu Lys Ile Gly Ala Phe Glu Glu Glu
610 615 620
Leu Lys Thr Leu Leu Pro Lys Glu Val Glu Ser Ala Arg Ser Ala Phe
625 630 635 640
Glu Ser Gly Asn Leu Glu Ile Pro Asn Arg Ile Lys Glu Cys Arg Ser
645 650 655
Tyr Pro Leu Tyr Arg Phe Val Arg Glu Glu Leu Gly Ala Arg Tyr Leu
660 665 670
Thr Gly Glu Lys Ala Ile Ser Pro Gly Glu Glu Cys Asp Lys Val Phe
675 680 685
Thr Ala Ile Cys Gln Gly Lys Ile Ile Asp Pro Leu Leu Glu Cys Leu
690 695 700
Lys Glu Trp Asp Gly Ser Pro Leu Pro Ile Cys
705 710 715
<210> 66
<211> 2148
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 65
<400> 66
atgtccgaag cttctcacga aaaccaatct ggtggtaaca ttccatctgg taagttgtgt 60
actaacattg atccattgaa ctgggtttct gcttctgaat ctttgaaggg ttctcacttg 120
gatgaagtta agagaatggt ttctgaatac agaaagcaag ttgttagatt gggtggtgaa 180
accttgacta tcgctcaagt tgctgctgtt gcttctagag atggtggtgt cactgttgaa 240
ttgaacgaag aagccagagc tggtgtcaag gcttcttctg attgggttat ggaatctatg 300
aacaagggta ctgattctta cggcatcact actggcttcg gtgctacttc gcacagaaga 360
accaagcaag gtgctgcctt gcaaaaggaa ttgattagat tcttgaacgc tggtatcttc 420
ggtaagggta ctgaatcctg tcaaatgttg ccacacactg ctactagagc tgctatgctc 480
gttcgtatca acacattgtt gcaaggttac tctggtatta gattcgaaat tttggaagct 540
atcactaagt tcttgaacag aaacattact ccatgtttgc cattgagagc ctccatcact 600
gcgtcgggtg atctcatccc attctcgtac atcgccggtt tgttgaccgg tagattgaac 660
tctgttgctg ttggtccaaa cggtgaatct ttgaacgctg ctgaagcttt ctctcaagct 720
ggtattgatg gtggtttctt cgaattgcaa ccaaaggagg gcttggcgtt ggttaacggt 780
actggtgttg gtgctggttt ggcttctatt gttttgttcg aagctaacat tttgactgtt 840
ttgtccgaag ttttgtctgc tattttcgct gaagctatgt tgggtaagcc agaattcact 900
gatcacttga ctcacaagtt gaagcaccac ccaggtcaaa ttgaagctgc tgctatcatg 960
gaacacatct tggatggttc ttcttacgtt aaggctgctc aaaagttgca cgaaattgac 1020
ccattgcaaa agccaaagca agatagatac gctttgagaa cttctccaca atggttgggt 1080
ccacaagctg aagttattag agcttctact aagtctattg aaagagaaat taactctgtt 1140
aacgataacc cattgattga tgtttctaga aacaaggctt tgcacggtgg taacttccaa 1200
ggtaccccaa ttggtgtctc tatggataac tctagattgg ctattgcttc tattggtaag 1260
ttgatgttcg ctcaattctc tgaattggtt aacgatttct actctaacgg tttgccatct 1320
aacttgtctg gtggtagaaa cccatctttg gattacggtt tcaagggtgc cgaaatcgct 1380
atggctgctt actgttccga attgcaattc ttggccaacc cagttactaa ccacgtccaa 1440
tctgctgaac aacacaacca agatgttaac tctttgggtt tgatctctgc cagaaagact 1500
gctgaagctg ttgatatctt gaagttgatg tcctctactt acttgattgc tttgtgtcaa 1560
gctatcgact tgagacactt ggaagaaaac ttgaagtcta ctgttaagaa cactatctct 1620
caagttgtta agaaggtctt gactatgggt gtcaacggtg aattgcaccc atctagattc 1680
tgtgaaaagg atttgttgaa ggttgttgat agagaatacg ttttctctta cgctgatgat 1740
ccatgttctg ctacttaccc attgatgcaa aagttgagac aagtcttggt tgatcacgct 1800
ttgactaaca acgaagattt gaagaacgct aacgcttcta tcttcttgaa aataggtgcg 1860
ttcgaagaag aactcaagac cttgttgcca aaggaagttg aatctgctag atctgctttc 1920
gaatctggta acttggaaat cccaaacaga attaaggaat gtagatccta cccattgtac 1980
agattcgtta gagaagaatt gggtgctaga tacttgactg gtgaaaaggc tatctctcca 2040
ggtgaagaat gtgataaggt tttcactgct atttgtcaag gtaagatcat tgatccattg 2100
ttggaatgtt tgaaggaatg ggatggttct ccattgccaa tttgttaa 2148
<210> 67
<211> 537
<212> PRT
<213> Citrus sinensis
<400> 67
Met Ser Ala Asn Leu Val Thr Ile Ser Phe Phe Ser Ile Leu Leu Thr
1 5 10 15
Ile Ser Leu Leu Ser Phe Asn Lys Ser Leu Asn Leu Ile Ser Ile Thr
20 25 30
Leu Pro Leu Val Pro Leu Ile Ala Tyr Val Leu Lys Ser Phe Leu Lys
35 40 45
Ser Ser Lys Ala Phe Tyr Pro Pro Thr Pro Ile Ser Ile Pro Ile Phe
50 55 60
Gly Asn Trp Leu Gln Val Gly Asn Asp Leu Asn His Arg Leu Leu Ala
65 70 75 80
Ser Met Ala Gln Ile Tyr Gly Pro Val Phe Arg Leu Lys Leu Gly Ser
85 90 95
Lys Asn Leu Ile Val Val Ser Glu Pro Asp Leu Ala Thr Gln Val Leu
100 105 110
His Thr Gln Gly Val Glu Phe Gly Ser Arg Pro Arg Asn Val Val Phe
115 120 125
Asp Ile Phe Thr Gly Asn Gly Gln Asp Met Val Phe Thr Val Tyr Gly
130 135 140
Glu His Trp Arg Lys Met Arg Arg Ile Met Thr Leu Pro Phe Phe Thr
145 150 155 160
Asn Lys Val Val His Asn Tyr Ser Asp Met Trp Glu Gln Glu Met Asp
165 170 175
Leu Val Val His Asp Leu Lys Asn Asp Tyr Glu Ser Val Ser Thr Lys
180 185 190
Gly Ile Val Ile Arg Lys Arg Leu Gln Leu Met Leu Tyr Asn Ile Met
195 200 205
Tyr Arg Met Met Phe Asp Ala Lys Phe Glu Ser Gln Glu Asp Pro Leu
210 215 220
Phe Ile Glu Ala Thr Arg Phe Asn Ser Glu Arg Ser Arg Leu Ala Gln
225 230 235 240
Ser Phe Glu Tyr Asn Tyr Gly Asp Phe Ile Pro Leu Leu Arg Pro Phe
245 250 255
Leu Arg Gly Tyr Leu Asn Lys Cys Arg Asp Leu Gln Cys Arg Arg Leu
260 265 270
Ala Phe Phe Asn Asn Asn Phe Val Glu Lys Arg Arg Lys Ile Met Ala
275 280 285
Ala Asn Gly Glu Lys His Lys Ile Ser Cys Ala Ile Asp His Ile Ile
290 295 300
Asp Ala Gln Met Lys Gly Glu Ile Thr Glu Glu Asn Val Ile Tyr Ile
305 310 315 320
Val Glu Asn Ile Asn Val Ala Ala Ile Glu Thr Thr Leu Trp Ser Met
325 330 335
Glu Trp Ala Ile Ala Glu Leu Val Asn His Pro Glu Val Gln Gln Lys
340 345 350
Ile Arg Arg Glu Ile Ser Thr Val Leu Lys Gly Asn Pro Val Thr Glu
355 360 365
Ser Asn Leu His Glu Leu Pro Tyr Leu Gln Ala Ala Val Lys Glu Val
370 375 380
Leu Arg Leu His Thr Pro Ile Pro Leu Leu Val Pro His Met Asn Leu
385 390 395 400
Glu Glu Ala Lys Leu Gly Gly Phe Thr Ile Pro Lys Glu Ser Lys Ile
405 410 415
Val Val Asn Ala Trp Trp Leu Ala Asn Asn Pro Lys Trp Trp Glu Lys
420 425 430
Pro Glu Glu Phe Arg Pro Glu Arg Phe Leu Glu Glu Glu Cys Asn Ile
435 440 445
Asp Ala Val Ala Gly Gly Gly Lys Val Asp Phe Arg Tyr Leu Pro Phe
450 455 460
Gly Val Gly Arg Arg Ser Cys Pro Gly Ile Ile Leu Ala Leu Pro Ile
465 470 475 480
Leu Gly Leu Val Ile Ala Lys Leu Val Thr Ser Phe Glu Met Lys Ala
485 490 495
Pro Gln Gly Ile Asp Lys Ile Asp Val Ser Glu Lys Gly Gly Gln Phe
500 505 510
Ser Leu His Ile Ala Asn His Ser Thr Val Val Phe Asp Pro Ile Met
515 520 525
Glu Ser Leu Ser Gln Pro Met Pro Gln
530 535
<210> 68
<211> 1614
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 67
<400> 68
atgtccgcta acttggttac tatttctttc ttctctatct tgttgactat ctctttgttg 60
tctttcaaca agtctttgaa cttgatctct atcactttgc cattggttcc attgattgct 120
tacgttttga agtccttctt gaagtcatct aaggccttct acccaccaac tccaatctct 180
atcccaatct tcggtaactg gttgcaagtt ggtaacgact tgaaccacag attgttggct 240
tctatggctc aaatttacgg tccagttttc agattgaagt tgggttctaa gaacttgatc 300
gttgtttctg aaccagacct cgctactcaa gtgctacaca ctcaaggtgt tgaattcggt 360
tccagaccaa gaaacgttgt tttcgatatt ttcactggta acggtcaaga catggtattt 420
actgtctacg gcgaacactg gagaaagatg agaagaatta tgactttgcc attcttcacc 480
aacaaggttg ttcacaacta ctctgacatg tgggaacaag aaatggactt ggttgttcac 540
gacttgaaga acgattacga gtctgtaagc actaagggta ttgttattag aaagagattg 600
caattgatgt tgtacaacat tatgtacaga atgatgttcg atgctaagtt cgaatctcaa 660
gaagatccat tgttcattga agctactaga ttcaactctg aaagatctag attggcgcag 720
agcttcgaat acaactacgg tgatttcatt ccattgttaa gaccattctt gagaggttac 780
ttgaacaagt gtagagactt gcaatgtaga agattggctt tcttcaacaa caacttcgtt 840
gaaaagagaa gaaagatcat ggctgccaac ggtgaaaagc acaagatctc ttgtgccatt 900
gatcacatca ttgatgctca aatgaagggt gaaatcactg aagaaaacgt tatttacatt 960
gttgaaaaca tcaacgttgc tgctatcgaa actactttgt ggtccatgga atgggctatc 1020
gctgaattgg tcaaccaccc agaagttcaa caaaagatca gaagagaaat ctctactgtc 1080
ttgaagggta acccagtcac tgaatctaac ttgcacgaat tgccatactt gcaagccgct 1140
gttaaggaag ttttgagatt gcacactcca attccattgt tggttccaca catgaacttg 1200
gaagaagcta agttgggtgg tttcactatt ccaaaggaat ccaagattgt tgttaacgct 1260
tggtggttgg ctaacaaccc aaagtggtgg gaaaagccag aagaattcag accagaaaga 1320
ttcttggaag aagaatgtaa cattgatgct gttgctggtg gtggtaaggt tgacttcaga 1380
tacttgccat tcggtgttgg tagaagatct tgtccaggta taatattggc tctcccaatc 1440
ttgggcttgg ttattgctaa gttggttact tctttcgaaa tgaaggctcc acaaggtatc 1500
gataagattg acgtttctga aaagggtggt caattctctt tgcacattgc taaccactct 1560
actgttgtct ttgatccaat catggaatct ttgtcccaac caatgccaca ataa 1614
<210> 69
<211> 520
<212> PRT
<213> Citrus sinensis
<400> 69
Met Ser Asp Leu Asn Gly Trp Cys Asn Ser Gly Asn Gln Asn Met Cys
1 5 10 15
Cys Cys Gln Ser Tyr Val Lys Arg Gly Tyr Asp Arg Val Leu Ser Phe
20 25 30
Asn Gly Leu Ile Thr Val Ser Lys Leu Arg Gly Lys Arg Phe Lys Leu
35 40 45
Pro Pro Gly Pro Leu Pro Val Pro Val Phe Gly Asn Trp Leu Gln Val
50 55 60
Gly Asp Asp Leu Asn His Arg Asn Leu Ser Asp Leu Ala Lys Lys Tyr
65 70 75 80
Gly Asp Val Leu Leu Leu Arg Met Gly Gln Arg Asn Leu Val Val Val
85 90 95
Ser Ser Pro Asp His Ala Lys Glu Val Leu His Thr Gln Gly Val Glu
100 105 110
Phe Gly Ser Arg Thr Arg Asn Val Val Phe Asp Ile Phe Thr Gly Lys
115 120 125
Gly Gln Asp Met Val Phe Thr Val Tyr Gly Glu His Trp Arg Lys Met
130 135 140
Arg Arg Ile Met Thr Val Pro Phe Phe Thr Asn Lys Val Val Gln Gln
145 150 155 160
Gln Arg Phe Asn Trp Glu Asp Glu Ala Ala Arg Val Val Glu Asp Val
165 170 175
Lys Lys Asp Pro Glu Ala Ala Thr Asn Gly Ile Val Leu Arg Arg Arg
180 185 190
Leu Gln Leu Met Met Tyr Asn Asn Met Tyr Arg Ile Met Phe Asp Arg
195 200 205
Arg Phe Glu Ser Gln Asp Asp Pro Leu Phe Asn Arg Leu Lys Ala Leu
210 215 220
Asn Gly Glu Arg Ser Arg Leu Ala Gln Ser Phe Glu Tyr Asn Tyr Gly
225 230 235 240
Asp Phe Ile Pro Ile Leu Arg Pro Phe Leu Arg Gly Tyr Leu Lys Ile
245 250 255
Cys Lys Glu Val Lys Glu Arg Arg Leu Gln Leu Phe Lys Asp Tyr Phe
260 265 270
Val Glu Glu Arg Lys Lys Leu Ala Ser Thr Lys Ser Met Ser Asn Glu
275 280 285
Ser Leu Lys Cys Ala Ile Asp His Ile Leu Asp Ala Gln Thr Lys Gly
290 295 300
Glu Ile Asn Glu Asp Asn Val Leu Tyr Ile Val Glu Asn Ile Asn Val
305 310 315 320
Ala Ala Ile Glu Thr Thr Leu Trp Ser Ile Glu Trp Gly Ile Ala Glu
325 330 335
Leu Val Asn His Pro Glu Ile Gln Lys Lys Leu Arg Asn Glu Leu Asp
340 345 350
Thr Val Leu Gly Pro Gly His Gln Ile Thr Glu Pro Asp Thr His Lys
355 360 365
Leu Pro Tyr Leu Gln Ala Val Ile Lys Glu Thr Leu Arg Leu Arg Met
370 375 380
Ala Ile Pro Leu Leu Val Pro His Met Asn Leu His Asp Ala Lys Leu
385 390 395 400
Gly Gly Tyr Asp Val Pro Ala Glu Ser Lys Ile Leu Val Asn Ala Trp
405 410 415
Trp Leu Ala Asn Asn Pro Ala Gln Trp Lys Lys Pro Glu Glu Phe Arg
420 425 430
Pro Glu Arg Phe Leu Glu Glu Glu Ser Lys Val Glu Ala Asn Gly Asn
435 440 445
Asp Phe Arg Tyr Leu Pro Phe Gly Val Gly Arg Arg Ser Cys Pro Gly
450 455 460
Ile Ile Leu Ala Leu Pro Ile Leu Gly Ile Thr Ile Gly Arg Leu Val
465 470 475 480
Gln Asn Phe Glu Leu Leu Pro Pro Pro Gly Gln Ser Lys Ile Asp Thr
485 490 495
Ala Glu Lys Gly Gly Gln Phe Ser Leu His Ile Leu Lys His Ser Thr
500 505 510
Ile Val Ala Lys Pro Arg Ser Phe
515 520
<210> 70
<211> 1563
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 69
<400> 70
atgtccgact tgaacggttg gtgtaactct ggtaaccaaa acatgtgttg ttgtcaatct 60
tacgttaaga gaggttacga tagagttttg tctttcaacg gtttgattac cgtttctaag 120
ttgagaggta agagattcaa gttgccacca ggtccattgc cagtcccagt tttcggtaac 180
tggttgcaag tcggtgatga cttgaaccac agaaacttgt ccgacttggc caagaagtac 240
ggtgatgtct tgttgttgag aatgggtcaa agaaacttgg tcgtcgtttc ttctccagac 300
cacgccaagg aagtcttgca cactcaaggt gttgaattcg gttctagaac tcgtaatgtc 360
gtgttcgaca tcttcactgg taagggtcaa gatatggttt tcactgtcta cggcgaacac 420
tggagaaaga tgagaagaat catgaccgtc ccattcttca ctaacaaggt tgttcaacaa 480
caaagattca actgggaaga tgaagccgct agagtcgttg aagatgttaa gaaggaccca 540
gaagctgcta ccaacggtat cgtcttgaga agaagattgc aattgatgat gtacaacaac 600
atgtacagaa ttatgttcga tagaagattc gaatctcaag atgatccatt gttcaacaga 660
ttgaaggctt tgaacggtga aagatctaga ttggcgcaga gcttcgaata caactacggt 720
gatttcattc caattttaag accattcttg agaggttact tgaagatttg taaggaagtt 780
aaggaaagaa gattgcaatt gttcaaggac tacttcgttg aagaaagaaa gaagttggct 840
tctactaagt ctatgtctaa cgaatctttg aagtgtgcta tcgatcacat tttggacgct 900
caaactaagg gtgaaatcaa cgaagataac gttttgtaca tcgttgaaaa catcaacgtt 960
gccgctatcg aaactacttt gtggtctatc gaatggggta ttgctgaatt ggttaaccac 1020
ccagaaatcc aaaagaagtt gagaaacgaa ttggacaccg ttttgggtcc aggtcaccaa 1080
atcactgaac cagacaccca caagttgcca tacttgcaag ccgttatcaa ggaaactttg 1140
agattgagaa tggctattcc attgttggtt ccacacatga acttgcacga cgccaagttg 1200
ggtggttacg acgtcccagc tgaatctaag atcttggtta acgcttggtg gttggccaac 1260
aacccagccc aatggaagaa gccagaagaa ttcagaccag aaagattctt ggaagaagaa 1320
tccaaggttg aagctaacgg taacgacttc agatacttgc cattcggtgt tggtagaaga 1380
tcttgtccag gtataatatt ggctctccca attttgggca tcactattgg tagattggtt 1440
caaaacttcg aattgttgcc accaccaggt caatctaaga ttgacactgc tgaaaagggt 1500
ggtcaattct ctttgcacat tttgaagcac tctaccattg ttgccaagcc aagatctttc 1560
taa 1563
<210> 71
<211> 513
<212> PRT
<213> Saccharothrix espanaensis
<400> 71
Met Ser Thr Ile Thr Ser Pro Ala Pro Ala Gly Arg Leu Asn Asn Val
1 5 10 15
Arg Pro Met Thr Gly Glu Glu Tyr Leu Glu Ser Leu Arg Asp Gly Arg
20 25 30
Glu Val Tyr Ile Tyr Gly Glu Arg Val Asp Asp Val Thr Thr His Leu
35 40 45
Ala Phe Arg Asn Ser Val Arg Ser Ile Ala Arg Leu Tyr Asp Val Leu
50 55 60
His Asp Pro Ala Ser Glu Gly Val Leu Arg Val Pro Thr Asp Thr Gly
65 70 75 80
Asn Gly Gly Phe Thr His Pro Phe Phe Lys Thr Ala Arg Ser Ser Glu
85 90 95
Asp Leu Val Ala Ala Arg Glu Ala Ile Val Gly Trp Gln Arg Leu Val
100 105 110
Tyr Gly Trp Met Gly Arg Thr Pro Asp Tyr Lys Ala Ala Phe Phe Gly
115 120 125
Thr Leu Asp Ala Asn Ala Glu Phe Tyr Gly Pro Phe Glu Ala Asn Ala
130 135 140
Arg Arg Trp Tyr Arg Asp Ala Gln Glu Arg Val Leu Tyr Phe Asn His
145 150 155 160
Ala Ile Val His Pro Pro Val Asp Arg Asp Arg Pro Ala Asp Arg Thr
165 170 175
Ala Asp Ile Cys Val His Val Glu Glu Glu Thr Asp Ser Gly Leu Ile
180 185 190
Val Ser Gly Ala Lys Val Val Ala Thr Gly Ser Ala Met Thr Asn Ala
195 200 205
Asn Leu Ile Ala His Tyr Gly Leu Pro Val Arg Asp Lys Lys Phe Gly
210 215 220
Leu Val Phe Thr Val Pro Met Asn Ser Pro Gly Leu Lys Leu Ile Cys
225 230 235 240
Arg Thr Ser Tyr Glu Leu Met Val Ala Thr Gln Gly Ser Pro Phe Asp
245 250 255
Tyr Pro Leu Ser Ser Arg Leu Asp Glu Asn Asp Ser Ile Met Ile Phe
260 265 270
Asp Arg Val Leu Val Pro Trp Glu Asn Val Phe Met Tyr Asp Ala Gly
275 280 285
Ala Ala Asn Ser Phe Ala Thr Gly Ser Gly Phe Leu Glu Arg Phe Thr
290 295 300
Phe His Gly Cys Thr Arg Leu Ala Val Lys Leu Asp Phe Ile Ala Gly
305 310 315 320
Cys Val Met Lys Ala Val Glu Val Thr Gly Thr Thr His Phe Arg Gly
325 330 335
Val Gln Ala Gln Val Gly Glu Val Leu Asn Trp Arg Asp Val Phe Trp
340 345 350
Gly Leu Ser Asp Ala Met Ala Lys Ser Pro Asn Ser Trp Val Gly Gly
355 360 365
Ser Val Gln Pro Asn Leu Asn Tyr Gly Leu Ala Tyr Arg Thr Phe Met
370 375 380
Gly Val Gly Tyr Pro Arg Ile Lys Glu Ile Ile Gln Gln Thr Leu Gly
385 390 395 400
Ser Gly Leu Ile Tyr Leu Asn Ser Ser Ala Ala Asp Trp Lys Asn Pro
405 410 415
Asp Val Arg Pro Tyr Leu Asp Arg Tyr Leu Arg Gly Ser Arg Gly Ile
420 425 430
Gln Ala Ile Asp Arg Val Lys Leu Leu Lys Leu Leu Trp Asp Ala Val
435 440 445
Gly Thr Glu Phe Ala Gly Arg His Glu Leu Tyr Glu Arg Asn Tyr Gly
450 455 460
Gly Asp His Glu Gly Ile Arg Val Gln Thr Leu Gln Ala Tyr Gln Ala
465 470 475 480
Asn Gly Gln Ala Ala Ala Leu Lys Gly Phe Ala Glu Gln Cys Met Ser
485 490 495
Glu Tyr Asp Leu Asp Gly Trp Thr Arg Pro Asp Leu Ile Asn Pro Gly
500 505 510
Thr
<210> 72
<211> 1542
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 71
<400> 72
atgtccacca tcacttctcc agctccagct ggtagattga acaacgtcag accaatgact 60
ggtgaagaat acttggaatc tttgagagat ggtagagaag tctacatcta cggtgaaaga 120
gtcgacgacg tcaccactca cttggccttc agaaactctg ttagatccat cgctagattg 180
tacgacgttt tgcacgaccc agcttcggag ggtgtactaa gagttccaac cgacactggt 240
aatggtggct tcactcatcc attcttcaag accgcccgtt cttctgaaga tttggtcgcc 300
gctagagaag ccatcgtcgg ttggcaaaga ttggtttacg gttggatggg tagaacccca 360
gattacaagg ctgcgttctt cggtactctc gacgccaacg ccgaattcta cggtccattc 420
gaagccaacg ccagaagatg gtacagagat gcccaagaaa gagttttgta cttcaaccac 480
gctatcgttc acccaccagt cgacagagac agaccagccg acagaaccgc cgacatctgt 540
gttcacgttg aagaagaaac cgactctggt ttgatcgttt ccggtgccaa ggttgtcgct 600
accggttccg ctatgaccaa cgctaacttg atcgctcact acggtttgcc agttagagac 660
aagaagttcg gtttggtttt cactgtccca atgaactctc caggtttgaa gttgatctgt 720
agaacctcct acgaattgat ggtcgctact caaggttctc cattcgacta cccattatct 780
tctagattgg acgaaaacga ctctatcatg atcttcgaca gagttttggt tccatgggaa 840
aacgttttca tgtacgacgc tggtgctgcc aactccttcg ccaccggttc tggtttcttg 900
gaaagattca ccttccacgg ttgtaccaga ttggctgtca agttggactt catcgccggt 960
tgtgtcatga aggctgttga agtcaccggt accactcact tcagaggtgt tcaagctcaa 1020
gtcggtgaag ttttgaactg gagagatgtt ttctggggtt tgtccgacgc tatggccaag 1080
tctccaaact cttgggtcgg tggttctgtt caaccaaact tgaactacgg tttggcttac 1140
agaaccttca tgggtgttgg ttacccaaga atcaaggaaa tcatccaaca aaccttgggt 1200
tctggtttga tctacttgaa ctcctctgcc gccgactgga agaacccaga cgtcagacca 1260
tacttggaca gatacttgag aggttctaga ggtatccaag ctatcgacag agtcaagttg 1320
ttgaagttgt tgtgggacgc tgtcggtacc gaattcgccg gtagacacga attgtacgaa 1380
agaaactacg gtggtgacca cgaaggtatc agagttcaaa ccttgcaagc ttaccaagct 1440
aacggtcagg cggccgctct caagggtttc gcggaacaat gtatgtccga atacgacttg 1500
gacggttgga ctagaccaga cttgatcaac ccaggtacct aa 1542
<210> 73
<211> 498
<212> PRT
<213> Beta vulgaris
<400> 73
Met Ser Asp His Ala Thr Leu Ala Met Ile Leu Ala Ile Leu Phe Ile
1 5 10 15
Ser Phe His Phe Ile Lys Leu Leu Phe Ser Gln Gln Thr Thr Lys Leu
20 25 30
Leu Pro Pro Gly Pro Lys Pro Leu Pro Ile Ile Gly Asn Ile Leu Glu
35 40 45
Val Gly Lys Lys Pro His Arg Ser Phe Ala Asn Leu Ala Lys Ile His
50 55 60
Gly Pro Leu Ile Ser Leu Arg Leu Gly Ser Val Thr Thr Ile Val Val
65 70 75 80
Ser Ser Ala Asp Val Ala Lys Glu Met Phe Leu Lys Lys Asp His Pro
85 90 95
Leu Ser Asn Arg Thr Ile Pro Asn Ser Val Thr Ala Gly Asp His His
100 105 110
Lys Leu Thr Met Ser Trp Leu Pro Val Ser Pro Lys Trp Arg Asn Phe
115 120 125
Arg Lys Ile Thr Ala Val His Leu Leu Ser Pro Gln Arg Leu Asp Ala
130 135 140
Cys Gln Thr Phe Arg His Ala Lys Val Gln Gln Leu Tyr Glu Tyr Val
145 150 155 160
Gln Glu Cys Ala Gln Lys Gly Gln Ala Val Asp Ile Gly Lys Ala Ala
165 170 175
Phe Thr Thr Ser Leu Asn Leu Leu Ser Lys Leu Phe Phe Ser Val Glu
180 185 190
Leu Ala His His Lys Ser His Thr Ser Gln Glu Phe Lys Glu Leu Ile
195 200 205
Trp Asn Ile Met Glu Asp Ile Gly Lys Pro Asn Tyr Ala Asp Tyr Phe
210 215 220
Pro Ile Leu Gly Cys Val Asp Pro Ser Gly Ile Arg Arg Arg Leu Ala
225 230 235 240
Cys Ser Phe Asp Lys Leu Ile Ala Val Phe Gln Gly Ile Ile Cys Glu
245 250 255
Arg Leu Ala Pro Asp Ser Ser Thr Thr Thr Thr Thr Thr Thr Asp Asp
260 265 270
Val Leu Asp Val Leu Leu Gln Leu Phe Lys Gln Asn Glu Leu Thr Met
275 280 285
Gly Glu Ile Asn His Leu Leu Val Asp Ile Phe Asp Ala Gly Thr Asp
290 295 300
Thr Thr Ser Ser Thr Leu Glu Trp Val Met Thr Glu Leu Ile Arg Asn
305 310 315 320
Pro Glu Met Met Glu Lys Ala Gln Glu Glu Ile Lys Gln Val Leu Gly
325 330 335
Lys Asp Lys Gln Ile Gln Glu Ser Asp Ile Ile Asn Leu Pro Tyr Leu
340 345 350
Gln Ala Ile Ile Lys Glu Thr Leu Arg Leu His Pro Pro Thr Val Phe
355 360 365
Leu Leu Pro Arg Lys Ala Asp Thr Asp Val Glu Leu Tyr Gly Tyr Ile
370 375 380
Val Pro Lys Asp Ala Gln Ile Leu Val Asn Leu Trp Ala Ile Gly Arg
385 390 395 400
Asp Pro Asn Ala Trp Gln Asn Ala Asp Ile Phe Ser Pro Glu Arg Phe
405 410 415
Ile Gly Cys Glu Ile Asp Val Lys Gly Arg Asp Phe Gly Leu Leu Pro
420 425 430
Phe Gly Ala Gly Arg Arg Ile Cys Pro Gly Met Asn Leu Ala Ile Arg
435 440 445
Met Leu Thr Leu Met Leu Ala Thr Leu Leu Gln Phe Phe Asn Trp Lys
450 455 460
Leu Glu Gly Asp Ile Ser Pro Lys Asp Leu Asp Met Asp Glu Lys Phe
465 470 475 480
Gly Ile Ala Leu Gln Lys Thr Lys Pro Leu Lys Leu Ile Pro Ile Pro
485 490 495
Arg Tyr
<210> 74
<211> 1497
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 73
<400> 74
atgtccgatc acgctacttt ggcgatgata ttggccatcc tattcatttc tttccacttc 60
atcaagttgt tgttctctca acaaactacc aagttgttgc caccaggtcc aaagccattg 120
ccaatcattg gtaacatctt ggaagttggt aagaagccac acagatcttt cgctaacttg 180
gctaagattc acggtccatt gatctctttg agattgggtt ctgttactac tattgttgtt 240
tcttctgctg atgttgctaa ggaaatgttc ttgaagaagg accacccatt gtctaacaga 300
actattccaa actctgtcac tgccggtgac caccacaagt tgaccatgtc ttggttgcca 360
gtttctccaa agtggagaaa cttcagaaag attactgccg tccacttgtt gtctccacaa 420
agattggatg cttgtcaaac cttcagacac gccaaggttc aacaattgta cgaatacgtt 480
caagaatgtg ctcaaaaggg tcaagctgtt gatattggta aggctgcttt cactacctcc 540
ttgaacttgt tgtctaagtt gttcttctct gttgaattgg cccaccacaa gtctcacact 600
tctcaagaat tcaaggaatt gatctggaac attatggaag atattggtaa gccaaactac 660
gctgattact tcccaatttt gggttgtgtt gatccatctg gtattagaag aagattggct 720
tgttctttcg acaagttgat tgctgttttc caaggtatca tctgtgaaag attggctcca 780
gattcttcta ctacaaccac tactaccact gatgatgttt tggacgtttt gttgcaattg 840
ttcaagcaaa acgaattgac tatgggtgaa attaaccact tgttggtcga cattttcgat 900
gctggtactg acactacttc ttctactttg gaatgggtca tgactgaatt gattagaaac 960
ccagaaatga tggaaaaggc tcaagaagaa attaagcaag ttttgggtaa ggataagcaa 1020
attcaagaat ctgacattat taacttgcca tacttgcaag ccattatcaa ggaaactttg 1080
agattgcacc caccaactgt tttcttgttg ccaagaaagg ccgacactga tgttgaattg 1140
tacggttaca ttgttccaaa ggatgctcaa atcttggtta acttgtgggc tattggtaga 1200
gatccaaacg cttggcaaaa cgctgatatt ttctctccag aaagattcat cggttgtgaa 1260
attgatgtca agggtagaga tttcggtttg ttgccattcg gtgccggtag aagaatctgt 1320
ccaggtatga acttggccat tagaatgttg actttgatgt tggctacttt gttgcaattc 1380
ttcaactgga agttggaagg tgacatctct ccaaaggact tggacatgga tgaaaagttc 1440
ggtattgctt tgcaaaagac taagccattg aagttgattc caatcccaag atactaa 1497
<210> 75
<211> 413
<212> PRT
<213> Rhodopseudomonas palustris
<400> 75
Met Ser Thr Thr Ala Pro Ser Leu Val Pro Val Thr Thr Pro Ser Gln
1 5 10 15
His Gly Ala Gly Val Pro His Leu Gly Ile Asp Pro Phe Ala Leu Asp
20 25 30
Tyr Phe Ala Asp Pro Tyr Pro Glu Gln Glu Thr Leu Arg Glu Ala Gly
35 40 45
Pro Val Val Tyr Leu Asp Lys Trp Asn Val Tyr Gly Val Ala Arg Tyr
50 55 60
Ala Glu Val Tyr Ala Val Leu Asn Asp Pro Leu Thr Phe Cys Ser Ser
65 70 75 80
Arg Gly Val Gly Leu Ser Asp Phe Lys Lys Glu Lys Pro Trp Arg Pro
85 90 95
Pro Ser Leu Ile Leu Glu Ala Asp Pro Pro Ala His Thr Arg Thr Arg
100 105 110
Ala Val Leu Ser Lys Val Leu Ser Pro Ala Thr Met Lys Arg Leu Arg
115 120 125
Asp Gly Phe Ala Ala Ala Ala Asp Ala Lys Ile Asp Glu Leu Leu Ala
130 135 140
Arg Gly Gly Asn Ile Asp Ala Ile Ala Asp Leu Ala Glu Ala Tyr Pro
145 150 155 160
Leu Ser Val Phe Pro Asp Ala Met Gly Leu Lys Gln Glu Gly Arg Glu
165 170 175
Asn Leu Leu Pro Tyr Ala Gly Leu Val Leu Asn Ala Phe Gly Pro Pro
180 185 190
Asn Glu Leu Arg Gln Ser Ala Ile Glu Arg Ser Ala Pro His Gln Ala
195 200 205
Tyr Val Ala Glu Gln Cys Gln Arg Pro Asn Leu Ala Pro Gly Gly Phe
210 215 220
Gly Ala Cys Ile His Ala Phe Ser Asp Thr Gly Glu Ile Thr Pro Glu
225 230 235 240
Glu Ala Pro Leu Leu Val Arg Ser Leu Leu Ser Ala Gly Leu Asp Thr
245 250 255
Thr Val Asn Gly Ile Ala Ala Ala Val Tyr Cys Leu Ala Arg Phe Pro
260 265 270
Asp Glu Phe Ala Arg Leu Arg Ala Asp Pro Ser Leu Ala Arg Asn Ala
275 280 285
Phe Glu Glu Ala Val Arg Phe Glu Ser Pro Val Gln Thr Phe Phe Arg
290 295 300
Thr Thr Thr Arg Asp Val Glu Leu Ala Gly Ala Thr Ile Gly Glu Gly
305 310 315 320
Glu Lys Val Leu Met Phe Leu Gly Ser Ala Asn Arg Asp Pro Arg Arg
325 330 335
Trp Asp Asp Pro Asp Arg Tyr Asp Ile Thr Arg Lys Thr Ser Gly His
340 345 350
Val Gly Phe Gly Ser Gly Val His Met Cys Val Gly Gln Leu Val Ala
355 360 365
Arg Leu Glu Gly Glu Val Val Leu Ala Ala Leu Ala Arg Lys Val Ala
370 375 380
Ala Ile Glu Ile Ala Gly Pro Leu Lys Arg Arg Phe Asn Asn Thr Leu
385 390 395 400
Arg Gly Leu Glu Ser Leu Pro Ile Gln Leu Thr Pro Ala
405 410
<210> 76
<211> 1242
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 75
<400> 76
atgtccacca ctgctccatc tttggttcca gttaccactc catcccaaca cggtgctggt 60
gttccacact tgggtatcga tccattcgct ttggactact tcgccgatcc atacccagaa 120
caagaaactt tgagagaagc tggtccagtt gtctacttgg acaagtggaa cgtctacggt 180
gtcgccagat acgctgaagt atacgccgta ctcaacgatc cattgacctt ctgttcctct 240
agaggtgttg gtttgtctga tttcaagaag gaaaagccat ggaggccacc atctttgatc 300
ttggaagccg acccaccagc tcacaccaga accagagctg ttttgtctaa ggttttgtct 360
ccagctacta tgaagagatt gagagatggt ttcgctgctg ctgctgacgc caagatcgat 420
gaattgttgg ccagaggtgg taacatcgat gctatcgccg acttggccga agcctaccca 480
ttgtctgttt tcccagatgc gatgggtttg aagcaagaag gcagagaaaa cttgttgcca 540
tacgcgggct tggttttgaa cgcattcggt ccaccaaacg aattgagaca atctgctatc 600
gaaagatctg ctccacacca agcctacgtt gccgaacaat gtcaaagacc aaacttggct 660
ccaggtggtt tcggtgcctg tatccacgcc ttctctgaca ccggtgaaat cactccagaa 720
gaagccccat tgttggttag atctttgttg tctgctggtt tggacactac cgtcaacggt 780
attgctgctg ctgtttactg tttggctaga ttcccagacg aattcgctag attgagagcc 840
gatccatctt tggccagaaa cgccttcgaa gaagctgtta gattcgaatc tccagttcaa 900
accttcttca gaaccaccac tagagatgtc gaattggctg gtgccactat cggtgaaggt 960
gaaaaggttt tgatgttctt gggttccgcc aacagagatc caagaagatg ggacgatcca 1020
gacagatacg acatcaccag aaagacctct gggcatgtcg gcttcggttc tggtgttcac 1080
atgtgtgtcg gtcaattggt cgccagattg gaaggtgaag ttgttttggc cgctttggct 1140
agaaaggttg ctgctatcga aatcgccggt ccattgaaga gaagattcaa caacactttg 1200
agaggtttgg aatctttgcc aatccaattg actccagctt aa 1242
<210> 77
<211> 718
<212> PRT
<213> Arabidopsis thaliana
<400> 77
Met Ser Asp Gln Ile Glu Ala Met Leu Cys Gly Gly Gly Glu Lys Thr
1 5 10 15
Lys Val Ala Val Thr Thr Lys Thr Leu Ala Asp Pro Leu Asn Trp Gly
20 25 30
Leu Ala Ala Asp Gln Met Lys Gly Ser His Leu Asp Glu Val Lys Lys
35 40 45
Met Val Glu Glu Tyr Arg Arg Pro Val Val Asn Leu Gly Gly Glu Thr
50 55 60
Leu Thr Ile Gly Gln Val Ala Ala Ile Ser Thr Val Gly Gly Ser Val
65 70 75 80
Lys Val Glu Leu Ala Glu Thr Ser Arg Ala Gly Val Lys Ala Ser Ser
85 90 95
Asp Trp Val Met Glu Ser Met Asn Lys Gly Thr Asp Ser Tyr Gly Val
100 105 110
Thr Thr Gly Phe Gly Ala Thr Ser His Arg Arg Thr Lys Asn Gly Thr
115 120 125
Ala Leu Gln Thr Glu Leu Ile Arg Phe Leu Asn Ala Gly Ile Phe Gly
130 135 140
Asn Thr Lys Glu Thr Cys His Thr Leu Pro Gln Ser Ala Thr Arg Ala
145 150 155 160
Ala Met Leu Val Arg Val Asn Thr Leu Leu Gln Gly Tyr Ser Gly Ile
165 170 175
Arg Phe Glu Ile Leu Glu Ala Ile Thr Ser Leu Leu Asn His Asn Ile
180 185 190
Ser Pro Ser Leu Pro Leu Arg Gly Thr Ile Thr Ala Ser Gly Asp Leu
195 200 205
Val Pro Leu Ser Tyr Ile Ala Gly Leu Leu Thr Gly Arg Pro Asn Ser
210 215 220
Lys Ala Thr Gly Pro Asp Gly Glu Ser Leu Thr Ala Lys Glu Ala Phe
225 230 235 240
Glu Lys Ala Gly Ile Ser Thr Gly Phe Phe Asp Leu Gln Pro Lys Glu
245 250 255
Gly Leu Ala Leu Val Asn Gly Thr Ala Val Gly Ser Gly Met Ala Ser
260 265 270
Met Val Leu Phe Glu Ala Asn Val Gln Ala Val Leu Ala Glu Val Leu
275 280 285
Ser Ala Ile Phe Ala Glu Val Met Ser Gly Lys Pro Glu Phe Thr Asp
290 295 300
His Leu Thr His Arg Leu Lys His His Pro Gly Gln Ile Glu Ala Ala
305 310 315 320
Ala Ile Met Glu His Ile Leu Asp Gly Ser Ser Tyr Met Lys Leu Ala
325 330 335
Gln Lys Val His Glu Met Asp Pro Leu Gln Lys Pro Lys Gln Asp Arg
340 345 350
Tyr Ala Leu Arg Thr Ser Pro Gln Trp Leu Gly Pro Gln Ile Glu Val
355 360 365
Ile Arg Gln Ala Thr Lys Ser Ile Glu Arg Glu Ile Asn Ser Val Asn
370 375 380
Asp Asn Pro Leu Ile Asp Val Ser Arg Asn Lys Ala Ile His Gly Gly
385 390 395 400
Asn Phe Gln Gly Thr Pro Ile Gly Val Ser Met Asp Asn Thr Arg Leu
405 410 415
Ala Ile Ala Ala Ile Gly Lys Leu Met Phe Ala Gln Phe Ser Glu Leu
420 425 430
Val Asn Asp Phe Tyr Asn Asn Gly Leu Pro Ser Asn Leu Thr Ala Ser
435 440 445
Ser Asn Pro Ser Leu Asp Tyr Gly Phe Lys Gly Ala Glu Ile Ala Met
450 455 460
Ala Ser Tyr Cys Ser Glu Leu Gln Tyr Leu Ala Asn Pro Val Thr Ser
465 470 475 480
His Val Gln Ser Ala Glu Gln His Asn Gln Asp Val Asn Ser Leu Gly
485 490 495
Leu Ile Ser Ser Arg Lys Thr Ser Glu Ala Val Asp Ile Leu Lys Leu
500 505 510
Met Ser Thr Thr Phe Leu Val Gly Ile Cys Gln Ala Val Asp Leu Arg
515 520 525
His Leu Glu Glu Asn Leu Arg Gln Thr Val Lys Asn Thr Val Ser Gln
530 535 540
Val Ala Lys Lys Val Leu Thr Thr Gly Ile Asn Gly Glu Leu His Pro
545 550 555 560
Ser Arg Phe Cys Glu Lys Asp Leu Leu Lys Val Val Asp Arg Glu Gln
565 570 575
Val Phe Thr Tyr Val Asp Asp Pro Cys Ser Ala Thr Tyr Pro Leu Met
580 585 590
Gln Arg Leu Arg Gln Val Ile Val Asp His Ala Leu Ser Asn Gly Glu
595 600 605
Thr Glu Lys Asn Ala Val Thr Ser Ile Phe Gln Lys Ile Gly Ala Phe
610 615 620
Glu Glu Glu Leu Lys Ala Val Leu Pro Lys Glu Val Glu Ala Ala Arg
625 630 635 640
Ala Ala Tyr Gly Asn Gly Thr Ala Pro Ile Pro Asn Arg Ile Lys Glu
645 650 655
Cys Arg Ser Tyr Pro Leu Tyr Arg Phe Val Arg Glu Glu Leu Gly Thr
660 665 670
Lys Leu Leu Thr Gly Glu Lys Val Val Ser Pro Gly Glu Glu Phe Asp
675 680 685
Lys Val Phe Thr Ala Met Cys Glu Gly Lys Leu Ile Asp Pro Leu Met
690 695 700
Asp Cys Leu Lys Glu Trp Asn Gly Ala Pro Ile Pro Ile Cys
705 710 715
<210> 78
<211> 2157
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 77
<400> 78
atgtccgatc aaatcgaagc tatgttgtgt ggtggtggtg aaaaaacaaa agttgctgtt 60
actactaaga ccttggccga tccattgaat tggggtttgg ctgctgatca aatgaagggt 120
tctcatttgg atgaagtcaa gaagatggtc gaagaataca gaaggccagt tgttaatttg 180
ggtggtgaaa ctttgactat tggtcaagtt gctgctattt ctactgttgg tggttctgtt 240
aaggttgaat tggctgaaac ttctagagct ggtgttaagg cttcttctga ttgggttatg 300
gaatctatga acaagggtac tgattcttac ggtgttacta caggttttgg tgctacttct 360
catagaagaa ctaagaatgg tactgccttg caaaccgaat tgatcagatt tttgaacgcc 420
ggtattttcg gtaacaccaa agaaacttgt cataccttgc cacaatctgc tactagagct 480
gctatgttgg ttagagttaa cactttgttg caaggttact ccggtatcag attcgaaatt 540
ttggaagcta tcacctcctt gttgaaccat aacatttctc catctttgcc attgagaggt 600
actattactg cttctggtga tttggttcca ttgtcttata ttgctggttt gttgactggt 660
agaccaaact ctaaagctac tggtccagat ggtgaatcat tgactgctaa agaagctttt 720
gaaaaggctg gtatctctac tggttttttc gacttgcaac ctaaagaagg tttggctttg 780
gttaatggta cagctgttgg ttctggtatg gcttctatgg ttttgtttga agctaacgtt 840
caagctgttt tggccgaagt tttgtctgct atttttgctg aagttatgtc cggtaagcca 900
gaattcactg atcatttgac ccatagattg aaacatcacc caggtcaaat tgaagctgct 960
gcaattatgg aacatatctt ggatggttcc tcttacatga agttggctca aaaagttcac 1020
gaaatggacc cattgcaaaa gccaaaacaa gatagatacg ctttgagaac ttctccacaa 1080
tggttgggtc cacaaataga agttattaga caagccacca agtccatcga aagagaaatc 1140
aattctgtta acgacaaccc attgatcgac gtcagtagaa acaaagctat tcatggtggt 1200
aacttccaag gtactccaat tggtgtttct atggacaaca ctagattggc tattgctgcc 1260
attggtaaat tgatgttcgc tcaattctcc gaattggtca acgattttta caacaacggt 1320
ttgccttcta acttgaccgc ttcttctaat ccatcattgg attacggttt taagggtgct 1380
gaaattgcta tggcttcata ctgttctgaa ttgcaatact tggctaaccc agttacctct 1440
catgttcaat ctgctgaaca acacaatcaa gacgttaact ccttgggttt gatctcttct 1500
agaaagactt ctgaagccgt tgacatcttg aagttgatgt ctactacatt cttggtcggt 1560
atttgccaag ctgttgattt gagacatttg gaagaaaact tgagacaaac cgtcaagaac 1620
accgtttcac aagttgctaa gaaagttttg accaccggta ttaacggtga attgcatcca 1680
tctagattct gcgaaaagga tttgttgaag gtcgttgata gagaacaagt tttcacctac 1740
gttgatgatc catgttctgc tacttatcca ttgatgcaaa gattgagaca agtcatcgtt 1800
gatcatgctt tgtctaatgg tgaaaccgaa aagaacgctg ttacctccat tttccaaaag 1860
attggtgctt tcgaagaaga attgaaggcc gttttgccaa aagaagttga agcagctaga 1920
gcagcttacg gtaacggtac tgctccaatt ccaaatagaa tcaaagaatg cagatcctac 1980
ccattataca gattcgttag agaagaatta ggtactaagt tgttgaccgg tgaaaaggtt 2040
gtttctccag gtgaagaatt cgataaggtt ttcactgcta tgtgcgaagg taaattgatc 2100
gatccattga tggactgctt gaaagaatgg aatggtgctc ctattcctat ctgctaa 2157
<210> 79
<211> 506
<212> PRT
<213> Arabidopsis thaliana
<400> 79
Met Ser Asp Leu Leu Leu Leu Glu Lys Ser Leu Ile Ala Val Phe Val
1 5 10 15
Ala Val Ile Leu Ala Thr Val Ile Ser Lys Leu Arg Gly Lys Lys Leu
20 25 30
Lys Leu Pro Pro Gly Pro Ile Pro Ile Pro Ile Phe Gly Asn Trp Leu
35 40 45
Gln Val Gly Asp Asp Leu Asn His Arg Asn Leu Val Asp Tyr Ala Lys
50 55 60
Lys Phe Gly Asp Leu Phe Leu Leu Arg Met Gly Gln Arg Asn Leu Val
65 70 75 80
Val Val Ser Ser Pro Asp Leu Thr Lys Glu Val Leu Leu Thr Gln Gly
85 90 95
Val Glu Phe Gly Ser Arg Thr Arg Asn Val Val Phe Asp Ile Phe Thr
100 105 110
Gly Lys Gly Gln Asp Met Val Phe Thr Val Tyr Gly Glu His Trp Arg
115 120 125
Lys Met Arg Arg Ile Met Thr Val Pro Phe Phe Thr Asn Lys Val Val
130 135 140
Gln Gln Asn Arg Glu Gly Trp Glu Phe Glu Ala Ala Ser Val Val Glu
145 150 155 160
Asp Val Lys Lys Asn Pro Asp Ser Ala Thr Lys Gly Ile Val Leu Arg
165 170 175
Lys Arg Leu Gln Leu Met Met Tyr Asn Asn Met Phe Arg Ile Met Phe
180 185 190
Asp Arg Arg Phe Glu Ser Glu Asp Asp Pro Leu Phe Leu Arg Leu Lys
195 200 205
Ala Leu Asn Gly Glu Arg Ser Arg Leu Ala Gln Ser Phe Glu Tyr Asn
210 215 220
Tyr Gly Asp Phe Ile Pro Ile Leu Arg Pro Phe Leu Arg Gly Tyr Leu
225 230 235 240
Lys Ile Cys Gln Asp Val Lys Asp Arg Arg Ile Ala Leu Phe Lys Lys
245 250 255
Tyr Phe Val Asp Glu Arg Lys Gln Ile Ala Ser Ser Lys Pro Thr Gly
260 265 270
Ser Glu Gly Leu Lys Cys Ala Ile Asp His Ile Leu Glu Ala Glu Gln
275 280 285
Lys Gly Glu Ile Asn Glu Asp Asn Val Leu Tyr Ile Val Glu Asn Ile
290 295 300
Asn Val Ala Ala Ile Glu Thr Thr Leu Trp Ser Ile Glu Trp Gly Ile
305 310 315 320
Ala Glu Leu Val Asn His Pro Glu Ile Gln Ser Lys Leu Arg Asn Glu
325 330 335
Leu Asp Thr Val Leu Gly Pro Gly Val Gln Val Thr Glu Pro Asp Leu
340 345 350
His Lys Leu Pro Tyr Leu Gln Ala Val Val Lys Glu Thr Leu Arg Leu
355 360 365
Arg Met Ala Ile Pro Leu Leu Val Pro His Met Asn Leu His Asp Ala
370 375 380
Lys Leu Ala Gly Tyr Asp Ile Pro Ala Glu Ser Lys Ile Leu Val Asn
385 390 395 400
Ala Trp Trp Leu Ala Asn Asn Pro Asn Ser Trp Lys Lys Pro Glu Glu
405 410 415
Phe Arg Pro Glu Arg Phe Phe Glu Glu Glu Ser His Val Glu Ala Asn
420 425 430
Gly Asn Asp Phe Arg Tyr Val Pro Phe Gly Val Gly Arg Arg Ser Cys
435 440 445
Pro Gly Ile Ile Leu Ala Leu Pro Ile Leu Gly Ile Thr Ile Gly Arg
450 455 460
Met Val Gln Asn Phe Glu Leu Leu Pro Pro Pro Gly Gln Ser Lys Val
465 470 475 480
Asp Thr Ser Glu Lys Gly Gly Gln Phe Ser Leu His Ile Leu Asn His
485 490 495
Ser Ile Ile Val Met Lys Pro Arg Asn Cys
500 505
<210> 80
<211> 1521
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 79
<400> 80
atgtccgact tgttgttgtt ggaaaagtcc ttgattgctg ttttcgttgc tgttattttg 60
gccaccgtta tctctaaatt gagaggtaag aaattgaagt tgccaccagg tccaattcca 120
atcccaattt ttggtaattg gttgcaagtt ggtgatgact tgaaccacag aaacttggtt 180
gattacgcta aaaagttcgg tgatttgttc ttgttgagaa tgggtcaaag aaatttggtc 240
gttgtttcct caccagactt gaccaaagaa gttttgttga ctcaaggtgt cgaattcggt 300
tccagaacta gaaatgttgt tttcgatatc ttcaccggta agggtcaaga tatggttttt 360
actgtttacg gtgaacattg gagaaagatg agaagaatta tgaccgttcc attcttcacc 420
aacaaggttg tccaacaaaa cagagaaggt tgggaatttg aagctgcttc tgttgttgaa 480
gatgtcaaga agaatccaga ttctgctact aagggtatcg ttttgagaaa aagattgcaa 540
ttgatgatgt acaacaacat gttcagaatc atgttcgaca gaagatttga atccgaagat 600
gaccctttgt ttttgagatt gaaggctttg aacggtgaaa gatctagatt ggctcaatcc 660
ttcgaataca actacggtga tttcatccca atcttaagac cattcttgag aggttacttg 720
aagatctgcc aagatgttaa ggatagaaga atcgccttgt tcaaaaagta cttcgttgac 780
gaaagaaagc aaatcgcttc ttctaaacct actggttctg aaggtttgaa gtgcgccatt 840
gatcatattt tggaagctga acaaaagggt gaaatcaacg aagataacgt cttgtacatc 900
gtcgaaaaca ttaacgttgc tgctattgaa actaccttgt ggtctattga atggggtatt 960
gctgaattgg ttaatcaccc agaaatccaa tccaagttga gaaacgaatt ggatactgtt 1020
ttgggtccag gtgttcaagt tactgaacct gacttgcata agttgccata cttgcaagct 1080
gttgtaaaag aaaccttgag attaagaatg gccatccctt tgttggttcc acatatgaac 1140
ttgcatgatg ctaaattggc cggttatgat attccagccg aatccaagat tttggttaat 1200
gcttggtggt tggctaacaa tccaaattct tggaaaaagc cagaagaatt cagaccagaa 1260
agatttttcg aagaagaaag tcacgttgaa gccaacggta atgattttag atacgttcca 1320
tttggtgttg gtagaagatc ttgtccaggt attatcttgg ctttgccaat tttgggtatt 1380
accatcggta gaatggtcca aaacttcgaa ttattgccac cacctggtca atctaaggtt 1440
gatacttctg aaaagggtgg tcaattctcc ttgcatattt tgaaccactc catcatcgtt 1500
atgaagccaa gaaactgtta a 1521
<210> 81
<211> 384
<212> PRT
<213> Saccharomyces cerevisiae
<400> 81
Met Ser Lys Ser Lys Thr Phe Leu Phe Thr Ser Glu Ser Val Gly Glu
1 5 10 15
Gly His Pro Asp Lys Ile Cys Asp Gln Val Ser Asp Ala Ile Leu Asp
20 25 30
Ala Cys Leu Glu Gln Asp Pro Phe Ser Lys Val Ala Cys Glu Thr Ala
35 40 45
Ala Lys Thr Gly Met Ile Met Val Phe Gly Glu Ile Thr Thr Lys Ala
50 55 60
Arg Leu Asp Tyr Gln Gln Ile Val Arg Asp Thr Ile Lys Lys Ile Gly
65 70 75 80
Tyr Asp Asp Ser Ala Lys Gly Phe Asp Tyr Lys Thr Cys Asn Val Leu
85 90 95
Val Ala Ile Glu Gln Gln Ser Pro Asp Ile Ala Gln Gly Leu His Tyr
100 105 110
Glu Lys Ser Leu Glu Asp Leu Gly Ala Gly Asp Gln Gly Ile Met Phe
115 120 125
Gly Tyr Ala Thr Asp Glu Thr Pro Glu Gly Leu Pro Leu Thr Ile Leu
130 135 140
Leu Ala His Lys Leu Asn Met Ala Met Ala Asp Ala Arg Arg Asp Gly
145 150 155 160
Ser Leu Pro Trp Leu Arg Pro Asp Thr Lys Thr Gln Val Thr Val Glu
165 170 175
Tyr Glu Asp Asp Asn Gly Arg Trp Val Pro Lys Arg Ile Asp Thr Val
180 185 190
Val Ile Ser Ala Gln His Ala Asp Glu Ile Ser Thr Ala Asp Leu Arg
195 200 205
Thr Gln Leu Gln Lys Asp Ile Val Glu Lys Val Ile Pro Lys Asp Met
210 215 220
Leu Asp Glu Asn Thr Lys Tyr Phe Ile Gln Pro Ser Gly Arg Phe Val
225 230 235 240
Ile Gly Gly Pro Gln Gly Asp Ala Gly Leu Thr Gly Arg Lys Ile Ile
245 250 255
Val Asp Ala Tyr Gly Gly Ala Ser Ser Val Gly Gly Gly Ala Phe Ser
260 265 270
Gly Lys Asp Tyr Ser Lys Val Asp Arg Ser Ala Ala Tyr Ala Ala Arg
275 280 285
Trp Val Ala Lys Ser Leu Val Ala Ala Gly Leu Cys Lys Arg Val Gln
290 295 300
Val Gln Phe Ser Tyr Ala Ile Gly Ile Ala Glu Pro Leu Ser Leu His
305 310 315 320
Val Asp Thr Tyr Gly Thr Ala Thr Lys Ser Asp Asp Glu Ile Ile Glu
325 330 335
Ile Ile Lys Lys Asn Phe Asp Leu Arg Pro Gly Val Leu Val Lys Glu
340 345 350
Leu Asp Leu Ala Arg Pro Ile Tyr Leu Pro Thr Ala Ser Tyr Gly His
355 360 365
Phe Thr Asn Gln Glu Tyr Ser Trp Glu Lys Pro Lys Lys Leu Glu Phe
370 375 380
<210> 82
<211> 1155
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 81
<400> 82
atgtccaaga gcaaaacttt cttatttacc tctgaatccg tcggtgaagg tcacccagac 60
aagatttgtg accaagtttc tgatgctatt ttggacgctt gtttagaaca agatccattc 120
tccaaggttg cctgtgaaac agctgccaaa actggtatga ttatggtttt cggtgaaatt 180
accaccaaag ctagacttga ctaccaacaa atagtaagag ataccatcaa gaagattggt 240
tatgacgatt ctgccaaggg tttcgactac aagacatgta atgttttagt agctatcgaa 300
caacaatctc cagatatcgc tcaaggtctg cactatgaaa agagcttaga agatttaggt 360
gctggtgacc aaggtataat gtttggttac gctacagacg aaactccaga agggttacca 420
ttgaccattc ttttggctca caaattgaac atggctatgg cagatgctag aagagatggt 480
tctctcccat ggttgaggcc agacacaaag actcaagtca ctgtcgaata cgaggacgac 540
aatggtagat gggttccaaa gaggatagat accgttgtta tttctgctca acatgctgat 600
gaaatttcca ccgctgactt gagaactcaa cttcaaaaag atattgttga aaaggtcata 660
ccaaaggata tgttagacga aaataccaaa tatttcatcc aaccatccgg tagattcgtc 720
atcggtggtc ctcaaggtga cgctggtttg accggtagaa agattattgt cgacgcttac 780
ggtggtgcct catccgtcgg tggtggtgcc ttctccggta aggactattc caaggtcgat 840
cgttccgctg cttacgctgc tagatgggtt gccaagtctc tagttgccgc tggtttgtgt 900
aagagagtcc aagtccaatt ttcatatgct attggtattg ctgaaccatt gtctttacat 960
gtggacacct atggtacagc tacaaaatca gatgacgaaa tcattgaaat tattaagaag 1020
aacttcgact tgaggccagg tgtgttagta aaggaattag atttggctag accaatttac 1080
ttaccaaccg cttcttatgg tcacttcact aatcaagagt actcatggga aaaaccaaag 1140
aaattggaat tttaa 1155
<210> 83
<211> 521
<212> PRT
<213> Escherichia coli
<400> 83
Met Ser Lys Pro Glu Asp Phe Arg Ala Ser Thr Gln Arg Pro Phe Thr
1 5 10 15
Gly Glu Glu Tyr Leu Lys Ser Leu Gln Asp Gly Arg Glu Ile Tyr Ile
20 25 30
Tyr Gly Glu Arg Val Lys Asp Val Thr Thr His Pro Ala Phe Arg Asn
35 40 45
Ala Ala Ala Ser Val Ala Gln Leu Tyr Asp Ala Leu His Lys Pro Glu
50 55 60
Met Gln Asp Ser Leu Cys Trp Asn Thr Asp Thr Gly Ser Gly Gly Tyr
65 70 75 80
Thr His Lys Phe Phe Arg Val Ala Lys Ser Ala Asp Asp Leu Arg Gln
85 90 95
Gln Arg Asp Ala Ile Ala Glu Trp Ser Arg Leu Ser Tyr Gly Trp Met
100 105 110
Gly Arg Thr Pro Asp Tyr Lys Ala Ala Phe Gly Cys Ala Leu Gly Ala
115 120 125
Asn Pro Gly Phe Tyr Gly Gln Phe Glu Gln Asn Ala Arg Asn Trp Tyr
130 135 140
Thr Arg Ile Gln Glu Thr Gly Leu Tyr Phe Asn His Ala Ile Val Asn
145 150 155 160
Pro Pro Ile Asp Arg His Leu Pro Thr Asp Lys Val Lys Asp Val Tyr
165 170 175
Ile Lys Leu Glu Lys Glu Thr Asp Ala Gly Ile Ile Val Ser Gly Ala
180 185 190
Lys Val Val Ala Thr Asn Ser Ala Leu Thr His Tyr Asn Met Ile Gly
195 200 205
Phe Gly Ser Ala Gln Val Met Gly Glu Asn Pro Asp Phe Ala Leu Met
210 215 220
Phe Val Ala Pro Met Asp Ala Asp Gly Val Lys Leu Ile Ser Arg Ala
225 230 235 240
Ser Tyr Glu Met Val Ala Gly Ala Thr Gly Ser Pro Tyr Asp Tyr Pro
245 250 255
Leu Ser Ser Arg Phe Asp Glu Asn Asp Ala Ile Leu Val Met Asp Asn
260 265 270
Val Leu Ile Pro Trp Glu Asn Val Leu Ile Tyr Arg Asp Phe Asp Arg
275 280 285
Cys Arg Arg Trp Thr Met Glu Gly Gly Phe Ala Arg Met Tyr Pro Leu
290 295 300
Gln Ala Cys Val Arg Leu Ala Val Lys Leu Asp Phe Ile Thr Ala Leu
305 310 315 320
Leu Lys Lys Ser Leu Glu Cys Thr Gly Thr Leu Glu Phe Arg Gly Val
325 330 335
Gln Ala Asp Leu Gly Glu Val Val Ala Trp Arg Asn Thr Phe Trp Ala
340 345 350
Leu Ser Asp Ser Met Cys Ser Glu Ala Thr Pro Trp Val Asn Gly Ala
355 360 365
Tyr Leu Pro Asp His Ala Ala Leu Gln Thr Tyr Arg Val Leu Ala Pro
370 375 380
Met Ala Tyr Ala Lys Ile Lys Asn Ile Ile Glu Arg Asn Val Thr Ser
385 390 395 400
Gly Leu Ile Tyr Leu Pro Ser Ser Ala Arg Asp Leu Asn Asn Pro Gln
405 410 415
Ile Asp Gln Tyr Leu Ala Lys Tyr Val Arg Gly Ser Asn Gly Met Asp
420 425 430
His Val Gln Arg Ile Lys Ile Leu Lys Leu Met Trp Asp Ala Ile Gly
435 440 445
Ser Glu Phe Gly Gly Arg His Glu Leu Tyr Glu Ile Asn Tyr Ser Gly
450 455 460
Ser Gln Asp Glu Ile Arg Leu Gln Cys Leu Arg Gln Ala Gln Asn Ser
465 470 475 480
Gly Asn Met Asp Lys Met Met Ala Met Val Asp Arg Cys Leu Ser Glu
485 490 495
Tyr Asp Gln Asp Gly Trp Thr Val Pro His Leu His Asn Asn Asp Asp
500 505 510
Ile Asn Met Leu Asp Lys Leu Leu Lys
515 520
<210> 84
<211> 1566
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 83
<400> 84
atgtccaaac cagaagattt ccgcgccagt acccaacgtc ctttcaccgg ggaagagtat 60
ctgaaaagcc tgcaggatgg tcgcgagatc tatatctatg gcgagcgagt gaaagacgtc 120
accactcatc cggcatttcg taatgcggca gcgtctgttg cccagctgta cgacgcactg 180
cacaaaccgg agatgcagga ctctctgtgt tggaacaccg acaccggcag cggcggctat 240
acccataaat tcttccgcgt ggcgaaaagt gccgacgacc tgcgccagca acgcgacgcc 300
atcgctgagt ggtcacgcct gagctatggc tggatgggcc gtaccccaga ctacaaagcc 360
gctttcggtt gcgcactggg cgcgaatccg ggcttttacg gtcagttcga gcagaacgcc 420
cgtaactggt acacccgtat tcaggaaact ggcctctact ttaaccacgc gattgttaac 480
ccaccgatcg atcgtcattt gccgaccgat aaagtgaaag acgtttacat caagctggaa 540
aaagagactg acgccgggat tatcgtcagc ggtgcgaaag tggttgccac caactcggcg 600
ctgactcact acaacatgat tggcttcggc tcggcacaag tgatgggcga aaacccggac 660
ttcgcactga tgttcgttgc gccaatggat gccgatggcg tgaaattaat ctcccgcgcc 720
tcttatgaga tggtcgcggg tgctaccggc tcgccatacg actacccgct ctccagccgc 780
ttcgatgaga acgatgcgat tctggtgatg gataacgtgc tgattccatg ggaaaacgtg 840
ctgatctacc gcgattttga tcgctgccgt cgctggacga tggaaggcgg ttttgcccgt 900
atgtatccgc tgcaagcctg tgtgcgcctg gcagtgaaat tagacttcat tacggcactg 960
ctgaaaaaat cactcgaatg taccggcacc ctggagttcc gtggtgtgca ggccgatctc 1020
ggtgaagtgg tagcgtggcg caacaccttc tgggcattga gtgactcgat gtgttcagaa 1080
gcaacgccgt gggtcaacgg ggcttattta ccggatcatg ccgcactgca aacctatcgc 1140
gtactggcac caatggccta cgcgaagatc aaaaacatta tcgaacgcaa cgttaccagt 1200
ggcctgatct atctcccttc cagtgcccgt gacctgaata atccgcagat cgaccagtat 1260
ctggcgaagt atgtgcgcgg ttcgaacggt atggatcacg tccagcgcat caagatcctc 1320
aaactgatgt gggatgctat tggcagcgaa tttggtggtc gtcacgaact gtatgaaatc 1380
aactactccg gtagccagga tgagattcgc ctgcagtgtc tgcgccaggc acaaaactcc 1440
ggcaatatgg acaagatgat ggcgatggtt gatcgctgcc tgtcggaata cgaccaggac 1500
ggctggactg tgccgcacct gcacaacaac gacgatatca acatgctgga taagctgctg 1560
aaataa 1566
<210> 85
<211> 171
<212> PRT
<213> Escherichia coli
<400> 85
Met Ser Gln Leu Asp Glu Gln Arg Leu Arg Phe Arg Asp Ala Met Ala
1 5 10 15
Ser Leu Ser Ala Ala Val Asn Ile Ile Thr Thr Glu Gly Asp Ala Gly
20 25 30
Gln Cys Gly Ile Thr Ala Thr Ala Val Cys Ser Val Thr Asp Thr Pro
35 40 45
Pro Ser Leu Met Val Cys Ile Asn Ala Asn Ser Ala Met Asn Pro Val
50 55 60
Phe Gln Gly Asn Gly Lys Leu Cys Val Asn Val Leu Asn His Glu Gln
65 70 75 80
Glu Leu Met Ala Arg His Phe Ala Gly Met Thr Gly Met Ala Met Glu
85 90 95
Glu Arg Phe Ser Leu Ser Cys Trp Gln Lys Gly Pro Leu Ala Gln Pro
100 105 110
Val Leu Lys Gly Ser Leu Ala Ser Leu Glu Gly Glu Ile Arg Asp Val
115 120 125
Gln Ala Ile Gly Thr His Leu Val Tyr Leu Val Glu Ile Lys Asn Ile
130 135 140
Ile Leu Ser Ala Glu Gly His Gly Leu Ile Tyr Phe Lys Arg Arg Phe
145 150 155 160
His Pro Val Met Leu Glu Met Glu Ala Ala Ile
165 170
<210> 86
<211> 516
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 85
<400> 86
atgtcccaat tagatgaaca acgcctgcgc tttcgtgacg cgatggccag cctgtcggca 60
gcggtaaata ttatcaccac cgagggcgac gccggacaat gcgggattac ggcaacggcc 120
gtctgctcgg tcacggatac accaccgtcg ctgatggtgt gcattaacgc caacagtgcg 180
atgaacccgg tttttcaggg caacggcaag ttgtgcgtca acgtcctcaa ccatgagcag 240
gaactgatgg cacgccactt cgcgggcatg acaggcatgg cgatggaaga gcgttttagc 300
ctctcatgct ggcaaaaagg tccgctggcg cagccggtgc taaaaggttc gctggccagt 360
cttgaaggtg agatccgcga tgtgcaggca attggcacac atctggtgta tctggtggag 420
attaaaaaca tcatcctcag tgcagaaggt catggactta tctactttaa acgccgtttc 480
catccggtga tgctggaaat ggaagctgcg atttaa 516
<210> 87
<211> 233
<212> PRT
<213> Arabidopsis thaliana
<400> 87
Met Ser Ala Lys Asp Glu Ala Lys Gly Leu Leu Lys Ser Glu Glu Leu
1 5 10 15
Tyr Lys Tyr Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Glu Val
20 25 30
Leu Arg Glu Leu Arg Asn Ile Thr His Asn His Pro Gln Ala Gly Met
35 40 45
Ala Thr Ala Pro Asp Ala Gly Gln Leu Met Gly Met Leu Leu Asn Leu
50 55 60
Val Asn Ala Arg Lys Thr Ile Glu Val Gly Val Phe Thr Gly Tyr Ser
65 70 75 80
Leu Leu Leu Thr Ala Leu Thr Leu Pro Glu Asp Gly Lys Val Ile Ala
85 90 95
Ile Asp Met Asn Arg Asp Ser Tyr Glu Ile Gly Leu Pro Val Ile Lys
100 105 110
Lys Ala Gly Val Glu His Lys Ile Asp Phe Lys Glu Ser Glu Ala Leu
115 120 125
Pro Ala Leu Asp Glu Leu Leu Asn Asn Lys Val Asn Glu Gly Gly Phe
130 135 140
Asp Phe Ala Phe Val Asp Ala Asp Lys Leu Asn Tyr Trp Asn Tyr His
145 150 155 160
Glu Arg Leu Ile Arg Leu Ile Lys Val Gly Gly Ile Ile Val Tyr Asp
165 170 175
Asn Thr Leu Trp Gly Gly Ser Val Ala Glu Pro Asp Ser Ser Thr Pro
180 185 190
Glu Trp Arg Ile Glu Val Lys Lys Ala Thr Leu Glu Leu Asn Lys Lys
195 200 205
Leu Ser Ala Asp Gln Arg Val Gln Ile Ser Gln Ala Ala Leu Gly Asp
210 215 220
Gly Ile Thr Ile Cys Arg Arg Leu Tyr
225 230
<210> 88
<211> 702
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 87
<400> 88
atgtccgcta aggatgaagc caagggtttg ttgaagtctg aagaattgta caagtacatc 60
ttggaaactt ctgtttaccc aagagaacca gaagttttga gagaattgag aaacattact 120
cacaaccacc cacaagctgg tatggctact gctccagacg ctggtcaatt gatgggtatg 180
ttgttgaact tggttaacgc tagaaagact atcgaagttg gtgttttcac tggttactct 240
ttgttgttga ctgctttgac tttgccagaa gatggtaagg ttatcgccat tgacatgaac 300
agagactctt acgaaatcgg tttgccagtt atcaagaagg ctggtgttga acacaagatt 360
gatttcaagg aatctgaagc tttgccagcc ttggacgaat tgttgaacaa caaggttaac 420
gaaggtggtt tcgacttcgc tttcgttgat gctgacaagt tgaactactg gaactaccac 480
gaaagattga ttagattgat caaggttggt ggtatcatcg tttacgataa cactttgtgg 540
ggtggttctg ttgctgaacc agactcttcc actccagaat ggagaatcga agtcaagaag 600
gctaccttgg aattgaacaa gaagttgtct gctgatcaaa gagttcaaat ctctcaagct 660
gctttgggtg atggtatcac tatttgtaga agattgtact aa 702
<210> 89
<211> 222
<212> PRT
<213> Homo sapiens
<400> 89
Met Ser Gly Asp Thr Lys Glu Gln Arg Ile Leu Asn His Val Leu Gln
1 5 10 15
His Ala Glu Pro Gly Asn Ala Gln Ser Val Leu Glu Ala Ile Asp Thr
20 25 30
Tyr Cys Glu Gln Lys Glu Trp Ala Met Asn Val Gly Asp Lys Lys Gly
35 40 45
Lys Ile Val Asp Ala Val Ile Gln Glu His Gln Pro Ser Val Leu Leu
50 55 60
Glu Leu Gly Ala Tyr Cys Gly Tyr Ser Ala Val Arg Met Ala Arg Leu
65 70 75 80
Leu Ser Pro Gly Ala Arg Leu Ile Thr Ile Glu Ile Asn Pro Asp Cys
85 90 95
Ala Ala Ile Thr Gln Arg Met Val Asp Phe Ala Gly Val Lys Asp Lys
100 105 110
Val Thr Leu Val Val Gly Ala Ser Gln Asp Ile Ile Pro Gln Leu Lys
115 120 125
Lys Lys Tyr Asp Val Asp Thr Leu Asp Met Val Phe Leu Asp His Trp
130 135 140
Lys Asp Arg Tyr Leu Pro Asp Thr Leu Leu Leu Glu Glu Cys Gly Leu
145 150 155 160
Leu Arg Lys Gly Thr Val Leu Leu Ala Asp Asn Val Ile Cys Pro Gly
165 170 175
Ala Pro Asp Phe Leu Ala His Val Arg Gly Ser Ser Cys Phe Glu Cys
180 185 190
Thr His Tyr Gln Ser Phe Leu Glu Tyr Arg Glu Val Val Asp Gly Leu
195 200 205
Glu Lys Ala Ile Tyr Lys Gly Pro Gly Ser Glu Ala Gly Pro
210 215 220
<210> 90
<211> 669
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 89
<400> 90
atgtccggtg acaccaagga acaaagaatc ttgaaccacg ttttgcaaca cgctgaacca 60
ggtaacgctc aatctgtttt ggaagccatt gacacctact gtgaacaaaa ggaatgggcc 120
atgaacgttg gtgacaagaa gggtaagatc gttgacgccg ttattcaaga acaccaacca 180
tccgttttgt tggaattggg tgcctactgt ggttactctg ctgttagaat ggccagattg 240
ttgtctccag gtgctagatt gatcaccatc gaaatcaacc cagactgtgc cgccatcacc 300
caaagaatgg ttgatttcgc tggtgttaag gacaaggtca ccttggttgt tggtgcttcc 360
caagacatca tcccacaatt gaagaagaag tacgatgttg acactttgga catggttttc 420
ttggaccact ggaaggacag atacttgcca gacactttgt tgttggaaga atgtggtttg 480
ttgagaaagg gtactgtttt gttggctgac aacgttatct gtccaggtgc tccagacttc 540
ttggctcacg ttagaggttc ttcttgtttc gaatgtactc actaccaatc tttcttggaa 600
tacagagaag ttgttgacgg tttggaaaag gccatctaca agggtccagg ttctgaagct 660
ggtccataa 669
<210> 91
<211> 489
<212> PRT
<213> Arabidopsis thaliana
<400> 91
Met Ser Gly Thr Pro Val Glu Val Ser Lys Leu His Phe Leu Leu Phe
1 5 10 15
Pro Phe Met Ala His Gly His Met Ile Pro Thr Leu Asp Met Ala Lys
20 25 30
Leu Phe Ala Thr Lys Gly Ala Lys Ser Thr Ile Leu Thr Thr Pro Leu
35 40 45
Asn Ala Lys Leu Phe Phe Glu Lys Pro Ile Lys Ser Phe Asn Gln Asp
50 55 60
Asn Pro Gly Leu Glu Asp Ile Thr Ile Gln Ile Leu Asn Phe Pro Cys
65 70 75 80
Thr Glu Leu Gly Leu Pro Asp Gly Cys Glu Asn Thr Asp Phe Ile Phe
85 90 95
Ser Thr Pro Asp Leu Asn Val Gly Asp Leu Ser Gln Lys Phe Leu Leu
100 105 110
Ala Met Lys Tyr Phe Glu Glu Pro Leu Glu Glu Leu Leu Val Thr Met
115 120 125
Arg Pro Asp Cys Leu Val Gly Asn Met Phe Phe Pro Trp Ser Thr Lys
130 135 140
Val Ala Glu Lys Phe Gly Val Pro Arg Leu Val Phe His Gly Thr Gly
145 150 155 160
Tyr Phe Ser Leu Cys Ala Ser His Cys Ile Arg Leu Pro Lys Asn Val
165 170 175
Ala Thr Ser Ser Glu Pro Phe Val Ile Pro Asp Leu Pro Gly Asp Ile
180 185 190
Leu Ile Thr Glu Glu Gln Val Met Glu Thr Glu Glu Glu Ser Val Met
195 200 205
Gly Arg Phe Met Lys Ala Ile Arg Asp Ser Glu Arg Asp Ser Phe Gly
210 215 220
Val Leu Val Asn Ser Phe Tyr Glu Leu Glu Gln Ala Tyr Ser Asp Tyr
225 230 235 240
Phe Lys Ser Phe Val Ala Lys Arg Ala Trp His Ile Gly Pro Leu Ser
245 250 255
Leu Gly Asn Arg Lys Phe Glu Glu Lys Ala Glu Arg Gly Lys Lys Ala
260 265 270
Ser Ile Asp Glu His Glu Cys Leu Lys Trp Leu Asp Ser Lys Lys Cys
275 280 285
Asp Ser Val Ile Tyr Met Ala Phe Gly Thr Met Ser Ser Phe Lys Asn
290 295 300
Glu Gln Leu Ile Glu Ile Ala Ala Gly Leu Asp Met Ser Gly His Asp
305 310 315 320
Phe Val Trp Val Val Asn Arg Lys Gly Ser Gln Val Glu Lys Glu Asp
325 330 335
Trp Leu Pro Glu Gly Phe Glu Glu Lys Thr Lys Gly Lys Gly Leu Ile
340 345 350
Ile Arg Gly Trp Ala Pro Gln Val Leu Ile Leu Glu His Lys Ala Ile
355 360 365
Gly Gly Phe Leu Thr His Cys Gly Trp Asn Ser Leu Leu Glu Gly Val
370 375 380
Ala Ala Gly Leu Pro Met Val Thr Trp Pro Val Gly Ala Glu Gln Phe
385 390 395 400
Tyr Asn Glu Lys Leu Val Thr Gln Val Leu Lys Thr Gly Val Ser Val
405 410 415
Gly Val Lys Lys Met Met Gln Val Val Gly Asp Phe Ile Ser Arg Glu
420 425 430
Lys Val Glu Gly Ala Val Arg Glu Val Met Val Gly Glu Glu Arg Arg
435 440 445
Lys Arg Ala Lys Glu Leu Ala Glu Met Ala Lys Asn Ala Val Lys Glu
450 455 460
Gly Gly Ser Ser Asp Leu Glu Val Asp Arg Leu Met Glu Glu Leu Thr
465 470 475 480
Leu Val Lys Leu Gln Lys Glu Lys Val
485
<210> 92
<211> 1470
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 91
<400> 92
atgtccggta ctccagtcga agtctctaag ttgcacttct tgttgttccc attcatggct 60
cacggtcaca tgatcccaac tttggacatg gctaagttgt tcgccaccaa gggtgctaag 120
tccactatct tgactactcc attgaacgcc aagttgttct tcgaaaagcc aatcaagtct 180
ttcaaccaag acaacccagg tttggaagat atcaccatcc aaatcttgaa cttcccatgt 240
actgaattgg gtttgccaga tggttgtgaa aacactgatt tcatcttctc cactccagac 300
ttgaacgttg gtgacttgtc tcaaaagttc ttgttggcta tgaagtactt cgaagaacca 360
ttggaagaat tgttggttac tatgaggcca gactgtttgg tcggtaacat gttcttccca 420
tggtccacta aggttgctga aaagttcggt gttccaagat tggttttcca cggtactggt 480
tacttctctt tgtgtgcttc tcactgtatc agattgccaa agaacgttgc tacttcttct 540
gaaccattcg ttattccaga tttgccaggt gacattttga ttactgaaga acaagtcatg 600
gaaactgaag aagaatctgt tatgggtaga ttcatgaagg ctatcagaga ctctgaaaga 660
gattctttcg gtgttttggt taactctttc tacgaattgg aacaagctta ctctgattac 720
ttcaagtctt tcgttgctaa gagagcttgg cacatcggtc cattgtcctt gggtaacaga 780
aagttcgaag aaaaggctga aagaggtaag aaggcttcta ttgatgaaca cgaatgtttg 840
aagtggttgg actccaagaa gtgtgattct gttatttaca tggccttcgg taccatgtcc 900
tctttcaaga acgaacaatt gatcgaaatt gctgctggtt tggatatgtc tggtcacgat 960
ttcgtctggg ttgttaacag aaagggttct caagttgaaa aggaagattg gttgccagaa 1020
ggtttcgaag aaaagaccaa gggtaagggt ttgatcatca gaggttgggc tccacaagtt 1080
ttgatcttgg aacacaaggc tattggtggt ttcttgactc actgtggttg gaactctttg 1140
ttggaaggtg ttgctgctgg tttgccaatg gttacttggc cagttggtgc cgaacaattc 1200
tacaacgaaa agttggttac tcaagtttta aagactggtg tttctgttgg tgttaagaag 1260
atgatgcaag ttgttggtga cttcatttct agagaaaagg ttgaaggtgc tgttagagaa 1320
gttatggttg gtgaagaaag aagaaagaga gccaaggaat tggctgaaat ggctaagaac 1380
gctgttaagg aaggtggttc ttctgatttg gaagttgata gattgatgga agaattgact 1440
ttggttaagt tgcaaaagga aaaggtttaa 1470
<210> 93
<211> 470
<212> PRT
<213> Scutellaria baicalensis
<400> 93
Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly
1 5 10 15
His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly
20 25 30
Val Arg Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg
35 40 45
Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe
50 55 60
Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Leu Ser Leu Asp Gln
65 70 75 80
Val Thr His Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu
85 90 95
Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu
100 105 110
Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe
115 120 125
Gly Ile Pro Arg Leu Leu Phe His Gly Thr Ser Leu Phe Ala Arg Cys
130 135 140
Phe Ala Glu Gln Met Ser Leu Gln Lys Pro Tyr Lys Asn Val Ser Ser
145 150 155 160
Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe
165 170 175
Val Arg Thr Gln Ile Pro Gly Tyr Glu Leu Gln Glu Gly Gly Asp Asp
180 185 190
Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser
195 200 205
Tyr Gly Asp Val Ile Asn Ser Phe Glu Glu Leu Glu Ser Glu Tyr Val
210 215 220
Asp His Tyr Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro
225 230 235 240
Leu Ser Leu Cys Asn Asn Arg Ala Glu Gln Lys Ser Pro Ile Asp Asp
245 250 255
His Glu Cys Leu Ala Trp Leu Asn Ser Lys Lys Pro Asn Ser Val Val
260 265 270
Tyr Met Cys Phe Gly Ser Met Ala Thr Phe Ser Pro Ala Gln Leu His
275 280 285
Glu Thr Ala Val Gly Leu Glu Ser Ser Gly Gln Asp Phe Ile Trp Val
290 295 300
Val Arg Asn Gly Gly Glu Asn Glu Asp Trp Leu Pro Gln Gly Phe Glu
305 310 315 320
Glu Arg Ile Lys Gly Lys Gly Leu Met Ile Arg Gly Trp Ala Pro Gln
325 330 335
Val Val Ile Leu Asp His Pro Ser Thr Gly Ala Phe Val Thr His Cys
340 345 350
Gly Trp Asn Ser Thr Leu Glu Gly Ile Cys Ala Gly Leu Pro Met Val
355 360 365
Thr Trp Pro Val Phe Ala Glu Gln Phe Tyr Asn Glu Lys Leu Val Thr
370 375 380
Glu Val Leu Lys Thr Gly Val Ser Val Gly Asn Lys Lys Trp Gln Arg
385 390 395 400
Val Gly Glu Trp Val Gly Ser Glu Ala Val Lys Glu Ala Val Glu Trp
405 410 415
Val Met Val Gly Asp Gly Ala Ala Glu Met Arg Ser Arg Ala Asn Tyr
420 425 430
Tyr Lys Glu Met Ala Arg Lys Ala Val Glu Asp Gly Gly Ser Ser Tyr
435 440 445
Asn Asn Leu Asn Ala Leu Ile Gln Glu Leu Ser Ala Tyr Val Pro Pro
450 455 460
Met Lys Gln Gly Leu Asn
465 470
<210> 94
<211> 1413
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 93
<400> 94
atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60
atgttggaca tggccaagtt gttctcttcc agaggtgtca gaaccaccat catcgccact 120
ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180
accaccaagt tcccaccaaa gggttcctct ttgccagaca acatcttgtc tttggatcaa 240
gttactcacg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300
gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360
actaccgact ctgctgccaa gttcggtatt ccaagattgt tgttccacgg tacctctttg 420
ttcgctagat gtttcgctga acaaatgtct ttgcaaaagc catacaagaa cgtttcttct 480
gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540
atcccaggtt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600
atgagagatg ctgataagaa gtcttacggt gacgttatca actctttcga agaattggaa 660
tctgaatacg ttgatcacta caagaacgtt ttcggtaaga aggcttggca catcggtcca 720
ttgtctttgt gtaacaacag agctgaacaa aagtctccaa tcgacgatca cgaatgtttg 780
gcttggttga actctaagaa gccaaactct gttgtttaca tgtgtttcgg ttctatggcc 840
actttctctc cagcccaatt gcacgaaact gctgtcggtt tggaatcctc tggtcaagat 900
ttcatctggg ttgttagaaa cggtggtgaa aacgaagatt ggttgccaca aggtttcgaa 960
gaaagaatca agggtaaggg tttgatgatc agaggttggg ccccacaagt tgttattttg 1020
gatcacccat ctactggtgc tttcgttact cactgtggtt ggaactctac tttggaaggt 1080
atctgtgctg gtttgccaat ggttacttgg ccagttttcg ctgaacaatt ctacaacgaa 1140
aagttggtta ctgaagtttt aaagactggt gtttctgttg gtaacaagaa gtggcaaaga 1200
gttggtgaat gggttggttc tgaagccgtt aaggaagctg ttgaatgggt catggtcggt 1260
gacggtgctg ctgaaatgag atctagagct aactactaca aggaaatggc tagaaaggct 1320
gttgaagatg gtggttcttc ttacaacaac ttgaacgctt tgatccaaga attgtctgcc 1380
tacgtcccac caatgaagca aggtttgaac taa 1413
<210> 95
<211> 470
<212> PRT
<213> Scutellaria baicalensis
<400> 95
Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly
1 5 10 15
His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly
20 25 30
Val Lys Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg
35 40 45
Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe
50 55 60
Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Trp Ser Leu Asp Gln
65 70 75 80
Val Thr Asp Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu
85 90 95
Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu
100 105 110
Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe
115 120 125
Gly Ile Pro Arg Leu Leu Phe His Gly Thr Ser Leu Phe Ala Arg Cys
130 135 140
Phe Ala Glu Gln Met Ser Leu Gln Lys Pro Tyr Lys Asn Val Ser Ser
145 150 155 160
Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe
165 170 175
Val Arg Thr Gln Ile Pro Gly Tyr Glu Leu Gln Glu Gly Gly Asp Asp
180 185 190
Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser
195 200 205
Tyr Gly Asp Val Ile Asn Asn Phe Glu Glu Leu Glu Ser Glu Tyr Val
210 215 220
Asp His Tyr Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro
225 230 235 240
Leu Ser Leu Cys Asn Asn Arg Ala Glu Gln Lys Ser Pro Ile Asp Asp
245 250 255
His Glu Cys Leu Ala Trp Leu Asn Ser Lys Lys Pro Asn Ser Val Val
260 265 270
Tyr Met Cys Phe Gly Ser Met Ala Thr Phe Thr Pro Ala Gln Leu His
275 280 285
Glu Thr Ala Val Gly Leu Glu Ser Ser Gly Gln Asp Phe Ile Trp Val
290 295 300
Val Arg Asn Gly Gly Glu Asn Glu Asp Trp Leu Pro Gln Gly Phe Glu
305 310 315 320
Glu Arg Ile Lys Gly Lys Gly Leu Met Ile Arg Gly Trp Ala Pro Gln
325 330 335
Val Met Ile Leu Asp His Pro Ser Thr Gly Ala Phe Val Thr His Cys
340 345 350
Gly Trp Asn Ser Thr Leu Glu Gly Ile Cys Ala Gly Leu Pro Met Val
355 360 365
Thr Trp Pro Val Phe Ala Glu Gln Phe Tyr Asn Glu Lys Leu Val Thr
370 375 380
Glu Val Leu Lys Thr Gly Val Ser Val Gly Asn Lys Lys Trp Gln Arg
385 390 395 400
Val Gly Glu Gly Val Gly Ser Glu Ala Val Lys Glu Ala Val Glu Arg
405 410 415
Val Met Val Gly Asp Gly Ala Ala Glu Met Arg Ser Arg Ala Ile Tyr
420 425 430
Tyr Lys Glu Met Ala Arg Lys Ala Val Glu Glu Gly Gly Ser Ser Tyr
435 440 445
Asn Asn Leu Asn Ala Leu Ile Glu Glu Leu Ser Ala Tyr Val Pro Pro
450 455 460
Met Lys Gln Gly Leu Asn
465 470
<210> 96
<211> 1413
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 95
<400> 96
atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60
atgttggaca tggccaagtt gttctcttcc agaggtgtca agaccaccat catcgccact 120
ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180
accaccaagt tcccaccaaa gggttcctct ttgccagaca acatctggtc tttggatcaa 240
gttactgatg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300
gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360
actaccgact ctgctgccaa gttcggtatt ccaagattgt tgttccacgg tacctctttg 420
ttcgctagat gtttcgctga acaaatgtct ttgcaaaagc catacaagaa cgtttcttct 480
gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540
atcccaggtt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600
atgagagatg ctgataagaa gtcttacggt gacgttatca acaacttcga agaattggaa 660
tctgaatacg ttgatcacta caagaacgtt ttcggtaaga aggcttggca catcggtcca 720
ttgtctttgt gtaacaacag agctgaacaa aagtctccaa tcgacgatca cgaatgtttg 780
gcttggttga actctaagaa gccaaactct gttgtttaca tgtgtttcgg ttctatggcc 840
actttcactc cagcccaatt gcacgaaact gctgtcggtt tggaatcctc tggtcaagat 900
ttcatctggg ttgttagaaa cggtggtgaa aacgaagatt ggttgccaca aggtttcgaa 960
gaaagaatca agggtaaggg tttgatgatc agaggttggg ccccacaagt tatgattttg 1020
gatcacccat ctactggtgc tttcgttact cactgtggtt ggaactctac tttggaaggt 1080
atctgtgctg gtttgccaat ggttacttgg ccagttttcg ctgaacaatt ctacaacgaa 1140
aagttggtta ctgaagtttt aaagactggt gtttctgttg gtaacaagaa gtggcaaaga 1200
gttggtgaag gtgttggttc tgaagctgtt aaggaagctg ttgaaagagt catggtcggt 1260
gacggtgctg ctgaaatgag atctagagct atctactaca aggaaatggc tagaaaggct 1320
gttgaagaag gtggttcttc ttacaacaac ttgaacgctt tgatcgaaga attgtctgcc 1380
tacgtcccac caatgaagca aggtttgaac taa 1413
<210> 97
<211> 477
<212> PRT
<213> Scutellaria baicalensis
<400> 97
Met Ser Gly Gln Leu His Ile Val Leu Val Pro Met Ile Ala His Gly
1 5 10 15
His Met Ile Pro Met Leu Asp Met Ala Lys Leu Phe Ser Ser Arg Gly
20 25 30
Val Lys Thr Thr Ile Ile Ala Thr Pro Ala Phe Ala Glu Pro Ile Arg
35 40 45
Lys Ala Arg Glu Ser Gly His Asp Ile Gly Leu Thr Thr Thr Lys Phe
50 55 60
Pro Pro Lys Gly Ser Ser Leu Pro Asp Asn Ile Arg Ser Leu Asp Gln
65 70 75 80
Val Thr Gly Asp Leu Leu Pro His Phe Phe Arg Ala Leu Glu Leu Leu
85 90 95
Gln Glu Pro Val Glu Glu Ile Met Glu Asp Leu Lys Pro Asn Cys Leu
100 105 110
Val Ser Asp Met Phe Leu Pro Trp Thr Thr Asp Ser Ala Ala Lys Phe
115 120 125
Gly Ile Pro Arg Leu Val Phe His Gly Thr Ser Leu Phe Ala Arg Cys
130 135 140
Phe Ser Glu Gln Met Ser Ile Gln Lys Pro Tyr Lys Asn Val Ser Ser
145 150 155 160
Asp Ser Glu Pro Phe Val Leu Arg Gly Leu Pro His Glu Val Ser Phe
165 170 175
Val Arg Thr Gln Ile Pro Asp Tyr Glu Leu Gln Glu Gly Gly Asp Asp
180 185 190
Ala Phe Ser Lys Met Ala Lys Gln Met Arg Asp Ala Asp Lys Lys Ser
195 200 205
Tyr Gly Asp Val Ile Asn Ser Phe Glu Glu Leu Glu Ser Glu Tyr Ala
210 215 220
Asp Tyr Asn Lys Asn Val Phe Gly Lys Lys Ala Trp His Ile Gly Pro
225 230 235 240
Leu Lys Leu Phe Asn Asn Arg Ala Glu Gln Lys Ser Ser Gln Arg Gly
245 250 255
Lys Glu Ser Ala Ile Asp Asp His Glu Cys Leu Ala Trp Leu Asn Ser
260 265 270
Lys Lys Pro Asn Ser Val Val Tyr Met Cys Phe Gly Ser Met Ala Thr
275 280 285
Phe Thr Pro Ala Gln Leu His Glu Thr Ala Val Gly Leu Glu Ser Ser
290 295 300
Gly Gln Asp Phe Ile Trp Val Val Arg Asn Gly Gly Lys Asn Glu Asp
305 310 315 320
Trp Leu Pro Gln Gly Phe Glu Glu Arg Ile Lys Gly Lys Gly Leu Met
325 330 335
Ile Arg Gly Trp Ala Pro Gln Val Met Ile Leu Asp His Pro Ser Thr
340 345 350
Gly Ala Phe Val Thr His Cys Gly Trp Asn Ser Thr Leu Glu Gly Ile
355 360 365
Cys Ala Gly Leu Pro Met Val Thr Trp Pro Val Phe Ala Glu Gln Phe
370 375 380
Tyr Asn Glu Lys Leu Val Thr Glu Val Leu Lys Thr Gly Val Ser Val
385 390 395 400
Gly Asn Lys Lys Trp Gln Arg Val Gly Glu Gly Val Gly Ser Glu Ala
405 410 415
Val Lys Glu Ala Val Glu Arg Val Met Val Gly Asp Gly Ala Ala Glu
420 425 430
Met Arg Ser Arg Ala Val Tyr Tyr Lys Glu Met Ala Arg Lys Ala Val
435 440 445
Glu Glu Gly Gly Ser Ser Tyr Asn Asn Leu Asn Ala Leu Ile Gln Glu
450 455 460
Leu Ser Ala Tyr Val Pro Pro Met Lys Gln Gly Leu Asn
465 470 475
<210> 98
<211> 1434
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO:97
<400> 98
atgtccggtc aattgcacat cgtcttggtt ccaatgatcg ctcacggtca catgatccca 60
atgttggaca tggccaagtt gttctcttcc agaggtgtca agaccaccat catcgccact 120
ccagccttcg ctgaaccaat cagaaaggcc agagaatctg gtcacgacat cggtttgacc 180
accaccaagt tcccaccaaa gggttcctct ttgccagaca acatcagatc tttggatcaa 240
gttactggtg atttgttgcc acacttcttc agagccttgg aattgttgca agaaccagtt 300
gaagaaatca tggaagattt gaagccaaac tgtttggttt ctgacatgtt cttgccatgg 360
actaccgact ctgctgccaa gttcggtatt ccaagattgg ttttccacgg tacctctttg 420
ttcgctagat gtttctctga acaaatgtct atccaaaagc catacaagaa cgtttcttct 480
gattccgaac cattcgtttt gagaggtttg ccacacgaag tttctttcgt tagaactcaa 540
atcccagatt acgaattgca agaaggtggt gatgatgcct tctctaagat ggctaagcaa 600
atgagagatg ctgataagaa gtcttacggt gacgttatca actctttcga agaattggaa 660
tctgaatacg ctgattacaa caagaacgtt ttcggtaaga aggcttggca catcggtcca 720
ttgaagttgt tcaacaacag agctgaacaa aagtcatctc aaagaggtaa ggaatctgcc 780
atcgacgatc acgaatgttt ggcttggttg aactctaaga agccaaactc tgttgtttac 840
atgtgtttcg gttctatggc cactttcact ccagcccaat tgcacgaaac tgctgtcggt 900
ttggaatcct ctggtcaaga tttcatctgg gttgttagaa acggtggtaa gaacgaagat 960
tggttgccac aaggtttcga agaaagaatc aagggtaagg gtttgatgat cagaggttgg 1020
gccccacaag ttatgatttt ggatcaccca tctactggtg ctttcgttac tcactgtggt 1080
tggaactcta ctttggaagg tatctgtgcc ggtttgccaa tggttacttg gccagttttc 1140
gctgaacaat tctacaacga aaagttggtt actgaagttt taaagactgg tgtttctgtt 1200
ggtaacaaga agtggcaaag agttggtgaa ggtgttggtt ctgaagctgt taaggaagct 1260
gttgaaagag tcatggtcgg tgacggtgct gctgaaatga gatctagagc tgtctactac 1320
aaggaaatgg ctagaaaggc tgttgaagaa ggtggttctt cttacaacaa cttgaacgct 1380
ttgatccaag aattgtctgc ctacgttcca ccaatgaagc aaggtttgaa ctaa 1434
<210> 99
<211> 533
<212> PRT
<213> Homo sapiens
<400> 99
Met Ser Ala Cys Leu Leu Arg Ser Phe Gln Arg Ile Ser Ala Gly Val
1 5 10 15
Phe Phe Leu Ala Leu Trp Gly Met Val Val Gly Asp Lys Leu Leu Val
20 25 30
Val Pro Gln Asp Gly Ser His Trp Leu Ser Met Lys Asp Ile Val Glu
35 40 45
Val Leu Ser Asp Arg Gly His Glu Ile Val Val Val Val Pro Glu Val
50 55 60
Asn Leu Leu Leu Lys Glu Ser Lys Tyr Tyr Thr Arg Lys Ile Tyr Pro
65 70 75 80
Val Pro Tyr Asp Gln Glu Glu Leu Lys Asn Arg Tyr Gln Ser Phe Gly
85 90 95
Asn Asn His Phe Ala Glu Arg Ser Phe Leu Thr Ala Pro Gln Thr Glu
100 105 110
Tyr Arg Asn Asn Met Ile Val Ile Gly Leu Tyr Phe Ile Asn Cys Gln
115 120 125
Ser Leu Leu Gln Asp Arg Asp Thr Leu Asn Phe Phe Lys Glu Ser Lys
130 135 140
Phe Asp Ala Leu Phe Thr Asp Pro Ala Leu Pro Cys Gly Val Ile Leu
145 150 155 160
Ala Glu Tyr Leu Gly Leu Pro Ser Val Tyr Leu Phe Arg Gly Phe Pro
165 170 175
Cys Ser Leu Glu His Thr Phe Ser Arg Ser Pro Asp Pro Val Ser Tyr
180 185 190
Ile Pro Arg Cys Tyr Thr Lys Phe Ser Asp His Met Thr Phe Ser Gln
195 200 205
Arg Val Ala Asn Phe Leu Val Asn Leu Leu Glu Pro Tyr Leu Phe Tyr
210 215 220
Cys Leu Phe Ser Lys Tyr Glu Glu Leu Ala Ser Ala Val Leu Lys Arg
225 230 235 240
Asp Val Asp Ile Ile Thr Leu Tyr Gln Lys Val Ser Val Trp Leu Leu
245 250 255
Arg Tyr Asp Phe Val Leu Glu Tyr Pro Arg Pro Val Met Pro Asn Met
260 265 270
Val Phe Ile Gly Gly Ile Asn Cys Lys Lys Arg Lys Asp Leu Ser Gln
275 280 285
Glu Phe Glu Ala Tyr Ile Asn Ala Ser Gly Glu His Gly Ile Val Val
290 295 300
Phe Ser Leu Gly Ser Met Val Ser Glu Ile Pro Glu Lys Lys Ala Met
305 310 315 320
Ala Ile Ala Asp Ala Leu Gly Lys Ile Pro Gln Thr Val Leu Trp Arg
325 330 335
Tyr Thr Gly Thr Arg Pro Ser Asn Leu Ala Asn Asn Thr Ile Leu Val
340 345 350
Lys Trp Leu Pro Gln Asn Asp Leu Leu Gly His Pro Met Thr Arg Ala
355 360 365
Phe Ile Thr His Ala Gly Ser His Gly Val Tyr Glu Ser Ile Cys Asn
370 375 380
Gly Val Pro Met Val Met Met Pro Leu Phe Gly Asp Gln Met Asp Asn
385 390 395 400
Ala Lys Arg Met Glu Thr Lys Gly Ala Gly Val Thr Leu Asn Val Leu
405 410 415
Glu Met Thr Ser Glu Asp Leu Glu Asn Ala Leu Lys Ala Val Ile Asn
420 425 430
Asp Lys Ser Tyr Lys Glu Asn Ile Met Arg Leu Ser Ser Leu His Lys
435 440 445
Asp Arg Pro Val Glu Pro Leu Asp Leu Ala Val Phe Trp Val Glu Phe
450 455 460
Val Met Arg His Lys Gly Ala Pro His Leu Arg Pro Ala Ala His Asp
465 470 475 480
Leu Thr Trp Tyr Gln Tyr His Ser Leu Asp Val Ile Gly Phe Leu Leu
485 490 495
Ala Val Val Leu Thr Val Ala Phe Ile Thr Phe Lys Cys Cys Ala Tyr
500 505 510
Gly Tyr Arg Lys Cys Leu Gly Lys Lys Gly Arg Val Lys Lys Ala His
515 520 525
Lys Ser Lys Thr His
530
<210> 100
<211> 1602
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 99
<400> 100
atgtccgcct gtttgttgag atctttccaa agaatttctg ctggtgtttt cttcttggct 60
ttgtggggta tggttgttgg tgacaagttg ttggttgtcc cacaagacgg ttctcactgg 120
ttgtctatga aggatatcgt tgaagttttg tctgacagag gtcacgaaat tgttgttgtt 180
gttccagaag ttaacttgtt gttgaaggaa tccaagtact acactagaaa gatctaccca 240
gttccatacg accaagaaga attgaagaac agataccaat ctttcggtaa caaccacttc 300
gctgaaagat ctttcttgac tgctccacaa actgaataca gaaacaacat gattgttatt 360
ggtttgtact tcatcaactg tcaatctttg ttgcaagaca gagacacctt gaacttcttc 420
aaggaatcta agttcgatgc tttgttcact gacccagcct tgccatgtgg tgttatcttg 480
gctgaatact tgggtttgcc atctgtttac ttgttcagag gtttcccatg ttccttggaa 540
cacactttct ctagatctcc agacccagtt tcctacattc caagatgtta cactaagttc 600
tctgaccaca tgactttctc ccaaagagtt gccaacttct tggttaactt gttggaacca 660
tacttgttct actgtttgtt ctctaagtac gaagaattgg cttctgctgt cttgaagaga 720
gatgttgata tcatcacctt gtaccaaaag gtatctgttt ggttgttgag atacgacttc 780
gttttggaat acccaagacc agtcatgcca aacatggtat tcattggtgg tatcaactgt 840
aagaagagaa aggacttgtc tcaagaattc gaagcctaca ttaacgcttc tggtgaacac 900
ggtattgttg ttttctcttt gggttctatg gtatctgaaa ttccagaaaa gaaggctatg 960
gctattgctg atgctttggg taagatccca caaactgtct tgtggagata cactggtacc 1020
agaccatcta acttggctaa caacactatc ttggttaagt ggttgccaca aaacgatttg 1080
ttgggtcacc caatgaccag agccttcatc acccacgctg gttcccacgg tgtttacgaa 1140
tctatctgta acggtgttcc aatggttatg atgccattgt tcggtgatca aatggacaac 1200
gctaagagaa tggaaactaa gggtgctggt gttaccttga acgttttgga aatgacttct 1260
gaagatttgg aaaacgcttt gaaggctgtc atcaacgaca agtcttacaa ggaaaacatc 1320
atgagattgt cctctttgca caaggacaga ccagttgaac cattggactt ggccgttttc 1380
tgggttgaat tcgttatgag acacaagggt gctccacact taagaccagc tgcccacgac 1440
ttgacctggt accaatacca ctccttggac gttattggtt tcttgttggc cgtcgttttg 1500
actgttgcct tcatcacctt caagtgttgt gcttacggtt acagaaagtg tttgggtaag 1560
aagggtagag ttaagaaggc ccacaagtcc aagacccact aa 1602
<210> 101
<211> 531
<212> PRT
<213> Homo sapiens
<400> 101
Met Val Ala Arg Ala Gly Trp Thr Gly Leu Leu Pro Leu Tyr Val Cys
1 5 10 15
Leu Leu Leu Thr Cys Gly Phe Ala Lys Ala Gly Lys Leu Leu Val Val
20 25 30
Pro Met Asp Gly Ser His Trp Phe Thr Met Gln Ser Val Val Glu Lys
35 40 45
Leu Ile Leu Arg Gly His Glu Val Val Val Val Met Pro Glu Val Ser
50 55 60
Trp Gln Leu Gly Arg Ser Leu Asn Cys Thr Val Lys Thr Tyr Ser Thr
65 70 75 80
Ser Tyr Thr Leu Glu Asp Gln Asp Arg Glu Phe Met Val Phe Ala Asp
85 90 95
Ala Arg Trp Thr Ala Pro Leu Arg Ser Ala Phe Ser Leu Leu Thr Ser
100 105 110
Ser Ser Asn Gly Ile Phe Asp Leu Phe Phe Ser Asn Cys Arg Ser Leu
115 120 125
Phe Asn Asp Arg Lys Leu Val Glu Tyr Leu Lys Glu Ser Cys Phe Asp
130 135 140
Ala Val Phe Leu Asp Pro Phe Asp Ala Cys Gly Leu Ile Val Ala Lys
145 150 155 160
Tyr Phe Ser Leu Pro Ser Val Val Phe Ala Arg Gly Ile Phe Cys His
165 170 175
Tyr Leu Glu Glu Gly Ala Gln Cys Pro Ala Pro Leu Ser Tyr Val Pro
180 185 190
Arg Leu Leu Leu Gly Phe Ser Asp Ala Met Thr Phe Lys Glu Arg Val
195 200 205
Trp Asn His Ile Met His Leu Glu Glu His Leu Phe Cys Pro Tyr Phe
210 215 220
Phe Lys Asn Val Leu Glu Ile Ala Ser Glu Ile Leu Gln Thr Pro Val
225 230 235 240
Thr Ala Tyr Asp Leu Tyr Ser His Thr Ser Ile Trp Leu Leu Arg Thr
245 250 255
Asp Phe Val Leu Glu Tyr Pro Lys Pro Val Met Pro Asn Met Ile Phe
260 265 270
Ile Gly Gly Ile Asn Cys His Gln Gly Lys Pro Val Pro Met Glu Phe
275 280 285
Glu Ala Tyr Ile Asn Ala Ser Gly Glu His Gly Ile Val Val Phe Ser
290 295 300
Leu Gly Ser Met Val Ser Glu Ile Pro Glu Lys Lys Ala Met Ala Ile
305 310 315 320
Ala Asp Ala Leu Gly Lys Ile Pro Gln Thr Val Leu Trp Arg Tyr Thr
325 330 335
Gly Thr Arg Pro Ser Asn Leu Ala Asn Asn Thr Ile Leu Val Lys Trp
340 345 350
Leu Pro Gln Asn Asp Leu Leu Gly His Pro Met Thr Arg Ala Phe Ile
355 360 365
Thr His Ala Gly Ser His Gly Val Tyr Glu Ser Ile Cys Asn Gly Val
370 375 380
Pro Met Val Met Met Pro Leu Phe Gly Asp Gln Met Asp Asn Ala Lys
385 390 395 400
Arg Met Glu Thr Lys Gly Ala Gly Val Thr Leu Asn Val Leu Glu Met
405 410 415
Thr Ser Glu Asp Leu Glu Asn Ala Leu Lys Ala Val Ile Asn Asp Lys
420 425 430
Ser Tyr Lys Glu Asn Ile Met Arg Leu Ser Ser Leu His Lys Asp Arg
435 440 445
Pro Val Glu Pro Leu Asp Leu Ala Val Phe Trp Val Glu Phe Val Met
450 455 460
Arg His Lys Gly Ala Pro His Leu Arg Pro Ala Ala His Asp Leu Thr
465 470 475 480
Trp Tyr Gln Tyr His Ser Leu Asp Val Ile Gly Phe Leu Leu Ala Val
485 490 495
Val Leu Thr Val Ala Phe Ile Thr Phe Lys Cys Cys Ala Tyr Gly Tyr
500 505 510
Arg Lys Cys Leu Gly Lys Lys Gly Arg Val Lys Lys Ala His Lys Ser
515 520 525
Lys Thr His
530
<210> 102
<211> 1596
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 101
<400> 102
atgtccgcta gagctggttg gactggtttg ttgccattgt acgtttgttt gttgttgacc 60
tgtggtttcg ccaaggctgg taagttgttg gttgttccaa tggatggttc tcactggttc 120
accatgcaat ctgttgttga aaagttgatc ttgagaggtc acgaagttgt cgttgtcatg 180
ccagaagttt cttggcaatt gggtagatct ttgaactgta ctgttaagac ttactctacc 240
tcttacactt tggaagatca agacagagaa ttcatggttt tcgccgatgc tagatggact 300
gctccattga gatctgcttt ctctttgttg acttcttctt ccaacggtat tttcgacttg 360
ttcttctcta actgtagatc tttgttcaac gacagaaagt tggttgaata cttgaaggaa 420
tcttgtttcg atgctgtttt cttggatcca ttcgatgcct gtggtttgat tgttgccaag 480
tacttctcct tgccatctgt tgtattcgcc agaggtatct tctgtcacta cttggaagaa 540
ggtgctcaat gtccagctcc attgtcctac gtcccaagat tgttgttggg tttctctgac 600
gccatgactt tcaaggaaag agtttggaac cacatcatgc acttggaaga acacttgttc 660
tgtccatact tcttcaagaa cgtcttggaa atcgcctctg aaattttgca aaccccagtc 720
actgcttacg atttgtactc tcacacttct atttggttgt tgagaactga cttcgttttg 780
gaatacccaa agccagttat gccaaacatg atcttcattg gtggtatcaa ctgtcaccaa 840
ggtaagccag ttccaatgga attcgaagcc tacattaacg cttctggtga acacggtatt 900
gttgttttct ctttgggttc tatggtatct gaaattccag aaaagaaggc tatggctatt 960
gctgatgctt tgggtaagat cccacaaact gtcttgtgga gatacactgg taccagacca 1020
tctaacttgg ctaacaacac tatcttggtt aagtggttgc cacaaaacga tttgttgggt 1080
cacccaatga ccagagcctt catcacccac gctggttccc acggtgttta cgaatctatc 1140
tgtaacggtg ttccaatggt tatgatgcca ttgttcggtg atcaaatgga caacgctaag 1200
agaatggaaa ctaagggtgc tggtgttacc ttgaacgttt tggaaatgac ttctgaagat 1260
ttggaaaacg ctttgaaggc tgtcatcaac gacaagtctt acaaggaaaa catcatgaga 1320
ttgtcctctt tgcacaagga cagaccagtt gaaccattgg acttggccgt tttctgggtt 1380
gaattcgtta tgagacacaa gggtgctcca cacttaagac cagctgccca cgacttgacc 1440
tggtaccaat accactcctt ggacgttatt ggtttcttgt tggccgtcgt tttgactgtt 1500
gccttcatca ccttcaagtg ttgtgcttac ggttacagaa agtgtttggg taagaagggt 1560
agagttaaga aggcccacaa gtccaagacc cactaa 1596
<210> 103
<211> 482
<212> PRT
<213> Citrus clementina
<400> 103
Met Ser His Ala Ser Ser Asn Met His Ala Pro Ser Asn Gln His His
1 5 10 15
Lys Met Gly Thr Glu Ser Ala Glu Ala Asp Gln Leu His Val Val Met
20 25 30
Phe Pro Trp Phe Ala Phe Gly His Ile Ser Pro Phe Val Gln Leu Ser
35 40 45
Asn Lys Leu Ser Leu His Gly Val Lys Val Ser Phe Phe Ser Ala Pro
50 55 60
Gly Asn Ile Pro Arg Ile Lys Ser Ser Leu Asn Leu Thr Pro Met Ala
65 70 75 80
Asp Ile Ile Pro Leu Gln Ile Pro His Val Asp Gly Leu Pro Pro Gly
85 90 95
Leu Asp Ser Thr Ser Glu Met Thr Pro His Met Ala Glu Leu Leu Lys
100 105 110
Gln Ala Leu Asp Leu Met Gln Pro Gln Ile Lys Thr Leu Leu Ser Gln
115 120 125
Leu Lys Pro His Phe Val Phe Phe Asp Phe Thr His Tyr Trp Leu Pro
130 135 140
Gly Leu Val Gly Ser Gln Leu Gly Ile Lys Thr Val Asn Phe Ser Val
145 150 155 160
Phe Ser Ala Ile Ser Gln Ala Tyr Leu Val Val Pro Ala Arg Lys Leu
165 170 175
Asn Asn Ser Leu Ala Asp Leu Met Lys Ser Pro Asp Gly Phe Pro Ala
180 185 190
Thr Ser Ile Thr Ser Leu Asp Glu Phe Val Ala Arg Asp Tyr Leu Tyr
195 200 205
Val Tyr Thr Lys Phe Asn Gly Gly Pro Ser Val Tyr Glu Arg Gly Ile
210 215 220
Gln Gly Val Asp Gly Cys Asp Val Leu Ala Ile Lys Thr Cys Asn Glu
225 230 235 240
Met Glu Gly Pro Tyr Leu Asp Phe Val Arg Thr Gln Phe Lys Lys Pro
245 250 255
Val Leu Leu Thr Gly Pro Leu Val Asn Pro Glu Pro Pro Ser Gly Glu
260 265 270
Leu Glu Glu Arg Trp Ala Lys Trp Leu Cys Lys Tyr Pro Pro Lys Ser
275 280 285
Val Ile Tyr Cys Ser Phe Gly Ser Glu Thr Phe Leu Thr Val Asp Gln
290 295 300
Ile Lys Glu Leu Ala Ile Gly Leu Glu Ile Thr Gly Leu Pro Phe Phe
305 310 315 320
Leu Val Leu Asn Phe Pro Pro Asn Val Asp Ala Gln Ser Glu Leu Val
325 330 335
Arg Thr Leu Pro Pro Gly Phe Met Asp Arg Val Lys Asp Arg Gly Val
340 345 350
Val His Thr Gly Trp Val Gln Gln Gln Leu Ile Leu Arg His Glu Ser
355 360 365
Val Gly Cys Tyr Val Cys His Ser Gly Phe Ser Ser Val Thr Glu Ala
370 375 380
Val Ile Ser Asp Cys Gln Leu Val Leu Leu Pro Leu Lys Gly Asp Gln
385 390 395 400
Phe Leu Asn Ser Lys Leu Val Ala Gly Asp Leu Lys Ala Gly Val Glu
405 410 415
Val Asn Arg Arg Asp His Asp Gly His Phe Gly Lys Glu Asp Ile Phe
420 425 430
Lys Ala Val Lys Thr Val Met Val Asp Val Asn Lys Glu Pro Gly Ala
435 440 445
Ser Ile Arg Ala Asn Gln Lys Trp Trp Arg Glu Phe Leu Leu Asn Gly
450 455 460
Gln Ile Gln Asp Lys Phe Ile Ala Asp Phe Val Lys Asp Leu Lys Thr
465 470 475 480
Leu Ala
<210> 104
<211> 1449
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 103
<400> 104
atgtcccacg cctcttctaa catgcacgcc ccatctaacc aacaccacaa gatgggtact 60
gaatctgctg aagctgatca attgcacgtt gttatgttcc catggttcgc tttcggtcac 120
atctctccat tcgttcaatt gtccaacaag ttgtctttgc acggtgtcaa ggtatctttc 180
ttctctgctc caggtaacat tccaagaatc aagtcatctt tgaacttgac tccaatggcc 240
gacattatcc cattgcaaat cccacacgtc gatggtttgc caccaggttt ggattctacc 300
tctgaaatga ctccacacat ggctgaattg ttgaagcaag ccttggactt gatgcaacca 360
caaatcaaga ctttgttgtc tcaattgaag ccacacttcg ttttcttcga tttcacccac 420
tactggttgc caggtttggt tggttctcaa ttgggtatca agactgttaa cttctctgtt 480
ttctctgcca tttctcaagc ctacttggtt gttccagcca gaaagttgaa caactctttg 540
gctgatttga tgaagtctcc agatggtttc ccagctactt ccattacctc tttggatgaa 600
ttcgttgcta gagattactt gtacgtttac actaagttca acggtggtcc atctgtttac 660
gaaagaggta ttcaaggtgt tgatggttgt gatgttttgg ccatcaagac ttgtaacgaa 720
atggaaggtc catacttgga tttcgttaga acccaattca agaagccagt tttgttgacc 780
ggtccattgg ttaacccaga accaccatcc ggtgaattgg aagaaagatg ggctaagtgg 840
ttgtgtaagt acccaccaaa gtctgttatt tactgttcct tcggttctga aactttcttg 900
accgttgatc aaatcaagga attggccatt ggtttggaaa ttactggttt gccattcttc 960
ttggtcttga acttcccacc aaacgtcgat gctcaatctg aattggtcag aactttgcca 1020
ccaggtttca tggacagagt taaggacaga ggtgttgttc acactggttg ggttcaacaa 1080
caattgattt tgagacacga atctgttggt tgttacgttt gtcactctgg tttctcttct 1140
gttactgaag ctgttatttc tgattgtcaa ttggttttgt tgccattgaa gggtgaccaa 1200
ttcttgaact ccaagttggt tgctggtgac ttgaaggctg gtgttgaagt taacagaaga 1260
gatcacgatg gtcacttcgg taaggaagat attttcaagg ctgttaagac tgttatggtt 1320
gatgttaaca aggaaccagg tgcttctatc agagctaacc aaaagtggtg gagagaattc 1380
ttgttgaacg gtcaaattca agataagttc attgctgatt tcgtcaagga tttaaagacc 1440
ttggcttaa 1449
<210> 105
<211> 476
<212> PRT
<213> Citrus sinensis
<400> 105
Met Ser His Ala Pro Ser Asn Gln His His Lys Met Gly Thr Glu Ser
1 5 10 15
Ala Glu Ala Asp Gln Leu His Val Val Met Phe Pro Trp Phe Ala Ser
20 25 30
Gly His Ile Ser Pro Phe Val Gln Leu Ser Asn Lys Leu Ser Leu His
35 40 45
Gly Val Lys Val Ser Phe Phe Ser Ala Pro Gly Asn Ile Pro Arg Ile
50 55 60
Lys Ser Ser Leu Asn Leu Thr Pro Met Ala Asp Ile Ile Pro Leu Gln
65 70 75 80
Ile Pro His Val Asp Gly Leu Pro Pro Gly Leu Asp Ser Thr Ser Glu
85 90 95
Met Thr Pro His Met Ala Glu Leu Leu Lys Gln Ala Leu Asp Leu Met
100 105 110
Gln Pro Gln Ile Lys Thr Leu Leu Ser Gln Leu Lys Pro His Phe Val
115 120 125
Phe Phe Asp Phe Thr His Tyr Trp Leu Pro Gly Leu Val Gly Ser Gln
130 135 140
Leu Gly Ile Lys Thr Val Asn Phe Ser Val Phe Ser Ala Ile Ser Gln
145 150 155 160
Ala Tyr Leu Val Val Pro Ala Arg Lys Leu Asn Asn Ser Leu Ala Asp
165 170 175
Leu Met Lys Ser Pro Asp Gly Phe Pro Ala Thr Ser Ile Thr Ser Leu
180 185 190
Asp Glu Phe Val Ala Arg Asp Tyr Leu Tyr Val Tyr Thr Lys Phe Asn
195 200 205
Gly Gly Pro Ser Val Tyr Glu Arg Gly Ile Gln Gly Val Asp Gly Cys
210 215 220
Asp Val Leu Ala Ile Lys Thr Cys Asn Glu Met Glu Gly Pro Tyr Leu
225 230 235 240
Asp Phe Val Arg Thr Gln Phe Lys Lys Pro Val Leu Leu Thr Gly Pro
245 250 255
Leu Val Asn Pro Glu Pro Pro Ser Gly Glu Leu Glu Glu Arg Trp Ala
260 265 270
Asn Trp Leu Gly Lys Phe Pro Pro Lys Ser Val Ile Tyr Cys Ser Phe
275 280 285
Gly Ser Glu Thr Phe Leu Thr Val Asp Gln Ile Lys Glu Leu Ala Ile
290 295 300
Gly Leu Glu Ile Thr Gly Leu Pro Phe Phe Leu Val Leu Asn Phe Pro
305 310 315 320
Pro Asn Val Asp Gly Gln Ser Glu Leu Val Arg Thr Leu Pro Pro Gly
325 330 335
Phe Met Asp Arg Val Lys Asp Arg Gly Val Val His Thr Gly Trp Val
340 345 350
Gln Gln Gln Leu Ile Leu Arg His Glu Ser Val Gly Cys Tyr Val Cys
355 360 365
His Ser Gly Phe Ser Ser Val Thr Glu Ala Val Ile Ser Asp Cys Gln
370 375 380
Leu Val Leu Leu Pro Leu Lys Gly Asp Gln Phe Leu Asn Ser Lys Leu
385 390 395 400
Val Ala Gly Asp Leu Lys Ala Gly Val Glu Val Asn Arg Arg Asp His
405 410 415
Asp Gly His Phe Gly Lys Glu Asp Ile Phe Lys Ala Val Lys Thr Val
420 425 430
Met Val Asp Val Asn Lys Glu Pro Gly Ala Ser Ile Arg Ala Asn Gln
435 440 445
Lys Trp Trp Arg Glu Phe Leu Leu Asn Gly Gln Ile Gln Asp Lys Phe
450 455 460
Ile Ala Asp Phe Val Lys Asp Leu Lys Ala Leu Ala
465 470 475
<210> 106
<211> 1431
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 105
<400> 106
atgtcccacg ccccatctaa ccaacaccac aagatgggta ctgaatctgc tgaagctgat 60
caattgcacg ttgttatgtt cccatggttc gcttctggtc acatctctcc attcgttcaa 120
ttgtccaaca agttgtcttt gcacggtgtc aaggtatctt tcttctctgc tccaggtaac 180
attccaagaa tcaagtcatc tttgaacttg actccaatgg ccgacattat cccattgcaa 240
atcccacacg tcgatggttt gccaccaggt ttggattcta cctctgaaat gactccacac 300
atggctgaat tgttgaagca agccttggac ttgatgcaac cacaaatcaa gactttgttg 360
tctcaattga agccacactt cgttttcttc gatttcaccc actactggtt gccaggtttg 420
gttggttctc aattgggtat caagaccgtt aacttctctg ttttctctgc catttctcaa 480
gcctacttgg ttgtcccagc cagaaagttg aacaactctt tggctgattt gatgaagtct 540
ccagatggtt tcccagctac ttccattacc tctttggatg aattcgttgc tagagattac 600
ttgtacgttt acactaagtt caacggtggt ccatctgttt acgaaagagg tattcaaggt 660
gttgatggtt gtgatgtttt ggccatcaag acttgtaacg aaatggaagg tccatacttg 720
gatttcgtta gaacccaatt caagaagcca gttttgttga ccggtccatt ggttaaccca 780
gaaccaccat ccggtgaatt ggaagaaaga tgggctaact ggttgggtaa gttcccacca 840
aagtctgtca tttactgttc tttcggttct gaaactttct tgaccgttga tcaaatcaag 900
gaattggcca ttggtttgga aattactggt ttgccattct tcttggtctt gaacttccca 960
ccaaacgttg atggtcaatc tgaattggtc agaactttgc caccaggttt catggacaga 1020
gttaaggaca gaggtgttgt tcacactggt tgggttcaac aacaattgat tttgagacac 1080
gaatctgttg gttgttacgt ttgtcactct ggtttctctt ctgttactga agctgttatt 1140
tctgattgtc aattggtttt gttgccattg aagggtgacc aattcttgaa ctccaagttg 1200
gttgctggtg acttgaaggc tggtgttgaa gttaacagaa gagatcacga tggtcacttc 1260
ggtaaggaag atattttcaa ggctgttaag actgttatgg ttgatgttaa caaggaacca 1320
ggtgcttcta tcagagctaa ccaaaagtgg tggagagaat tcttgttgaa cggtcaaatt 1380
caagataagt tcattgctga tttcgtcaag gatttgaagg ccttggctta a 1431
<210> 107
<211> 669
<212> PRT
<213> Citrus sinensis
<400> 107
Met Ser Ala Thr Tyr Thr Pro Lys Asn Ile Leu Ile Thr Gly Ala Ala
1 5 10 15
Gly Phe Ile Ala Ser His Val Cys Asn Arg Leu Ile Arg Asn Tyr Pro
20 25 30
Glu Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser Asn Leu
35 40 45
Lys Asn Leu Ile Pro Ser Lys Ala Ser Ser Asn Phe Lys Phe Val Lys
50 55 60
Gly Asp Ile Ala Ser Ala Asp Leu Val Asn Phe Leu Leu Ile Thr Glu
65 70 75 80
Ser Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val Asp Asn
85 90 95
Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr Gly Thr
100 105 110
His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg Arg Phe
115 120 125
Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu Asp Ala
130 135 140
Val Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn Pro Tyr
145 150 155 160
Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr Gly Arg
165 170 175
Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val Tyr Gly
180 185 190
Pro Asn Gln Phe Pro Glu Lys Leu Ile Pro Lys Phe Ile Leu Leu Ala
195 200 205
Met Arg Gly Leu Pro Leu Pro Ile His Gly Asp Gly Ser Asn Val Arg
210 215 220
Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Cys Ile Leu
225 230 235 240
His Lys Gly Glu Val Gly His Val Tyr Asn Val Gly Thr Lys Lys Glu
245 250 255
Arg Arg Val Ile Asp Val Ala Lys Asp Ile Cys Lys Leu Phe Ser Met
260 265 270
Asp Pro Glu Thr Ser Ile Lys Phe Val Glu Asn Arg Pro Phe Asn Asp
275 280 285
Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Thr Ser Leu Gly Trp Ser
290 295 300
Glu Arg Thr Ile Trp Glu Glu Gly Leu Arg Lys Thr Ile Glu Trp Tyr
305 310 315 320
Thr Gln Asn Pro Asp Trp Trp Gly Asp Val Ser Gly Ala Leu Leu Pro
325 330 335
His Pro Arg Met Leu Met Met Pro Gly Gly Arg His Phe Asp Gly Ser
340 345 350
Glu Glu Asn Lys Ala Val Ser Ser Val Ser Thr Asn Asn Ile Gln Ser
355 360 365
Arg Met Val Val Pro Val Ser Lys Cys Ser Ser Pro Arg Lys Pro Ser
370 375 380
Met Lys Phe Leu Ile Tyr Gly Arg Thr Gly Trp Ile Gly Gly Leu Leu
385 390 395 400
Gly Lys Leu Cys Glu Lys Glu Gly Ile Pro Phe Glu Tyr Gly Lys Gly
405 410 415
Arg Leu Glu Asp Arg Ser Ser Leu Ile Ala Asp Val Gln Ser Val Lys
420 425 430
Pro Thr His Val Phe Asn Ala Ala Gly Val Thr Gly Arg Pro Asn Val
435 440 445
Asp Trp Cys Glu Ser His Lys Thr Asp Thr Ile Arg Thr Asn Val Ala
450 455 460
Gly Thr Leu Thr Leu Ala Asp Val Cys Arg Asp His Gly Ile Leu Met
465 470 475 480
Met Asn Tyr Ala Thr Gly Cys Ile Phe Glu Tyr Asp Ala Ala His Pro
485 490 495
Glu Gly Ser Gly Ile Gly Tyr Lys Glu Glu Asp Thr Pro Asn Phe Thr
500 505 510
Gly Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu Lys
515 520 525
Glu Tyr Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser Ser
530 535 540
Asp Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr Asn
545 550 555 560
Lys Val Val Asn Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu Leu
565 570 575
Pro Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Arg Gly Ile Trp Asn
580 585 590
Phe Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met Tyr
595 600 605
Lys Lys Tyr Ile Asn Pro Glu Phe Lys Trp Val Asn Phe Thr Leu Asp
610 615 620
Glu Gln Ala Lys Val Ile Val Ala Pro Arg Ser Asn Asn Glu Met Asp
625 630 635 640
Ala Ser Lys Leu Lys Lys Glu Phe Pro Glu Leu Leu Ser Ile Lys Asp
645 650 655
Ser Leu Ile Lys Tyr Val Phe Glu Pro Asn Lys Lys Thr
660 665
<210> 108
<211> 2010
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 107
<400> 108
atgtccgcta cttacacccc aaagaacatc ttgatcactg gtgctgctgg tttcattgct 60
tcccacgttt gtaacagatt gattagaaac tacccagaat acaagattgt tgttttggac 120
aagttggatt actgttctaa cttgaagaac ttgatcccat ccaaggcttc ctccaacttc 180
aagttcgtta agggtgacat tgcctctgct gacttggtca acttcttgtt gatcaccgaa 240
tccattgaca ctattatgca cttcgctgct caaactcacg ttgacaactc tttcggtaac 300
tctttcgaat tcaccaagaa caacatctac ggtactcacg tcttgttgga agcctgtaag 360
gttactggtc aaatcagaag attcatccac gtatctactg atgaagtcta cggtgaaact 420
gatgaagatg ctgttgttgg taaccacgaa gcttcccaat tgttgccaac taacccatac 480
tctgctacta aggctggtgc tgaaatgttg gttatggctt acggtagatc ttacggtttg 540
ccagttatta ctaccagagg taacaacgtt tacggtccaa accaattccc agaaaagttg 600
attccaaagt tcatcttgtt ggccatgaga ggtttgccat tgccaattca cggtgatggt 660
tctaacgtta gatcttactt gtactgtgaa gatgttgctg aagctttcga atgtattttg 720
cacaagggtg aagttggtca cgtttacaac gttggtacta agaaggaaag aagagttatt 780
gatgttgcta aggatatttg taagttgttc tctatggacc cagaaacttc tatcaagttc 840
gttgaaaaca gaccattcaa cgatcaaaga tacttcttgg atgatcaaaa gttgacttct 900
ttgggttggt ctgaaagaac catctgggaa gaaggtttga gaaagactat tgaatggtac 960
actcaaaacc cagattggtg gggtgatgtc tctggtgctt tgttgccaca cccaagaatg 1020
ttgatgatgc caggtggtag acacttcgat ggttctgaag aaaacaaggc tgtttcctct 1080
gtctctacta acaacattca atccagaatg gttgttccag tttccaagtg ttcttctcca 1140
agaaagccat ccatgaagtt cttgatctac ggtagaactg gttggattgg tggtttgttg 1200
ggtaagttgt gtgaaaagga aggtattcca ttcgaatacg gtaagggtag attggaagat 1260
agatcttctt tgattgctga tgttcaatct gttaagccaa ctcacgtttt caacgctgct 1320
ggtgttactg gtagaccaaa cgttgattgg tgtgaatctc acaagactga caccattaga 1380
accaacgttg ctggtacctt gaccttggct gatgtttgta gagatcacgg tatcttgatg 1440
atgaactacg ctaccggttg tatcttcgaa tacgatgctg ctcacccaga aggttctggt 1500
attggttaca aggaagaaga tactccaaac ttcactggtt ctttctactc taagaccaag 1560
gccatggttg aagaattgtt gaaggaatac gacaacgttt gtactttgag agtcagaatg 1620
ccaatctctt ctgacttgaa caacccaaga aacttcatta ccaagatttc tagatacaac 1680
aaggttgtca acattccaaa ctctatgact gttttggatg aattgttgcc aatttctatt 1740
gaaatggcta agagaaactt gagaggtatt tggaacttca ctaacccagg tgttgtttct 1800
cacaacgaaa ttttggaaat gtacaagaag tacattaacc cagaattcaa gtgggttaac 1860
ttcactttgg atgaacaagc taaggttatc gtcgccccaa gatctaacaa cgaaatggat 1920
gcttctaagt tgaagaagga attcccagaa ttgttgtcca tcaaggattc tttgatcaag 1980
tacgtattcg aaccaaacaa gaaaacctaa 2010
<210> 109
<211> 670
<212> PRT
<213> Arabidopsis thaliana
<400> 109
Met Ser Ala Ser Tyr Thr Pro Lys Asn Ile Leu Ile Thr Gly Ala Ala
1 5 10 15
Gly Phe Ile Ala Ser His Val Ala Asn Arg Leu Ile Arg Ser Tyr Pro
20 25 30
Asp Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser Asn Leu
35 40 45
Lys Asn Leu Asn Pro Ser Lys His Ser Pro Asn Phe Lys Phe Val Lys
50 55 60
Gly Asp Ile Ala Ser Ala Asp Leu Val Asn His Leu Leu Ile Thr Glu
65 70 75 80
Gly Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val Asp Asn
85 90 95
Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr Gly Thr
100 105 110
His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg Arg Phe
115 120 125
Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu Asp Ala
130 135 140
Leu Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn Pro Tyr
145 150 155 160
Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr Gly Arg
165 170 175
Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val Tyr Gly
180 185 190
Pro Asn Gln Phe Pro Glu Lys Leu Ile Pro Lys Phe Ile Leu Leu Ala
195 200 205
Met Arg Gly Gln Val Leu Pro Ile His Gly Asp Gly Ser Asn Val Arg
210 215 220
Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Val Val Leu
225 230 235 240
His Lys Gly Glu Val Gly His Val Tyr Asn Ile Gly Thr Lys Lys Glu
245 250 255
Arg Arg Val Asn Asp Val Ala Lys Asp Ile Cys Lys Leu Phe Asn Met
260 265 270
Asp Pro Glu Ala Asn Ile Lys Phe Val Asp Asn Arg Pro Phe Asn Asp
275 280 285
Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Lys Lys Leu Gly Trp Ser
290 295 300
Glu Arg Thr Thr Trp Glu Glu Gly Leu Lys Lys Thr Met Asp Trp Tyr
305 310 315 320
Thr Gln Asn Pro Glu Trp Trp Gly Asp Val Ser Gly Ala Leu Leu Pro
325 330 335
His Pro Arg Met Leu Met Met Pro Gly Gly Arg His Phe Asp Gly Ser
340 345 350
Glu Asp Asn Ser Leu Ala Ala Thr Leu Ser Glu Lys Pro Ser Gln Thr
355 360 365
His Met Val Val Pro Ser Gln Arg Ser Asn Gly Thr Pro Gln Lys Pro
370 375 380
Ser Leu Lys Phe Leu Ile Tyr Gly Lys Thr Gly Trp Ile Gly Gly Leu
385 390 395 400
Leu Gly Lys Ile Cys Asp Lys Gln Gly Ile Ala Tyr Glu Tyr Gly Lys
405 410 415
Gly Arg Leu Glu Asp Arg Ser Ser Leu Leu Gln Asp Ile Gln Ser Val
420 425 430
Lys Pro Thr His Val Phe Asn Ser Ala Gly Val Thr Gly Arg Pro Asn
435 440 445
Val Asp Trp Cys Glu Ser His Lys Thr Glu Thr Ile Arg Ala Asn Val
450 455 460
Ala Gly Thr Leu Thr Leu Ala Asp Val Cys Arg Glu His Gly Leu Leu
465 470 475 480
Met Met Asn Phe Ala Thr Gly Cys Ile Phe Glu Tyr Asp Asp Lys His
485 490 495
Pro Glu Gly Ser Gly Ile Gly Phe Lys Glu Glu Asp Thr Pro Asn Phe
500 505 510
Thr Gly Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu
515 520 525
Lys Glu Tyr Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser
530 535 540
Ser Asp Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr
545 550 555 560
Asn Lys Val Val Asn Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu
565 570 575
Leu Pro Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Lys Gly Ile Trp
580 585 590
Asn Phe Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met
595 600 605
Tyr Arg Asp Tyr Ile Asn Pro Glu Phe Lys Trp Ala Asn Phe Thr Leu
610 615 620
Glu Glu Gln Ala Lys Val Ile Val Ala Pro Arg Ser Asn Asn Glu Met
625 630 635 640
Asp Ala Ser Lys Leu Lys Lys Glu Phe Pro Glu Leu Leu Ser Ile Lys
645 650 655
Glu Ser Leu Ile Lys Tyr Ala Tyr Gly Pro Asn Lys Lys Thr
660 665 670
<210> 110
<211> 2013
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 109
<400> 110
atgtccgctt cttacactcc aaagaacatt ttgatcaccg gtgctgctgg tttcattgct 60
tctcacgtcg ccaacagatt gatcagatct tacccagatt acaagatcgt tgttttggac 120
aagttggatt actgttctaa cttgaagaac ttgaacccat ctaagcactc tccaaacttc 180
aagttcgtca agggtgatat cgcttctgct gacttggtta accacttgtt gatcactgaa 240
ggtattgaca ccatcatgca cttcgctgct caaactcacg tcgacaactc cttcggtaac 300
tctttcgaat tcactaagaa caacatctac ggtactcacg tcttgttgga agcttgtaag 360
gttactggtc aaattagaag attcattcac gtttctactg atgaagttta cggtgaaact 420
gatgaagatg ctttggttgg taaccacgaa gcttctcaat tgttgccaac taacccatac 480
tctgccacta aggctggtgc tgaaatgttg gttatggctt acggtagatc ttacggtttg 540
ccagttatta ccactagagg taacaacgtc tacggtccaa accaattccc agaaaagttg 600
attccaaagt tcattttgtt ggctatgaga ggtcaagttt tgccaattca cggtgatggt 660
tctaacgtca gatcttactt gtactgtgag gacgttgctg aagctttcga agttgttttg 720
cacaagggtg aagttggtca cgtttacaac attggtacta agaaggaaag aagagttaac 780
gatgttgcca aggacatctg taagttgttc aacatggacc cagaagctaa catcaagttc 840
gtcgacaaca gaccattcaa cgatcaaaga tacttcttgg acgatcaaaa gttgaagaag 900
ttgggttggt ctgaaagaac cacttgggaa gaaggtttga agaaaactat ggattggtac 960
actcaaaacc cagaatggtg gggtgatgtt tctggtgctt tgttgccaca cccaagaatg 1020
ttgatgatgc caggtggtag acacttcgat ggttccgaag ataactcttt ggctgctact 1080
ttgtctgaaa agccatctca aacccacatg gttgttccat ctcaaagatc taacggtact 1140
ccacaaaagc catctttgaa gttcttgatc tacggtaaga ccggttggat cggtggtttg 1200
ttgggtaaga tctgtgataa gcaaggtatt gcttacgaat acggtaaggg tagattggaa 1260
gatagatctt ctttgttgca agatattcaa tctgttaagc caacccacgt tttcaactcc 1320
gctggtgtta ctggtagacc aaacgttgac tggtgtgaat ctcacaagac cgaaactatc 1380
agagccaacg ttgctggtac tttgactttg gctgatgtct gtagagaaca cggtttgttg 1440
atgatgaact tcgctactgg ttgtatcttc gaatacgacg acaagcaccc agaaggttct 1500
ggtattggtt tcaaggaaga agatactcca aacttcactg gttctttcta ctctaagacc 1560
aaggccatgg tcgaagaatt gttgaaggaa tacgacaacg tttgtacttt gagagttaga 1620
atgccaatct cctctgattt gaacaaccca agaaacttca tcaccaagat ctccagatac 1680
aacaaggttg ttaacatccc aaactctatg actgttttgg acgaattgtt gccaatctcc 1740
atcgaaatgg ctaagagaaa cttgaagggt atctggaact tcactaaccc aggtgttgtt 1800
tctcacaacg aaatcttgga aatgtacaga gactacatca acccagaatt caagtgggct 1860
aacttcactt tggaagaaca agctaaggtc attgttgctc caagatctaa caacgaaatg 1920
gatgcttcca agttgaagaa ggaattccca gaattgttgt ctatcaagga atctttgatt 1980
aagtacgctt acggtccaaa caagaaaacc taa 2013
<210> 111
<211> 668
<212> PRT
<213> Arabidopsis thaliana
<400> 111
Met Ser Asp Asp Thr Thr Tyr Lys Pro Lys Asn Ile Leu Ile Thr Gly
1 5 10 15
Ala Ala Gly Phe Ile Ala Ser His Val Ala Asn Arg Leu Ile Arg Asn
20 25 30
Tyr Pro Asp Tyr Lys Ile Val Val Leu Asp Lys Leu Asp Tyr Cys Ser
35 40 45
Asp Leu Lys Asn Leu Asp Pro Ser Phe Ser Ser Pro Asn Phe Lys Phe
50 55 60
Val Lys Gly Asp Ile Ala Ser Asp Asp Leu Val Asn Tyr Leu Leu Ile
65 70 75 80
Thr Glu Asn Ile Asp Thr Ile Met His Phe Ala Ala Gln Thr His Val
85 90 95
Asp Asn Ser Phe Gly Asn Ser Phe Glu Phe Thr Lys Asn Asn Ile Tyr
100 105 110
Gly Thr His Val Leu Leu Glu Ala Cys Lys Val Thr Gly Gln Ile Arg
115 120 125
Arg Phe Ile His Val Ser Thr Asp Glu Val Tyr Gly Glu Thr Asp Glu
130 135 140
Asp Ala Ala Val Gly Asn His Glu Ala Ser Gln Leu Leu Pro Thr Asn
145 150 155 160
Pro Tyr Ser Ala Thr Lys Ala Gly Ala Glu Met Leu Val Met Ala Tyr
165 170 175
Gly Arg Ser Tyr Gly Leu Pro Val Ile Thr Thr Arg Gly Asn Asn Val
180 185 190
Tyr Gly Pro Asn Gln Phe Pro Glu Lys Met Ile Pro Lys Phe Ile Leu
195 200 205
Leu Ala Met Ser Gly Lys Pro Leu Pro Ile His Gly Asp Gly Ser Asn
210 215 220
Val Arg Ser Tyr Leu Tyr Cys Glu Asp Val Ala Glu Ala Phe Glu Val
225 230 235 240
Val Leu His Lys Gly Glu Ile Gly His Val Tyr Asn Val Gly Thr Lys
245 250 255
Arg Glu Arg Arg Val Ile Asp Val Ala Arg Asp Ile Cys Lys Leu Phe
260 265 270
Gly Lys Asp Pro Glu Ser Ser Ile Gln Phe Val Glu Asn Arg Pro Phe
275 280 285
Asn Asp Gln Arg Tyr Phe Leu Asp Asp Gln Lys Leu Lys Lys Leu Gly
290 295 300
Trp Gln Glu Arg Thr Asn Trp Glu Asp Gly Leu Lys Lys Thr Met Asp
305 310 315 320
Trp Tyr Thr Gln Asn Pro Glu Trp Trp Gly Asp Val Ser Gly Ala Leu
325 330 335
Leu Pro His Pro Arg Met Leu Met Met Pro Gly Gly Arg Leu Ser Asp
340 345 350
Gly Ser Ser Glu Lys Lys Asp Val Ser Ser Asn Thr Val Gln Thr Phe
355 360 365
Thr Val Val Thr Pro Lys Asn Gly Asp Ser Gly Asp Lys Ala Ser Leu
370 375 380
Lys Phe Leu Ile Tyr Gly Lys Thr Gly Trp Leu Gly Gly Leu Leu Gly
385 390 395 400
Lys Leu Cys Glu Lys Gln Gly Ile Thr Tyr Glu Tyr Gly Lys Gly Arg
405 410 415
Leu Glu Asp Arg Ala Ser Leu Val Ala Asp Ile Arg Ser Ile Lys Pro
420 425 430
Thr His Val Phe Asn Ala Ala Gly Leu Thr Gly Arg Pro Asn Val Asp
435 440 445
Trp Cys Glu Ser His Lys Pro Glu Thr Ile Arg Val Asn Val Ala Gly
450 455 460
Thr Leu Thr Leu Ala Asp Val Cys Arg Glu Asn Asp Leu Leu Met Met
465 470 475 480
Asn Phe Ala Thr Gly Cys Ile Phe Glu Tyr Asp Ala Thr His Pro Glu
485 490 495
Gly Ser Gly Ile Gly Phe Lys Glu Glu Asp Lys Pro Asn Phe Phe Gly
500 505 510
Ser Phe Tyr Ser Lys Thr Lys Ala Met Val Glu Glu Leu Leu Arg Glu
515 520 525
Phe Asp Asn Val Cys Thr Leu Arg Val Arg Met Pro Ile Ser Ser Asp
530 535 540
Leu Asn Asn Pro Arg Asn Phe Ile Thr Lys Ile Ser Arg Tyr Asn Lys
545 550 555 560
Val Val Asp Ile Pro Asn Ser Met Thr Val Leu Asp Glu Leu Leu Pro
565 570 575
Ile Ser Ile Glu Met Ala Lys Arg Asn Leu Arg Gly Ile Trp Asn Phe
580 585 590
Thr Asn Pro Gly Val Val Ser His Asn Glu Ile Leu Glu Met Tyr Lys
595 600 605
Asn Tyr Ile Glu Pro Gly Phe Lys Trp Ser Asn Phe Thr Val Glu Glu
610 615 620
Gln Ala Lys Val Ile Val Ala Ala Arg Ser Asn Asn Glu Met Asp Gly
625 630 635 640
Ser Lys Leu Ser Lys Glu Phe Pro Glu Met Leu Ser Ile Lys Glu Ser
645 650 655
Leu Leu Lys Tyr Val Phe Glu Pro Asn Lys Arg Thr
660 665
<210> 112
<211> 2007
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 111
<400> 112
atgtccgatg atactactta caagccaaag aacattttga ttactggtgc tgctggtttc 60
attgcttctc acgttgccaa cagattgatc agaaactacc cagattacaa gatcgttgtt 120
ttggacaagt tggattactg ttctgatttg aagaacttgg atccatcttt ctcttctcca 180
aacttcaagt tcgtcaaggg tgatatcgct tctgatgatt tggttaacta cttgttgatc 240
actgaaaaca ttgatactat catgcacttc gctgctcaaa ctcacgttga taactctttc 300
ggtaactctt tcgaattcac caagaacaac atttacggta ctcacgtttt gttggaagcc 360
tgtaaggtta ctggtcaaat cagaagattc atccacgttt ctaccgatga agtctacggt 420
gaaaccgatg aagatgctgc tgttggtaac cacgaagctt ctcaattgtt gccaactaac 480
ccatactctg ctactaaggc tggtgctgaa atgttggtta tggcttacgg tagatcttac 540
ggtttgccag ttattactac tagaggtaac aacgtttacg gtccaaacca attcccagaa 600
aagatgattc caaagttcat cttgttggct atgtctggta agccattgcc aatccacggt 660
gatggttcta acgtcagatc ttacttgtac tgtgaggacg ttgctgaagc tttcgaagtt 720
gttttgcaca agggtgaaat cggtcacgtc tacaacgtcg gtactaagag agaaagaaga 780
gttatcgatg ttgctagaga catctgtaag ttgttcggta aggacccaga atcttctatt 840
caattcgttg aaaacagacc attcaacgat caaagatact tcttggatga tcaaaagttg 900
aagaagttgg gttggcaaga aagaactaac tgggaagatg gtttgaagaa aactatggac 960
tggtacactc aaaacccaga atggtggggt gatgtttctg gtgctttgtt gccacaccca 1020
agaatgttga tgatgccagg tggtagattg tctgatggtt cttctgaaaa gaaggacgtt 1080
tcttctaaca ctgtccaaac tttcactgtt gttactccaa agaacggtga ttctggtgac 1140
aaggcttctt tgaagttctt gatctacggt aagactggtt ggttgggtgg tttgttgggt 1200
aagttgtgtg aaaagcaagg tattacttac gaatacggta agggtagatt ggaagataga 1260
gcttctttgg ttgctgatat tagatctatc aagccaactc acgttttcaa cgctgctggt 1320
ttgactggta gaccaaacgt tgactggtgt gaatctcaca agccagaaac cattagagtt 1380
aacgtcgctg gtactttgac tttggctgat gtttgtagag aaaacgattt gttgatgatg 1440
aacttcgcca ccggttgtat cttcgaatac gacgctactc acccagaagg ttctggtatc 1500
ggtttcaagg aagaagataa gccaaacttc ttcggttctt tctactctaa gaccaaggcc 1560
atggttgaag aattgttgag agaattcgac aacgtttgta ccttgagagt cagaatgcca 1620
atctcctctg acttgaacaa cccaagaaac ttcatcacta agatctctag atacaacaag 1680
gttgttgaca tcccaaactc tatgaccgtt ttggacgaat tgttgccaat ctctatcgaa 1740
atggctaaga gaaacttgag aggtatctgg aacttcacca acccaggtgt tgtttctcac 1800
aacgaaatct tggaaatgta caagaactac atcgaaccag gtttcaagtg gtccaacttc 1860
actgttgaag aacaagctaa ggtcattgtt gctgctagat ctaacaacga aatggatggt 1920
tctaagttgt ctaaggaatt cccagaaatg ttgtccatca aggaatcttt gttgaagtac 1980
gtattcgaac caaacaagag aacctaa 2007
<210> 113
<211> 482
<212> PRT
<213> Citrus sinensis
<400> 113
Met Ser Lys Asp Thr Ile Val Phe Tyr Thr Ser Pro Gly Arg Gly His
1 5 10 15
Leu Asn Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Tyr His Pro
20 25 30
Cys Phe Ser Ile Asp Ile Ile Ile Pro Thr Ala Pro Phe Val Ser Ser
35 40 45
Ala Gly Thr Asp Asp Tyr Ile Ala Ser Val Ser Ala Thr Ala Pro Ser
50 55 60
Val Thr Phe His Gln Leu Pro Pro Pro Val Ser Gly Leu Pro Asp Thr
65 70 75 80
Leu Arg Ser Pro Ala Asp Phe Pro Ala Leu Val Tyr Glu Leu Gly Glu
85 90 95
Leu Asn Asn Pro Asn Leu His Glu Thr Leu Ile Thr Ile Ser Lys Arg
100 105 110
Ser Asn Leu Lys Ala Phe Val Ile Asp Phe Leu Cys Asn Pro Ala Phe
115 120 125
Gln Val Ser Ser Ser Thr Leu Ser Ile Pro Thr Tyr Tyr Tyr Phe Thr
130 135 140
Thr Ala Gly Ser Val Leu Ala Ala Asn Leu Tyr Leu Pro Thr Leu His
145 150 155 160
Lys Asn Thr Thr Lys Ser Phe Arg Glu Leu Gly Ser Ala Leu Leu Asn
165 170 175
Phe Pro Gly Phe Pro Pro Phe Pro Ala Arg Asp Met Ala Leu Pro Met
180 185 190
His Asp Arg Glu Gly Lys Val Tyr Lys Gly Leu Val Asp Thr Gly Ile
195 200 205
Gln Met Ala Lys Ser Ala Gly Val Ile Val Asn Thr Phe Glu Leu Leu
210 215 220
Glu Glu Arg Ala Ile Lys Ala Met Leu Glu Gly Gln Cys Thr Pro Gly
225 230 235 240
Asp Thr Ser Pro Pro Leu Tyr Cys Ile Gly Pro Val Val Gly Arg Gly
245 250 255
Asn Gly Glu Asn Arg Gly Arg Asp Arg His Glu Cys Leu Ser Trp Leu
260 265 270
Asp Ser Lys Pro Ser Arg Ser Val Leu Phe Leu Cys Phe Gly Ser Leu
275 280 285
Gly Ser Phe Ser Cys Lys Gln Leu Lys Glu Met Ala Ile Gly Leu Glu
290 295 300
Arg Ser Gly Val Lys Phe Leu Trp Val Val Arg Ala Pro Ala Pro Asp
305 310 315 320
Ser Val Glu Asn Arg Ser Ser Leu Glu Ser Leu Leu Pro Glu Gly Phe
325 330 335
Leu Asp Arg Thr Lys Asp Arg Gly Leu Val Val Glu Ser Trp Ala Pro
340 345 350
Gln Val Glu Val Leu Asn His Glu Ser Val Gly Gly Phe Val Thr His
355 360 365
Cys Gly Trp Asn Ser Val Leu Glu Gly Val Cys Ala Gly Val Pro Met
370 375 380
Leu Ala Trp Pro Leu Tyr Ala Glu Gln Lys Met Ile Arg Ala Val Val
385 390 395 400
Val Glu Glu Met Lys Val Gly Leu Ala Val Thr Arg Ser Glu Glu Gly
405 410 415
Asp Gly Leu Val Ser Ser Ala Glu Leu Glu Gln Arg Val Ser Glu Leu
420 425 430
Met Asp Ser Glu Lys Gly Arg Ala Val Lys Glu Arg Ala Val Ala Met
435 440 445
Lys Glu Ala Ala Ala Ala Ala Met Arg Asp Gly Gly Ser Ser Arg Val
450 455 460
Ala Leu Asp Asn Leu Val Glu Ser Phe Lys Arg Gly Cys Ile Ala Pro
465 470 475 480
Phe Gly
<210> 114
<211> 1449
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO: 113
<400> 114
atgtccaagg atactattgt tttctacact tctccaggta gaggtcactt gaactccatg 60
gttgaattgg gtaagttgat cttgacttac cacccatgtt tctccattga catcatcatc 120
ccaaccgccc cattcgtttc ttctgccggt accgatgatt acatcgcctc cgtttccgcc 180
actgctccat ccgttacctt ccaccaattg ccaccaccag ttagtggttt gccagacact 240
ctcagatctc cagctgactt cccagccttg gtttacgaat tgggtgaatt gaacaaccca 300
aacttgcacg aaaccttgat cactatttcc aagagatcta acttgaaggc cttcgttatc 360
gatttcttgt gtaacccagc tttccaagtt tcctcttcta ctttgtctat cccaacttac 420
tactacttca ccaccgctgg ttctgttttg gctgctaact tgtacttgcc aactttgcac 480
aagaacacca ctaagtcttt cagagaattg ggttctgctt tgttgaactt cccaggtttc 540
ccaccattcc cagctagaga catggctttg ccaatgcacg atagagaagg taaggtttac 600
aagggtttgg tcgacaccgg tatccaaatg gctaagtctg ctggtgtaat tgttaacaca 660
ttcgaattgt tggaggaaag agctatcaag gctatgttgg aaggtcaatg tactccaggt 720
gatacttctc caccattgta ctgtatcggt ccagttgttg gtagaggtaa cggtgaaaac 780
agaggtagag atagacacga atgtttgtct tggttggact ctaagccatc tagatctgtc 840
ttgttcttgt gtttcggttc tttgggttct ttctcttgta agcaattgaa ggaaatggcc 900
attggtttgg aaagatctgg tgttaagttc ttgtgggtcg ttagagctcc agctccagac 960
tctgtcgaaa acagatcttc tttggaatct ttgttgccag aaggtttctt ggatagaact 1020
aaggatagag gtttggttgt tgaatcttgg gctccacaag ttgaagtttt gaaccacgaa 1080
tctgttggcg gcttcgttac tcactgcggt tggaactctg ttttggaagg tgtttgtgcc 1140
ggtgttccaa tgttggcttg gccattgtac gccgaacaaa agatgattag agctgtcgtt 1200
gttgaagaaa tgaaggttgg tttggctgtt actagatctg aagaaggtga cggtttggtt 1260
tcttctgccg aattggaaca aagagtttct gaattgatgg actctgaaaa gggtagagct 1320
gttaaggaaa gagctgttgc tatgaaggaa gctgctgctg ctgctatgag agatggtggt 1380
tcttctagag ttgcgctcga caacttggtt gaaagcttta agagaggttg catcgctcca 1440
ttcggttaa 1449
<210> 115
<211> 477
<212> PRT
<213> Citrus clementina
<400> 115
Met Ser Glu Lys Gln Asp His Val His Val Ala Ile Leu Pro Leu Pro
1 5 10 15
Ala Val Gly His Val Asn Ser Met Leu Asn Leu Ala Glu Leu Leu Gly
20 25 30
His Ala Gly Ile Lys Ile Thr Phe Leu Asn Thr Glu His Tyr Tyr Asp
35 40 45
Arg Val Ile Arg His Ser Ser Asp Ala Phe Ser Arg Tyr Met Gln Ile
50 55 60
Pro Gly Phe Gln Phe Lys Thr Leu Thr Asp Gly Leu Pro Arg Asp His
65 70 75 80
Pro Arg Thr Pro Asp Lys Phe Pro Glu Leu Val Asp Ser Leu Asn Cys
85 90 95
Ala Thr Pro Pro Leu Leu Lys Glu Met Val Ser Asp Ser Lys Ser Pro
100 105 110
Val Asn Cys Ile Ile Thr Asp Gly Tyr Met Ser Arg Ala Ile Asp Ala
115 120 125
Ala Arg Glu Val Gly Val Ser Ile Ile Tyr Phe Arg Thr Ile Ser Ala
130 135 140
Cys Ala Phe Trp Ser Phe His Cys Ile Pro Asp Ile Ile Asp Ala Gly
145 150 155 160
Glu Leu Pro Ile Lys Gly Thr Glu Asp Met Asp Arg Leu Ile Thr Thr
165 170 175
Val Pro Gly Met Glu Gly Phe Leu Arg Cys Arg Asp Leu Pro Ser Phe
180 185 190
Cys Arg Val Asn Asp Pro Met Asp Pro His Leu Leu Leu Phe Ala Arg
195 200 205
Glu Thr Arg Leu Ser Ala His Ala Asp Gly Leu Ile Leu Asn Thr Phe
210 215 220
Glu Asp Leu Glu Gly Pro Ile Leu Ser Gln Ile Arg Asn His Ser Cys
225 230 235 240
Pro Asn Ile Tyr Ser Ile Gly Pro Leu Asn Ala His Leu Lys Val Arg
245 250 255
Ile Pro Glu Lys Thr Tyr Ser Ser Ser Ser Leu Trp Lys Ile Asp Arg
260 265 270
Ser Cys Met Ala Trp Leu Asp Lys Gln Pro Lys Gln Ser Val Ile Tyr
275 280 285
Val Ser Phe Gly Ser Ile Ala Val Met Ser Arg Asp Gln Leu Ile Glu
290 295 300
Phe Tyr Tyr Gly Leu Val His Ser Lys Lys Asn Phe Leu Trp Val Ile
305 310 315 320
Arg Pro Asp Leu Ile Ser Gly Lys Asp Gly Glu Asn Gln Ile Pro Glu
325 330 335
Glu Leu Leu Glu Ala Thr Lys Glu Arg Gly Cys Ile Ala Gly Trp Val
340 345 350
Pro Gln Glu Glu Val Leu Ala His Ser Ala Val Gly Gly Phe Leu Thr
355 360 365
His Cys Gly Trp Asn Ser Thr Leu Glu Ser Ile Val Ala Gly Met Pro
370 375 380
Met Ile Cys Trp Pro Ser Phe Ala Asp Gln Gln Ile Asn Ser Arg Phe
385 390 395 400
Val Gly Glu Val Trp Lys Leu Gly Leu Asp Ile Lys Asp Leu Cys Asp
405 410 415
Arg Asn Ile Val Glu Lys Thr Val Asn Asp Leu Met Val Glu Arg Lys
420 425 430
Glu Glu Phe Met Glu Ser Ala Asp Arg Met Ala Asn Leu Ala Lys Lys
435 440 445
Ser Val Asn Lys Gly Gly Ser Ser Tyr Cys Asn Leu Asp Arg Leu Val
450 455 460
Asn Asp Ile Lys Met Met Ser Ser Gln Pro Gln Asn Cys
465 470 475
<210> 116
<211> 1434
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO: 115
<400> 116
atgtccgaaa agcaagatca cgttcacgtt gctatcttgc cattgccagc cgttggtcac 60
gtcaactcca tgttgaactt ggctgaattg ttgggtcacg ccggtatcaa gattactttc 120
ttgaacaccg aacactacta cgatagagtc atcagacact cttctgatgc cttctctaga 180
tacatgcaaa ttccaggttt ccaattcaag accttgactg atggtttgcc aagagatcac 240
ccaagaactc cagataagtt cccagaattg gttgattctt tgaactgtgc cactccacca 300
ttgttgaagg aaatggtatc tgattctaag tctccagtta actgtattat cactgatggt 360
tacatgtcta gagctattga cgctgccaga gaagttggtg tttccattat ttacttcaga 420
actatttctg cttgtgcttt ctggtctttc cactgtatcc cagatatcat tgatgctggt 480
gaattgccaa tcaagggtac tgaagatatg gatagattga tcaccactgt tccaggtatg 540
gaaggtttct tgagatgtag agatttgcca tctttctgta gagttaacga cccaatggat 600
ccacacttgt tgttgttcgc tagagaaacc agattgagtg ctcatgctga cggcttgatc 660
ttgaacactt tcgaagattt ggaaggtcca atcttgtccc aaatcagaaa ccactcttgt 720
ccaaacatct actctattgg tccattgaac gctcacttga aggttagaat cccagaaaag 780
acttactcct cttcttcttt gtggaagatt gacagatctt gtatggcttg gttggacaag 840
caaccaaagc aatctgttat ctacgtatct ttcggttcta ttgctgttat gtctagagat 900
caattgatcg aattctacta cggtttggtt cactctaaga agaacttctt gtgggtcatc 960
agaccagact tgatttctgg taaggatggt gaaaaccaaa ttccagaaga attgttggaa 1020
gctaccaagg aaagaggttg tattgctggt tgggttccac aagaagaagt tttggcccac 1080
tctgctgttg gtggtttctt gacccactgt ggttggaact ctaccttgga atctatcgtt 1140
gctggtatgc caatgatttg ctggccaagc ttcgctgatc aacagatcaa ctctagattc 1200
gttggtgaag tttggaagtt gggtttggat atcaaggatt tgtgtgatag aaacattgtt 1260
gaaaagactg ttaacgattt gatggttgaa agaaaggaag aattcatgga atctgctgat 1320
agaatggcta acttggctaa gaagtctgtt aacaagggtg gttcctctta ctgtaacttg 1380
gacagattgg ttaacgatat caagatgatg tcctctcaac cacaaaactg ttaa 1434
<210> 117
<211> 354
<212> PRT
<213> Citrus clementina
<400> 117
Met Ser Gly Ser Ile Val Asp Gly Glu Arg Asp Gln Ser Phe Ala Tyr
1 5 10 15
Ala Asn Gln Leu Ala Met Gly Thr Val Leu Pro Met Ala Met Gln Ala
20 25 30
Val Tyr Glu Leu Gly Ile Phe Gln Ile Ile Asp Lys Ala Gly Pro Gly
35 40 45
Ala Lys Leu Ser Ala Ser Asp Ile Ala Ala Gln Leu Pro Thr Lys Asn
50 55 60
Lys Asp Ala Pro Thr Met Leu Asp Arg Ile Leu Arg Leu Leu Ala Ser
65 70 75 80
Tyr Ser Val Val Glu Cys Ser Leu Asp Gly Ser Gly Ala Arg Arg Arg
85 90 95
Tyr Ser Leu Asn Ser Val Ser Lys Tyr Tyr Val Pro Asn Lys Asp Gly
100 105 110
Val Ser Leu Gly Pro Ala Leu Gln Met Ile Gln Asp Lys Val Phe Leu
115 120 125
Glu Ser Trp Ser His Leu Lys Asp Ala Ile Leu Glu Gly Gly Ile Pro
130 135 140
Phe Asn Arg Ala His Gly Met His Ala Phe Glu Tyr Gly Arg Val Asp
145 150 155 160
Pro Arg Phe Asn Lys His Phe Asn Thr Ala Met Tyr Asn His Thr Ser
165 170 175
Leu Ile Met Ser Asn Ile Leu Glu Ser Tyr Lys Gly Phe Ala Asn Ile
180 185 190
Lys Gln Leu Val Asp Val Gly Gly Asn Leu Gly Val Thr Leu Gln Ala
195 200 205
Ile Thr Ser Lys Tyr Pro Tyr Ile Lys Gly Ile Asn Phe Asp Gln Pro
210 215 220
His Val Ile Glu His Ala Pro Leu His Pro His Ile Glu His Val Ala
225 230 235 240
Gly Asp Met Phe Gln Ser Val Pro Lys Gly Asp Ala Ile Phe Leu Lys
245 250 255
Trp Ile Leu His Asp Trp Asp Asp Glu His Cys Leu Lys Leu Leu Lys
260 265 270
Asn Cys Tyr Lys Ser Val Pro Glu Asp Gly Lys Val Ile Val Val Glu
275 280 285
Leu Met Leu Pro Glu Val Pro Asn Thr Ser Ile Glu Ser Lys Ser Asn
290 295 300
Ser His Ile Asp Val Leu Met Met Thr Gln Asn Pro Gly Gly Lys Glu
305 310 315 320
Arg Thr Lys His Glu Phe Met Thr Leu Ala Thr Gly Ala Gly Phe Ser
325 330 335
Gly Ile Arg Phe Asp Leu Val Thr Gly Asn Phe Trp Val Met Glu Phe
340 345 350
Tyr Lys
<210> 118
<211> 1065
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:117
<400> 118
atgtccggtt ctatcgttga tggtgaaaga gatcaatctt tcgcttacgc taaccaattg 60
gctatgggta ctgttttgcc aatggccatg caagctgttt acgaattggg tattttccaa 120
atcatcgaca aggctggtcc aggtgctaag ttgtctgctt ctgatattgc tgcccaattg 180
ccaaccaaga acaaggacgc tccaactatg ctcgacagaa tactaagatt gttggcttct 240
tactctgttg ttgaatgttc tttggatggt tctggtgcca gaagaagata ctctttgaac 300
tctgtctcca agtactacgt tccaaacaag gatggtgtct ctttgggtcc agctttgcaa 360
atgattcaag acaaggtttt cttggaatct tggtcccact tgaaggatgc tattttggaa 420
ggtggtattc cattcaacag agcccacggt atgcacgctt tcgaatacgg tagagttgac 480
ccaagattca acaagcactt caacactgct atgtacaacc acacctcttt gattatgtct 540
aacattttgg aatcttacaa gggtttcgcc aacatcaagc aattggtcga tgttggtggt 600
aacttgggcg taactctcca agccatcact tccaagtacc catacattaa gggtatcaac 660
ttcgaccaac cacacgttat tgaacacgcc ccattgcacc cacacattga acacgttgct 720
ggtgatatgt tccaatctgt tccaaagggt gacgccattt tcttgaagtg gatcttgcac 780
gattgggacg atgaacactg tttgaagttg ttgaagaact gttacaagtc tgttccagaa 840
gatggtaagg ttatcgttgt tgaattgatg ttgccagaag ttccaaacac ttctattgaa 900
tctaagtcta actcccacat tgacgttttg atgatgactc aaaacccagg tggtaaggaa 960
agaactaagc acgaattcat gaccttggct actggtgctg gtttctctgg tatcagattc 1020
gatttggtta ctggtaactt ctgggttatg gaattctaca agtaa 1065
<210> 119
<211> 250
<212> PRT
<213> Citrus sinensis
<400> 119
Met Ser Ala Ala Asn Arg Glu Asp Gln Glu Glu Asn Lys Asp Arg Tyr
1 5 10 15
Phe Lys Ala Val His Gly Asn Lys Thr Leu Leu Gln Ser Glu Lys Leu
20 25 30
Tyr Glu Tyr Ile Leu Glu Thr Ser Val Tyr Pro Arg Glu Pro Gln Cys
35 40 45
Leu Lys Glu Ile Arg Glu Leu Thr Tyr Lys His Pro Leu Ser Pro Met
50 55 60
Met Thr Ser Pro Asp Glu Ala Gln Phe Phe Ser Met Leu Leu Lys Leu
65 70 75 80
Ile Asn Ala Lys Asn Thr Met Glu Ile Gly Val Phe Thr Gly Tyr Ser
85 90 95
Leu Leu Ala Thr Ala Leu Ala Ile Pro Asp Asp Gly Lys Ile Leu Ala
100 105 110
Leu Asp Ile Thr Lys Glu His Tyr Glu Lys Gly Leu Pro Ile Ile Gln
115 120 125
Lys Ala Gly Val Ala His Lys Ile Asp Phe Arg Glu Gly Pro Ala Leu
130 135 140
Pro Leu Leu Asp Gln Leu Ile Gln His Glu Lys Tyr His Gly Thr Phe
145 150 155 160
Asp Phe Val Phe Val Asp Ala Asp Lys Asp Asn Tyr Val Asn Tyr His
165 170 175
Lys Arg Leu Ile Glu Leu Val Lys Val Gly Gly Val Ile Gly Tyr Asp
180 185 190
Asn Thr Leu Trp Gly Gly Ser Val Val Ala Pro Pro Asp Ala Asp Leu
195 200 205
Asp Glu His Ile Leu Tyr Leu Arg Asp Phe Val Gln Glu Leu Asn Lys
210 215 220
Ala Leu Ala Val Asp Pro Arg Ile Glu Ile Cys Gln Leu Ser Ile Ala
225 230 235 240
Asp Gly Val Thr Leu Cys Arg Arg Ile Gly
245 250
<210> 120
<211> 753
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:119
<400> 120
atgtccgctg ctaacagaga agatcaagaa gaaaacaagg atagatactt caaggctgtt 60
cacggtaaca agaccttgtt gcaatctgaa aagttgtacg aatacatctt ggaaacctct 120
gtttacccaa gagaaccaca atgtttgaag gaaatcagag aattgactta caagcaccca 180
ttgtctccaa tgatgacttc tccagatgaa gctcaattct tctctatgtt gttgaagttg 240
atcaacgcca agaacaccat ggagataggt gtattcaccg gttactcttt gttggccact 300
gccttggcca ttccagacga tggtaagatt ttggccttgg acatcaccaa ggaacactac 360
gaaaagggtt tgccaatcat tcaaaaggct ggtgttgctc acaagattga cttcagagaa 420
ggtccagctt tgccattatt ggatcaatta atccaacacg aaaagtacca tggcacattc 480
gacttcgtct ttgttgatgc tgacaaggat aactacgtta actaccacaa gagattgatt 540
gaattggtta aggttggtgg tgttattggt tacgacaaca ccttgtgggg tggttctgtt 600
gttgctccac cagatgccga cttggatgaa cacatcttgt acttgagaga tttcgttcaa 660
gaattgaaca aggccttggc cgttgatcca agaatagaaa tttgtcaatt gtccattgct 720
gatggtgtta ctttgtgtag aagaattggt taa 753
<210> 121
<211> 514
<212> PRT
<213> Arabidopsis thaliana
<400> 121
Met Ser Ala Thr Leu Phe Leu Thr Ile Leu Leu Ala Thr Val Leu Phe
1 5 10 15
Leu Ile Leu Arg Ile Phe Ser His Arg Arg Asn Arg Ser His Asn Asn
20 25 30
Arg Leu Pro Pro Gly Pro Asn Pro Trp Pro Ile Ile Gly Asn Leu Pro
35 40 45
His Met Gly Thr Lys Pro His Arg Thr Leu Ser Ala Met Val Thr Thr
50 55 60
Tyr Gly Pro Ile Leu His Leu Arg Leu Gly Phe Val Asp Val Val Val
65 70 75 80
Ala Ala Ser Lys Ser Val Ala Glu Gln Phe Leu Lys Ile His Asp Ala
85 90 95
Asn Phe Ala Ser Arg Pro Pro Asn Ser Gly Ala Lys His Met Ala Tyr
100 105 110
Asn Tyr Gln Asp Leu Val Phe Ala Pro Tyr Gly His Arg Trp Arg Leu
115 120 125
Leu Arg Lys Ile Ser Ser Val His Leu Phe Ser Ala Lys Ala Leu Glu
130 135 140
Asp Phe Lys His Val Arg Gln Glu Glu Val Gly Thr Leu Thr Arg Glu
145 150 155 160
Leu Val Arg Val Gly Thr Lys Pro Val Asn Leu Gly Gln Leu Val Asn
165 170 175
Met Cys Val Val Asn Ala Leu Gly Arg Glu Met Ile Gly Arg Arg Leu
180 185 190
Phe Gly Ala Asp Ala Asp His Lys Ala Asp Glu Phe Arg Ser Met Val
195 200 205
Thr Glu Met Met Ala Leu Ala Gly Val Phe Asn Ile Gly Asp Phe Val
210 215 220
Pro Ser Leu Asp Trp Leu Asp Leu Gln Gly Val Ala Gly Lys Met Lys
225 230 235 240
Arg Leu His Lys Arg Phe Asp Ala Phe Leu Ser Ser Ile Leu Lys Glu
245 250 255
His Glu Met Asn Gly Gln Asp Gln Lys His Thr Asp Met Leu Ser Thr
260 265 270
Leu Ile Ser Leu Lys Gly Thr Asp Leu Asp Gly Asp Gly Gly Ser Leu
275 280 285
Thr Asp Thr Glu Ile Lys Ala Leu Leu Leu Asn Met Phe Thr Ala Gly
290 295 300
Thr Asp Thr Ser Ala Ser Thr Val Asp Trp Ala Ile Ala Glu Leu Ile
305 310 315 320
Arg His Pro Asp Ile Met Val Lys Ala Gln Glu Glu Leu Asp Ile Val
325 330 335
Val Gly Arg Asp Arg Pro Val Asn Glu Ser Asp Ile Ala Gln Leu Pro
340 345 350
Tyr Leu Gln Ala Val Ile Lys Glu Asn Phe Arg Leu His Pro Pro Thr
355 360 365
Pro Leu Ser Leu Pro His Ile Ala Ser Glu Ser Cys Glu Ile Asn Gly
370 375 380
Tyr His Ile Pro Lys Gly Ser Thr Leu Leu Thr Asn Ile Trp Ala Ile
385 390 395 400
Ala Arg Asp Pro Asp Gln Trp Ser Asp Pro Leu Ala Phe Lys Pro Glu
405 410 415
Arg Phe Leu Pro Gly Gly Glu Lys Ser Gly Val Asp Val Lys Gly Ser
420 425 430
Asp Phe Glu Leu Ile Pro Phe Gly Ala Gly Arg Arg Ile Cys Ala Gly
435 440 445
Leu Ser Leu Gly Leu Arg Thr Ile Gln Phe Leu Thr Ala Thr Leu Val
450 455 460
Gln Gly Phe Asp Trp Glu Leu Ala Gly Gly Val Thr Pro Glu Lys Leu
465 470 475 480
Asn Met Glu Glu Ser Tyr Gly Leu Thr Leu Gln Arg Ala Val Pro Leu
485 490 495
Val Val His Pro Lys Pro Arg Leu Ala Pro Asn Val Tyr Gly Leu Gly
500 505 510
Ser Gly
<210> 122
<211> 1545
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:121
<400> 122
atgtccgcta ctttgttctt gactatcttg ttggctactg ttttgttctt gatcttgaga 60
atcttctctc acagaagaaa cagatctcac aacaacagat tgccaccagg tccaaaccca 120
tggccaatca tcggtaactt gccacacatg ggtactaagc cacacagaac tttgtctgct 180
atggttacta cttacggtcc aatcttgcac ttgagattgg gtttcgttga cgttgttgtt 240
gctgcttcta agtctgttgc tgaacaattc ttgaagatcc acgacgctaa cttcgcttct 300
agaccaccaa actctggtgc taagcacatg gcttacaact accaagactt ggttttcgct 360
ccatacggtc acagatggag attgttgaga aagatctctt ctgttcactt gttctctgct 420
aaggctttgg aagatttcaa gcacgttaga caagaagaag ttggtacttt gactagagaa 480
ttggttagag ttggtactaa gccagttaac ttgggtcaat tggttaacat gtgtgttgtt 540
aacgctttgg gtagagaaat gatcggtaga agattgttcg gtgctgacgc tgaccacaag 600
gctgacgaat tcagatctat ggttactgaa atgatggctt tggctggtgt tttcaacatc 660
ggtgacttcg ttccatcttt ggactggttg gacttgcaag gtgttgctgg taagatgaag 720
agattgcaca agagattcga cgctttcttg tcatctatct tgaaggaaca cgaaatgaac 780
ggtcaagacc aaaagcacac tgacatgttg tctactttga tctctttgaa gggtactgac 840
ttggacggtg acggtggttc tttgactgac actgaaatca aggctttgtt gttgaacatg 900
ttcactgctg gtactgacac ttctgcttct actgttgact gggctatcgc tgaattgatc 960
agacacccag acatcatggt taaggctcaa gaagaattgg acatcgttgt tggtagagac 1020
agaccagtta acgaatctga catcgctcaa ttgccatact tgcaagctgt tatcaaggaa 1080
aacttcagat tgcacccacc aactccattg tctttgccac acatcgcttc tgaatcttgt 1140
gaaatcaacg gttaccacat cccaaagggt tctactttgt tgactaacat ctgggctatc 1200
gctagggacc cagaccaatg gtctgaccca ttggctttca agccagaaag attcttgcca 1260
ggtggtgaaa agtctggtgt tgacgttaag ggttctgact tcgaattgat cccattcggt 1320
gctggtagaa gaatctgtgc tggtttgtct ttgggtttga gaactatcca attcttgact 1380
gctactttgg ttcaaggttt cgactgggaa ttggctggtg gtgttactcc agaaaagttg 1440
aacatggaag aatcttacgg tttgactttg caaagagctg ttccattggt tgttcaccca 1500
aagccaagat tggctccaaa cgtttacggt ttgggttctg gttaa 1545
<210> 123
<211> 571
<212> PRT
<213> Arabidopsis thaliana
<400> 123
Met Ser Val Leu Gln Gln Gln Thr His Phe Leu Thr Lys Lys Ile Asp
1 5 10 15
Gln Glu Asp Glu Glu Glu Glu Pro Ser His Asp Phe Ile Phe Arg Ser
20 25 30
Lys Leu Pro Asp Ile Phe Ile Pro Asn His Leu Pro Leu Thr Asp Tyr
35 40 45
Val Phe Gln Arg Phe Ser Gly Asp Gly Asp Gly Asp Ser Ser Thr Thr
50 55 60
Cys Ile Ile Asp Gly Ala Thr Gly Arg Ile Leu Thr Tyr Ala Asp Val
65 70 75 80
Gln Ile Asn Met Arg Arg Ile Ala Thr Gly Ile His Arg Leu Gly Ile
85 90 95
Arg His Gly Asp Val Val Met Leu Leu Leu Pro Asn Ser Pro Glu Phe
100 105 110
Ala Leu Ser Phe Leu Ala Val Ala Tyr Leu Gly Ala Val Ser Thr Thr
115 120 125
Ala Asn Pro Phe Tyr Thr Gln Pro Glu Ile Ala Lys Gln Ala Lys Ala
130 135 140
Ser Ala Ala Lys Met Ile Ile Thr Lys Lys Cys Leu Val Asp Lys Leu
145 150 155 160
Thr Asn Leu Lys Asn Asp Gly Val Leu Ile Val Cys Leu Asp Asp Asp
165 170 175
Gly Asp Asn Gly Val Val Ser Ser Ser Asp Asp Gly Cys Val Ser Phe
180 185 190
Thr Glu Leu Thr Gln Ala Asp Glu Thr Glu Leu Leu Lys Pro Lys Ile
195 200 205
Ser Pro Glu Asp Thr Val Ala Met Pro Tyr Ser Ser Gly Thr Thr Gly
210 215 220
Leu Pro Lys Gly Val Met Ile Thr His Lys Gly Leu Val Thr Ser Ile
225 230 235 240
Ala Gln Lys Val Asp Gly Glu Asn Pro Asn Leu Asn Phe Thr Ala Asn
245 250 255
Asp Val Ile Leu Cys Phe Leu Pro Met Phe His Ile Tyr Ala Leu Asp
260 265 270
Ala Leu Met Leu Ser Ala Met Arg Thr Gly Ala Ala Leu Leu Ile Val
275 280 285
Pro Arg Phe Glu Leu Asn Leu Val Met Glu Leu Ile Gln Arg Tyr Lys
290 295 300
Val Thr Val Val Pro Val Ala Pro Pro Val Val Leu Ala Phe Ile Lys
305 310 315 320
Ser Pro Glu Thr Glu Arg Tyr Asp Leu Ser Ser Val Arg Ile Met Leu
325 330 335
Ser Gly Ala Ala Thr Leu Lys Lys Glu Leu Glu Asp Ala Val Arg Leu
340 345 350
Lys Phe Pro Asn Ala Ile Phe Gly Gln Gly Tyr Gly Met Thr Glu Ser
355 360 365
Gly Thr Val Ala Lys Ser Leu Ala Phe Ala Lys Asn Pro Phe Lys Thr
370 375 380
Lys Ser Gly Ala Cys Gly Thr Val Ile Arg Asn Ala Glu Met Lys Val
385 390 395 400
Val Asp Thr Glu Thr Gly Ile Ser Leu Pro Arg Asn Lys Ser Gly Glu
405 410 415
Ile Cys Val Arg Gly His Gln Leu Met Lys Gly Tyr Leu Asn Asp Pro
420 425 430
Glu Ala Thr Ala Arg Thr Ile Asp Lys Asp Gly Trp Leu His Thr Gly
435 440 445
Asp Ile Gly Phe Val Asp Asp Asp Asp Glu Ile Phe Ile Val Asp Arg
450 455 460
Leu Lys Glu Leu Ile Lys Phe Lys Gly Tyr Gln Val Ala Pro Ala Glu
465 470 475 480
Leu Glu Ala Leu Leu Ile Ser His Pro Ser Ile Asp Asp Ala Ala Val
485 490 495
Val Ala Met Lys Asp Glu Val Ala Asp Glu Val Pro Val Ala Phe Val
500 505 510
Ala Arg Ser Gln Gly Ser Gln Leu Thr Glu Asp Asp Val Lys Ser Tyr
515 520 525
Val Asn Lys Gln Val Val His Tyr Lys Arg Ile Lys Met Val Phe Phe
530 535 540
Ile Glu Val Ile Pro Lys Ala Val Ser Gly Lys Ile Leu Arg Lys Asp
545 550 555 560
Leu Arg Ala Lys Leu Glu Thr Met Cys Ser Lys
565 570
<210> 124
<211> 1716
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:123
<400> 124
atgtccgttt tgcaacaaca aactcacttc ttgactaaga agatcgatca agaagatgaa 60
gaagaagaac catctcacga tttcattttc agatctaagt tgccagatat cttcatccca 120
aaccacttgc cattgaccga ttacgtattc caaagattct ccggtgatgg tgacggtgat 180
tcctctacta cctgtatcat cgacggtgcc actggccgta tcctcaccta cgccgatgtt 240
caaatcaaca tgagaagaat cgctaccggt atccacagat tgggtatcag acacggtgac 300
gtcgttatgt tgttgttgcc aaactctcca gaattcgctt tgtctttctt ggccgttgct 360
tacttgggtg ccgtttccac taccgctaac ccattctaca ctcaaccaga aatcgctaag 420
caagctaagg cctccgccgc taagatgatc atcactaaga aatgcctggt cgataagttg 480
actaacttga agaacgacgg tgttttgatc gtttgtttgg acgatgacgg tgacaatggc 540
gttgtgagct cttctgatga tggttgtgtt tctttcactg aattgactca agctgacgaa 600
actgaattgt tgaagccaaa gatctctcca gaagatactg ttgctatgcc atactcttcc 660
ggcactactg gtttaccaaa gggtgttatg attactcaca agggtttggt tacttctatc 720
gctcaaaagg tcgacggtga aaacccaaac ttgaacttca ctgccaacga cgtcatcttg 780
tgtttcttgc caatgttcca catttacgct ttggacgctt tgatgttgtc tgctatgaga 840
accggtgctg ctttgttgat cgttccaaga ttcgaattga acttggttat ggaattgatt 900
caaagataca aggtcactgt tgttccagtt gctccaccag ttgttttggc tttcattaag 960
tccccagaaa ctgaaagata cgacttatct tctgttagaa ttatgttgtc tggtgctgct 1020
actttgaaga aggaattgga agatgccgtt agattgaagt tcccaaacgc cattttcggt 1080
caaggttacg gtatgaccga atccggtact gttgctaagt cgctcgcgtt cgctaagaac 1140
ccattcaaga ccaagtccgg tgcttgtggt actgttatca gaaacgccga aatgaaggtt 1200
gtcgataccg aaaccggtat ctccttgcca agaaacaagt ctggtgaaat ctgtgtcaga 1260
ggtcaccaat tgatgaaggg ttacttgaac gatccagaag ctactgctag aaccatcgac 1320
aaggacggtt ggttgcacac tggtgatatt ggtttcgttg atgatgatga tgaaatcttc 1380
attgttgata gattgaagga attgatcaag ttcaagggtt accaagttgc tccagctgaa 1440
ttggaagctt tgttgatttc tcacccatct atcgatgatg ccgctgttgt tgctatgaag 1500
gatgaagttg ctgatgaagt tccagttgct ttcgttgcta gatctcaagg ttctcaattg 1560
actgaagatg atgtcaagtc ttacgttaac aagcaagttg ttcactacaa gagaattaag 1620
atggttttct tcatcgaagt tatcccaaag gctgtttctg gtaagatttt gagaaaggat 1680
ttgagagcta agttggaaac catgtgttct aagtaa 1716
<210> 125
<211> 561
<212> PRT
<213> Citrus clementina
<400> 125
Met Ser Ile Ser Ile Ala Thr Lys Lys Pro Glu Leu Ser Leu Asp Ile
1 5 10 15
Ser Ser Pro Ala Pro Pro Ala Pro Ser Asn Glu Lys Ile Ala Thr His
20 25 30
Ile Phe Lys Ser Lys Leu Pro Asp Ile Pro Ile Ser Asn His Leu Pro
35 40 45
Leu His Thr Tyr Cys Phe Gln Asp Arg Leu Ser Asp Asp Pro Cys Leu
50 55 60
Ile Val Gly Leu Thr Gly Lys Thr Tyr Ser Tyr Ala Glu Thr His Leu
65 70 75 80
Ile Cys Arg Lys Thr Ala Ala Gly Leu Ser Asn Leu Gly Ile Lys Lys
85 90 95
Gly Asp Val Ile Met Ile Leu Leu Gln Asn Cys Ala Glu Phe Val Phe
100 105 110
Ser Phe Met Gly Ala Ser Met Ile Gly Ala Val Thr Thr Thr Ala Asn
115 120 125
Pro Phe Tyr Thr Ser Ala Glu Ile Leu Lys Gln Phe Arg Thr Ser Gly
130 135 140
Ala Lys Leu Ile Ile Thr Met Ser Gln Tyr Val Asp Arg Leu Pro Lys
145 150 155 160
Thr Asp Lys Asp Phe Thr Val Ile Thr Ile Asp Ala Pro Pro Glu Asn
165 170 175
Cys Leu His Phe Thr Val Leu Ser Glu Ala Asp Glu Asp Gln Ile Pro
180 185 190
Glu Val Ala Ile Glu Pro Asp Asp Pro Val Ala Leu Pro Phe Ser Ser
195 200 205
Gly Thr Thr Gly Leu Pro Lys Gly Val Val Leu Thr His Lys Ser Leu
210 215 220
Ile Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn Pro Asn Leu Tyr
225 230 235 240
Leu Thr Asn Gly Asp Val Val Leu Cys Val Leu Pro Leu Phe His Ile
245 250 255
Tyr Ser Leu Asn Ser Val Leu Leu Cys Ser Leu Arg Ala Gly Ala Gly
260 265 270
Val Leu Leu Met Gln Lys Phe Glu Ile Gly Ala Leu Leu Glu Leu Ile
275 280 285
Gln Arg His Arg Val Ser Val Ala Ala Val Val Pro Pro Leu Val Leu
290 295 300
Ala Leu Ala Lys Asn Pro Met Val Ala Asp Tyr Asp Leu Ser Ser Ile
305 310 315 320
Arg Val Val Leu Ser Gly Ala Ala Pro Leu Gly Lys Glu Leu Glu Asp
325 330 335
Ala Leu Arg Ser Arg Val Pro Gln Ala Ile Leu Gly Gln Gly Tyr Gly
340 345 350
Met Thr Glu Ala Gly Pro Val Leu Ser Met Cys Leu Gly Phe Ala Lys
355 360 365
Gln Pro Phe Pro Thr Lys Ser Gly Ser Cys Gly Thr Val Val Arg Asn
370 375 380
Ala Glu Leu Lys Val Ile Asp Pro Glu Ile Gly Ala Ser Leu Pro His
385 390 395 400
Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly Pro Gln Ile Met Lys Gly
405 410 415
Tyr Leu Asn Asp Pro Glu Ala Thr Ala Ala Thr Ile Asp Val Glu Gly
420 425 430
Trp Leu His Thr Gly Asp Ile Gly Tyr Val Asp Asp Asp Asp Glu Val
435 440 445
Phe Ile Val Asp Arg Val Lys Glu Ile Ile Lys Phe Lys Gly Phe Gln
450 455 460
Val Pro Pro Ala Glu Ile Glu Ala Leu Leu Leu Ser His Pro Ser Ile
465 470 475 480
Gly Asp Ala Ala Val Val Pro Gln Lys Asp Glu Val Ala Gly Glu Val
485 490 495
Pro Val Ala Phe Val Val Arg Ser Asn Gly Phe Glu Leu Thr Glu Glu
500 505 510
Ala Ile Lys Glu Tyr Ile Ala Lys Gln Val Val Phe Tyr Lys Arg Leu
515 520 525
His Lys Ile Tyr Phe Val His Ala Ile Pro Lys Ser Pro Ser Gly Lys
530 535 540
Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Ser Ser Met Pro Leu
545 550 555 560
Asn
<210> 126
<211> 1686
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:125
<400> 126
atgtccatct ctatcgccac taagaagcca gaattgtctt tggatatctc ttctccagct 60
ccaccagctc catccaacga aaagatcgcc acccacattt tcaagtctaa gttgccagat 120
atcccaatct ccaaccactt gccattgcac acttactgtt tccaagatag attgtctgac 180
gacccatgtt tgatcgttgg tttgactggt aagacttact cttacgccga aactcacttg 240
atctgtagaa agaccgctgc cggtttgtct aacttgggta tcaagaaggg tgacgttatc 300
atgatcttgt tgcaaaactg tgccgaattc gttttctctt tcatgggtgc ttccatgatc 360
ggtgctgtca ctactactgc caacccattc tacacttctg ctgaaatctt gaagcaattc 420
agaacctctg gtgccaagtt gattatcact atgtctcaat acgtcgacag attgccaaag 480
actgacaagg atttcactgt tatcactatc gatgccccac cagaaaactg tttgcacttc 540
actgttttgt ctgaagctga tgaagatcaa atcccagaag ttgccatcga accagacgat 600
ccagttgctt tgccattctc ttctggtacc actggtttgc caaagggtgt tgttttgact 660
cataagagct tgatcacctc tgttgctcaa caagttgacg gtgaaaaccc aaacttgtac 720
ttgactaacg gtgacgttgt tttgtgtgtt ttgccattgt tccacattta ctctttgaac 780
tctgttttgt tgtgttcttt gagagctggt gctggtgttt tgttgatgca aaagttcgaa 840
atcggtgctt tgttggaatt gatccaaaga cacagagttt ctgttgctgc tgttgttcca 900
ccattggttt tggctttggc caagaaccca atggttgctg attacgactt gtcatctatc 960
agagttgttt tgtccggtgc tgctccattg ggtaaggaat tggaagatgc tttgagatct 1020
agagtcccac aagctatctt gggtcaaggt tacggtatga ctgaagctgg tccagttttg 1080
tctatgtgtt tgggtttcgc taagcaacca ttcccaacta agtctggttc ttgtggtacc 1140
gttgttagaa acgctgaatt gaaggttatt gacccagaaa ttggtgcctc cttgccacac 1200
aaccaaccag gtgaaatttg tatcagaggt ccacaaatta tgaagggtta cttgaacgat 1260
ccagaagcta ctgctgctac tatcgacgtt gaaggttggt tgcacactgg tgacatcggt 1320
tacgttgatg atgatgatga agttttcatc gtcgatagag tcaaggaaat catcaagttc 1380
aagggtttcc aagttccacc agctgaaatt gaagccttgt tgttgtctca cccatctatt 1440
ggtgatgctg ctgttgttcc acaaaaggat gaagttgcgg gtgaagttcc agttgcgttc 1500
gttgttcgtt cgaacggctt cgaattgacc gaggaagcca ttaaggaata catcgctaag 1560
caagttgttt tctacaagag attgcacaag atttacttcg ttcacgctat tccaaagtct 1620
ccatccggta agattttgag aaaggatttg agagccaagt tggcctcttc tatgccattg 1680
aactaa 1686
<210> 127
<211> 365
<212> PRT
<213> Angelica archangelica
<400> 127
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu
1 5 10 15
Asn Leu Ala Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Met Asp
35 40 45
Asp Asp Thr Gly Arg Arg Pro Gln Ile Cys Arg Lys Ile Val Glu Ala
50 55 60
Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp Gly
65 70 75 80
Thr Leu Ile Ser Glu Met Thr Arg Leu Ser Arg Glu Phe Phe Ala Leu
85 90 95
Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg Gly
100 105 110
Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Lys Asp Trp
115 120 125
Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asp Asp Arg Asp Tyr
130 135 140
Ser Arg Trp Pro Asp Lys Pro Gln Gly Trp Arg Ser Thr Thr Glu Val
145 150 155 160
Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val Leu
165 170 175
Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys Val
180 185 190
Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro Glu
195 200 205
Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr Ile
210 215 220
Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg Asp
225 230 235 240
Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe Val
245 250 255
Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe Lys
260 265 270
Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu Ser
275 280 285
Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro Leu
290 295 300
Arg Ile Arg Glu Gly Glu Lys Ala Val Leu Asp Glu Ala Ile Thr Tyr
305 310 315 320
Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala Thr
325 330 335
Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Glu Glu Lys Ala Lys
340 345 350
Leu Glu Thr Glu Ser Lys Ser Ala Asp Gly Ile Ser Ala
355 360 365
<210> 128
<211> 1098
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:127
<400> 128
atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa cttggctttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaatccca 120
atcatctctt tggctggtat ggacgacgac actggtagga ggccacaaat ctgtagaaag 180
atcgttgaag ctttcgaaga ttggggtatc ttccaagttg ttgaccacgg tatcgacggt 240
actttgatct ctgaaatgac tagattgtct agagaattct tcgctttgcc agctgaagaa 300
aagttgagat acgacactac tggtggtaag agaggtggtt tcactatctc tactcacttg 360
caaggtgacg acgttaagga ctggagagaa ttcgttactt acttctctta cccaatcgac 420
gacagagact actctagatg gccagacaag ccacaaggtt ggagatctac tactgaagtt 480
tactctgaaa agttgatggt tttgggtgct aagttgttgg aagttttgtc tgaagctatg 540
ggtttggaaa aggaagcttt gactaaggct tgtgttaaca tggaacaaaa ggttttgatc 600
aactactacc caacttgtcc agaaccagac ttgactttgg gtgttaggag acacactgac 660
ccaggtacta tcactatctt gttgcaagac atggttggtg gtttgcaagc tactagagat 720
ggtggtaaga cttggatcac tgttcaacca gttgaaggtg ctttcgttgt taacttgggt 780
gaccacggtc actacttgtc taacggtaga ttcaagaacg ctgaccacca agctgttgtt 840
aactctactt cttctagatt gtctatcgct actttccaaa acccagctca aaacgctatc 900
gtttacccat tgagaatcag agaaggtgaa aaggctgttt tggacgaagc tatcacttac 960
gctgaaatgt acaagaagaa catgactaag cacatcgaag ttgctacttt gaagaagttg 1020
gctaaggaaa agagattgca agaagaaaag gctaagttgg aaactgaatc taagtctgct 1080
gacggtatct ctgcttaa 1098
<210> 129
<211> 514
<212> PRT
<213> Cynara cardunculus var. scolymus
<400> 129
Met Ser Gln Val His Glu Thr Leu Thr Pro Ala Val Ile Ala Ala Val
1 5 10 15
Val Leu Ser Ser Val Phe Leu Tyr Leu Leu Phe Lys Lys Lys Gln Asn
20 25 30
His Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu
35 40 45
His His Leu Gly Pro Leu Ile His Gln Ser Phe His His Leu Ser Thr
50 55 60
Arg Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Pro Cys Ile
65 70 75 80
Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu Lys Thr Asn Glu
85 90 95
Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile Asp His Ile Thr
100 105 110
Tyr Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe
115 120 125
Ile Lys Lys Met Ser Thr Val Glu Leu Leu Gly Asn Gln Asn Leu Gly
130 135 140
His Phe Leu Pro Ile Arg Thr His Glu Ile Gln Glu Leu Leu Gln Thr
145 150 155 160
Leu Thr Glu Lys Ala Lys Arg Arg Glu Ser Val Asn Leu Thr Glu Glu
165 170 175
Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met Met Met Ser Ile
180 185 190
Arg Cys Ser Gly Thr Asn Ser Glu Ala Asp Glu Ala Lys Asn Leu Val
195 200 205
Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile
210 215 220
Trp Phe Cys Lys Asn Ile Asp Leu Gln Gly Phe Lys Lys Arg Tyr Thr
225 230 235 240
Asp Thr His Lys Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Phe Glu
245 250 255
Arg Glu Glu Lys Arg Arg Lys Glu Gly Lys Arg Glu Asp Gly Lys Gly
260 265 270
Lys Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Ala Lys Ala
275 280 285
Glu Ile Lys Ile Thr Arg Asp His Ile Lys Ala Leu Ile Leu Asp Phe
290 295 300
Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala Leu Glu Trp Met Leu
305 310 315 320
Val Glu Leu Ile Ser Asn Pro Lys Val Leu Glu Ile Ala Arg Glu Glu
325 330 335
Ile Asp Gln Val Val Gly Asn Glu Arg Leu Val Gln Glu Ser Asp Ala
340 345 350
Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Ala Leu Arg Leu
355 360 365
His Pro Pro Ile Pro Met Leu Ile Arg Lys Ser Ile Glu Asp Val Ser
370 375 380
Val Gln Gly Tyr Asp Ile Pro Ala Gly Thr Met Leu Phe Val Asn Ile
385 390 395 400
Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu Phe
405 410 415
Lys Pro His Arg Phe Leu Glu Asp Asp Pro Val Lys Lys Ser Leu Asp
420 425 430
Ile Lys Gly Gln Ser Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg Arg
435 440 445
Gly Cys Pro Gly Ile Asn Leu Ala Met Arg Glu Leu Pro Val Val Ile
450 455 460
Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Val Asn Gly Lys Gln Val
465 470 475 480
Leu Asp Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala Ala Asp
485 490 495
Phe Val Cys Val Pro Ser Val Arg Glu Asn Ser Pro Met Met Phe Thr
500 505 510
Ser Thr
<210> 130
<211> 1545
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:129
<400> 130
atgtcccaag ttcacgaaac tttgactcca gctgttatcg ctgctgttgt tttgtcatct 60
gttttcttgt acttgttgtt caagaagaag caaaaccaca gattgccacc atctccacca 120
tctttgccaa tcatcggtca cttgcaccac ttgggtccat tgatccacca atctttccac 180
cacttgtcta ctagatacgg tccattgatc cacttgagat tgggttctgt tccatgtatc 240
gttgcttcta ctccagactt ggctagagac ttcttgaaaa ctaacgaatt ggctttctct 300
tctagaaagc actctttggc tatcgaccac atcacttacg gtgttgcttt cgctttcgct 360
ccatacggtc catactggaa gttcatcaag aagatgtcta ctgttgaatt gttgggtaac 420
caaaacttgg gtcacttctt gccaatcaga actcacgaaa tccaagaatt gttgcaaact 480
ttgactgaaa aggctaagag aagagaatct gttaacttga ctgaagaatt gttgaagttg 540
actaacaacg ttatctgtca aatgatgatg tctatcagat gttctggtac taactctgaa 600
gctgacgaag ctaagaactt ggttagagaa gttactcaaa tcttcggtga attcaacgtt 660
tctgacttca tctggttctg taagaacatc gacttgcaag gtttcaagaa gagatacact 720
gacactcaca agagatacga cgctttgttg gaaaagatca tcttcgaaag agaagaaaag 780
agaagaaagg aaggtaagag agaagatggt aagggtaagg acttcttgga catgttgttg 840
gacgttttgg aagatgctaa ggctgaaatc aagatcacta gagatcacat caaggctttg 900
atcttggact tcttcactgc tgctactgac actactgcta tcgctttgga atggatgttg 960
gttgaattga tctctaaccc aaaggttttg gaaatcgcta gagaagaaat cgaccaagtt 1020
gttggtaacg aaagattggt tcaagaatct gacgctccaa acttgccata catccaagct 1080
atcatcaagg aagctttgag attgcaccca ccaatcccaa tgttgatcag aaagtctatc 1140
gaagatgttt ctgttcaagg ttacgacatc ccagctggta ctatgttgtt cgttaacatc 1200
tggtctatcg gtagaaaccc aaagtactgg gaatctccat tggaattcaa gccacacaga 1260
ttcttggaag atgacccagt taagaagtct ttggacatca agggtcaatc tttccaattg 1320
ttgccattcg gtactggtag aagaggttgt ccaggtatca acttggctat gagagaattg 1380
ccagttgtta tcgctggttt gatccaatgt ttcgaatgga acgttaacgg taagcaagtt 1440
ttggacatgg acgaaagagc tggtttgact gctccaagag ctgctgactt cgtttgtgtt 1500
ccatctgtta gagaaaactc tccaatgatg ttcacttcta cttaa 1545
<210> 131
<211> 507
<212> PRT
<213> Perilla frutescens var. crispa
<400> 131
Met Ser Ala Leu Tyr Ala Ala Leu Phe Leu Leu Ser Ala Ala Val Val
1 5 10 15
Arg Ser Val Leu Asp Arg Lys Arg Gly Arg Pro Pro Tyr Pro Pro Gly
20 25 30
Pro Phe Pro Leu Pro Ile Ile Gly His Leu His Leu Leu Gly Pro Arg
35 40 45
Leu His Gln Thr Phe His Asp Leu Ser Gln Arg Tyr Gly Pro Leu Met
50 55 60
Gln Leu Arg Leu Gly Ser Ile Arg Cys Val Ile Ala Ala Ser Pro Glu
65 70 75 80
Leu Ala Lys Glu Cys Leu Lys Thr His Glu Leu Val Phe Ser Ser Arg
85 90 95
Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala
100 105 110
Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr
115 120 125
Tyr Glu Leu Leu Gly Ala Arg Asn Leu Ala His Phe Gln Pro Ile Arg
130 135 140
Thr Leu Glu Val Lys Ser Phe Leu Gln Ile Leu Met Arg Lys Gly Glu
145 150 155 160
Ser Gly Glu Ser Phe Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser
165 170 175
Asn Val Ile Ser His Met Met Leu Ser Ile Arg Cys Ser Glu Thr Glu
180 185 190
Ser Glu Ala Glu Ala Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile
195 200 205
Phe Gly Glu Phe Asp Val Ser Asp Ile Ile Trp Leu Cys Lys Asn Phe
210 215 220
Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Gln Arg Arg Tyr
225 230 235 240
Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg Glu Lys Gln Arg Arg
245 250 255
Thr His Gly Gly Gly Gly Gly Gly Gly Glu Ala Lys Asp Phe Leu Asp
260 265 270
Met Phe Leu Asp Ile Met Glu Ser Gly Lys Ala Glu Val Lys Phe Thr
275 280 285
Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr
290 295 300
Asp Thr Thr Ala Ile Val Cys Glu Trp Ala Ile Ala Glu Val Ile Asn
305 310 315 320
Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Ile Ala Asn Ile Val
325 330 335
Gly Phe Asp Arg Ile Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr
340 345 350
Leu Gln Ala Leu Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro
355 360 365
Met Leu Ala Arg Lys Ser Ile Ser Asp Cys Val Ile Asp Gly Tyr Met
370 375 380
Ile Pro Ala Asn Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg
385 390 395 400
Asn Pro Lys Ile Trp Asp Tyr Pro Thr Ala Phe Gln Pro Glu Arg Phe
405 410 415
Leu Glu Lys Glu Lys Ala Ala Ile Asp Val Lys Gly Gln His Phe Glu
420 425 430
Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu
435 440 445
Ala Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met Ile Gln Cys Phe
450 455 460
Asp Trp Lys Leu Pro Asp Gly Ser Gly His Val Asp Met Ala Glu Arg
465 470 475 480
Pro Gly Leu Thr Ala Pro Arg Glu Thr Asp Leu Phe Cys Arg Val Val
485 490 495
Pro Arg Val Asp Pro Leu Val Val Ser Thr Gln
500 505
<210> 132
<211> 1524
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:131
<400> 132
atgtccgctt tgtacgctgc tttgttcttg ttgtctgctg ctgttgttag atctgttttg 60
gacagaaaga gaggtagacc accataccca ccaggtccat tcccattgcc aatcatcggt 120
cacttgcact tgttgggtcc aagattgcac caaactttcc acgacttgtc tcaaagatac 180
ggtccattga tgcaattgag attgggttct atcagatgtg ttatcgctgc ttctccagaa 240
ttggctaagg aatgtttgaa aactcacgaa ttggttttct cttctagaaa gcactctact 300
gctatcgaca tcgttactta cgactcttct ttcgctttct ctccatacgg tccatactgg 360
aagttcatca agaagttgtg tacttacgaa ttgttgggtg ctagaaactt ggctcacttc 420
caaccaatca gaactttgga agttaagtct ttcttgcaaa tcttgatgag aaagggtgaa 480
tctggtgaat ctttcaacgt tactgaagaa ttggttaagt tgacttctaa cgttatctct 540
cacatgatgt tgtctatcag atgttctgaa actgaatctg aagctgaagc tgctagaact 600
gttatcagag aagttactca aatcttcggt gaattcgacg tttctgacat catctggttg 660
tgtaagaact tcgacttcca aggtatcaga aagagatctg aagatatcca aagaagatac 720
gacgctttgt tggaaaagat catcactgac agagaaaagc aaagaagaac tcacggtggt 780
ggtggtggtg gtggtgaagc taaggacttc ttggacatgt tcttggacat catggaatct 840
ggtaaggctg aagttaagtt cactagagaa cacttgaagg ctttgatctt ggacttcttc 900
actgctggta ctgacactac tgctatcgtt tgtgaatggg ctatcgctga agttatcaac 960
aacccaaacg ttttgaagaa ggctcaagaa gaaatcgcta acatcgttgg tttcgacaga 1020
atcttgcaag aatctgacgc tccaaacttg ccatacttgc aagctttgat caaggaaact 1080
ttcagattgc acccaccaat cccaatgttg gctagaaagt ctatctctga ctgtgttatc 1140
gacggttaca tgatcccagc taacactttg ttgttcgtta acttgtggtc tatgggtaga 1200
aacccaaaga tctgggacta cccaactgct ttccaaccag aaagattctt ggaaaaggaa 1260
aaggctgcta tcgacgttaa gggtcaacac ttcgaattgt tgccattcgg tactggtaga 1320
agaggttgtc caggtatgtt gttggctatc caagaagttg ttatcatcat cggtactatg 1380
atccaatgtt tcgactggaa gttgccagac ggttctggtc acgttgacat ggctgaaaga 1440
ccaggtttga ctgctccaag agaaactgac ttgttctgta gagttgttcc aagagttgac 1500
ccattggttg tttctactca ataa 1524
<210> 133
<211> 515
<212> PRT
<213> Dahlia pinnata
<400> 133
Met Ser Asn Thr Leu Leu Val Leu Gln Met Val Ile Pro Ala Ile Ile
1 5 10 15
Ala Phe Val Ile Phe His Leu Leu Phe Phe Lys Ser Lys Pro Asn Arg
20 25 30
Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu His
35 40 45
His Leu Gly Pro Leu Ile His Gln Ser Phe Asn Arg Leu Ser Ala Arg
50 55 60
Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Ser Cys Val Val
65 70 75 80
Ala Asp Ala Pro Asp Leu Ala Gln Glu Leu Leu Gln Lys Asn Asp Leu
85 90 95
Ala Phe Ala Asn Arg Lys His Thr Leu Ala Ile Asp His Val Thr Tyr
100 105 110
Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Arg Phe Ile
115 120 125
Lys Lys Met Ser Thr Val Glu Leu Leu Gly Ile Gln Asn Leu Gly His
130 135 140
Phe Leu Pro Ile Arg Thr Gln Glu Ile His Gly Leu Leu Leu Thr Leu
145 150 155 160
Thr Glu Lys Ser Lys Gln Asn Glu Ser Val Asn Met Thr Asn Glu Leu
165 170 175
Leu Lys Leu Ser Asn Asn Ile Ile Cys Gln Met Met Met Gly Ile Arg
180 185 190
Cys Ser Gly Asn Lys Thr Glu Ala Glu Glu Ala Lys Asn Leu Val Arg
195 200 205
Glu Val Thr Thr Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile Trp
210 215 220
Phe Cys Lys Lys Leu Asp Leu Gln Gly Phe Lys Lys Arg Tyr Glu Asp
225 230 235 240
Ile Arg Thr Arg Tyr Asp Ala Leu Leu Glu Arg Ile Ile Phe Ala Arg
245 250 255
Glu Glu Met Arg Lys Glu Gly Lys Gly Met Glu Asp Gly Lys Gly Lys
260 265 270
Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Asp Lys Ala Glu
275 280 285
Ile Lys Ile Thr Arg Asn His Ile Lys Ala Leu Ile Leu Asp Phe Val
290 295 300
Thr Ala Gly Thr Asp Thr Thr Ala Val Ile Ile Glu Trp Thr Leu Val
305 310 315 320
Glu Leu Ile Lys Asn Pro Met Val Met Glu Lys Ala Lys Gln Glu Leu
325 330 335
Asp Glu Val Val Gly Asn Thr Arg Leu Val Glu Glu Ser Asp Ala Pro
340 345 350
Lys Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Ala Phe Arg Leu His
355 360 365
Pro Pro Ile Pro Met Ile Ile Arg Lys Ser Asn Glu Asn Val Ser Val
370 375 380
Lys Ser Gly Tyr Glu Ile Pro Ala Gly Ser Ile Leu Phe Val Asn Asn
385 390 395 400
Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu Phe
405 410 415
Lys Pro Asp Arg Phe Leu Lys Glu Gly Val Leu Lys Pro Ser Leu Asp
420 425 430
Ile Arg Gly Gln Asn Phe Gln Ile Leu Pro Phe Gly Thr Gly Arg Arg
435 440 445
Ser Cys Pro Gly Ile Asn Met Ala Met Arg Gln Leu Pro Val Val Val
450 455 460
Ala Ile Leu Ile Gln Cys Phe Glu Trp Thr Val Asn Asp Lys Gln Val
465 470 475 480
Leu Asn Met Asp Glu Arg Gly Gly Leu Thr Thr Pro Arg Ala Thr Asp
485 490 495
Leu Val Cys Phe Pro Leu Leu Arg Lys Asn Ser Pro His Ser Met Phe
500 505 510
Thr Ser Val
515
<210> 134
<211> 1548
<212> DNA
<213> Artificial Sequence
<220>
<223> coding sequence for SEQ ID NO:133
<400> 134
atgtccaaca ctttgttggt tttgcaaatg gttatcccag ctatcatcgc tttcgttatc 60
ttccacttgt tgttcttcaa gtctaagcca aacagaagat tgccaccatc tccaccatct 120
ttgccaatca tcggtcactt gcaccacttg ggtccattga tccaccaatc tttcaacaga 180
ttgtctgcta gatacggtcc attgatccac ttgagattgg gttctgtttc ttgtgttgtt 240
gctgacgctc cagacttggc tcaagaattg ttgcaaaaga acgacttggc tttcgctaac 300
agaaagcaca ctttggctat cgaccacgtt acttacggtg ttgctttcgc tttcgctcca 360
tacggtccat actggagatt catcaagaag atgtctactg ttgaattgtt gggtatccaa 420
aacttgggtc acttcttgcc aatcagaact caagaaatcc acggtttgtt gttgactttg 480
actgaaaagt ctaagcaaaa cgaatctgtt aacatgacta acgaattgtt gaagttgtct 540
aacaacatca tctgtcaaat gatgatgggt atcagatgtt ctggtaacaa gactgaagct 600
gaagaagcta agaacttggt tagagaagtt actactatct tcggtgaatt caacgtttct 660
gacttcatct ggttctgtaa gaagttggac ttgcaaggtt tcaagaagag atacgaagat 720
atcagaacta gatacgacgc tttgttggaa agaatcatct tcgctagaga agaaatgaga 780
aaggaaggta agggtatgga agatggtaag ggtaaggact tcttggacat gttgttggac 840
gttttggaag atgacaaggc tgaaatcaag atcactagaa accacatcaa ggctttgatc 900
ttggacttcg ttactgctgg tactgacact actgctgtta tcatcgaatg gactttggtt 960
gaattgatca agaacccaat ggttatggaa aaggctaagc aagaattgga cgaagttgtt 1020
ggtaacacta gattggttga agaatctgac gctccaaagt tgccatacat ccaagctatc 1080
atcaaggaag ctttcagatt gcacccacca atcccaatga tcatcagaaa gtctaacgaa 1140
aacgtttctg ttaagtctgg ttacgaaatc ccagctggtt ctatcttgtt cgttaacaac 1200
tggtctatcg gtagaaaccc aaagtactgg gaatctccat tggaattcaa gccagacaga 1260
ttcttgaagg aaggtgtttt gaagccatct ttggacatca gaggtcaaaa cttccaaatc 1320
ttgccattcg gtactggtag aagatcttgt ccaggtatca acatggctat gagacaattg 1380
ccagttgttg ttgctatctt gatccaatgt ttcgaatgga ctgttaacga caagcaagtt 1440
ttgaacatgg acgaaagagg tggtttgact actccaagag ctactgactt ggtttgtttc 1500
ccattgttga gaaagaactc tccacactct atgttcactt ctgtttaa 1548
<210> 135
<211> 515
<212> PRT
<213> Callistephus chinensis
<400> 135
Met Ser Asn Ile Phe Glu Val Phe Gln Ser Val Ser Pro Ala Ile Ile
1 5 10 15
Ala Ile Phe Phe Ile Ser Ser Leu Phe Ile Tyr Leu Val Leu Ile Arg
20 25 30
Asn Gln Lys Ser Leu Ser Leu Pro Pro Ser Pro Pro Ala Leu Pro Ile
35 40 45
Ile Gly His Leu His His Leu Gly Pro Leu Ile His His Ser Phe His
50 55 60
Asp Leu Ser Thr Arg Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser
65 70 75 80
Val Pro Cys Val Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu
85 90 95
Lys Thr Asn Glu Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile
100 105 110
Asp His Val Thr Tyr Gly Val Ser Phe Ala Phe Ala Pro Tyr Gly Pro
115 120 125
Tyr Trp Lys Phe Ile Lys Lys Thr Ser Ile Val Glu Leu Leu Gly Asn
130 135 140
Gln Asn Leu Ser Asn Phe Leu Pro Ile Arg Thr Gln Glu Val His Glu
145 150 155 160
Leu Leu Gln Thr Leu Met Val Lys Ser Lys Lys Asn Glu Ser Val Asn
165 170 175
Leu Ser Glu Glu Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met
180 185 190
Met Met Ser Ile Arg Cys Ser Gly Thr Asn Asn Glu Ala Asp Glu Ala
195 200 205
Lys Asn Leu Val Arg Glu Val Thr Lys Ile Phe Gly Glu Phe Asn Ile
210 215 220
Ser Asp Phe Ile Cys Leu Phe Lys Asn Ile Asp Leu Gln Gly Phe Lys
225 230 235 240
Lys Arg Tyr Val Asp Thr His Thr Arg Tyr Asn Ala Leu Leu Glu Lys
245 250 255
Met Ile Phe Glu Arg Glu Glu Lys Arg Lys Gln Lys Lys Ser Glu Asp
260 265 270
Gly Lys Gly Lys Asp Phe Leu Asp Ile Leu Leu Asp Val Leu Glu Asp
275 280 285
Glu Asn Ala Glu Ile Lys Ile Thr Arg Asp His Ile Lys Ala Leu Ile
290 295 300
Leu Asp Phe Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ser Ile Glu
305 310 315 320
Trp Thr Leu Val Glu Leu Thr Asn Asn Pro Lys Val Leu Glu Asn Ala
325 330 335
Arg Lys Glu Ile Ala Glu Val Val Gly Asp Glu Arg Leu Val Gln Glu
340 345 350
Ser Asp Ile Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Thr
355 360 365
Leu Arg Met His Pro Pro Ile Pro Met Val Ile Arg Lys Ser Ile Asp
370 375 380
Asn Val Thr Val Gln Gly Tyr Asp Ile Arg Ala Gly Thr Met Leu Phe
385 390 395 400
Val Asn Ile Trp Ser Ile Gly Arg Asn Pro Leu Tyr Trp Glu Ser Pro
405 410 415
Leu Glu Phe Lys Pro His Arg Phe Leu Asp Gly His Ala Arg Asn Leu
420 425 430
Asp Val Lys Gly Gln Cys Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg
435 440 445
Arg Gly Cys Pro Gly Ile Ser Leu Ala Met Arg Glu Leu Pro Val Val
450 455 460
Ile Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Ala Asn Asp Lys Glu
465 470 475 480
Val Leu Ser Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala Val
485 490 495
Asp Leu Glu Phe Val Pro Leu Met Arg Gln Asn Cys Pro Asn Ile Phe
500 505 510
Val Ser Ala
515
<210> 136
<211> 1548
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ D NO 135
<400> 136
atgtccaaca tcttcgaagt tttccaatct gtttctccag ctatcatcgc tatcttcttc 60
atctcttctt tgttcatcta cttggttttg atcagaaacc aaaagtcttt gtctttgcca 120
ccatctccac cagctttgcc aatcatcggt cacttgcacc acttgggtcc attgatccac 180
cactctttcc acgacttgtc tactagatac ggtccattga tccacttgag attgggttct 240
gttccatgtg ttgttgcttc tactccagac ttggctagag acttcttgaa aactaacgaa 300
ttggctttct cttctagaaa gcactctttg gctatcgacc acgttactta cggtgtttct 360
ttcgctttcg ctccatacgg tccatactgg aagttcatca agaaaacttc tatcgttgaa 420
ttgttgggta accaaaactt gtctaacttc ttgccaatca gaactcaaga agttcacgaa 480
ttgttgcaaa ctttgatggt taagtctaag aagaacgaat ctgttaactt gtctgaagaa 540
ttgttgaagt tgactaacaa cgttatctgt caaatgatga tgtctatcag atgttctggt 600
actaacaacg aagctgacga agctaagaac ttggttagag aagttactaa gatcttcggt 660
gaattcaaca tctctgactt catctgtttg ttcaagaaca tcgacttgca aggtttcaag 720
aagagatacg ttgacactca cactagatac aacgctttgt tggaaaagat gatcttcgaa 780
agagaagaaa agagaaagca aaagaagtct gaagatggta agggtaagga cttcttggac 840
atcttgttgg acgttttgga agatgaaaac gctgaaatca agatcactag agatcacatc 900
aaggctttga tcttggactt cttcactgct gctactgaca ctactgctat ctctatcgaa 960
tggactttgg ttgaattgac taacaaccca aaggttttgg aaaacgctag aaaggaaatc 1020
gctgaagttg ttggtgacga aagattggtt caagaatctg acatcccaaa cttgccatac 1080
atccaagcta tcatcaagga aactttgaga atgcacccac caatcccaat ggttatcaga 1140
aagtctatcg acaacgttac tgttcaaggt tacgacatca gagctggtac tatgttgttc 1200
gttaacatct ggtctatcgg tagaaaccca ttgtactggg aatctccatt ggaattcaag 1260
ccacacagat tcttggacgg tcacgctaga aacttggacg ttaagggtca atgtttccaa 1320
ttgttgccat tcggtactgg tagaagaggt tgtccaggta tctctttggc tatgagagaa 1380
ttgccagttg ttatcgctgg tttgatccaa tgtttcgaat ggaacgctaa cgacaaggaa 1440
gttttgtcta tggacgaaag agctggtttg actgctccaa gagctgttga cttggaattc 1500
gttccattga tgagacaaaa ctgtccaaac atcttcgttt ctgcttaa 1548
<210> 137
<211> 356
<212> PRT
<213> Apium graveolens
<400> 137
Met Ser Ala Pro Ser Thr Ile Thr Ala Leu Ser Gln Glu Lys Thr Leu
1 5 10 15
Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Val Pro Ile Ile Ser Leu Ala Gly Leu Asp
35 40 45
Asp Asp Ser Asn Gly Arg Arg Ala Glu Ile Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Glu Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Ser Gly Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Val Tyr Asp Thr Thr Gly Glu Lys Lys
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Arg Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Ser Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Lys Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys
180 185 190
Val Glu Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Arg Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Thr Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Ala Val Ala
325 330 335
Thr Gln Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Lys Met Lys Ile
355
<210> 138
<211> 1071
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 137
<400> 138
atgtccgctc catctactat cactgctttg tctcaagaaa agactttgaa cttggacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaagttcca 120
atcatctctt tggctggttt ggacgacgac tctaacggta gaagagctga aatctgtaga 180
aagatcgttg aagctttcga agaatggggt atcttccaag ttgttgacca cggtatcgac 240
tctggtttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttgg tttacgacac tactggtgaa aagaagggtg gtttcactat ctctactcac 360
ttgcaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccaatc 420
tctgctagag actactctag atggccaaag aagccagaag gttggagatc tactactgaa 480
gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg aaaaggaagc tttgactaag gcttgtgttg aaatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660
gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactaga 720
gatggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcagaa acgctgacca ccaagctgtt 840
gttaactcta cttctactag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg ctgttgctac tcaaaagaag 1020
ttggctaagg aaaagagatt gcaagacgaa aaggctaaga tgaagatcta a 1071
<210> 139
<211> 521
<212> PRT
<213> Medicago truncatula
<400> 139
Met Ser Glu Pro Leu Leu Leu Ala Phe Thr Leu Phe Leu Ser Ser Leu
1 5 10 15
Ile Cys Tyr Ile Ile Phe Gln Pro Ile Leu Asn Arg His Lys Asn Leu
20 25 30
Pro Pro Ser Pro Leu Phe Lys Leu Pro Ile Ile Gly His Met His Met
35 40 45
Leu Gly Pro Leu Leu His His Ser Phe Asp Arg Leu Ser Gln Lys Tyr
50 55 60
Gly Pro Ile Phe Ser Leu Asn Phe Gly Ser Val Leu Cys Val Val Ala
65 70 75 80
Ser Thr Pro His Tyr Ala Lys Gln Ile Leu Gln Ile Asn Glu His Ala
85 90 95
Phe Asn Cys Arg Asn Glu Ser Thr Ala Ile Lys Arg Leu Thr Tyr Glu
100 105 110
Ala Ser Leu Ala Phe Ala Pro Tyr Gly Glu Tyr Trp Arg Phe Ile Lys
115 120 125
Lys Leu Ser Met Asn Glu Leu Leu Gly Ser Arg Ser Ile Ser Ser Phe
130 135 140
Gln His Leu Arg Leu Gln Glu Thr His Asn Leu Leu Lys Leu Phe Ala
145 150 155 160
Asp Lys Ala Lys Asn Tyr Glu Ala Val Asn Val Thr Gln Glu Leu Leu
165 170 175
Lys Leu Ser Asn Asn Val Ile Ser Lys Met Met Leu Gly Glu Ala Glu
180 185 190
Glu Ala Arg Asp Val Val Arg Asp Val Thr Glu Ile Phe Gly Glu Phe
195 200 205
Asn Val Ser Asp Phe Ile Trp Leu Phe Lys Lys Leu Asp Leu Gln Gly
210 215 220
Phe Gly Lys Arg Ile Glu Asp Leu Phe Met Arg Phe Asp Thr Leu Val
225 230 235 240
Glu Arg Ile Ile Ser Lys Arg Glu Glu Leu Arg Lys Asn Lys Gly Arg
245 250 255
Lys Glu Asn Lys Gly Glu Gln Gly Ala Glu Phe Arg Asp Phe Leu Asp
260 265 270
Ile Leu Leu Asp Cys Ala Glu Asp Gln Asn Ser Glu Ile Lys Val Gln
275 280 285
Arg Val His Ile Lys Ala Leu Ile Met Asp Phe Phe Thr Ala Gly Thr
290 295 300
Asp Thr Thr Ser Ile Ser Thr Glu Trp Ala Leu Val Glu Leu Met Asn
305 310 315 320
Asn Pro Ser Leu Leu Gln Lys Ala Arg Glu Glu Ile Asp Asn Val Val
325 330 335
Gly Lys Asn Arg Leu Val Asp Glu Ser Asp Gly Pro Asn Leu Pro Tyr
340 345 350
Ile Gln Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Val Pro
355 360 365
Met Val Thr Arg Arg Cys Val Thr Gln Cys Lys Ile Glu Asn Tyr Val
370 375 380
Ile Pro Glu Asn Ser Leu Ile Phe Val Asn Asn Trp Ala Met Gly Arg
385 390 395 400
Asn Ser Ala Tyr Trp Asp Lys Pro Leu Glu Phe Asn Pro Glu Arg Phe
405 410 415
Leu Lys Asn Ser Thr Asn Ser Asn Gly Val Ile Asp Val Arg Gly Gln
420 425 430
Asn Phe Gln Ile Leu Pro Phe Gly Ser Gly Arg Arg Met Cys Pro Gly
435 440 445
Val Thr Leu Ala Met Gln Glu Val Pro Ala Leu Leu Gly Ala Ile Ile
450 455 460
Gln Cys Phe Asp Phe Asn Phe Val Gly Pro Lys Gly Glu Ile Leu Lys
465 470 475 480
Gly Gly Asp Ile Val Ile Asp Val Asn Glu Arg Pro Gly Leu Thr Ala
485 490 495
Pro Arg Val His Asp Leu Val Cys Val Pro Val Glu Arg Phe Ala Cys
500 505 510
Gly Gly Pro Leu Gln Ser Leu Gly Cys
515 520
<210> 140
<211> 1566
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 139
<400> 140
atgtccgaac cattgttgtt ggctttcact ttgttcttgt catctttgat ctgttacatc 60
atcttccaac caatcttgaa cagacacaag aacttgccac catctccatt gttcaagttg 120
ccaatcatcg gtcacatgca catgttgggt ccattgttgc accactcttt cgacagattg 180
tctcaaaagt acggtccaat cttctctttg aacttcggtt ctgttttgtg tgttgttgct 240
tctactccac actacgctaa gcaaatcttg caaatcaacg aacacgcttt caactgtaga 300
aacgaatcta ctgctatcaa gagattgact tacgaagctt ctttggcttt cgctccatac 360
ggtgaatact ggagattcat caagaagttg tctatgaacg aattgttggg ttctagatct 420
atctcttctt tccaacactt gagattgcaa gaaactcaca acttgttgaa gttgttcgct 480
gacaaggcta agaactacga agctgttaac gttactcaag aattgttgaa gttgtctaac 540
aacgttatct ctaagatgat gttgggtgaa gctgaagaag ctagagatgt tgttagagat 600
gttactgaaa tcttcggtga attcaacgtt tctgacttca tctggttgtt caagaagttg 660
gacttgcaag gtttcggtaa gagaatcgaa gatttgttca tgagattcga cactttggtt 720
gaaagaatca tctctaagag agaagaattg agaaagaaca agggtagaaa ggaaaacaag 780
ggtgaacaag gtgctgaatt cagagacttc ttggacatct tgttggactg tgctgaagat 840
caaaactctg aaatcaaggt tcaaagagtt cacatcaagg ctttgatcat ggacttcttc 900
actgctggta ctgacactac ttctatctct actgaatggg ctttggttga attgatgaac 960
aacccatctt tgttgcaaaa ggctagagaa gaaatcgaca acgttgttgg taagaacaga 1020
ttggttgacg aatctgacgg tccaaacttg ccatacatcc aagctatcat caaggaaact 1080
ttcagattgc acccaccagt tccaatggtt actagaagat gtgttactca atgtaagatc 1140
gaaaactacg ttatcccaga aaactctttg atcttcgtta acaactgggc tatgggtaga 1200
aactctgctt actgggacaa gccattggaa ttcaacccag aaagattctt gaagaactct 1260
actaactcta acggtgttat cgacgttaga ggtcaaaact tccaaatctt gccattcggt 1320
tctggtagaa gaatgtgtcc aggtgttact ttggctatgc aagaagttcc agctttgttg 1380
ggtgctatca tccaatgttt cgacttcaac ttcgttggtc caaagggtga aatcttgaag 1440
ggtggtgaca tcgttatcga cgttaacgaa agaccaggtt tgactgctcc aagagttcac 1500
gacttggttt gtgttccagt tgaaagattc gcttgtggtg gtccattgca atctttgggt 1560
tgttaa 1566
<210> 141
<211> 366
<212> PRT
<213> Cuminum cyminum
<400> 141
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu
1 5 10 15
Asn Ser Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Thr Glu Ile Pro Ile Ile Ser Leu Ala Gly Ile Asp
35 40 45
Asp Asp Ser Lys Gly Arg Arg Pro Glu Val Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Val Asp
65 70 75 80
Ser Ala Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Gln Gln Gly Asp Asp Val Arg Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Val Asp Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Glu Lys Pro Glu Gly Trp Arg Ser Val Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Asp Lys Gly Ala Leu Thr Lys Ala Cys
180 185 190
Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Val Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Pro Ile Leu Glu Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala
325 330 335
Thr Gln Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Glu Glu Lys Ala
340 345 350
Lys Leu Glu Thr Lys Thr Lys Ser Ala Asp Gly Ile Leu Ala
355 360 365
<210> 142
<211> 1101
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 141
<400> 142
atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa ctctgacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctac tgaaatccca 120
atcatctctt tggctggtat cgacgacgac tctaagggta ggaggccaga agtttgtaga 180
aagatcgttg aagctttcga agattggggt atcttccaag ttgttgacca cggtgttgac 240
tctgctttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360
caacaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccagtt 420
gacgctagag actactctag atggccagaa aagccagaag gttggagatc tgttactgaa 480
gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg acaagggtgc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660
gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactagg 720
gacggtggta agacttggat cactgttcaa ccagttgaag gtgttttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840
gttaactcta cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaagccaa tcttggaaga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctac tcaaaagaag 1020
ttggctaagg aaaagagatt gcaagaagaa aaggctaagt tggaaactaa gactaagtct 1080
gctgacggta tcttggctta a 1101
<210> 143
<211> 356
<212> PRT
<213> Aethusa cynapium
<400> 143
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ser Gln Glu Lys Ser Leu
1 5 10 15
Asn Leu Asp Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Gln Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Met Asp
35 40 45
Asp Asp Ser Asn Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Asp Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Lys Gly Leu Ile Ser Gln Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Lys Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Glu Asp Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Glu Lys Pro Glu Gly Trp Arg Ser Thr Thr Glu
145 150 155 160
Val Tyr Ser Glu Lys Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys
180 185 190
Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Ile Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Thr Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala
325 330 335
Ala Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Lys Leu Glu Met
355
<210> 144
<211> 1071
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 143
<400> 144
atgtccgctc caactactat cactgctttg tctcaagaaa agtctttgaa cttggacttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacc aattctctaa cgaaatccca 120
atcatctctt tggctggtat ggacgacgac tctaacggta ggaggccaga aatctgtaga 180
aagatcgttg aagctttcga agattggggt atcttccaag ttgttgacca cggtatcgac 240
aagggtttga tctctcaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360
ttgcaaggtg acgacgttaa ggactggaga gaattcgtta cttacttctc ttacccaatc 420
gaagatagag actactctag atggccagaa aagccagaag gttggagatc tactactgaa 480
gtttactctg aaaagttgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg aaaaggaagc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag gagacacact 660
gacccaggta ctatcactat cttgttgcaa gacatggttg gtggtttgca agctactagg 720
gacggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840
gttaactcta cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctgc tttgaagaag 1020
ttggctaagg aaaagagatt gcaagacgaa aaggctaagt tggaaatgta a 1071
<210> 145
<211> 366
<212> PRT
<213> Conium maculatum
<400> 145
Met Ser Ala Pro Thr Thr Ile Thr Ala Leu Ala Gln Glu Lys Thr Leu
1 5 10 15
Asn Leu Ala Phe Val Arg Asp Glu Asp Glu Arg Pro Lys Val Ala Tyr
20 25 30
Asn Glu Phe Ser Asn Glu Ile Pro Ile Ile Ser Leu Ala Gly Leu Glu
35 40 45
Asn Asp Ser Asp Gly Arg Arg Pro Glu Ile Cys Arg Lys Ile Val Glu
50 55 60
Ala Phe Glu Asn Trp Gly Ile Phe Gln Val Val Asp His Gly Ile Asp
65 70 75 80
Ser Ala Leu Ile Ser Glu Met Ser Arg Leu Ser Arg Glu Phe Phe Ala
85 90 95
Leu Pro Ala Glu Glu Lys Leu Arg Tyr Asp Thr Thr Gly Gly Lys Arg
100 105 110
Gly Gly Phe Thr Ile Ser Thr His Leu Gln Gly Asp Asp Val Arg Asp
115 120 125
Trp Arg Glu Phe Val Thr Tyr Phe Ser Tyr Pro Ile Asp Ala Arg Asp
130 135 140
Tyr Ser Arg Trp Pro Asp Lys Pro Glu Gly Trp Arg Ser Ile Thr Glu
145 150 155 160
Val Tyr Ser Glu Arg Leu Met Val Leu Gly Ala Lys Leu Leu Glu Val
165 170 175
Leu Ser Glu Ala Met Gly Leu Glu Lys Glu Ala Leu Thr Lys Ala Cys
180 185 190
Val Asn Met Glu Gln Lys Val Leu Ile Asn Tyr Tyr Pro Thr Cys Pro
195 200 205
Glu Pro Asp Leu Thr Leu Gly Val Arg Arg His Thr Asp Pro Gly Thr
210 215 220
Ile Thr Val Leu Leu Gln Asp Met Val Gly Gly Leu Gln Ala Thr Arg
225 230 235 240
Asp Gly Gly Lys Thr Trp Ile Thr Val Gln Pro Val Glu Gly Ala Phe
245 250 255
Val Val Asn Leu Gly Asp His Gly His Tyr Leu Ser Asn Gly Arg Phe
260 265 270
Lys Asn Ala Asp His Gln Ala Val Val Asn Ser Ser Ser Ser Arg Leu
275 280 285
Ser Ile Ala Thr Phe Gln Asn Pro Ala Gln Asn Ala Ile Val Tyr Pro
290 295 300
Leu Lys Ile Arg Glu Gly Glu Lys Ala Ile Leu Asp Glu Ala Ile Thr
305 310 315 320
Tyr Ala Glu Met Tyr Lys Lys Asn Met Thr Lys His Ile Glu Val Ala
325 330 335
Thr Leu Lys Lys Leu Ala Lys Glu Lys Arg Leu Gln Asp Glu Lys Ala
340 345 350
Asn Met Glu Lys Lys Ser Lys Ser Ala His Gly Ile Ser Ala
355 360 365
<210> 146
<211> 1101
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 145
<400> 146
atgtccgctc caactactat cactgctttg gctcaagaaa agactttgaa cttggctttc 60
gttagagatg aagatgaaag accaaaggtt gcttacaacg aattctctaa cgaaatccca 120
atcatctctt tggctggttt ggaaaacgac tctgacggta gaaggccaga aatctgtaga 180
aagatcgttg aagctttcga aaactggggt atcttccaag ttgttgacca cggtatcgac 240
tctgctttga tctctgaaat gtctagattg tctagagaat tcttcgcttt gccagctgaa 300
gaaaagttga gatacgacac tactggtggt aagagaggtg gtttcactat ctctactcac 360
ttgcaaggtg acgacgttag agactggaga gaattcgtta cttacttctc ttacccaatc 420
gacgctagag actactctag atggccagac aagccagaag gttggagatc tatcactgaa 480
gtttactctg aaagattgat ggttttgggt gctaagttgt tggaagtttt gtctgaagct 540
atgggtttgg aaaaggaagc tttgactaag gcttgtgtta acatggaaca aaaggttttg 600
atcaactact acccaacttg tccagaacca gacttgactt tgggtgttag aaggcacact 660
gacccaggta ctatcactgt tttgttgcaa gacatggttg gtggtttgca agctactaga 720
gatggtggta agacttggat cactgttcaa ccagttgaag gtgctttcgt tgttaacttg 780
ggtgaccacg gtcactactt gtctaacggt agattcaaga acgctgacca ccaagctgtt 840
gttaactctt cttcttctag attgtctatc gctactttcc aaaacccagc tcaaaacgct 900
atcgtttacc cattgaagat cagagaaggt gaaaaggcta tcttggacga agctatcact 960
tacgctgaaa tgtacaagaa gaacatgact aagcacatcg aagttgctac tttgaagaag 1020
ttggctaagg aaaagagatt gcaagacgaa aaggctaaca tggaaaagaa gtctaagtct 1080
gctcacggta tctctgctta a 1101
<210> 147
<211> 535
<212> PRT
<213> Camellia sinensis
<400> 147
Met Ser Phe Asp Leu Ile Ser Ile Ala Thr Leu Phe Phe Val Ile Ile
1 5 10 15
Ser Thr Thr Ile Leu Leu Leu Ser Ile Asn His Phe Lys Lys Pro Pro
20 25 30
His Leu Arg Arg Arg Leu Ser Leu Pro Pro Thr Pro Phe Ala Leu Pro
35 40 45
Ile Ile Gly His Leu His Leu Leu Gly Pro Ile Ile His Arg Ser Phe
50 55 60
His Asp Leu Ser Ser Arg Tyr Gly Pro Leu Phe His Leu Arg Leu Gly
65 70 75 80
Ser Val Pro Cys Phe Val Val Ser Thr Pro Glu Leu Ala Lys Glu Phe
85 90 95
Leu Leu Thr His Glu Leu Lys Phe Ser Ser Arg Arg Asp Ser Ile Ala
100 105 110
Ile Gln Arg Leu Thr Tyr Asp Ser Ala Phe Ala Phe Ala Pro Tyr Gly
115 120 125
Pro Tyr Trp Lys Phe Leu Lys Lys Leu Cys Thr Cys Asp Leu Leu Gly
130 135 140
Ala Arg Ser Ile Asn His Phe Leu Pro Thr Arg Thr Arg Glu Leu His
145 150 155 160
Cys Phe Val Arg Leu Leu Ile Asp Lys Ala Val Ala Cys Glu Pro Val
165 170 175
Asn Ile Thr Lys Glu Leu Ser Thr Leu Ala Asn Asn Ile Ile Ser Gln
180 185 190
Met Met Ile Gly Val Arg Cys Ser Gly Thr Thr Gly Glu Ala Glu Glu
195 200 205
Ala Thr Thr Leu Ala Arg Glu Val Thr Lys Ile Phe Gly Glu Phe Asn
210 215 220
Val Ser Asp Phe Met Trp Val Ile Arg Asn Phe Asp Leu Gln Gly Phe
225 230 235 240
Arg Lys Arg Val Glu Asp Ile Tyr Thr Arg Tyr Asp Ala Leu Leu Glu
245 250 255
Arg Ile Ile Thr Asn Arg Glu Glu Val Arg Glu Lys Asn Val Gln Glu
260 265 270
Arg Lys Leu Gly Val Gly Glu Gly His His Val Lys Asp Phe Leu Asp
275 280 285
Leu Leu Leu Asp Val Leu Glu Glu Asp His Ser Glu Ile Asn Phe Ser
290 295 300
Arg Asp Asn Ile Lys Gly Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr
305 310 315 320
Asp Thr Ser Ser Ile Ala Ile Glu Trp Ala Leu Ala Glu Leu Ile Asn
325 330 335
Asn Pro Arg Val Leu Gln Lys Ala Gln Glu Glu Ile Asp Asn Val Val
340 345 350
Gly Lys His Arg Leu Val Ser Glu Ser Asp Gly Pro Asn Leu Pro Tyr
355 360 365
Ile Gln Ala Ile Ile Arg Glu Ala Leu Arg Leu His Pro Pro Val Pro
370 375 380
Leu Ile Thr Arg Lys Ser Ile Glu Asp Cys Met Ile Gln Gly Tyr Asn
385 390 395 400
Ile Pro Ala Asn Ser Met Leu Phe Val Asn Val Trp Ser Leu Ala Arg
405 410 415
Asn Pro Lys Tyr Trp Asp Ser Pro Leu Asp Phe Leu Pro Glu Arg Phe
420 425 430
Leu Arg Pro Glu Lys Gly Gly Pro Val Gly Pro Thr Asp Val Lys Gly
435 440 445
Gln His Phe Gln Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro
450 455 460
Gly Thr Ser Leu Ala Met Gln Glu Leu Pro Ala Met Leu Ala Ala Met
465 470 475 480
Ile Gln Cys Phe Glu Trp Lys Val Val Asn Gln Ser Gly Asp Val Met
485 490 495
Asn Gly Asp Gly Ala Leu Asp Met Thr Glu Gln Pro Gly Met Thr Ala
500 505 510
Pro Arg Ala His Asp Leu Val Cys Met Pro Ile Pro Arg Ile Asp Gln
515 520 525
Leu Tyr Ala Leu Leu Asp Pro
530 535
<210> 148
<211> 1608
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO:147
<400> 148
atgtccttcg acttgatctc tatcgctact ttgttcttcg ttatcatctc tactactatc 60
ttgttgttgt ctatcaacca cttcaagaag ccaccacact tgagaagaag attgtctttg 120
ccaccaactc cattcgcttt gccaatcatc ggtcacttgc acttgttggg tccaatcatc 180
cacagatctt tccacgactt gtcatctaga tacggtccat tgttccactt gagattgggt 240
tctgttccat gtttcgttgt ttctactcca gaattggcta aggaattctt gttgactcac 300
gaattgaagt tctcttctag aagagactct atcgctatcc aaagattgac ttacgactct 360
gctttcgctt tcgctccata cggtccatac tggaagttct tgaagaagtt gtgtacttgt 420
gacttgttgg gtgctagatc tatcaaccac ttcttgccaa ctagaactag agaattgcac 480
tgtttcgtta gattgttgat cgacaaggct gttgcttgtg aaccagttaa catcactaag 540
gaattgtcta ctttggctaa caacatcatc tctcaaatga tgatcggtgt tagatgttct 600
ggtactactg gtgaagctga agaagctact actttggcta gagaagttac taagatcttc 660
ggtgaattca acgtttctga cttcatgtgg gttatcagaa acttcgactt gcaaggtttc 720
agaaagagag ttgaagatat ctacactaga tacgacgctt tgttggaaag aatcatcact 780
aacagagaag aagttagaga aaagaacgtt caagaaagaa agttgggtgt tggtgaaggt 840
caccacgtta aggacttctt ggacttgttg ttggacgttt tggaagaaga tcactctgaa 900
atcaacttct ctagagacaa catcaagggt ttgatcttgg acttcttcac tgctggtact 960
gacacttctt ctatcgctat cgaatgggct ttggctgaat tgatcaacaa cccaagagtt 1020
ttgcaaaagg ctcaagaaga aatcgacaac gttgttggta agcacagatt ggtttctgaa 1080
tctgacggtc caaacttgcc atacatccaa gctatcatca gagaagcttt gagattgcac 1140
ccaccagttc cattgatcac tagaaagtct atcgaagatt gtatgatcca aggttacaac 1200
atcccagcta actctatgtt gttcgttaac gtttggtctt tggctagaaa cccaaagtac 1260
tgggactctc cattggactt cttgccagaa agattcttga ggccagaaaa gggtggtcca 1320
gttggtccaa ctgacgttaa gggtcaacac ttccaattgt tgccattcgg tactggtaga 1380
agaggttgtc caggtacttc tttggctatg caagaattgc cagctatgtt ggctgctatg 1440
atccaatgtt tcgaatggaa ggttgttaac caatctggtg acgttatgaa cggtgacggt 1500
gctttggaca tgactgaaca accaggtatg actgctccaa gagctcacga cttggtttgt 1560
atgccaatcc caagaatcga ccaattgtac gctttgttgg acccataa 1608
<210> 149
<211> 517
<212> PRT
<213> Saussurea medusa
<400> 149
Met Ser Gln Val Leu Gln Thr Leu Thr Pro Ala Val Ile Ala Ala Val
1 5 10 15
Leu Leu Ser Ser Leu Phe Leu Tyr Leu Leu Ile Lys Lys Asn Gln Asn
20 25 30
His Arg Leu Pro Pro Ser Pro Pro Ser Leu Pro Ile Ile Gly His Leu
35 40 45
His His Leu Gly Pro Leu Ile His Gln Ser Phe His His Leu Ser Thr
50 55 60
Lys Tyr Gly Pro Leu Ile His Leu Arg Leu Gly Ser Val Thr Cys Val
65 70 75 80
Val Ala Ser Thr Pro Asp Leu Ala Arg Asp Phe Leu Lys Thr Asn Glu
85 90 95
Leu Ala Phe Ser Ser Arg Lys His Ser Leu Ala Ile Asp His Ile Thr
100 105 110
Tyr Gly Val Ala Phe Ala Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe
115 120 125
Ile Lys Lys Met Ser Thr Val Glu Leu Leu Gly Asn Gln Asn Leu Gly
130 135 140
His Phe Leu Pro Ile Arg Thr Gln Glu Ile His Glu Leu Leu His Thr
145 150 155 160
Leu Met Asn Lys Ala Lys Lys Arg Glu Ser Val Asn Leu Thr Glu Glu
165 170 175
Leu Leu Lys Leu Thr Asn Asn Val Ile Cys Gln Met Met Met Ser Ile
180 185 190
Arg Cys Ser Gly Thr Asn Ser Glu Ala Asp Glu Ala Lys Asn Leu Val
195 200 205
Arg Glu Val Thr Gln Ile Phe Gly Glu Phe Asn Val Ser Asp Phe Ile
210 215 220
Trp Phe Cys Lys Asn Ile Asp Leu Gln Gly Phe Lys Lys Arg Tyr Glu
225 230 235 240
Asp Thr His Arg Arg Tyr Asp Val Leu Leu Glu Lys Ile Ile Leu Glu
245 250 255
Arg Glu Glu Glu Arg Arg Lys Glu Gly Lys Arg Glu Asp Gly Asn Lys
260 265 270
Gly Lys Asp Phe Leu Asp Met Leu Leu Asp Val Leu Glu Asp Gly Lys
275 280 285
Ala Glu Ile Gln Ile Thr Arg Asp His Ile Lys Ala Leu Ile Leu Asp
290 295 300
Phe Phe Thr Ala Ala Thr Asp Thr Thr Ala Ile Ala Leu Glu Trp Met
305 310 315 320
Leu Val Glu Leu Ile Arg Asn Pro Lys Val Leu Glu Ile Ala Arg Glu
325 330 335
Glu Ile Asp His Ile Ile Gly Asn Glu Arg Leu Val Gln Glu Ser Asp
340 345 350
Ile Pro Asn Leu Pro Tyr Ile Gln Ala Ile Ile Lys Glu Thr Leu Arg
355 360 365
Leu His Pro Pro Ile Pro Met Leu Ile Arg Lys Ser Ile Glu Asn Val
370 375 380
Ser Val Gln Gly Tyr Asp Ile Pro Ala Gly Thr Met Leu Phe Val Asn
385 390 395 400
Ile Trp Ser Ile Gly Arg Asn Pro Lys Tyr Trp Glu Ser Pro Leu Glu
405 410 415
Phe Lys Pro His Arg Phe Leu Glu Glu Asp Asn Ala Leu Lys Ser Ser
420 425 430
Phe Asp Ile Lys Gly Gln Asn Phe Gln Leu Leu Pro Phe Gly Thr Gly
435 440 445
Arg Arg Gly Cys Pro Gly Ile Asn Leu Ala Met Lys Glu Leu Pro Val
450 455 460
Val Ile Ala Gly Leu Ile Gln Cys Phe Glu Trp Asn Ile Asn Glu Lys
465 470 475 480
Gln Val Leu Asp Met Asp Glu Arg Ala Gly Leu Thr Ala Pro Arg Ala
485 490 495
Ala Asp Phe Val Cys Val Pro Ser Ile Arg Glu Asp Ser Pro Lys Ser
500 505 510
Phe Ile Thr Ser Thr
515
<210> 150
<211> 1554
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 149
<400> 150
atgtcccaag ttttgcaaac tttgactcca gctgttatcg ctgctgtttt gttgtcatct 60
ttgttcttgt acttgttgat caagaagaac caaaaccaca gattgccacc atctccacca 120
tctttgccaa tcatcggtca cttgcaccac ttgggtccat tgatccacca atctttccac 180
cacttgtcta ctaagtacgg tccattgatc cacttgagat tgggttctgt tacttgtgtt 240
gttgcttcta ctccagactt ggctagagac ttcttgaaaa ctaacgaatt ggctttctct 300
tctagaaagc actctttggc tatcgaccac atcacttacg gtgttgcttt cgctttcgct 360
ccatacggtc catactggaa gttcatcaag aagatgtcta ctgttgaatt gttgggtaac 420
caaaacttgg gtcacttctt gccaatcaga actcaagaaa tccacgaatt gttgcacact 480
ttgatgaaca aggctaagaa gagagaatct gttaacttga ctgaagaatt gttgaagttg 540
actaacaacg ttatctgtca aatgatgatg tctatcagat gttctggtac taactctgaa 600
gctgacgaag ctaagaactt ggttagagaa gttactcaaa tcttcggtga attcaacgtt 660
tctgacttca tctggttctg taagaacatc gacttgcaag gtttcaagaa gagatacgaa 720
gatactcaca gaagatacga cgttttgttg gaaaagatca tcttggaaag agaagaagaa 780
agaagaaagg aaggtaagag agaagatggt aacaagggta aggacttctt ggacatgttg 840
ttggacgttt tggaagatgg taaggctgaa atccaaatca ctagagatca catcaaggct 900
ttgatcttgg acttcttcac tgctgctact gacactactg ctatcgcttt ggaatggatg 960
ttggttgaat tgatcagaaa cccaaaggtt ttggaaatcg ctagagaaga aatcgaccac 1020
atcatcggta acgaaagatt ggttcaagaa tctgacatcc caaacttgcc atacatccaa 1080
gctatcatca aggaaacttt gagattgcac ccaccaatcc caatgttgat cagaaagtct 1140
atcgaaaacg tttctgttca aggttacgac atcccagctg gtactatgtt gttcgttaac 1200
atctggtcta tcggtagaaa cccaaagtac tgggaatctc cattggaatt caagccacac 1260
agattcttgg aagaagataa cgctttgaag tcatctttcg acatcaaggg tcaaaacttc 1320
caattgttgc cattcggtac tggtagaaga ggttgtccag gtatcaactt ggctatgaag 1380
gaattgccag ttgttatcgc tggtttgatc caatgtttcg aatggaacat caacgaaaag 1440
caagttttgg acatggacga aagagctggt ttgactgctc caagagctgc tgacttcgtt 1500
tgtgttccat ctatcagaga agattctcca aagtctttca tcacttctac ttaa 1554
<210> 151
<211> 510
<212> PRT
<213> Plectranthus barbatus
<400> 151
Met Ser Asp His Val Glu Ala Ala Leu Phe Ala Ala Ile Phe Leu Leu
1 5 10 15
Ser Ala Ala Leu Leu Asn His Leu Leu Thr Gly Lys Arg Arg Gln Asn
20 25 30
Ala Tyr Pro Pro Gly Pro Phe Pro Leu Pro Ile Ile Gly His Leu His
35 40 45
Leu Leu Gly Pro Arg Leu His His Thr Phe His Asp Leu Thr Gln Arg
50 55 60
Tyr Gly Pro Leu Met Gln Val Arg Leu Gly Ser Ile Arg Cys Val Ile
65 70 75 80
Ala Ala Thr Pro Glu Leu Ala Lys Glu Phe Leu Lys Thr Ser Glu Leu
85 90 95
Val Phe Ser Ala Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr
100 105 110
Glu Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile
115 120 125
Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Asn His
130 135 140
Phe Leu Pro Ile Arg Thr Ile Glu Val Lys Thr Phe Leu Glu Ala Leu
145 150 155 160
Met Gln Lys Gly Lys Thr Gly Glu Arg Leu Asn Val Thr Glu Glu Leu
165 170 175
Val Lys Leu Thr Ser Asn Val Ile Ser Gln Met Met Leu Ser Ile Arg
180 185 190
Cys Ser Gly Thr Glu Gly Glu Thr Glu Ala Val Arg Thr Val Ile Arg
195 200 205
Glu Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ala Asp Ile Ile Trp
210 215 220
Phe Cys Lys Asn Phe Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp
225 230 235 240
Ile Gln Arg Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg
245 250 255
Glu Lys Gln Arg Arg Thr Gln His Gly Gly Glu Ala Lys Asp Phe Leu
260 265 270
Asp Met Phe Leu Asp Ile Met Lys Ser Gly Lys Ala Glu Val Asn Phe
275 280 285
Thr Arg Asp His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly
290 295 300
Thr Asp Thr Thr Ala Ile Val Val Gly Trp Ala Ile Ala Glu Leu Ile
305 310 315 320
Asn Asn Pro Asn Val Leu Lys Lys Ala Gln Ala Glu Ile Asp Lys Val
325 330 335
Val Gly Leu His Arg Ile Leu Gln Glu Ser Asp Gly Pro Asn Leu Pro
340 345 350
Tyr Leu Asn Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile
355 360 365
Pro Met Leu Ser Arg Lys Ser Ile Ser Asp Cys Val Ile Asp Gly Tyr
370 375 380
Thr Ile Pro Ala Asn Thr Leu Leu Phe Val Asn Ile Trp Ser Met Gly
385 390 395 400
Arg Asn Pro Lys Ile Trp Asp Asn Pro Met Ala Phe Arg Pro Glu Arg
405 410 415
Phe Leu Glu Lys Glu Lys Thr Gly Ile Asp Ile Lys Gly Gln His Phe
420 425 430
Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu
435 440 445
Leu Ala Ile Arg Glu Val Val Val Ile Ile Gly Thr Val Ile Gln Cys
450 455 460
Phe Asp Trp Lys Leu Pro Val Asp Asp Val Ser Gly Leu Val Asp Met
465 470 475 480
Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala Asp Asp Leu Ile Cys
485 490 495
Arg Val Val Pro Arg Val Asp Pro Leu Val Val Ser Gly His
500 505 510
<210> 152
<211> 1533
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 151
<400> 152
atgtccgacc acgttgaagc tgctttgttc gctgctatct tcttgttgtc tgctgctttg 60
ttgaaccact tgttgactgg taagagaagg caaaacgctt acccaccagg tccattccca 120
ttgccaatca tcggtcactt gcacttgttg ggtccaagat tgcaccacac tttccacgac 180
ttgactcaaa gatacggtcc attgatgcaa gttagattgg gttctatcag atgtgttatc 240
gctgctactc cagaattggc taaggaattc ttgaaaactt ctgaattggt tttctctgct 300
agaaagcact ctactgctat cgacatcgtt acttacgaat cttctttcgc tttctctcca 360
tacggtccat actggaagta catcaagaag ttgtgtactt acgaattgtt gggtgctaga 420
aacttgaacc acttcttgcc aatcagaact atcgaagtta agactttctt ggaagctttg 480
atgcaaaagg gtaagactgg tgaaagattg aacgttactg aagaattggt taagttgact 540
tctaacgtta tctctcaaat gatgttgtct atcagatgtt ctggtactga aggtgaaact 600
gaagctgtta gaactgttat cagagaagtt actcaaatct tcggtgaatt cgacgttgct 660
gacatcatct ggttctgtaa gaacttcgac ttccaaggta tcagaaagag atctgaagat 720
atccaaagaa gatacgacgc tttgttggaa aagatcatca ctgacagaga aaagcaaaga 780
agaactcaac acggtggtga agctaaggac ttcttggaca tgttcttgga catcatgaag 840
tctggtaagg ctgaagttaa cttcactaga gatcacttga aggctttgat cttggacttc 900
ttcactgctg gtactgacac tactgctatc gttgttggtt gggctatcgc tgaattgatc 960
aacaacccaa acgttttgaa gaaggctcaa gctgaaatcg acaaggttgt tggtttgcac 1020
agaatcttgc aagaatctga cggtccaaac ttgccatact tgaacgctgt tatcaaggaa 1080
actttcagat tgcacccacc aatcccaatg ttgtctagaa agtctatctc tgactgtgtt 1140
atcgacggtt acactatccc agctaacact ttgttgttcg ttaacatctg gtctatgggt 1200
agaaacccaa agatctggga caacccaatg gctttcagac cagaaagatt cttggaaaag 1260
gaaaagactg gtatcgacat caagggtcaa cacttcgaat tgttgccatt cggtactggt 1320
agaagaggtt gtccaggtat gttgttggct atcagagaag ttgttgttat catcggtact 1380
gttatccaat gtttcgactg gaagttgcca gttgacgacg tttctggttt ggttgacatg 1440
actgaaagac caggtttgac tgctccaaga gctgacgact tgatctgtag agttgttcca 1500
agagttgacc cattggttgt ttctggtcac taa 1533
<210> 153
<211> 506
<212> PRT
<213> Scutellaria baicalensis
<400> 153
Met Ser Glu Val Thr Leu Asn Val Ala Leu Leu Leu Leu Ser Ala Ala
1 5 10 15
Val Cys Leu Met Val Phe Thr Gly Lys Arg Arg Arg Arg Leu Pro Asn
20 25 30
Pro Pro Gly Pro Phe Pro Leu Pro Leu Ile Gly Asn Leu Asn Leu Val
35 40 45
Ser Pro Arg Leu His His Thr Phe His Met Leu Ala Gln Arg Tyr Gly
50 55 60
Pro Ile Met Lys Phe Arg Leu Gly Ser Ile Pro Cys Leu Val Val Ser
65 70 75 80
Thr Pro Glu Leu Ala Lys Asp Ile Leu Lys Thr His Glu Leu Ile Phe
85 90 95
Ser Ser Arg Val Lys Ser Thr Ala Ile Asp Ile Val Thr Tyr Gly Val
100 105 110
Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile Lys Lys
115 120 125
Leu Cys Thr Tyr Glu Leu Leu Gly Ser Arg Met Leu Asn His Phe Glu
130 135 140
Pro Leu Arg Ala Leu Glu Val Arg Glu Phe Leu Lys Asp Val Met Ala
145 150 155 160
Met Gly Lys Ala Gly Lys Ser Phe Asn Val Thr Glu Glu Leu Met Lys
165 170 175
Leu Thr Ser Asn Val Met Ser Asn Met Met Leu Ser Ile Arg Ala Ala
180 185 190
Glu Ser Glu Glu Gln Ala Glu Val Ala Arg Thr Leu Ile Arg Glu Val
195 200 205
Ser Gln Leu Phe Gly Glu Phe Asp Phe Gly Asp Met Leu Trp Phe Cys
210 215 220
Lys Ser Phe Asp Phe Gln Gly Ile Lys Lys Arg Ser Lys Asp Ile Lys
225 230 235 240
Val Arg Tyr Asp Ala Leu Leu Glu Lys Ile Leu Thr Asp Arg Glu Asn
245 250 255
Val Arg Arg Gln Asn Gly Val Val Glu Pro Lys Asp Met Leu Asp Met
260 265 270
Phe Leu Asp Ile Met Glu Gly Gly Lys Thr Asp Val Glu Phe Thr Arg
275 280 285
Glu His Leu Lys Ala Val Ile Leu Asp Phe Leu Thr Ala Gly Thr Asp
290 295 300
Thr Thr Ala Ile Thr Val Glu Trp Val Leu Ala Glu Leu Met Asn Ser
305 310 315 320
Pro Lys Ala Met Lys Lys Ala Gln Asp Glu Met Asp Arg Val Val Gly
325 330 335
Arg Glu Arg Met Met Ala Glu Ser Asp Ala Pro Asn Leu Pro Tyr Phe
340 345 350
Leu Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro Leu
355 360 365
Ile Ile Arg Arg Ser Ile Glu Asp Cys Val Ile Asp Gly Tyr His Ile
370 375 380
Pro Ala Asp Thr Leu Ala Phe Ile Asn Val Trp Ser Met Gly Arg Asn
385 390 395 400
Glu Lys Tyr Trp Asp Ser Pro Leu Ser Phe Arg Pro Glu Arg Phe Leu
405 410 415
Glu Gly Asp Asn Ala Ala Ile Asp Ile Lys Gly Met His Phe Glu Leu
420 425 430
Leu Pro Phe Gly Ser Gly Arg Arg Gly Cys Pro Gly Met Leu Ser Ala
435 440 445
Ile Gln Glu Val Leu Ile Ile Ala Gly Thr Val Ile Gln Cys Phe Asp
450 455 460
Trp Glu Gln Ala Asp Gly Ser Gly Arg Val Asp Met Ser Glu Arg Pro
465 470 475 480
Gly Leu Thr Thr Pro Arg Glu Ile Asp Leu Val Cys Arg Val Val Pro
485 490 495
Arg Val Asp Glu Arg Val Ile Ser Gly His
500 505
<210> 154
<211> 1521
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO:153
<400> 154
atgtccgaag ttactttgaa cgttgctttg ttgttgttgt ctgctgctgt ttgtttgatg 60
gttttcactg gtaagagaag aagaagattg ccaaacccac caggtccatt cccattgcca 120
ttgatcggta acttgaactt ggtttctcca agattgcacc acactttcca catgttggct 180
caaagatacg gtccaatcat gaagttcaga ttgggttcta tcccatgttt ggttgtttct 240
actccagaat tggctaagga catcttgaaa actcacgaat tgatcttctc ttctagagtt 300
aagtctactg ctatcgacat cgttacttac ggtgtttctt tcgctttctc tccatacggt 360
ccatactgga agtacatcaa gaagttgtgt acttacgaat tgttgggttc tagaatgttg 420
aaccacttcg aaccattgag agctttggaa gttagagaat tcttgaagga cgttatggct 480
atgggtaagg ctggtaagtc tttcaacgtt actgaagaat tgatgaagtt gacttctaac 540
gttatgtcta acatgatgtt gtctatcaga gctgctgaat ctgaagaaca agctgaagtt 600
gctagaactt tgatcagaga agtttctcaa ttgttcggtg aattcgactt cggtgacatg 660
ttgtggttct gtaagtcttt cgacttccaa ggtatcaaga agagatctaa ggacatcaag 720
gttagatacg acgctttgtt ggaaaagatc ttgactgaca gagaaaacgt taggagacaa 780
aacggtgttg ttgaaccaaa ggacatgttg gacatgttct tggacatcat ggaaggtggt 840
aagactgacg ttgaattcac tagagaacac ttgaaggctg ttatcttgga cttcttgact 900
gctggtactg acactactgc tatcactgtt gaatgggttt tggctgaatt gatgaactct 960
ccaaaggcta tgaagaaggc tcaagacgaa atggacagag ttgttggtag agaaagaatg 1020
atggctgaat ctgacgctcc aaacttgcca tacttcttgg ctatcatcaa ggaaactttc 1080
agattgcacc caccaatccc attgatcatc agaagatcta tcgaagattg tgttatcgac 1140
ggttaccaca tcccagctga cactttggct ttcatcaacg tttggtctat gggtagaaac 1200
gaaaagtact gggactctcc attgtctttc agaccagaaa gattcttgga aggtgacaac 1260
gctgctatcg acatcaaggg tatgcacttc gaattgttgc cattcggttc tggtagaaga 1320
ggttgtccag gtatgttgtc tgctatccaa gaagttttga tcatcgctgg tactgttatc 1380
caatgtttcg actgggaaca agctgacggt tctggtagag ttgacatgtc tgaaagacca 1440
ggtttgacta ctccaagaga aatcgacttg gtttgtagag ttgttccaag agttgacgaa 1500
agagttatct ctggtcacta a 1521
<210> 155
<211> 510
<212> PRT
<213> Dorcoceras hygrometricum
<400> 155
Met Ser Asp Leu Val Gln Ile Thr Leu Ser Ala Ala Leu Leu Leu Leu
1 5 10 15
Ser Ala Ala Phe Leu His Thr Ile Phe Ala Thr Lys Arg Arg Arg Leu
20 25 30
Ser Pro Pro Pro Gly Pro Leu Ala Leu Pro Ile Ile Gly His Leu His
35 40 45
Leu Leu Gly Pro Arg Leu His Gln Thr Phe His Asp Leu Ser Leu Arg
50 55 60
His Gly Pro Ile Phe Asn Leu Arg Leu Gly Ser Val Ala Cys Ala Val
65 70 75 80
Val Ser Thr Pro Glu Leu Ala Lys Glu Cys Leu Lys Thr His Glu Leu
85 90 95
Val Phe Ser Ser Arg Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr
100 105 110
Asp Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr Trp Lys Tyr Ile
115 120 125
Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg Asn Leu Leu His
130 135 140
Phe Gln Pro Ile Arg Thr Leu Glu Val Asn Ser Phe Val Gly Thr Leu
145 150 155 160
Met Asn Lys Ala Glu Ser Gly Glu Ser Phe Asn Val Thr Glu Glu Leu
165 170 175
Val Lys Leu Thr Ser Asn Val Ile Ser His Met Met Leu Gly Ile Arg
180 185 190
Cys Ser Gly Thr Glu Gly Glu Ala Glu Ala Ala Arg Thr Val Ile Arg
195 200 205
Glu Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ala Asp Ile Ile Trp
210 215 220
Phe Cys Lys Asn Phe Asp Phe Gln Gly Ile Arg Lys Arg Ser Glu Asp
225 230 235 240
Ile Gln Arg Arg Tyr Asp Ala Leu Leu Glu Lys Ile Ile Thr Asp Arg
245 250 255
Glu Glu Leu Arg Arg Ser His Gly Gly Ala Ala Gly Glu Ala Arg Asp
260 265 270
Phe Leu Asp Met Phe Leu Asp Ile Met Glu Gly Gly Lys Ser Glu Val
275 280 285
Thr Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr
290 295 300
Ala Gly Thr Asp Thr Thr Ala Ile Val Thr Glu Trp Ala Ile Ser Glu
305 310 315 320
Leu Ile Asn Asn Pro Lys Val Leu Glu Lys Ala Gln Gln Glu Ile Asp
325 330 335
Lys Val Ile Gly Ser Gly Arg Leu Val Gln Glu Ser Asp Ala Pro Asn
340 345 350
Leu Pro Tyr Leu Met Ala Val Ile Lys Glu Thr Phe Arg Leu His Pro
355 360 365
Pro Ile Pro Met Leu Ser Arg Lys Ser Ile Ser Asp Cys Val Ile Asp
370 375 380
Gly Tyr Asp Val Pro Ala Lys Ser Leu Leu Phe Val Asn Ile Trp Ser
385 390 395 400
Met Gly Arg Asn Pro Lys Ile Trp Glu Ser Pro Leu Glu Phe Arg Pro
405 410 415
Glu Arg Phe Leu Glu Arg Glu Lys Ser Ser Ile Asp Ile Lys Gly Gln
420 425 430
His Phe Glu Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly
435 440 445
Met Leu Leu Gly Ile Gln Glu Val Val Ile Ile Ile Gly Thr Met Val
450 455 460
Gln Cys Phe Asp Trp Lys Leu Ser Asp Gly Ser Gly Gln Val Asp Met
465 470 475 480
Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala His Asp Leu Phe Cys
485 490 495
Arg Val Val Pro Arg Ile Asn Pro Val Val Val Ser Gly Asn
500 505 510
<210> 156
<211> 1533
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 155
<400> 156
atgtccgact tggttcaaat cactttgtct gctgctttgt tgttgttgtc tgctgctttc 60
ttgcacacta tcttcgctac taagagaaga agattgtctc caccaccagg tccattggct 120
ttgccaatca tcggtcactt gcacttgttg ggtccaagat tgcaccaaac tttccacgac 180
ttgtctttga gacacggtcc aatcttcaac ttgagattgg gttctgttgc ttgtgctgtt 240
gtttctactc cagaattggc taaggaatgt ttgaaaactc acgaattggt tttctcttct 300
agaaagcact ctactgctat cgacatcgtt acttacgact cttctttcgc tttctctcca 360
tacggtccat actggaagta catcaagaag ttgtgtactt acgaattgtt gggtgctaga 420
aacttgttgc acttccaacc aatcagaact ttggaagtta actctttcgt tggtactttg 480
atgaacaagg ctgaatctgg tgaatctttc aacgttactg aagaattggt taagttgact 540
tctaacgtta tctctcacat gatgttgggt atcagatgtt ctggtactga aggtgaagct 600
gaagctgcta gaactgttat cagagaagtt actcaaatct tcggtgaatt cgacgttgct 660
gacatcatct ggttctgtaa gaacttcgac ttccaaggta tcagaaagag atctgaagat 720
atccaaagaa gatacgacgc tttgttggaa aagatcatca ctgacagaga agaattgaga 780
agatctcacg gtggtgctgc tggtgaagct agagacttct tggacatgtt cttggacatc 840
atggaaggtg gtaagtctga agttactttc actagagaac acttgaaggc tttgatcttg 900
gacttcttca ctgctggtac tgacactact gctatcgtta ctgaatgggc tatctctgaa 960
ttgatcaaca acccaaaggt tttggaaaag gctcaacaag aaatcgacaa ggttatcggt 1020
tctggtagat tggttcaaga atctgacgct ccaaacttgc catacttgat ggctgttatc 1080
aaggaaactt tcagattgca cccaccaatc ccaatgttgt ctagaaagtc tatctctgac 1140
tgtgttatcg acggttacga cgttccagct aagtctttgt tgttcgttaa catctggtct 1200
atgggtagaa acccaaagat ctgggaatct ccattggaat tcagaccaga aagattcttg 1260
gaaagagaaa agtcatctat cgacatcaag ggtcaacact tcgaattgtt gccattcggt 1320
actggtagaa gaggttgtcc aggtatgttg ttgggtatcc aagaagttgt tatcatcatc 1380
ggtactatgg ttcaatgttt cgactggaag ttgtctgacg gttctggtca agttgacatg 1440
actgaaagac caggtttgac tgctccaaga gctcacgact tgttctgtag agttgttcca 1500
agaatcaacc cagttgttgt ttctggtaac taa 1533
<210> 157
<211> 507
<212> PRT
<213> Antirrhinum majus
<400> 157
Met Ser Ser Thr Leu Val Tyr Ser Thr Leu Phe Ile Leu Ser Thr Leu
1 5 10 15
Leu Leu Thr Leu Leu Thr Arg Thr Arg Arg Lys Thr Arg Pro Pro Gly
20 25 30
Pro Leu Ala Leu Pro Leu Ile Gly His Leu His Leu Leu Gly Pro Lys
35 40 45
Leu His His Thr Phe His Gln Phe Ser Gln Arg Tyr Gly Pro Leu Ile
50 55 60
Gln Leu Tyr Leu Gly Ser Val Pro Cys Val Val Ala Ser Thr Pro Glu
65 70 75 80
Leu Ala Arg Glu Phe Leu Lys Thr His Glu Leu Asp Phe Ser Ser Arg
85 90 95
Lys His Ser Thr Ala Ile Asp Ile Val Thr Tyr Asp Ser Ser Phe Ala
100 105 110
Phe Ala Pro Tyr Gly Pro Tyr Trp Lys Phe Ile Lys Lys Leu Cys Thr
115 120 125
Tyr Glu Leu Leu Gly Ala Arg Asn Leu Ser His Phe Gln Pro Ile Arg
130 135 140
Ala Leu Glu Val Asn Ser Phe Leu Arg Ile Leu Tyr Glu Lys Thr Glu
145 150 155 160
Gln Lys Gln Ser Val Asn Val Thr Glu Glu Leu Val Lys Leu Thr Ser
165 170 175
Asn Val Ile Ser Asn Met Met Leu Gly Ile Arg Cys Ser Gly Thr Glu
180 185 190
Gly Glu Ala Glu Val Ala Arg Thr Val Ile Arg Glu Val Thr Gln Ile
195 200 205
Phe Gly Glu Phe Asp Val Ser Glu Ile Val Trp Phe Cys Lys Asn Leu
210 215 220
Asp Leu Gln Gly Ile Arg Lys Arg Ser Glu Asp Ile Arg Arg Arg Tyr
225 230 235 240
Asp Ala Leu Leu Glu Lys Ile Ile Ser Asp Arg Glu Arg Leu Arg Leu
245 250 255
Arg Gly Gly Gly Gly Gly Gly Gly Gly Glu Val Lys Asp Phe Leu Asp
260 265 270
Met Leu Leu Asp Val Met Glu Ser Glu Lys Ser Glu Val Glu Phe Thr
275 280 285
Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe Thr Ala Gly Thr
290 295 300
Asp Thr Thr Ala Ile Thr Thr Glu Trp Ala Ile Ala Glu Leu Ile Ser
305 310 315 320
Asn Pro Asn Val Leu Lys Lys Ala Gln Glu Glu Met Asp Lys Val Ile
325 330 335
Gly Ser Gln Arg Leu Leu Gln Glu Ser Asp Ala Pro Asn Leu Pro Tyr
340 345 350
Leu Asn Ala Ile Ile Lys Glu Thr Phe Arg Leu His Pro Pro Ile Pro
355 360 365
Met Leu Thr Arg Lys Ser Ile Ser Asp Val Val Val Asn Gly Tyr Thr
370 375 380
Ile Pro Ala Lys Thr Leu Leu Phe Val Asn Leu Trp Ser Met Gly Arg
385 390 395 400
Asn Pro Asn Tyr Trp Glu Asn Pro Met Glu Phe Arg Pro Glu Arg Phe
405 410 415
Leu Glu Lys Gly Thr Gly Ser Ile Asp Val Lys Gly Gln His Phe Glu
420 425 430
Leu Leu Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro Gly Met Leu Leu
435 440 445
Gly Met Gln Glu Leu Phe Ser Ile Ile Gly Ala Met Val Gln Cys Phe
450 455 460
Asp Trp Lys Leu Pro Asp Gly Val Lys Ser Val Asp Met Thr Glu Arg
465 470 475 480
Pro Gly Leu Thr Ala Pro Arg Ala Asn Asp Leu Val Cys Gln Leu Val
485 490 495
Pro Arg Ile Asp Pro Val Val Val Ser Gly Pro
500 505
<210> 158
<211> 1524
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 157
<400> 158
atgtcctcta ctttggttta ctctactttg ttcatcttgt ctactttgtt gttgactttg 60
ttgactagaa ctagaagaaa gactagacca ccaggtccat tggctttgcc attgatcggt 120
cacttgcact tgttgggtcc aaagttgcac cacactttcc accaattctc tcaaagatac 180
ggtccattga tccaattgta cttgggttct gttccatgtg ttgttgcttc tactccagaa 240
ttggctagag aattcttgaa aactcacgaa ttggacttct cttctagaaa gcactctact 300
gctatcgaca tcgttactta cgactcttct ttcgctttcg ctccatacgg tccatactgg 360
aagttcatca agaagttgtg tacttacgaa ttgttgggtg ctagaaactt gtctcacttc 420
caaccaatca gagctttgga agttaactct ttcttgagaa tcttgtacga aaagactgaa 480
caaaagcaat ctgttaacgt tactgaagaa ttggttaagt tgacttctaa cgttatctct 540
aacatgatgt tgggtatcag atgttctggt actgaaggtg aagctgaagt tgctagaact 600
gttatcagag aagttactca aatcttcggt gaattcgacg tttctgaaat cgtttggttc 660
tgtaagaact tggacttgca aggtatcaga aagagatctg aagatatcag aagaagatac 720
gacgctttgt tggaaaagat catctctgac agagaaagat tgagattgag aggtggtggt 780
ggtggtggtg gtggtgaagt taaggacttc ttggacatgt tgttggacgt tatggaatct 840
gaaaagtctg aagttgaatt cactagagaa cacttgaagg ctttgatctt ggacttcttc 900
actgctggta ctgacactac tgctatcact actgaatggg ctatcgctga attgatctct 960
aacccaaacg ttttgaagaa ggctcaagaa gaaatggaca aggttatcgg ttctcaaaga 1020
ttgttgcaag aatctgacgc tccaaacttg ccatacttga acgctatcat caaggaaact 1080
ttcagattgc acccaccaat cccaatgttg actagaaagt ctatctctga cgttgttgtt 1140
aacggttaca ctatcccagc taagactttg ttgttcgtta acttgtggtc tatgggtaga 1200
aacccaaact actgggaaaa cccaatggaa ttcagaccag aaagattctt ggaaaagggt 1260
actggttcta tcgacgttaa gggtcaacac ttcgaattgt tgccattcgg tactggtaga 1320
agaggttgtc caggtatgtt gttgggtatg caagaattgt tctctatcat cggtgctatg 1380
gttcaatgtt tcgactggaa gttgccagac ggtgttaagt ctgttgacat gactgaaaga 1440
ccaggtttga ctgctccaag agctaacgac ttggtttgtc aattggttcc aagaatcgac 1500
ccagttgttg tttctggtcc ataa 1524
<210> 159
<211> 511
<212> PRT
<213> Erythranthe lewisii
<400> 159
Met Ser Asn Gln Thr Met Asp Leu Pro Glu Ile Cys Leu Tyr Ala Val
1 5 10 15
Ile Leu Phe Val Ser Thr Leu Leu Ile Leu Gly Ile Tyr Lys Arg Lys
20 25 30
Arg Ser His Ile Pro Ser Pro Pro Gly Pro Phe Ala Leu Pro Val Ile
35 40 45
Gly His Leu His Leu Leu Gly Pro Arg Ile His His Thr Phe His Asp
50 55 60
Leu Ser Gln Arg Tyr Gly Pro Leu Phe Gln Leu Ser Leu Gly Ser Val
65 70 75 80
Arg Cys Val Val Val Ser Thr Pro Glu Leu Ala Arg Glu Phe Leu Lys
85 90 95
Thr His Glu Leu Val Phe Ser Ser Arg Lys His Thr Thr Ala Ile Asp
100 105 110
Ile Val Thr Tyr Glu Ser Ser Phe Ala Phe Ser Pro Tyr Gly Pro Tyr
115 120 125
Trp Lys Tyr Ile Lys Lys Leu Cys Thr Tyr Glu Leu Leu Gly Ala Arg
130 135 140
Asn Leu Ala Asn Phe Glu Pro Val Arg Asn Val Glu Ile Lys Asp Phe
145 150 155 160
Leu Lys Val Met Ser Asn Lys Ala Asn Thr Gly Glu Ile Val Asn Val
165 170 175
Thr Glu Glu Leu Val Lys Leu Thr Ser Asn Val Ile Ser His Met Met
180 185 190
Leu Gly Ile Arg Cys Ser Gly Thr Glu Gly Glu Ala Glu Ala Ala Arg
195 200 205
Asn Val Ile Arg Asp Val Thr Gln Ile Phe Gly Glu Phe Asp Val Ser
210 215 220
Asp Ile Ile Trp Phe Cys Lys Asn Phe Asp Leu Gln Gly Ile Arg Arg
225 230 235 240
Arg Ser Glu Asp Ile Gln Lys Arg Tyr Asp Gly Leu Leu Glu Lys Ile
245 250 255
Ile Thr Asp Arg Glu Lys Thr Arg Gly Gly Gly Gly Gly Gly Val Lys
260 265 270
Asp Phe Leu Asp Met Leu Leu Asp Val Met Asp Ser Lys Asn Ser Asp
275 280 285
Val Lys Phe Thr Arg Glu His Leu Lys Ala Leu Ile Leu Asp Phe Phe
290 295 300
Thr Ala Gly Thr Asp Thr Thr Ala Ile Ala Val Glu Trp Ser Ile Ala
305 310 315 320
Glu Leu Leu Arg Asn Pro Lys Val Ile Lys Lys Ala Gln Gln Glu Ile
325 330 335
Asp Asn Val Val Gly Ser Gln Arg Leu Leu Gln Glu Ser Asp Ala Pro
340 345 350
Lys Leu Pro Tyr Ile Met Ala Ile Ile Lys Glu Thr Phe Arg Leu His
355 360 365
Pro Pro Ile Pro Met Ile Ser Arg Lys Ser Val Ser Asp Cys Ala Ile
370 375 380
Asn Gly Cys Met Ile Arg Ala Asn Thr Leu Leu Phe Val Asn Ile Trp
385 390 395 400
Ser Ile Gly Arg Asn Pro Met Tyr Trp Glu Arg Pro Met Glu Phe Arg
405 410 415
Pro Glu Arg Phe Leu Asp Pro Gly Cys Gly Ser Ile Asp Val Lys Gly
420 425 430
Gln Asn Phe Glu Leu Met Pro Phe Gly Thr Gly Arg Arg Gly Cys Pro
435 440 445
Gly Met Leu Leu Ala Met Gln Glu Leu Val Ala Ile Ile Gly Ala Met
450 455 460
Val Gln Cys Phe Glu Trp Gln Leu Pro Asp Asp Ser Gln Asp Val Asp
465 470 475 480
Met Thr Glu Arg Pro Gly Leu Thr Ala Pro Arg Ala Asn Asp Leu Phe
485 490 495
Cys Arg Val Val Pro Arg Val Asp Val Ala Val Val Ser Gly Asn
500 505 510
<210> 160
<211> 1536
<212> DNA
<213> artificial
<220>
<223> coding sequence for SEQ ID NO: 159
<400> 160
atgtccaacc aaactatgga cttgccagaa atctgtttgt acgctgttat cttgttcgtt 60
tctactttgt tgatcttggg tatctacaag agaaagagat ctcacatccc atctccacca 120
ggtccattcg ctttgccagt tatcggtcac ttgcacttgt tgggtccaag aatccaccac 180
actttccacg acttgtctca aagatacggt ccattgttcc aattgtcttt gggttctgtt 240
agatgtgttg ttgtttctac tccagaattg gctagagaat tcttgaaaac tcacgaattg 300
gttttctctt ctagaaagca cactactgct atcgacatcg ttacttacga atcttctttc 360
gctttctctc catacggtcc atactggaag tacatcaaga agttgtgtac ttacgaattg 420
ttgggtgcta gaaacttggc taacttcgaa ccagttagaa acgttgaaat caaggacttc 480
ttgaaggtta tgtctaacaa ggctaacact ggtgaaatcg ttaacgttac tgaagaattg 540
gttaagttga cttctaacgt tatctctcac atgatgttgg gtatcagatg ttctggtact 600
gaaggtgaag ctgaagctgc tagaaacgtt atcagagatg ttactcaaat cttcggtgaa 660
ttcgacgttt ctgacatcat ctggttctgt aagaacttcg acttgcaagg tatcagaaga 720
agatctgaag atatccaaaa gagatacgac ggtttgttgg aaaagatcat cactgacaga 780
gaaaagacta gaggtggtgg tggtggtggt gttaaggact tcttggacat gttgttggac 840
gttatggact ctaagaactc tgacgttaag ttcactagag aacacttgaa ggctttgatc 900
ttggacttct tcactgctgg tactgacact actgctatcg ctgttgaatg gtctatcgct 960
gaattgttga gaaacccaaa ggttatcaag aaggctcaac aagaaatcga caacgttgtt 1020
ggttctcaaa gattgttgca agaatctgac gctccaaagt tgccatacat catggctatc 1080
atcaaggaaa ctttcagatt gcacccacca atcccaatga tctctagaaa gtctgtttct 1140
gactgtgcta tcaacggttg tatgatcaga gctaacactt tgttgttcgt taacatctgg 1200
tctatcggta gaaacccaat gtactgggaa agaccaatgg aattcagacc agaaagattc 1260
ttggacccag gttgtggttc tatcgacgtt aagggtcaaa acttcgaatt gatgccattc 1320
ggtactggta gaagaggttg tccaggtatg ttgttggcta tgcaagaatt ggttgctatc 1380
atcggtgcta tggttcaatg tttcgaatgg caattgccag acgactctca agacgttgac 1440
atgactgaaa gaccaggttt gactgctcca agagctaacg acttgttctg tagagttgtt 1500
ccaagagttg acgttgctgt tgtttctggt aactaa 1536
Claims (32)
- - 헤스페레틴 및/또는 디오스메틴의 7 위치에서 글루코스를 가할 수 있는 플라보논 7-O-베타-D-글루코실트랜스퍼라제(UGT)를 암호화하는 이종 핵산 서열; 및
- 람노스를 헤스페레틴-7-O-글루코시드 및/또는 디오스메틴-7-O-글루코시드의 글루코스의 6 위치 내로 전달할 수 있는 6"-O-람노실트랜스퍼라제(RhaT)를 암호화하는 이종 핵산 서열; 및
- UDP-람노스를 생산할 수 있는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제(RHM)를 암호화하는 이종 핵산 서열을 포함하는 재조합 미생물. - 제1항에 있어서,
플라보논 7-O-베타-D-글루코실트랜스퍼라제가 시트러스 시넨시스(Citrus sinensis)로부터, 시트러스 클레멘티나(Citrus clementina)로부터, 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터, 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis)로부터 또는 호모 사피엔스(Homo sapiens)로부터, 바람직하게는 시트러스 시넨시스 또는 스쿠텔라리아 바이칼렌시스로부터의 효소인, 재조합 미생물. - 제1항 또는 제2항에 있어서,
플라보논 7-O-베타-D-글루코실트랜스퍼라제가 서열 번호: 113, 115, 91, 93, 95, 97, 99 및 101로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 바람직하게는 서열 번호: 113, 115, 91, 93, 95 및 97로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 재조합 미생물. - 제1항 내지 제3항 중 어느 한 항에 있어서,
플라보논 7-O-베타-D-글루코실트랜스퍼라제가 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 재조합 미생물. - 제1항 내지 제4항 중 어느 한 항에 있어서,
6"-O-람노실트랜스퍼라제가 시트러스 속(genus Citrus) 또는 페투니아 하이브리다(Petunia hybrida), 바람직하게는 시트러스 시넨시스(Citrus sinensis), 시트러스 막시마(Citrus maxima) 또는 시트러스 클레멘티나(Citrus clementina), 보다 바람직하게는 시트러스 시넨시스 또는 시트러스 클레멘티나의 효소인, 재조합 미생물. - 제1항 내지 제5항 중 어느 한 항에 있어서,
6"-O-람노실트랜스퍼라제가 서열 번호: 103 및 105로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고; 바람직하게는, 6"-O-람노실트랜스퍼라제가 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되는, 재조합 미생물. - 제1항 내지 제6항 중 어느 한 항에 있어서,
UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 시트러스 시넨시스 또는 아라비돕시스 탈리아나로부터 유래되는, 재조합 미생물. - 제1항 내지 제6항 중 어느 한 항에 있어서,
UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 서열 번호: 107, 109 및 111로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고; 바람직하게는, UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 재조합 미생물. - 제1항 내지 제8항 중 어느 한 항에 있어서,
- 플라보논 7-O-베타-D-글루코실트랜스퍼라제가 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고;
- 6"-O-람노실트랜스퍼라제가 서열 번호: 103으로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택되고;
- UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제가 서열 번호: 107로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드로부터 선택된, 재조합 미생물. - 제1항 내지 제9항 중 어느 한 항에 있어서, 미생물이,
- 타이로신 암모니아 리아제(TAL)를 암호화하는 이종 핵산 서열;
- 4-쿠마린-CoA 리가제(4CL)를 암호화하는 이종 핵산 서열;
- 나린게닌-찰콘 신타제(CHS)를 암호화하는 이종 핵산 서열; 및
- 찰콘 이소머라제(CHI)를 암호화하는 이종 핵산 서열;을 또한 포함하는, 재조합 미생물. - 제10항에 있어서,
- 로도토룰라 글루티니스(Rhodotorula glutinis) 또는 플라보박테리움 존소니아에(Flavobacterium johnsoniae)로부터의 타이로신 암모니아 리아제(TAL)를, 특히 서열 번호: 41 및 39로부터 선택된 서열을 포함하는 TAL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를; 바람직하게는 서열 번호: 41로부터 선택된 서열을 포함하는 TAL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는, 이종 핵산 서열;
- 아라비돕시스 탈리아나(Arabidopsis thaliana), 시트러스 클레멘티나(Citrus clementina), 페트로셀리눔 크리스품(Petroselinum crispum) 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 4-쿠마로일-CoA 리가제(4CL)를; 바람직하게는 서열 번호: 123, 125, 43, 45, 47 및 49로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를; 특히 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 및 바람직하게는 서열 번호: 45로부터 선택된 서열을 포함하는 4CL 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는, 이종 핵산 서열;
- 시트러스 시넨시스, 호르데눔 불가레(Hordeum vulgare) 또는 스트렙토마이세스 클라불리게루스(Streptomyces clavuligerus)로부터의 찰콘 신타제(CHS)를, 특히 서열 번호: 53, 51, 55 및 57로부터 선택된 서열을 포함하는 CHS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 53으로부터 선택된 서열을 포함하는 CHS 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 아라비돕시스 탈리아나(Arabidopsis thaliana) 또는 스트렙토마이세스 클라부리게루스로부터의 찰콘 이소머라제(CHI)를, 특히 서열 번호: 61 및 59로부터 선택된 서열을 포함하는 CHI 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 61로부터 선택된 서열을 포함하는 CHI 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물. - 제10항 또는 제11항에 있어서,
- 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 123, 125 및 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물. - 제10항 내지 제12항 중 어느 한 항에 있어서,
- 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 45로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물. - 제1항 내지 제13항 중 어느 한 항에 있어서,
플라보노이드 3'-모노옥시게나제(F3'H)를 암호화하는 이종 핵산 서열을 또한 포함함을 특징으로 하는, 재조합 미생물. - 제14항에 있어서,
미생물이 칼리스테푸스 키넨시스(Callistephus chinensis), 페릴라 프루테스센스 바르. 크리스파(Perilla frutescens var. crispa), 페투니아 엑스 하이브리다(Petunia x hybrida), 게르베라 하이브리다(Gerbera hybrida), 시트러스 시넨시스(Citrus sinensis), 아라비돕시스 탈리아나(Arabidopsis thaliana), 시트러스 클레멘티나, 오스테오스페르뭄 하이브리드 쿨티바르(Osteospermum hybrid cultivar), 파네로차에테 크리소스포리움(Phanerochaete chrysosporium), 스트렙토마이세스 아베르미틸리스(Streptomyces avermitilis) 또는 피로셀라 오피시나룸(Pilosella officinarum)으로부터의 플라보노이드 3'-모노옥시게나제(F3'H), 바람직하게는 서열 번호: 7, 1, 3, 5, 9, 11, 13, 15, 17, 19, 21 및 121로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7, 11, 17 및 121을 갖는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드로부터 선택되는 효소를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물. - 제14항 또는 제15항에 있어서,
미생물이 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열을 포함하는 F3'H 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물. - 제1항 내지 제16항 중 어느 한 항에 있어서,
O-메틸트랜스퍼라제(OMT)를 암호화하는 이종 핵산 서열을 또한 포함함을 특징으로 하는, 재조합 미생물. - 제17항에 있어서,
미생물이 시트러스, 특히 시트러스 클레멘티나 또는 시트러스 시넨시스로부터, 호모 사피엔스(Homo sapiens)로부터 또는 아라비돕시스 탈리아나로부터의 O-메틸-트랜스퍼라제(OMT), 바람직하게는 서열 번호: 119, 117, 87 및 89로부터 선택된 서열을 포함하는 효소 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물. - 제17항 또는 제18항에 있어서,
서열 번호: 119, 117 및 89로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 119 및 117로부터 선택된 서열 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물. - 제1항 내지 제19항 중 어느 한 항에 있어서,
- 페닐알라닌 암모니아 리아제(PAL)를, 특히 서열 번호: 63, 65 및 77, 바람직하게는 서열 번호: 65 및 77로부터 선택된 서열을 포함하는 PAL, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 및 보다 특히 바람직하게는 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 신나메이트 4-하이드록실라제(C4H)를, 특히 서열 번호: 67, 69 및 79로부터 선택된 서열을 포함하는 C4H, 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 폴리펩타이드를, 및 가장 특히 바람직하게는 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 또한 포함하는, 재조합 미생물. - 제1항 내지 제20항 중 어느 한 항에 있어서,
플라본 신타제(FNS)를 암호화하는 이종 또는 내인성 핵산 서열을 또한 포함하는, 재조합 미생물. - 제21항에 있어서,
아라비돕시스 탈리아나, 로니세라 자포니카(Lonicera japonica), 로니세라 마크란토이데스(Lonicera macranthoides), 메디카고 트룬카툴라(Medicago truncatula), 오리자 사티바(Oryza sativa), 페트로셀리눔 크리스품(Petroselinum crispum), 포풀루스 델토이데스(Populus deltoides), 제아 마이스(Zea mays), 칼리스테푸스 키넨시스(Callistephus chinensis), 아피움 그라베올렌스(Apium graveolens), 메디카고 트룬카툴라(Medicago truncatula), 쿠미눔 시미눔(Cuminum cyminum), 아에투사 시나피움(Aethusa cynapium), 안젤리카 아르칸젤리카(Angelica archangelica), 코니움 마쿨라툼(Conium maculatum), 카멜리아 시넨시스(Camellia sinensis), 시나라 카르둔쿨루스 바르 시콜리무스(Cynara cardunculus var scolymus), 사우쑤레아 메두사(Saussurea medusa), 플렉트란투스 바르바투스(Plectranthus barbatus), 스쿠텔라리아 바이칼렌시스(Scutellaria baicalensis), 도르코세라스 하이그로메트리쿰(Dorcoceras hygrometricum), 안티리눔 마주스(Antirrhinum majus), 페릴라 프루테스센스 바르 크리스파(Perilla frutescens var crispa), 다흘리아 핀나타(Dahlia pinnata) 또는 에리트란테 레위시이(Erythranthe lewisii), 바람직하게는 로니세라 자포니카, 로니세라 마크란토이데스 및 페트로셀리눔 크리스품으로부터의 플라본 신타제(FNS)를, 바람직하게는 서열 번호: 33, 35, 37, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157 및 159로부터 선택된 서열을 포함하는 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 33, 35 및 37로부터 선택된 서열을 포함하는 효소로부터의 FNS 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물. - 제1항 내지 제22항 중 어느 한 항에 있어서,
- 시토크롬 P450 리덕타제(CPR)를 암호화하는 이종 핵산 서열; 및/또는
- S-아데노실메티오닌 신테타제(SAMT)를 암호화하는 이종 또는 내인성 핵산 서열;을 또한 포함하는, 재조합 미생물. - 제23항에 있어서,
미생물이 사카로마이세스 세레비지아에(Saccharomyces cerevisiae)로부터, 또는 식물, 예를 들면, 카타란투스 로세우스(Catharanthus roseus) 또는 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 시토크롬 P450 리덕타제(CPR)를; 바람직하게는, 서열 번호: 25, 23, 27, 29 및 31로부터 선택된 서열을 포함하는 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 바람직하게는 서열 번호: 23, 25 및 29로부터 선택된 서열을 포함하는 효소로부터의 CPR 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를, 및 특히 서열 번호: 25로부터 선택된 서열을 포함하는 효소 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열을 포함함을 특징으로 하는, 재조합 미생물. - 제1항 내지 제24항 중 어느 한 항에 있어서, 미생물이:
- 서열 번호: 65로부터 선택된 서열을 포함하는 페닐알라닌 암모니아 리아제(PAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 페닐알라닌 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 79로부터 선택된 서열을 포함하는 신나메이트 4-하이드록실라제(C4H) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 신나메이트 4-하이드록실라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 41로부터 선택된 서열을 포함하는 타이로신 암모니아 리아제(TAL) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 타이로신 암모니아 리아제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 45 또는 123으로부터 선택된 서열을 포함하는 4-쿠마로일-CoA 리가제(4CL) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 4-쿠마레이트-CoA 리가제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 53으로부터 선택된 서열을 포함하는 찰콘 신타제(CHS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 61로부터 선택된 서열을 포함하는 찰콘 이소머라제(CHI) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 찰콘 이소머라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 7, 17 및 121로부터 선택된 서열을 포함하는 플라보노이드 3'-모노옥시게나제(F3'H) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 7로부터 선택된 서열 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보노이드 3'-모노옥시게나제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;
- 서열 번호: 37로부터 선택된 서열을 포함하는 플라본 신타제(FNS) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라본 신타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 25로부터 선택된 서열을 포함하는 시토크롬 P450 리덕타제(CPR) 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 시토크롬 P450 리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호 117 및 119로부터 선택된 서열을 포함하는 O-메틸트랜스퍼라제(OMT) 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 117로부터 선택된 서열을 포함하는 OMT 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 동일성을 갖고 O-메틸트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 113 및 95로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제 및 이러한 서열 중 하나와 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드, 바람직하게는 서열 번호: 113으로부터 선택된 서열을 포함하는 플라보논 7-O-베타-D-글루코실트랜스퍼라제 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 플라보논 7-O-베타-D-글루코실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 103으로부터 선택된 서열을 포함하는 6"-O-람노실트랜스퍼라제 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 6"-O-람노실트랜스퍼라제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열; 및
- 서열 번호: 107로부터 선택된 서열을 포함하는 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 및 이러한 서열과 적어도 60, 70, 80, 85, 90 또는 95% 서열 동일성을 갖고 UDP-글루코스 4,6-데하이드라타제/UDP-4-케토-6-데옥시-D-글루코스 3,5-에피머라제/UDP-4-케토-L-람노스-리덕타제 활성을 갖는 서열을 포함하는 폴리펩타이드를 암호화하는 이종 핵산 서열;을 포함함을 특징으로 하는, 재조합 미생물. - 제1항 내지 제25항 중 어느 한 항에 있어서,
미생물이 효모 또는 세균, 바람직하게는 사카로마이세스 속의 효모, 특히 사카로마이세스 세레비지아에, 또는 세균, 예를 들면, 에스케리키아 콜라이(Escherichia coli)인, 재조합 미생물. - 디오스민 및/또는 헤스페리딘의 생산을 위한, 제1항 내지 제26항 중 어느 한 항에 따른 재조합 미생물의 용도.
- 제1항 내지 제26항 중 어느 한 항에 따른 재조합 미생물을 배양하는 단계 및 디오스민 및/또는 헤스페리딘을 수거(harvesting)하는 단계를 포함하는, 디오스민 및/또는 헤스페리딘의 생산 방법.
- 헤스페리딘의 생산을 위한, 제27항에 따른 용도 또는 제28항에 따른 방법.
- 디오스민의 생산을 위한 제27항에 따른 용도 또는 제28항에 따른 방법.
- 헤스페리딘 및 디오스민의 생산을 위한, 제27항에 따른 용도 또는 제28항에 따른 방법.
- 나린게닌, 아피게닌, 에리오딕티올, 루테올린, 헤스페레틴 및/또는 디오스메틴이 배양 배지에 보충되지 않음을 특징으로 하는, 제27항, 제29항, 제30항 및 제31항 중 어느 한 항에 따른 용도 또는 제28항 내지 제31항 중 어느 한 항에 따른 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19305163.8 | 2019-02-11 | ||
EP19305163 | 2019-02-11 | ||
PCT/EP2020/053503 WO2020165189A1 (fr) | 2019-02-11 | 2020-02-11 | Methode de biosynthese de la diosmine et/ou de l'hesperidine dans un microorganisme |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210126061A true KR20210126061A (ko) | 2021-10-19 |
Family
ID=65635605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217028541A KR20210126061A (ko) | 2019-02-11 | 2020-02-11 | 미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11987829B2 (ko) |
EP (1) | EP3924498A1 (ko) |
KR (1) | KR20210126061A (ko) |
CN (1) | CN113574177A (ko) |
BR (1) | BR112021015766A2 (ko) |
CA (1) | CA3129605A1 (ko) |
WO (1) | WO2020165189A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220031771A1 (en) * | 2020-07-31 | 2022-02-03 | Iowa State University Research Foundation, Inc. | Microencapsulated and chromosome integrated compositions for l-dopa microbiome therapy |
CN112391360B (zh) * | 2020-11-04 | 2022-09-06 | 江南大学 | 黄酮3β-羟化酶还原酶突变体及其应用 |
CN112391397B (zh) * | 2020-11-25 | 2023-01-31 | 云南中烟工业有限责任公司 | 一种烟草黄酮单加氧酶基因NtCYP75B2及其应用 |
CN112921049B (zh) * | 2021-02-06 | 2024-01-23 | 石河子大学 | 一种用于生产香草醛的基因片段、酿酒酵母工程菌及其构建方法 |
CN112725256B (zh) * | 2021-02-22 | 2023-01-20 | 湖南省农产品加工研究所 | 重组大肠杆菌及利用重组大肠杆菌生物合成香叶木素的方法 |
CN114181964B (zh) * | 2021-11-02 | 2023-06-09 | 云南大学 | 一种表达盒组合、重组载体和重组酿酒酵母及其应用 |
CN114164161B (zh) * | 2022-02-15 | 2022-05-13 | 佛山市汇腾生物技术有限公司 | 一种生产新橙皮苷的双酶共表达菌株及其构建方法和应用 |
CN114574458B (zh) * | 2022-02-28 | 2023-07-18 | 江南大学 | 可以提高柚皮素产量的查尔酮合成酶突变体 |
CN117330677B (zh) * | 2023-11-24 | 2024-02-23 | 成都凡微析医药科技有限公司 | 一种用于柑橘黄酮片生物等效性研究的香叶木素和橙皮素定量检测的方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8809028B2 (en) | 2011-11-07 | 2014-08-19 | University Of Georgia Research Foundation, Inc. | Biosynthesis of caffeic acid and caffeic acid derivatives by recombinant microorganisms |
EP3083937B1 (en) | 2013-12-20 | 2019-03-13 | Deinove | Is-targeting system for gene insertion and genetic engineering in deinococcus bacteria |
ES2909313T3 (es) | 2016-08-30 | 2022-05-06 | Chengdu Okay Pharmaceutical Co Ltd | Método de preparación de diosmina |
CN108504680A (zh) * | 2018-03-01 | 2018-09-07 | 华中农业大学 | 一种橙皮苷的制备方法 |
WO2019076021A1 (zh) * | 2018-04-25 | 2019-04-25 | 邦泰生物工程(深圳)有限公司 | 一种橙皮素的制备方法、橙皮素中间体的制备方法和用于制备橙皮素的生物酶 |
-
2020
- 2020-02-11 EP EP20703068.5A patent/EP3924498A1/fr active Pending
- 2020-02-11 US US17/429,459 patent/US11987829B2/en active Active
- 2020-02-11 CN CN202080020228.0A patent/CN113574177A/zh active Pending
- 2020-02-11 KR KR1020217028541A patent/KR20210126061A/ko unknown
- 2020-02-11 CA CA3129605A patent/CA3129605A1/fr active Pending
- 2020-02-11 WO PCT/EP2020/053503 patent/WO2020165189A1/fr unknown
- 2020-02-11 BR BR112021015766A patent/BR112021015766A2/pt unknown
Also Published As
Publication number | Publication date |
---|---|
WO2020165189A1 (fr) | 2020-08-20 |
US11987829B2 (en) | 2024-05-21 |
BR112021015766A2 (pt) | 2021-11-03 |
US20220042061A1 (en) | 2022-02-10 |
CA3129605A1 (fr) | 2020-08-20 |
CN113574177A (zh) | 2021-10-29 |
EP3924498A1 (fr) | 2021-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20210126061A (ko) | 미생물 내 디오스민 및/또는 헤스페리딘의 생합성 방법 | |
US20210198711A1 (en) | Production of steviol glycosides in recombinant hosts | |
US11807888B2 (en) | Production of steviol glycoside in recombinant hosts | |
AU2020200157B2 (en) | Recombinant production of steviol glycosides | |
CN113748204A (zh) | 在微生物中生物合成香叶木素和/或橙皮素的方法 | |
KR101827230B1 (ko) | 디올의 제조 방법 | |
KR101983115B1 (ko) | 사프란 화합물의 재조합 생성을 위한 방법 및 물질 | |
CN107771214B (zh) | 用于具有增加的2,4-二羟基丁酸外排物的优化的2,4-二羟基丁酸产生的修饰的微生物 | |
KR20170025315A (ko) | 3-hp를 생산할 수 있는 재조합 효모 및 이를 이용한 3-hp의 제조방법 | |
KR20180132696A (ko) | 재조합 숙주에서의 스테비올 글리코사이드의 생산 | |
CN114207108A (zh) | 产生糖基化大麻素的基因修饰的宿主细胞 | |
WO2018211032A1 (en) | Production of steviol glycosides in recombinant hosts | |
US20190071474A1 (en) | Production of gibberellins in recombinant hosts | |
AU2018200459A1 (en) | Recombinant production of steviol glycosides | |
CN114317306B (zh) | 一种合成白藜芦醇的基因工程菌株及其构建方法与应用 | |
KR20220088729A (ko) | 폴리아민 콘쥬게이트를 생산하는 효모 |