BR112020017490A2 - Produção microbiana de triterpenoides incluindo mogrosídeos - Google Patents

Produção microbiana de triterpenoides incluindo mogrosídeos Download PDF

Info

Publication number
BR112020017490A2
BR112020017490A2 BR112020017490-4A BR112020017490A BR112020017490A2 BR 112020017490 A2 BR112020017490 A2 BR 112020017490A2 BR 112020017490 A BR112020017490 A BR 112020017490A BR 112020017490 A2 BR112020017490 A2 BR 112020017490A2
Authority
BR
Brazil
Prior art keywords
amino acid
seq
acid sequence
fact
mog
Prior art date
Application number
BR112020017490-4A
Other languages
English (en)
Inventor
Ryan PHILIPPE
Ajikumar Parayil KUMARAN
Christine Nicole S. Santos
Michelle N. Goettge
Original Assignee
Manus Bio, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Manus Bio, Inc. filed Critical Manus Bio, Inc.
Publication of BR112020017490A2 publication Critical patent/BR112020017490A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • C12P5/026Unsaturated compounds, i.e. alkenes, alkynes or allenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L2/00Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
    • A23L2/52Adding ingredients
    • A23L2/60Sweeteners
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0014Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0083Miscellaneous (1.14.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids
    • C12P33/20Preparation of steroids containing heterocyclic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01017Glucuronosyltransferase (2.4.1.17)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • A23L27/30Artificial sweetening agents
    • A23L27/33Artificial sweetening agents containing sugars or derivatives
    • A23L27/36Terpene glycosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/99Miscellaneous (1.14.99)
    • C12Y114/99007Squalene monooxygenase (1.14.99.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01021Squalene synthase (2.5.1.21), i.e. farnesyl-disphosphate farnesyltransferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y303/00Hydrolases acting on ether bonds (3.3)
    • C12Y303/02Ether hydrolases (3.3.2)
    • C12Y303/02003Epoxide hydrolase (3.3.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y504/00Intramolecular transferases (5.4)
    • C12Y504/99Intramolecular transferases (5.4) transferring other groups (5.4.99)
    • C12Y504/99033Cucurbitadienol synthase (5.4.99.33)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Food Science & Technology (AREA)
  • Polymers & Plastics (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Steroid Compounds (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)

Abstract

a presente invenção fornece células hospedeiras e métodos para a produção de glicosídeos de mogrol, incluindo mogrosídeo v (mog. v), mogrosídeo vi (mog. vi), iso-mogrosídeo v (isomog. v), e produtos de glicosilação que são produtos secundários em siraitiagrosvenorii. a invenção fornece enzimas manipuladas e células hospedeiras manipuladas para a produção de produtos de glicosilação de mogrol, tais como mog. v, mog. vi e isomog. v, com pureza e/ou rendimento elevados. a presente tecnologia fornece ainda métodos de produção de produtos contendo glicosídeos de mogrol, tais como mog. v, mog. vi e isomog. v, incluindo produtos alimentícios, bebidas, produtos para higiene bucal, adoçantes e aromatizantes.

Description

PRODUÇÃO MICROBIANA DE TRITERPENOIDES INCLUINDO MOGROSÍDEOS FUNDAMENTOS
[0001] Mogrosídeos são metabólitos secundários especializados derivados do triterpeno, encontrados no fruto da planta Siraitia grosvenorii da família Cucurbitaceae (também conhecida como fruta-dos-monges ou Luohan Guo). Sua biossíntese no fruto envolve um número de glicosilações consecutivas do mogrol de aglicona para os produtos doces finais Mogrosídeo V (Mog. V). A indústria de alimentos está aumentando o uso do extrato de fruto de mogrosídeo como um adoçante alimentar natural sem açúcar. Por exemplo, Mog. V tem uma capacidade adoçante que é ~ 250 vezes a da sacarose (Kasai et al., Agric Biol Chem (1989)). Além disso, benefícios adicionais dos mogrosídeos para a saúde foram revelados em estudos recentes (Li et al., Chin J Nat Med (2014)). Uma variedade de fatores está promovendo um aumento no interesse na pesquisa e comercialização de mogrosídeos e da fruta-dos-monges em geral, incluindo, por exemplo, a explosão na popularidade e na demanda por adoçantes naturais; as dificuldades no fornecimento escalonável do atual adoçante natural principal, rebaudiosídeo M (RebM), da planta Stevia; o desempenho de sabor superior do mogrosídeo V em relação a outros produtos adoçantes naturais e artificiais no mercado; e o potencial medicinal da planta e do fruto.
[0002] Mog. V purificado foi aprovado como um adoçante de alta intensidade no Japão (Jakinovich et al., Journal of Natural Products (1990)) e o extrato ganhou o status de GRAS nos EUA como um adoçante não nutritivo e intensificador de sabor (GRAS 522). A extração de mogrosídeos do fruto pode render um produto de vários graus de pureza, muitas vezes acompanhado de gosto residual indesejável. Além disso, os rendimentos de mogrosídeo do fruto cultivado são limitados devido ao baixo rendimento das plantas e aos requisitos específicos de cultivo da planta. Os mogrosídeos estão presentes em cerca de 1% nos frutos frescos e cerca de 4% nos frutos secos (Li HB, et al., 2006). Mog. V é o principal componente, com teor de 0,5% a 1,4% no fruto seco. Além disso, as dificuldades de purificação limitam a pureza de Mog. V, com produtos comerciais de extratos de plantas sendo padronizados para cerca de 50% Mog. V. É altamente provável que um produto de Mog. V puro terá maior sucesso comercial do que a mistura, uma vez que é menos provável que tenha sabores estranhos, será mais fácil de formular em produtos e tem um bom potencial de solubilidade. Portanto, é vantajoso ser capaz de produzir compostos doces de mogrosídeo por meio de processos biotecnológicos.
SUMÁRIO
[0003] A presente invenção, em vários aspectos e modalidades, fornece um método para produzir glicosídeos de mogrol, bem como outros compostos triterpenoides, usando processos microbianos recombinantes. Em outros aspectos, a invenção fornece métodos para produzir produtos, incluindo alimentos, bebidas e adoçantes (entre outros), incorporando os glicosídeos de mogrol produzidos de acordo com os métodos descritos neste documento.
[0004] Em um aspecto, a invenção fornece um método para preparar um composto triterpenoide. O método compreende o fornecimento de uma célula hospedeira microbiana recombinante que expressa uma via de enzima heteróloga que catalisa a conversão de isopentenil pirofosfato (IPP) e/ou dimetilalil pirofosfato (DMAPP) em um ou mais compostos triterpenoides. A via enzimática heteróloga compreende uma farnesil difosfato sintase (FPPS) e uma esqualeno sintase (SQS), que são expressas de forma recombinante. Em várias modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 2 a 16, 166 e 167. A célula hospedeira é cultivada em condições para a produção do triterpenoide.
[0005] A célula hospedeira microbiana em várias modalidades pode ser procariótica ou eucariótica. Em algumas modalidades, a célula hospedeira microbiana é uma bactéria, como Escherichia coli, ou a célula microbiana pode ser uma célula de levedura. Em algumas modalidades, a célula hospedeira é uma célula hospedeira bacteriana ou de levedura manipulada para aumentar a produção de IPP e DMAPP a partir da glicose.
[0006] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Artemisia annua (SEQ ID NO: 11). AaSQS tem alta atividade em E. coli. Outras enzimas SQS que são ativas em E. coli (incluindo com condições de cultura a 37° C) incluem SQS de Siraitia grosvenorii (SEQ ID NO: 2), SQS de Euphorbia lathyris (SEQ ID NO: 14), SQS de Eleutherococcus senticosus (SEQ ID NO: 16), SQS de Flavobacteriales bacterium (SEQ ID NO: 166) e SQS de Bacteroietes bacterium (SEQ ID NO: 167).
[0007] Em várias modalidades, a via de enzima heteróloga produz esqualeno, que é opcionalmente um intermediário que atua como um substrato para enzimas adicionais da via a jusante. Em algumas modalidades, o esqualeno é recuperado da cultura e pode ser recuperado das células microbianas e/ou pode ser recuperado dos meios e/ou de uma camada orgânica.
[0008] Em várias modalidades, a célula hospedeira expressa uma ou mais enzimas que produzem mogrol a partir do esqualeno. Por exemplo, a célula hospedeira pode expressar um ou mais dentre esqualeno epoxidase (SQE), cucurbitadienol sintase (CDS), epóxido hidrolase (EPH), citocromo P450 oxidases (CYP450), oxigenases não heme dependentes de ferro e citocromo P450 reductases (CPR).
[0009] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma esqualeno epoxidase (SQE). Por exemplo, a via de enzima heteróloga pode compreender uma SQE que produz 2,3-oxidosqualeno. Esqualeno epoxidases exemplares podem compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a qualquer uma das SEQ ID NOS: 17 a 39, 168, 169 e
170. Por exemplo, a esqualeno epoxidase pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39). MlSQE tem alta atividade em E. coli. Além disso, quando coexpresso com AaSQS, foi observado uma alta titulação do produto epoxilado único (2,3-oxidosqualeno). Consequentemente, a coexpressão de AaSQS (ou um derivado manipulado) com MsSQE (ou um derivado manipulado) tem um bom potencial para biomanipulação da via de mogrol. Enzimas SQE alternativas de acordo com a divulgação incluem esqualeno epoxidase endossinbionte de Bathymodiolus azoricus (SEQ ID NO: 168), esqualeno epoxidase de Methyloprofundus sediment (SEQ ID NO: 169), esqualeno epoxidase de Methylomicrobium buryatense (SEQ ID NO: 170), e derivados manipulados destas.
[0010] Em várias modalidades, a via de enzima heteróloga compreende ainda uma triterpeno ciclase. Em algumas modalidades, onde a célula microbiana coexpressa FPPS, SQS, SQE e a triterpeno ciclase, a célula microbiana produz cucurbitadienol. O cucurbitadienol pode ser o substrato para enzimas a jusante na via heteróloga ou é, alternativamente, recuperado da cultura (seja de células microbianas, ou dos meios de cultura ou camada orgânica). Em algumas modalidades, a triterpeno ciclase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 40 a 55. Em algumas modalidades, a triterpeno ciclase tem atividade de cucurbitadienol sintetase (CDS). A CDS em várias modalidades compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos da SEQ ID NO: 40 (Siraitia grosvenorii).
[0011] Em algumas modalidades, a via de enzima heteróloga compreende ainda um epóxido hidrolase (EPH). Enzimas EPH exemplares compreendem uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos selecionada das SEQ ID NOS: 56 a 72. Em algumas modalidades, a EPH pode empregar como substrato 24,25-epoxicucurbitadienol, para a produção de 24,25-di-hidroxicucurbitadienol.
[0012] Em algumas modalidades, a via heteróloga compreende ainda uma ou mais oxidases. A uma ou mais oxidases podem ser ativas em cucurbitadienol ou produtos oxigenados deste como um substrato, adicionando (coletivamente) hidroxilações em C11, C24 e 25, produzindo assim mogrol. Enzimas oxidase exemplares são descritas neste documento.
[0013] Em várias modalidades, a via de enzima heteróloga produz mogrol, que pode ser um intermediário para enzimas a jusante na via heteróloga ou, em algumas modalidades, é recuperado da cultura. O mogrol pode ser recuperado das células hospedeiras em algumas modalidades ou, em algumas modalidades, pode ser recuperado dos meios de cultura ou da camada orgânica.
[0014] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma ou mais enzimas glicosiltransferases dependentes de difosfato de uridina (UGT), produzindo assim um ou mais glicosídeos de mogrol (ou "mogrosídeos"). O glicosídeo de mogrol pode ser pentaglicosilado ou hexaglicosilado em algumas modalidades. Em outras modalidades, o glicosídeo de mogrol tem duas, três ou quatro glicosilações. O um ou mais glicosídeos de mogrol podem ser selecionados de Mog. II-E, Mog. III-A-2, Mog. III-E, Mog. IIIx, Mog. IV-A, Mog. IV-E, Siamenosídeo, Isomog. IV e Mog. V. Em algumas modalidades, o mogrosídeo é um mogrosídeo pentaglicosilado ou hexaglicosilado.
[0015] Em algumas modalidades, a célula hospedeira expressa uma enzima UGT que catalisa a glicosilação primária de mogrol em grupos hidroxila C24 e/ou C3. Em algumas modalidades, a enzima UGT catalisa glicosilações de ramificação beta 1,2 e/ou beta 1,6 de glicosídeos de mogrol nos grupos gluscosil C3 e C24 primários. Enzimas UGT exemplares são divulgadas neste documento (SEQ ID NOS: 116 a 165). Por exemplo, em algumas modalidades, a célula microbiana expressa pelo menos quatro enzimas UGT, resultando na glicosilação de mogrol no grupo hidroxila C3, o grupo hidroxila C24, bem como uma glicosilação 1,6 adicional no grupo glicosil C3, e uma glicosilação adicional 1,6 e uma glicosilação 1,2 adicional no grupo glicosil C24. O produto de tais reações de glicosilação é Mog. V.
[0016] Por exemplo, pelo menos uma enzima UGT expressa pela célula microbiana pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165). UGT85C1, e derivados destas, fornecem glicosilação da hidroxila C3 de mogrol ou Mog. 1A.
[0017] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146). UGT85C2, e derivados destas, fornecem glicosilação da hidroxila C24 de mogrol ou Mog. 1E.
[0018] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a Coffea arabica UGT (CaUGT_1,6) (SEQ ID NO: 164). CaUGT_1,6, e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3.
[0019] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT94-289-3 de Siraitia grosvenorii (SEQ ID NO: 117). UGT94-289-3 ("Sg94_3"), e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3, bem como glicosilação beta 1,2 no grupo glicosil C24.
[0020] Em algumas modalidades, a célula microbiana expressa pelo menos uma enzima UGT capaz de catalisar a adição de beta 1,2 de uma molécula de glicose pelo menos ao grupo glicosil C24 (por exemplo, de Mog. IVA, ver FIGURA 4). Enzimas UGT exemplares de acordo com estas modalidades incluem UGT94- 289-3 de Siraitia grosvenorii (SEQ ID NO: 117), UGT91D1 de Stevia rebaudiana (SEQ ID NO: 147), UGT91D2 de Stevia rebaudiana (SEQ ID NO: 148), UGT91D2e de Stevia rebaudiana (SEQ ID NO: 149), OsUGT1-2 (SEQ ID NO: 150) ou MbUGT1-2 (SEQ ID NO: 163) ou derivados destas.
[0021] Em algumas modalidades, pelo menos uma enzima UGT é um permutante circular de uma enzima UGT de tipo selvagem, opcionalmente com substituições, deleções e/ou inserções de aminoácidos em relação à posição correspondente da enzima de tipo selvagem. Os permutantes circulares podem fornecer novas e desejáveis especificidades de substrato, perfis de produto e cinética de reação sobre as enzimas de tipo selvagem. Em algumas modalidades, pelo menos uma enzima UTG é um permutante circular de SEQ ID NO: 146, SEQ ID NO: 164 ou SEQ ID NO: 165, SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163 ou um derivado destas.
[0022] Os glicosídeos de mogrol podem ser recuperados da cultura microbiana. Por exemplo, os glicosídeos de mogrol podem ser recuperados de células microbianas ou, em algumas modalidades, são predominantemente transportados para o meio extracelular, onde podem ser recuperados ou sequestrados.
[0023] Em alguns aspectos, a invenção fornece um método para produzir um mogrosídeo pentaglicosilado ou hexaglicosilado, como Mog V. Em várias modalidades, a invenção compreende a reação de um glicosídeo de mogrol com uma pluralidade de enzimas glicosiltransferase dependentes de difosfato de uridina (UGT). Por exemplo, em algumas modalidades, uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SEQ ID NO: 164 (ou seu permutante circular), onde a enzima UGT catalisa a adição de beta 1,6 de uma glicose. Outras enzimas UGT, conforme descritas neste documento, serão coexpressas para glicosilar o substrato desejado para Mog. V.
[0024] Em algumas modalidades, o mogrol reage com cerca de quatro enzimas UGT. Uma primeira enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou um permutante circular desta Uma segunda enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou um permutante circular desta. Uma terceira enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou um permutante circular desta. Uma quarta enzima UGT é capaz de catalisar a adição de beta 1,2 de uma molécula de glicose, como SgUGT94_289_3 (SEQ ID NO: 117) ou um derivado ou permutante circular deste.
[0025] O glicosídeo de mogrol pode ser recuperado e/ou purificado da reação ou cultura. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
[0026] Em várias modalidades, a reação é realizada em uma célula microbiana e as enzimas UGT são expressas de forma recombinante na célula. Em algumas modalidades, o mogrol é produzido na célula por uma via de síntese de mogrol heteróloga, conforme descrito neste documento. Em outras modalidades, os glicosídeos de mogrol ou mogrol são alimentados às células para glicosilação. Em ainda outras modalidades, a reação é realizada in vitro usando enzima UGT purificada, enzima UGT parcialmente purificada ou lisados de células recombinantes.
[0027] Em outros aspectos, a invenção fornece um método para produzir um produto que compreende um glicosídeo de mogrol. O método compreende a produção de um glicosídeo de mogrol de acordo com esta divulgação e a incorporação do glicosídeo de mogrol em um produto. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V. Em algumas modalidades, o produto é uma composição adoçante, composição aromatizante, alimento, bebida, goma de mascar, texturizante, composição farmacêutica, produto de tabaco, composição nutracêutica ou composição de higiene oral.
[0028] O produto pode ser uma composição adoçante compreendendo uma mistura de adoçantes artificiais e/ou naturais. Por exemplo, a composição pode compreender ainda um ou mais de um glicosídeo de esteviol, aspartame e neotame.
Glicosídeos de esteviol exemplares compreendem um ou mais dentre RebM, RebB, RebD, RebA, RebE e RebI.
[0029] Outros aspectos e modalidades da invenção serão evidentes a partir da descrição detalhada seguinte.
DESCRIÇÃO DAS FIGURAS
[0030] A FIGURA 1 mostra as estruturas químicas de Mog. V, Mog. VI, e Isomog. V. O tipo de reação de glicosilação é mostrada dentro de cada fração de glicose (por exemplo, glicosilação central C3 ou C24 e as adições de glicosilação 1-2, 1-4 ou 1-6).
[0031] A FIGURA 2 mostra rotas para a produção de mogrosídeo V in vivo. A transformação enzimática necessária para cada etapa é indicada, juntamente com o tipo de enzima necessária. Os números entre parênteses correspondem às estruturas químicas na FIGURA 3. Abreviaturas: FPP, farnesil pirofosfato; SQS, esqualeno sintase; SQE, esqualeno epoxidase; TTC, triterpeno ciclase; EPH, epóxido hidrolase; CYP450, citocromo P450 com parceiro redutase; UGTs, glicosiltransferases de difosfato de uridina.
[0032] A FIGURA 3 representa estruturas químicas de metabólitos envolvidos na biossíntese de mogrosídeo V: (1) pirofosfato de farnesila; (2) esqualeno; (3) 2,3-oxidosqualeno; (4) 2,3; 22,23-dioxidosqualeno; (5) 24,25- epoxicucurbitadienol; (6) 24,25-di-hidroxicucurbitadienol; (7) mogrol; (8) mogrosídeo V; (9) cucurbitadienol.
[0033] A FIGURA 4 ilustra as rotas de glicosilação para mogrosídeo V e a atividade de biotransformação in vitro observada para várias enzimas UGT. As estruturas das bolhas representam diferentes mogrosídeos. O núcleo tetracíclico branco representa mogrol. Os números abaixo de cada estrutura indicam o mogrosídeo glicosilado particular, enquanto a notação com as setas indica as enzimas observadas para exibir a atividade de glicosilação. Os círculos pretos representam as glicosilações C3 ou C24. Os círculos verticais cinza-escuros representam glicosilações 1,6. Círculos horizontais cinza claro representam glicosilações 1,2. Abreviaturas: Mog, mogrol; sia, siamenosídeo.
[0034] A FIGURA 5 mostra resultados para a produção in vivo de esqualeno em E. coli usando diferentes esqualeno sintases. O asterisco denota uma construção de plasmídeo diferente e experimento executado em um dia diferente dos outros mostrados. Abreviaturas: SQS, esqualeno sintase; Sg, Siratia grosvenorii; Aa, Artemesia annua; Es, Eleutherococcus senticosus; El, Euphorbia lathyris; Fb, Flavobacteriales bacterium; Bb, Bacteroidetes bacterium.
[0035] A FIGURA 6 mostra resultados para a produção in vivo de esqualeno, 2,3-oxidosqualeno e 2,3; 22,23-dioxidosqualeno usando diferentes esqualeno epoxidases. Abreviaturas: SQS, esqualeno sintase; SQE, esqualeno epoxidase; Sg, Siratia grosvenorii; Aa, Artemesia annua; BaE, endossimbionte de Bathymodiolus azoricus; Ms, Methyloprofundus sedimenti; Mb, Methylomicrobium buryatense; Ml, Methylomonas lenta.
[0036] A FIGURA 7 mostra resultados para a produção in vivo do produto de triterpeno ciclizado. As reações envolvem um número crescente de enzimas expressas em uma linhagem celular de E. coli com uma superexpressão de enzimas da via MEP. Os asteriscos representam experimentos de fermentação incubados por um quarto do tempo do que os outros experimentos. Conforme mostrado, a coexpressão de AaSQS, MlSQE e SgTTC resultou em alta produção do produto triterpenoide, cucurbitadienol. Abreviaturas: SQS, esqualeno sintase; SQE, esqualeno epoxidase; TTC, triterpeno ciclase; Sg, Siratia grosvenorii; Aa, Artemesia annua; Ml, Methylomonas lenta.
[0037] A FIGURA 8 mostra a produção de Mogrosídeo V usando uma combinação de diferentes enzimas. (A) Produtos penta-glicosilados são observados quando 85C1, 85C2 e Sg94_3 ou CaUGT_1,6 são incubados junto com mogrol como substrato. Os substratos de mogrosídeo foram incubados em tampão Tris contendo cloreto de magnésio, beta-mercaptoetanol, UDP-glicose, UGT única e uma fosfatase. (B) Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V + H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrosídeo II-E. (C) Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V + H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrol. Abreviatura: MogV, mogrosídeo V.
[0038] A FIGURA 9 mostra ensaios in vitro mostrando a conversão de substratos de mogrosídeo em produtos mais glicosilados. Os substratos de mogrosídeo foram incubados em tampão Tris contendo cloreto de magnésio, beta- mercaptoetanol, UDP-glicose, UGT única e uma fosfatase. Os painéis correspondem ao uso de diferentes substratos: (A) mogrol; (B) mogrosídeo I-A; (C) mogrosídeo I-E; (D) mogrosídeo II-E; (E) mogrosídeo III; (F) mogrosídeo IV-A; (G) mogrosídeo IV; (H) siamenosídeo.
[0039] A FIGURA 10 é um alinhamento de aminoácidos de CaUGT_1,6 e SgUGT94_289_3 usando Clustal Omega (Versão CLUSTAL O (1,2,4). Essas sequências compartilham 54% de identidade de aminoácido.
[0040] A FIGURA 11 é um alinhamento de aminoácidos de Homo sapiens esqualeno sintase (HsSQS) (acesso NCBI NP_004453.3) e AaSQS (SEQ ID NO: 11) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQS tem uma estrutura de cristal publicada (entrada PDB: 1EZF). Essas sequências compartilham 42% de identidade de aminoácido.
[0041] A FIGURA 12 é um alinhamento de aminoácidos de Homo sapiens esqualeno epoxidase (HsSQE) (acesso NCBI XP_011515548) e MlSQE (SEQ ID NO: 39) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQE tem uma estrutura de cristal publicada (entrada PDB: 6C6N). Essas sequências compartilham 35% de identidade de aminoácido.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[0042] A presente invenção, em vários aspectos e modalidades, fornece um método para produzir glicosídeos de mogrol, bem como outros compostos triterpenoides, usando processos microbianos recombinantes. Em outros aspectos, a invenção fornece métodos para produzir produtos, incluindo alimentos, bebidas e adoçantes (entre outros), incorporando os glicosídeos de mogrol produzidos de acordo com os métodos descritos neste documento.
[0043] Conforme usado neste documento, os termos "terpeno ou triterpeno" são usados alternadamente com os termos "terpenoide" ou "triterpenoide", respectivamente.
[0044] Em um aspecto, a invenção fornece um método para preparar um composto triterpenoide. O método compreende o fornecimento de uma célula hospedeira microbiana recombinante que expressa uma via de enzima heteróloga que catalisa a conversão de isopentenil pirofosfato (IPP) e/ou dimetilalil pirofosfato (DMAPP) em um ou mais compostos triterpenoides. A via enzimática heteróloga compreende uma farnesil difosfato sintase (FPPS) e uma esqualeno sintase (SQS), que são expressas de forma recombinante. Em várias modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 2 a 16, 166 e 167. A célula hospedeira é cultivada em condições para a produção do triterpenoide.
[0045] A título de exemplo não limitativo, a FPPS pode ser Saccharomyces cerevisiae farnesil pirofosfato sintase (ScFPPS) (SEQ ID NO: 1), ou suas variantes modificadas. As variantes modificadas podem compreender uma sequência de aminoácidos que é pelo menos 70% idêntica à SEQ ID NO: 1). Por exemplo, a FPPS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 1. Em algumas modalidades, a FPPS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos ou possuindo de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 1, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Numerosas outras enzimas FPPS são conhecidas na técnica e podem ser empregadas para a conversão de IPP e/ou DMAPP em difosfato de farnesil de acordo com este aspecto.
[0046] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Artemisia annua (SEQ ID NO: 11). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 11. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 11, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, AaSQS tem alta atividade em E. coli.
[0047] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Siraitia grosvenorii (SEQ ID NO: 2). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 2. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 2, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, SgSQS tem alta atividade em E. coli.
[0048] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Euphorbia lathyris (SEQ ID NO: 14). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 14. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 14, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, ElSQS foi ativa em E. coli.
[0049] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Eleutherococcus senticosus (SEQ ID NO: 16). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
16. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 16, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, EsSQS foi ativa em E. coli.
[0050] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Flavobacteriales bacterium (SEQ ID NO: 166). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
166. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 166, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, FbSQS foi ativa em E. coli.
[0051] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Bacteroidetes bacterium (SEQ ID NO: 167). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
167. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 167, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, BbSQS foi ativa em E. coli.
[0052] As modificações de aminoácidos na enzima SQS podem ser guiadas por estruturas enzimáticas disponíveis e modelos de homologia, incluindo aqueles descritos em Aminfar e Tohidfar, In silico analysis of squalene synthase in Fabaceae family using bioinformtics tools, J. Genetic Engineer. and Biotech. 16 (2018) 739-
747. A estrutura de cristal publicamente disponível para HsSQE (entrada PDB: 6C6N) pode ser usada para informar as modificações de aminoácidos. Um alinhamento entre AaSQS e HsSQS é mostrado na FIGURA 11 As enzimas têm 42% de identidade de aminoácidos.
[0053] Em várias modalidades, a via de enzima heteróloga produz esqualeno, que é opcionalmente um intermediário que atua como um substrato para enzimas adicionais da via a jusante. Em algumas modalidades, o esqualeno é recuperado da cultura e pode ser recuperado das células microbianas e/ou pode ser recuperado dos meios e/ou de uma camada orgânica.
[0054] A célula hospedeira microbiana em várias modalidades pode ser procariótica ou eucariótica. Em algumas modalidades, a célula hospedeira microbiana é uma bactéria selecionada de Escherichia spp., Bacillus spp., Corynebacterium spp., Rhodobacter spp., Zymomonas spp., Vibrio spp., e Pseudomonas spp. Por exemplo, em algumas modalidades, a célula hospedeira bacteriana é uma espécie selecionada dentre Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida. Em algumas modalidades, a célula hospedeira bacteriana é E. coli. Alternativamente, a célula microbiana pode ser uma célula de levedura, tal como, mas não se limitando a uma espécie de Saccharomyces, Pichiaou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastorise Yarrowia lipolytica.
[0055] A célula microbiana produzirá produtos MEP ou MVA, que atuam como substratos para a via enzimática heteróloga. A via MEP (2-C-metil-D-eritritol 4-fosfato), também chamada via MEP/DOXP (2-C-metil-D-eritritol 4-fosfato/l- desoxi-D-xilulose 5-fosfato) ou a via não-mevalonato ou a via independente do ácido mevalônico refere-se à via que converte gliceraldeído-3-fosfato e piruvato em IPP e DMAPP. A via, que está presente nas bactérias, envolve tipicamente a ação das seguintes enzimas: 1-desoxi-D-xilulose-5-fosfato sintase (Dxs), 1-desoxi-D- xilulose-5-fosfato reductoisomerase (IspC), 4-difosfocitidil-2 -C-metil-D-eritritol- sintase (IspD), 4-difosfocitidil-2-C-metil-D-eritritol quinase (IspE), 2C-metil-D-eritritol 2,4-ciclodifosfato sintase (IspF), 1-hidroxi-2-metil-2-(E)-butenil-4-difosfato-sintase (IspG) e isopentenil-difosfato isomerase (IspH). A via de MEP e os genes e enzimas que constituem a via de MEP são descritos na US 8,512,988, que é incorporada neste documento por referência na sua totalidade. Por exemplo, os genes que constituem a via MEP incluem dxs, ispC, ispD, ispE, ispF, ispG, ispH, idi e ispA. Em algumas modalidades, a célula hospedeira expressa ou superexpressa um ou mais dentre dxs, ispC, ispD, ispE, ispF, ispG, ispH, idi, ispA ou variantes modificadas desta, o que resulta no aumento da produção de IPP e DMAPP. Em algumas modalidades, o triterpenoide (por exemplo, esqualeno, mogrol ou outro intermediário descrito neste documento) é produzido pelo menos em parte por fluxo metabólico através de uma via MEP, e em que a célula hospedeira tem pelo menos uma cópia de gene adicional de um ou mais dentre dxs, ispC, ispD, ispE, ispF, ispG, ispH, idi, ispA ou variantes destes modificadas.
[0056] A via MVA se refere à via biossintética que converte acetil-CoA em IPP. A via do mevalonato, que estará presente na levedura, compreende tipicamente enzimas que catalisam as seguintes etapas: (a) condensar duas moléculas de acetil-CoA em acetoacetil-CoA (por exemplo, pela ação da acetoacetil-CoA tiolase); (b) condensar acetoacetil-CoA com acetil-CoA para formar hidroximetilglutaril-CoenzimaA (HMG-CoA) (por exemplo, por ação de HMG-CoA sintase (HMGS)); (c) conversão de HMG-CoA em mevalonato (por exemplo, por ação da HMG-CoA redutase (HMGR)); (d) fosforilação do mevalonato em mevalonato 5-fosfato (por exemplo, por ação da mevalonato quinase (MK)); (e) conversão de mevalonato 5-fosfato em mevalonato 5-pirofosfato (por exemplo, por ação da fosfomevalonato quinase (PMK)); e (f) conversão de mevalonato 5- pirofosfato em isopentenil pirofosfato (por exemplo, por ação da mevalonato pirofosfato descarboxilase (MPD)). A via MVA e os genes e enzimas que constituem a via MVA são descritos na US 7,667,017, que é incorporada neste documento por referência na sua totalidade. Em algumas modalidades, a célula hospedeira expressa ou superexpressa uma ou mais de acetoacetil-CoA tiolase, HMGS, HMGR, MK, PMK e MPD ou variantes modificadas destas, o que resulta no aumento da produção de IPP e DMAPP. Em algumas modalidades, o triterpenoide (por exemplo, mogrol ou esqualeno) é produzido pelo menos em parte por fluxo metabólico através de uma via MVA, e em que a célula hospedeira tem pelo menos uma cópia de gene adicional de um ou mais de acetoacetil-CoA tiolase, HMGS, HMGR, MK, PMK, MPD ou variantes modificadas destas.
[0057] Em algumas modalidades, a célula hospedeira é uma célula hospedeira bacteriana manipulada para aumentar a produção de IPP e DMAPP a partir da glicose, conforme descrito na US 2018/0245103 e US 2018/0216137, cujos conteúdos são incorporados neste documento por referência em sua totalidade. Por exemplo, em algumas modalidades, a célula hospedeira superexpressa enzimas da via MEP, com expressão equilibrada para empurrar/puxar o fluxo de carbono para IPP e DMAP. Em algumas modalidades, a célula hospedeira é manipulada para aumentar a disponibilidade ou atividade das proteínas do cluster Fe-S, de modo a suportar uma atividade mais elevada de IspG e IspH, que são enzimas Fe- S. Em alguns aspectos, a célula hospedeira é manipulada para superexpressar IspG e IspH, de modo a fornecer um aumento do fluxo de carbono para o intermediário 1-hidroxi-2-metil-2-(E)-butenil-4-difosfato (HMBPP), mas com expressão equilibrada para evitar o acúmulo de HMBPP em uma quantidade que reduz o crescimento ou viabilidade celular, ou em uma quantidade que inibe o fluxo de via MEP e/ou a produção de terpenoides. Em algumas modalidades, a célula hospedeira exibe maior atividade de IspH em relação a IspG. Em algumas modalidades, a célula hospedeira é manipulada para regular negativamente a via de biossíntese da ubiquinona, por exemplo, reduzindo a expressão ou atividade de IspB, que usa substrato IPP e FPP.
[0058] Em várias modalidades, a célula hospedeira expressa uma ou mais enzimas que produzem mogrol a partir do esqualeno. Por exemplo, a célula hospedeira pode expressar um ou mais dentre esqualeno epoxidase (SQE), cucurbitadienol sintase (CDS), epóxido hidrolase (EPH), citocromo P450 oxidases (CYP450), oxigenases não heme dependentes de ferro e citocromo P450 reductases (CPR). Conforme mostrado na FIGURA 2, a via heteróloga pode prosseguir por várias rotas para o mogrol, que pode envolver uma ou duas epoxidações do substrato central. Em algumas modalidades, a via prossegue através do cucurbitadienol e, em algumas modalidades, não envolve uma etapa de epoxidação adicional. Em algumas modalidades, um ou mais dentre SQE, CDS, EPH, CYP450, oxigenases não heme dependentes de ferro, flavodoxina redutases (FPR), ferredoxina redutases (FDXR) e enzimas CPR são manipuladas para aumentar o fluxo para mogrol.
[0059] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma esqualeno epoxidase (SQE). Por exemplo, a via de enzima heteróloga pode compreender um SQE que produz 2,3-oxidosqualeno (intermediário (3) na FIGURA 2). Em algumas modalidades, a SQE produzirá 22,23-dioxidosqualeno (intermediário (4) na FIGURA 2). Por exemplo, a esqualeno epoxidase pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a qualquer uma das SEQ ID NOS: 17 a 39, 168-170.
[0060] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 39. Em algumas modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 39, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, MlSQE teve boa atividade em E. coli. Além disso, quando coexpresso com AaSQS, foram observados altos níveis do produto epoxilado único (2,3-oxidosqualeno). Consequentemente, a coexpressão de AaSQS (ou um derivado manipulado) com MlSQE (ou um derivado manipulado) tem um bom potencial para biomanipulação da via de mogrol. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima SQE na célula microbiana ou para aumentar a produtividade da enzima.
[0061] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a esqualeno epoxidase endossimbionte de Bathymodiolus azoricus (SEQ ID NO: 168). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 168. Em algumas modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 168, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, BaESQE teve boa atividade em E. coli. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0062] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methyloprofundus sediment (SEQ ID NO: 169). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 169. Em algumas modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 169, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, MsSQE teve boa atividade em E. coli. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0063] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomicrobium buryatense (SEQ ID NO: 170). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 170. Em várias modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 170, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, MbSQE teve boa atividade em E. coli. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0064] Outras enzimas SEQ testadas não mostraram atividade em E. coli.
[0065] As modificações de aminoácidos podem ser guiadas por estruturas de enzimas disponíveis e modelos de homologia, incluindo aqueles descritos em Padyana AK, et al., Structure and inhibition mechanism of the catalytic domain of human squalene epoxidase, Nat. Com. (2019) Vol. 10 (97): 1-10; ou Ruckenstulh et al., Structure-Function Correlations of Two Highly Conserved Motifs in Saccharomyces cerevisiae Squalene Epoxidase, Antimicrob. Agentes e Chemo. (2008) Vol. 52(4): 1496-1499. A FIGURA 12 mostra um alinhamento de HsSQE e MlSEQ, que é útil para guiar a manipulação das enzimas para expressão, estabilidade e produtividade em células hospedeiras microbianas. As duas enzimas têm 35% de identidade.
[0066] Em várias modalidades, a via de enzima heteróloga compreende ainda uma triterpeno ciclase. Em algumas modalidades, onde a célula microbiana coexpressa FPPS, SQS, SQE e a triterpeno ciclase, a célula microbiana produz cucurbitadienol (composto (9) na FIGURA 2). O cucurbitadienol pode ser o substrato para enzimas a jusante na via heteróloga ou é, alternativamente, recuperado da cultura (seja de células microbianas, ou dos meios de cultura ou camada orgânica).
[0067] Em algumas modalidades, a triterpeno ciclase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 40 a 55. Em algumas modalidades, a triterpeno ciclase tem atividade de cucurbitadienol sintetase (CDS). A CDS em várias modalidades compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos de SEQ ID NO: 40 e pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 40. Por exemplo, CDS pode compreender uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos ou tendo de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 40, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0068] As modificações de aminoácidos podem ser guiadas por estruturas de enzimas disponíveis e modelos de homologia, incluindo aqueles descritos em Itkin M., et al., The biosynthetic pathway of the nonsugar, high-intensity sweetener mogroside V from Siraitia grosvenorii, PNAS (2016) Vol 113( 47): E7619-E7628. Por exemplo, a CDS pode ser modelada usando a estrutura da lanosterol sintase humana (oxidosqualeno ciclase) (PDB 1W6K).
[0069] Em algumas modalidades, a via de enzima heteróloga compreende ainda um epóxido hidrolase (EPH). A EPH pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos selecionada das SEQ ID NOS: 56 a 72. Em algumas modalidades, a EPH pode empregar como substrato 24,25-epoxicucurbitadienol (intermediário (5) da FIGURA 2), para a produção de 24,25-di-hidroxicucurbitadienol (intermediário (6) da FIGURA 2). Em algumas modalidades, a EPH compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 56 a 72. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0070] Em algumas modalidades, a via heteróloga compreende ainda uma ou mais oxidases. A uma ou mais oxidases podem ser ativas em cucurbitadienol ou produtos oxigenados deste como um substrato, adicionando (coletivamente) hidroxilações em C11, C24 e 25, produzindo assim mogrol (ver FIGURA 2).
[0071] Em algumas modalidades, pelo menos uma oxidase é uma enzima do citocromo P450. Enzimas do citocromo P450 exemplares compreendem uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos selecionada das SEQ ID NOS: 73 a 91. Em algumas modalidades, pelo menos uma enzima P450 compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 73 a 91.
[0072] Em algumas modalidades, particularmente nas modalidades em que a célula microbiana é uma bactéria, a CYP450 e/ou CPR é modificada conforme descrito na US 2018/0251738, cujos conteúdos são incorporados neste documento por referência em sua totalidade. Por exemplo, em algumas modalidades, a enzima CYP450 tem uma deleção de toda ou parte da região transmembranar P450 N- terminal do tipo selvagem e a adição de um domínio transmembranar derivado de uma E. coli ou membrana bacteriana interna, proteína citoplasmática C-terminal. Em algumas modalidades, o domínio transmembranar é um domínio transmembranar de passagem única. Em algumas modalidades, o domínio transmembrana é um domínio transmembrana de múltiplas passagens (por exemplo, 2, 3 ou mais hélices transmembranares).
[0073] Em algumas modalidades, pelo menos uma oxidase é uma oxidase de ferro não heme. Oxidases de ferro não heme exemplares compreendem uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 100 a 115. Em algumas modalidades, a oxidase de ferro não heme compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 100 a
115.
[0074] Em várias modalidades, a célula hospedeira microbiana expressa uma ou mais proteínas de transferência de elétrons selecionadas de uma citocromo P450 redutase (CPR), flavodoxina redutase (FPR) e ferredoxina redutase (FDXR) suficiente para regenerar uma ou mais oxidases. Proteínas CPR exemplares são fornecidas neste documento como SEQ ID NOS: 92 a 99.
[0075] Em várias modalidades, a via de enzima heteróloga produz mogrol, que pode ser um intermediário para enzimas a jusante na via heteróloga ou, em algumas modalidades, é recuperado da cultura. O mogrol pode ser recuperado das células hospedeiras em algumas modalidades ou, em algumas modalidades, pode ser recuperado dos meios de cultura ou da camada orgânica.
[0076] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma ou mais enzimas glicosiltransferases dependentes de difosfato de uridina (UGT), produzindo assim um ou mais glicosídeos de mogrol (ou "mogrosídeos"). O glicosídeo de mogrol pode ser pentaglicosilado ou hexaglicosilado em algumas modalidades. Em outras modalidades, o glicosídeo de mogrol tem duas, três ou quatro glicosilações. O um ou mais glicosídeos de mogrol podem ser selecionados de Mog. II-E, Mog. III-A-2, Mog. III-E, Mog. IIIx, Mog. IV-A, Mog. IV-E, Siamenosídeo, Isomog. IV e Mog. V. Em algumas modalidades, o mogrosídeo é um mogrosídeo pentaglicosilado ou hexaglicosilado. Em algumas modalidades, o um ou mais glicosídeos de mogrol incluem Mog. VI, Isomog. V e Mog. V. Em algumas modalidades, a célula hospedeira produz Mog. V.
[0077] Em algumas modalidades, a célula hospedeira expressa uma enzima UGT que catalisa a glicosilação primária de mogrol em grupos hidroxila C24 e/ou C3. Em algumas modalidades, a enzima UGT catalisa glicosilações de ramificação beta 1,2 e/ou beta 1,6 de glicosídeos de mogrol nos grupos gluscosil C3 e C24 primários. Em algumas modalidades, a enzima UGT catalisa glicosilação de beta 1,2 Mog IV-A, glicosilação beta 1,6 de Mog. IV e/ou glicosilação beta 1,6 de Siamenoside para Mog. V. Em algumas modalidades, a enzima UGT catalisa a glicosilação beta 1,6 de Mog. V para Mog. VI. Em algumas modalidades, a enzima UGT catalisa a glicosilação beta 1,4 de Siamenosídeo e/ou a glicosilação beta 1,6 de Isomog. IV para Isomog. V,
[0078] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada de SEQ ID NOS: 116 a 165. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 116 a
165. Por exemplo, em algumas modalidades, a célula microbiana expressa pelo menos quatro enzimas UGT, resultando na glicosilação de mogrol no grupo hidroxila C3, o grupo hidroxila C24, bem como uma glicosilação 1,6 adicional no grupo glicosil C3, e uma glicosilação 1,6 adicional e uma glicosilação 1,2 adicional no grupo glicosil C24. O produto de tais reações de glicosilação é Mog. V (FIGURA 4).
[0079] Por exemplo, pelo menos uma enzima UGT expressa pela célula microbiana pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165). UGT85C1, e derivados destas, fornecem glicosilação da hidroxila C3 de mogrol ou Mog. 1A. Outras reações de glicosiltransferase detectadas para UGT85C1 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 165. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 165, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0080] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146). UGT85C2, e derivados destas, fornecem glicosilação da hidroxila C24 de mogrol ou Mog. 1E. Outras reações de glicosiltransferase detectadas para UGT85C2 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 146. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 146, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0081] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (CaUGT_1,6) (SEQ ID NO: 164). CaUGT_1,6, e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3. Outras reações de glicosiltransferase detectadas para CaUGT_1,6 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 164. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 164, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0082] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT94-289-3 de Siraitia grosvenorii(SEQ ID NO: 117). UGT94-289-3 ("Sg94_3"), e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3, bem como glicosilação beta 1,2 no grupo glicosil C24. Reações de glicosiltransferase detectadas para Sg94_3 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 117. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 117, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos.
[0083] Em algumas modalidades, a célula microbiana expressa pelo menos uma enzima UGT capaz de catalisar a adição de beta 1,2 de uma molécula de glicose pelo menos ao grupo glicosil C24 (por exemplo, de Mog. IVA, ver FIGURA 4). Enzimas UGT exemplares de acordo com estas modalidades incluem UGT94- 289-3 de Siraitia grosvenorii (SEQ ID NO: 117), UGT91D1 de Stevia rebaudiana (SEQ ID NO: 147), UGT91D2 de Stevia rebaudiana (SEQ ID NO: 148), UGT91D2e de Stevia rebaudiana (SEQ ID NO: 149), OsUGT1-2 (SEQ ID NO: 150) ou MbUGT1-2 (SEQ ID NO: 163) ou derivados destas. Derivados incluem enzimas que compreendem a sequência de aminoácidos que são pelo menos 70% idênticas a uma ou mais das SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163. Em algumas modalidades, a enzima UGT que catalisa a adição de beta 1,2 de uma molécula de glicose a pelo menos o grupo glicosil C24 compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma ou mais das SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO:
163. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0084] Em algumas modalidades, pelo menos uma enzima UGT é um permutante circular de uma enzima UGT de tipo selvagem, opcionalmente com substituições, deleções e/ou inserções de aminoácidos em relação à posição correspondente da enzima de tipo selvagem. Os permutantes circulares podem fornecer novas e desejáveis especificidades de substrato, perfis de produto e cinética de reação sobre as enzimas de tipo selvagem. Um permutante circular retém a mesma dobra básica da enzima parental, mas tem uma posição diferente do terminal N (por exemplo, "sítio de corte"), com os terminais N e C originais conectados, opcionalmente por uma sequência de ligação. Por exemplo, nos permutantes circulares, a metionina N-terminal está posicionada em um sítio na proteína diferente do terminal N natural. Os permutantes circulares UGT são descritos na US 2017/0332673, que é incorporado neste documento por referência em sua totalidade. Em algumas modalidades, pelo menos uma enzima UTG é um permutante circular de SEQ ID NO: 146, SEQ ID NO: 164 ou SEQ ID NO: 165, SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163. Em algumas modalidades, o permutante circular possui ainda uma ou mais modificações de aminoácidos (por exemplo, substituições, deleções e/ou inserções de aminoácidos) em relação à enzima UGT parental. Nessas modalidades, o permutante circular terá pelo menos cerca de 70%, ou pelo menos cerca de 80%, ou pelo menos cerca de 90%, ou pelo menos cerca de 95%, ou pelo menos cerca de 98% de identidade com a enzima parental, quando as sequências de aminoácidos correspondentes são alinhadas (isto é, sem levar em conta o novo terminal N do permutante circular).
[0085] Em algumas modalidades, a via de enzima heteróloga compreende três ou quatro enzimas UGT. Uma primeira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165) (ou derivado desta conforme descrito acima), ou compreende uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 165 ou derivado deste (conforme descrito acima). Uma segunda enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146) (ou derivado conforme descrito acima), ou compreende uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 146 (ou derivado conforme descrito acima). Uma terceira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT94-289-3 de Siraitia grosvenorri (SEQ ID NO: 117) (ou derivado ou permutante circular conforme descrito acima). Em algumas modalidades, UGT94- 289-3 é substituída por outra enzima UGT capaz de atividade de beta 1,2 glicosiltransferase (conforme descrito acima), juntamente com uma quarta enzima UGT. A quarta enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a CaUGT_1,6 (SEQ ID NO: 164) (ou derivado conforme descrito acima), ou compreende uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 164 (ou derivado conforme descrito acima). A expressão dessas enzimas na célula hospedeira converte mogrol em produtos predominantemente tetra e pentaglicosilados, incluindo Mog. V. Ver FIGURA 4, FIGURA 8, FIGURA 9.
[0086] Em algumas modalidades, a célula hospedeira microbiana tem uma ou mais modificações genéticas que aumentam a produção de UDP-glicose, o cofator empregado pelas enzimas UGT. Essas modificações genéticas podem incluir um ou mais, ou dois ou mais (ou todos) dentre ΔgalE, ΔgalT, ΔgalK, ΔgalM, ΔushA, Δagp, Δpgm, duplicação de GALU de E coli, expressão de UGPA de Bacillus subtillus e expressão de SPL de Bifidobacterium adolescentis.
[0087] Os glicosídeos de mogrol podem ser recuperados da cultura microbiana. Por exemplo, os glicosídeos de mogrol podem ser recuperados de células microbianas ou, em algumas modalidades, são predominantemente transportados para o meio extracelular, onde podem ser recuperados ou sequestrados.
[0088] Em alguns aspectos, a invenção fornece um método para produzir um mogrosídeo pentaglicosilado ou hexaglicosilado. Em algumas modalidades, o mogrosídeo é Mog V. Em várias modalidades, a invenção compreende a reação de um glicosídeo de mogrol com uma pluralidade de enzimas glicosiltransferases dependentes de difosfato de uridina (UGT). Por exemplo, em algumas modalidades, uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SEQ ID NO: 164, onde a enzima UGT catalisa a adição de beta 1,6 de uma glicose. Alternativamente, a enzima UGT compreende uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 164 ou um derivado desta (descrito acima).
[0089] Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 164. Em algumas modalidades, a enzima UGT pode compreender uma sequência de aminoácidos com 1 a 20 ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 164, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Em algumas modalidades, a enzima UGT é um permutante circular de SEQ ID NO: 164 ou um derivado desta. Modificações de aminoácidos podem ser produzidas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos de mogrosídeo, tal como Mog. IV ou Siamenosídeo.
[0090] Outras enzimas UGT serão coexpressas para glicosilar o substrato desejado em Mog. V.
[0091] Em algumas modalidades, o substrato de glicosídeo de mogrol compreende Mog. IIE. Em algumas modalidades, Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade com UGT85C1 (SEQ ID NO: 165), ou um permutante circular compreendendo uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 165, incluindo derivados de UGT85C1 ou permutantes circulares conforme descrito. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 165. Por exemplo, a enzima UGT pode compreender uma sequência de aminoácidos com 1 a 20 ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 165, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 165.
[0092] Em algumas modalidades, Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IA ou Mog, IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade à UGT85C2 (SEQ ID NO: 146), ou um derivado ou permutante circular de UGT85C2 conforme descrito neste documento. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 146. Por exemplo, a enzima UGT pode compreender uma sequência de aminoácidos com 1 a 20 ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 146, as modificações de aminoácidos sendo independentemente selecionadas de substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 146.
[0093] Em algumas modalidades, o mogrol reage com cerca de quatro enzimas UGT. Uma primeira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou um derivado de permutante circular conforme descrito. Uma segunda enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou um derivado ou permutante circular conforme descrito. Uma terceira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou um derivado ou permutante circular conforme descrito. Uma quarta enzima UGT é capaz de catalisar a adição de beta 1,2 de uma molécula de glicose, como SgUGT94_289_3 (SEQ ID NO: 117) ou um derivado ou permutante circular conforme descrito.
[0094] O glicosídeo de mogrol pode ser recuperado e/ou purificado da reação ou cultura. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
[0095] Em várias modalidades, a reação é realizada em uma célula microbiana e as enzimas UGT são expressas de forma recombinante na célula. Em algumas modalidades, o mogrol é produzido na célula por uma via de síntese de mogrol heteróloga, conforme descrito neste documento. Em outras modalidades, os glicosídeos de mogrol ou mogrol são alimentados às células para glicosilação. Em ainda outras modalidades, a reação é realizada in vitro usando enzima UGT purificada, enzima UGT parcialmente purificada ou lisados de células recombinantes.
[0096] Conforme descrito neste documento, a célula hospedeira microbiana pode ser procariótica ou eucariótica e é opcionalmente uma bactéria selecionada de Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida. Em algumas modalidades, a célula microbiana é uma levedura selecionada de uma espécie de Saccharomyces, Pichiaou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastorise Yarrowia lipolytica. Em algumas modalidades, a célula hospedeira microbiana é E. coli.
[0097] A célula hospedeira bacteriana é cultivada para produzir o produto triterpenoide (por exemplo, mogrosídeo). Em algumas modalidades, substratos de carbono, como substratos de carbono C1, C2, C3, C4, C5 e/ou C6, são empregados para a fase de produção. Em modalidades exemplificativas, a fonte de carbono é glicose, sacarose, frutose, xilose e/ou glicerol. As condições de cultura são geralmente selecionadas dentre aeróbica, microaeróbica e anaeróbica.
[0098] Em várias modalidades, a célula hospedeira bacteriana pode ser cultivada a uma temperatura entre 22° C e 37° C. Enquanto a biossíntese comercial em bactérias tais como E. coli pode ser limitada pela temperatura na qual as enzimas superexpressas e/ou exóticas (por exemplo, enzimas derivadas das plantas) ficam estáveis, enzimas recombinantes podem ser manipuladas para permitir que as culturas sejam mantidas em temperaturas mais altas, resultando em maiores rendimentos e maior produtividade geral. Em algumas modalidades, a cultura é conduzida a cerca de 22°C ou mais, cerca de 23°C ou mais, cerca de 24°C ou mais, cerca de 25°C ou mais, cerca de 26°C ou mais, cerca de 27°C ou mais, cerca de 28°C ou mais, cerca de 29°C ou mais, cerca de 30°C ou mais, cerca de 31°C ou mais, cerca de 32°C ou mais, cerca de 33°C ou mais, cerca de 34°C ou mais, cerca de 35° C ou mais, cerca de 36°C ou mais, ou cerca de 37°C.
[0099] Em algumas modalidades, as células hospedeiras bacterianas são ainda adequadas para produção comercial, à escala comercial. Em algumas modalidades, o tamanho da cultura é de pelo menos cerca de 100 L, pelo menos cerca de 200 L, pelo menos cerca de 500 L, pelo menos cerca de 1,000 L, ou pelo menos cerca de 10,000 L, ou pelo menos cerca de 100,000 L, ou pelo menos cerca de 500,000 L, ou pelo menos cerca de 600,000 L. Em uma modalidade, a cultura pode ser conduzida em cultura descontínua, cultura contínua ou cultura semicontínua.
[0100] Em várias modalidades, os métodos incluem ainda recuperar o produto da cultura de células ou dos lisados celulares. Em algumas modalidades, a cultura produz pelo menos cerca de 100 mg/L, ou pelo menos cerca de 200 mg/L,
ou pelo menos cerca de 500 mg/L, ou pelo menos cerca de 1 g/L, ou pelo menos cerca de 2 g/L, ou pelo menos cerca de 5 g/L, ou pelo menos cerca de 10 g/L, ou pelo menos cerca de 20 g/L, ou pelo menos cerca de 30 g/L, ou pelo menos cerca de 40 g/L do terpenoide ou produto de glicosídeo de terpenoide.
[0101] Em algumas modalidades, a produção de indol (incluindo indol prenilado) é utilizada como marcador substituto para a produção de terpenoides e/ou a acumulação de indol na cultura é controlada para aumentar a produção. Por exemplo, em várias modalidades, a acumulação de indol na cultura é controlada abaixo de cerca de 100 mg/L, ou abaixo de cerca de 75 mg/L, ou abaixo de cerca de 50 mg/L, ou abaixo de cerca de 25 mg/L, ou abaixo 10 mg/L. A acumulação de indol pode ser controlada equilibrando a expressão e a atividade da proteína utilizando a abordagem modular multivariada conforme descrito na Pat. U.S. Nº 8,927,241 (que é incorporado neste documento por referência), e/ou é controlado por meios químicos.
[0102] Outros marcadores para produção eficiente de terpenos e terpenoides, incluem o acúmulo de DOX ou ME no meio de cultura. Geralmente, as cepas bacterianas podem ser manipuladas para acumularem menos destas espécies químicas, que se acumulam na cultura a menos do que cerca de 5 g/L, ou menos de cerca de 4 g/L, ou menos de cerca de 3 g/L, ou menos de cerca de 2 g/L ou menos de cerca de 1 g/L, ou menos de cerca de 500 mg/L, ou menos de cerca de 100 mg/L.
[0103] Não se espera que a otimização da produção de terpenos ou terpenoides pela manipulação dos genes da via MEP, bem como a manipulação das vias a montante e a jusante, seja um processo linear ou aditivo simples. Em vez disso, por meio de análise combinatória, a otimização é obtida por meio do equilíbrio de componentes da via MEP, bem como pelas vias a montante e a jusante. O acúmulo de indol (incluindo o indol prenilado) e o acúmulo de metabólito MEP (por exemplo, DOX, ME, MEcPP e / ou farnesol) na cultura podem ser usados como marcadores substitutos para guiar esse processo.
[0104] Por exemplo, em algumas modalidades, a estirpe bacteriana tem pelo menos uma cópia adicional de dxs e idi expressa como um operon/módulo; ou dxs, ispD, ispF e idi expressos como um operon ou módulo (ou em um plasmídeo ou integrado no genoma), com complementação adicional da via MEP descrita neste documento para melhorar o carbono MEP. Por exemplo, a cepa bacteriana pode ter uma cópia adicional de dxr e ispG e/ou ispH, opcionalmente com uma cópia adicional de ispE e/ou idi, com expressões desses genes sintonizadas para aumentar carbono MEP e/ou melhorar a titulação de terpeno ou terpenoide. Em várias modalidades, a cepa bacteriana tem uma cópia adicional de pelo menos dxr, ispE, ispG e ispH, opcionalmente com uma cópia adicional de idi, com expressões destes genes sintonizadas para aumentar o carbono MEP e/ou melhorar a titulação de terpeno ou terpenoide.
[0105] Manipulação da expressão de genes e/ou proteínas, incluindo módulos genéticos, pode ser conseguida através de vários métodos. Por exemplo, a expressão dos genes ou operações pode ser regulada através da seleção de promotores, tais como promotores induzíveis ou constitutivos, com diferentes intensidades (por exemplo, forte, intermediário ou fraco). Vários exemplos não- limitativos de promotores de diferentes intensidades incluem Trc, T5 e T7. Adicionalmente, a expressão de genes ou operações pode ser regulada através da manipulação do número de cópias do gene ou operon na célula. Em algumas modalidades, a expressão de genes ou operons pode ser regulada através da manipulação da ordem dos genes dentro de um módulo, em que os genes transcritos em primeiro lugar são geralmente expressos a um nível superior. Em algumas modalidades, a expressão de genes ou operons é regulada através da integração de um ou mais genes ou operons no cromossomo.
[0106] A otimização da expressão proteica também pode ser alcançada através da seleção de promotores apropriados e sítios de ligação ribossômicos. Em algumas modalidades, isto pode incluir a seleção de plasmídeos com elevado número de cópias, ou plasmídeos com número único, baixo ou médio de cópia. A etapa de terminação da transcrição também pode ser direcionada para a regulação da expressão gênica, através da introdução ou eliminação de estruturas tais como haste-alças.
[0107] Os vectores de expressão contendo todos os elementos necessários para a expressão estão disponíveis comercialmente e são conhecidos dos versados na técnica. Ver, por exemplo, Sambrook et al., Molecular Cloning: A
Laboratory Manual, Segunda Edição, Cold Spring Harbor Laboratory Press, 1989. As células são geneticamente manipuladas pela introdução nas células do DNA heterólogo. O DNA heterólogo é colocado sob controle operável de elementos transcricionais para permitir a expressão do DNA heterólogo na célula hospedeira.
[0108] Em algumas modalidades, os genes endógenos são editados, em vez de passar por complementação gênica. A edição pode modificar os promotores endógenos, as sequências de ligação ribossomal ou outras sequências de controle da expressão, e/ou, em algumas modalidades, modifica os fatores de ação trans e/ou cis na regulação do gene. A edição de genoma pode ser feita usando técnicas de edição de genoma CRISPR/Cas, ou técnicas similares empregando nucleases de dedo de zinco e TALENs. Em algumas modalidades, os genes endógenos são substituídos por recombinação homóloga.
[0109] Em algumas modalidades, os genes são superexpressos, pelo menos em parte, pelo controle do número de cópias do gene. Embora o número de cópias de genes possa ser convenientemente controlado utilizando plasmídeos com número de cópias variável, a duplicação de genes e a integração cromossômica podem também ser empregadas. Por exemplo, um processo para duplicação de genes em série geneticamente estável é descrito na US 2011/0236927, que é incorporada neste documento por referência na sua totalidade.
[0110] O terpeno ou produto terpeno pode ser recuperado por qualquer processo adequado, incluindo a partição do produto desejado numa fase orgânica ou fase hidrofóbica. Alternativamente, a fase aquosa pode ser recuperada, e/ou toda a biomassa celular pode ser recuperada, para posterior processamento. A produção do produto desejado pode ser determinada e/ou quantificada, por exemplo, por cromatografia gasosa (por exemplo, GC-MS). O produto desejado pode ser produzido em sistemas de biorreatores contínuos ou descontínuos. A produção do produto, recuperação e/ou análise do produto pode ser feita conforme descrito na US 2012/0246767, que é incorporada neste documento por referência na sua totalidade. Por exemplo, em algumas modalidades, o óleo de produto é extraído do meio reacional aquoso utilizando um solvente orgânico, tal como um alcano tal como heptano ou dodecano, ou óleo vegetal (por exemplo, óleo de cártamo) seguido por destilação fracionada. Em outras modalidades, o óleo de produto é extraído a partir de meio reacional aquoso utilizando uma fase hidrofóbica, tal como um óleo vegetal, seguido de extração com solvente orgânico e destilação fracionada. Os componentes terpeno e terpenoides das frações podem ser medidos quantitativamente por GC/MS, seguido por mistura de frações para gerar um perfil de produto desejado.
[0111] A semelhança das sequências de nucleotídeos e aminoácidos, isto é, a porcentagem de identidade de sequência, pode ser determinada através de alinhamentos de sequências. Esses alinhamentos podem ser realizados com vários algoritmos conhecidos na técnica, como com o algoritmo matemático de Karlin e Altschul (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. EUA 90: 5873-5877), com hmmalign (HMMER package, http://hmmer.wustl.edu/) ou com o algoritmo CLUSTAL (Thompson, J.D., Higgins, D.G. & Gibson, T.J. (1994) Nucleic Acids Res. 22, 4673-80). O grau de identidade de sequência (correspondência de sequência) pode ser calculado usando, por exemplo, BLAST, BLAT ou BlastZ (ou BlastX). Um algoritmo semelhante é incorporado nos programas BLASTN e BLASTP de Altschul et al (1990) J. Mol. Biol. 215: 403-410. As pesquisas de polinucleotídeos BLAST podem ser realizadas com o programa BLASTN, pontuação = 100, comprimento da palavra = 12.
[0112] Pesquisas de proteína BLAST podem ser realizadas com o programa BLASTP, pontuação = 50, comprimento da palavra = 3. Para obter os alinhamentos com lacunas para fins de comparação, o Gapped BLAST pode ser utilizado conforme descrito em Altschul et al., (1997) Nucleic Acids Res. 25: 3389-3402. Ao utilizar os programas BLAST e Gapped BLAST, os parâmetros padrão dos respectivos programas podem ser usados. A análise de correspondência de sequências pode ser suplementada por técnicas de mapeamento de homologia estabelecidas, como os campos aleatórios de Shuffle-LAGAN (Brudno M., Bioinformatics 2003b, 19 Suppl 1: 154-162) ou Markov.
[0113] As "substituições conservativas" podem ser feitas, por exemplo, com base na semelhança em polaridade, carga, tamanho, hidrofobicidade, hidrofilicidade e/ou na natureza anfipática dos resíduos de aminoácidos envolvidos. Os 20 aminoácidos de ocorrência natural podem ser agrupados nos seguintes seis grupos padrão de aminoácidos:
(1) hidrofóbicos: Met, Ala, Val, Leu, Ile; (2) hidrofílicos neutros: Cys, Ser, Thr, Asn, Gln; (3) ácidos: Asp, Glu; (4) básicos: His, Lys, Arg; (5) resíduos que influenciam a orientação de cadeia: Gli, Pro; e (6) aromáticos: Trp, Tyr, Phe.
[0114] Como usado neste documento, “substituições conservativas” são definidas como trocas de um aminoácido por outro aminoácido listado dentro do mesmo grupo dos seis grupos de aminoácido padrão mostrados acima. Por exemplo, a troca de Asp por Glu mantém uma carga negativa no polipeptídeo assim modificado. Além disso, a glicina e a prolina podem ser substituídas entre si com base na sua capacidade de interromper as α-hélices. Algumas substituições conservativas preferidas dentro dos seis grupos acima são trocas dentro dos seguintes subgrupos: (i) Ala, Val, Leu e Ile; (ii) Ser e Thr; (ii) Asn e Gln; (iv) Lys e Arg; e (v) Tyr e Phe.
[0115] Conforme utilizado neste documento, "substituições não- conservativas" são definidas como trocas de um aminoácido por outro aminoácido listado em um grupo diferente dos seis grupos de aminoácidos padrão (1) a (6) mostrados acima.
[0116] Modificações de enzimas conforme descritas neste documento podem incluir mutações conservativas e/ou não-conservativas.
[0117] Em algumas modalidades, o "design racional" está envolvido na construção de mutações específicas em enzimas. Design racional refere-se à incorporação do conhecimento da enzima, ou enzimas relacionadas, tais como a termodinâmica e cinética da reação, sua estrutura tridimensional, seu(s) local(is) ativo(s), seu(s) substrato(s) e / ou interação entre a enzima e o substrato, no design da mutação específica. Com base em uma abordagem de design racional, mutações podem ser criadas em uma enzima que pode então ser rastreada para aumentar a produção de um terpeno ou terpenoide em relação aos níveis de controle. Em algumas modalidades, as mutações podem ser racionalmente projetadas com base na modelagem de homologia. Conforme utilizado neste documento, "modelagem de homologia" refere-se ao processo de construção de um modelo de resolução atômica de uma proteína a partir da sua sequência de aminoácidos e de uma estrutura tridimensional de uma proteína homóloga relacionada.
[0118] Em outros aspectos, a invenção fornece um método para produzir um produto que compreende um glicosídeo de mogrol. O método compreende a produção de um glicosídeo de mogrol de acordo com esta divulgação e a incorporação do glicosídeo de mogrol em um produto. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V. Em algumas modalidades, o produto é uma composição adoçante, composição aromatizante, alimento, bebida, goma de mascar, texturizante, composição farmacêutica, produto de tabaco, composição nutracêutica ou composição de higiene oral.
[0119] O produto pode ser uma composição adoçante compreendendo uma mistura de adoçantes artificiais e/ou naturais. Por exemplo, a composição pode compreender ainda um ou mais de um glicosídeo de esteviol, aspartame e neotame. Glicosídeos de esteviol exemplares compreendem um ou mais dentre RebM, RebB, RebD, RebA, RebE e RebI.
[0120] Exemplos não limitativos de sabores para os quais os produtos podem ser usados em combinação incluem sabores de lima, limão, laranja, fruta, banana, uva, pera, abacaxi, manga, amêndoa amarga, cola, canela, açúcar, algodão doce e baunilha. Exemplos não limitativos de outros ingredientes alimentares incluem aromas, acidulantes e aminoácidos, agentes corantes, agentes de volume, amidos modificados, gomas, texturizantes, conservantes, antioxidantes, emulsionantes, estabilizantes, espessantes e agentes gelificantes.
[0121] Glicosídeos de mogrol obtidos de acordo com esta invenção podem ser incorporados como um adoçante natural de alta intensidade em alimentos, bebidas, composições farmacêuticas, cosméticos, gomas de mascar, produtos de mesa, cereais, produtos lácteos, pastas de dente e outras composições para cavidade oral, etc.
[0122] Os glicosídeos de mogrol obtidos de acordo com esta invenção podem ser usados em combinação com várias substâncias fisiologicamente ativas ou ingredientes funcionais. Ingredientes funcionais geralmente são classificados em categorias como carotenoides, fibra alimentar, ácidos graxos, saponinas,
antioxidantes, nutracêuticos, flavonoides, isotiocianatos, fenóis, esteróis vegetais e estanóis (fitoesteróis e fitoestanóis); polióis; prebióticos, probióticos; fitoestrogênios; proteína de soja; sulfetos/tióis; aminoácidos; proteínas; vitaminas; e minerais. Ingredientes funcionais também podem ser classificados com base em seus benefícios à saúde, como cardiovasculares, redutores do colesterol e anti- inflamatórios.
[0123] Glicosídeos de mogrol obtidos de acordo com esta invenção podem ser aplicados como um adoçante de alta intensidade para produzir zero caloria, calorias reduzidas ou bebidas para diabéticos e produtos alimentícios com características de sabor melhoradas. Também pode ser usado em bebidas, alimentos, produtos farmacêuticos e outros produtos nos quais o açúcar não pode ser usado. Além disso, glicosídeo(s) de mogrol alvo altamente purificado(s), particularmente, Mog. V, Mog. VI, ou Isomog. V, podem ser utilizados como adoçante não apenas em bebidas, alimentos e outros produtos destinados ao consumo humano, mas também em rações e forragens com características melhoradas.
[0124] Exemplos de produtos nos quais glicosídeo(s) de mogrol podem ser usados como um composto edulcorante incluem, mas não estão limitados a, bebidas alcoólicas como vodca, vinho, cerveja, licor e saquê, etc.; sucos naturais; bebidas refrescantes; refrigerantes carbonatados; bebidas dietéticas; bebidas com zero calorias; bebidas e alimentos com calorias reduzidas; bebidas à base de iogurte; sucos instantâneos; café instantâneo; bebidas instantâneas do tipo em pó; produtos enlatados; xaropes; pasta de soja fermentada; molho de soja; vinagre; molhos; maionese; ketchups; curry; sopa; caldo instantâneo; molho de soja em pó; vinagre em pó; tipos de biscoitos; biscoito de arroz; bolachas; pão; chocolates; caramelo; doce; goma de mascar; gelatina; pudim; frutas e vegetais em conserva; natas frescas; geleia; marmelada; pasta de flores; leite em pó; sorvete; sorbet; vegetais e frutas embalados em recipientes; feijão enlatado e cozido; carne e alimentos cozidos em molho adoçado; produtos alimentares vegetais agrícolas; frutos do mar; presunto; linguiça; presunto de peixe; salsicha de peixe; pasta de peixe; produtos de peixe frito; produtos de frutos do mar secos; produtos alimentares congelados; algas marinhas em conserva; carne em conserva; tabaco;
medicamentos; e muitos outros.
[0125] Durante a fabricação de produtos como alimentos, bebidas, produtos farmacêuticos, cosméticos, produtos de mesa e goma de mascar, os métodos convencionais, como mistura, amassamento, dissolução, decapagem, permeação, percolação, aspersão, atomização, infusão e outros métodos podem ser usados.
[0126] Conforme utilizado neste relatório descritivo e nas reivindicações anexas, as formas singulares "um", "uma" e "o(a)" incluem referentes plurais, a menos que o contexto indique claramente o contrário. Assim, por exemplo, a referência a “uma célula” inclui uma combinação de duas ou mais células e similares.
[0127] Conforme usado neste documento, o termo "cerca de" em referência a um número é geralmente considerado como incluindo números que se enquadram dentro de um intervalo de 10% em qualquer direção (maior ou menor que) do número.
EXEMPLOS
[0128] Sua biossíntese de mogrosídeos no fruto envolve um número de glicosilações consecutivas do mogrol de aglicona nos produtos doces finais, incluindo mogrosídeo V (Mog. V). Mog. V tem uma capacidade adoçante que é cerca de 250 vezes a da sacarose (Kasai et al., Agric Biol Chem (1989)). Os mogrosídeos também apresentam benefícios para a saúde (Li et al., Chin J Nat Med (2014)).
[0129] Uma variedade de fatores está promovendo um aumento no interesse em mogrosídeos e da fruta-dos-monges em geral, incluindo a explosão na demanda por adoçantes naturais, as dificuldades no fornecimento escalonável do atual adoçante natural principal, rebaudiosídeo M (RebM), da planta Stevia, o desempenho de sabor superior do mogrosídeo V em relação a outros produtos adoçantes naturais e artificiais no mercado; e o potencial medicinal da planta e do fruto.
[0130] Mog. V purificado foi aprovado como um adoçante de alta intensidade no Japão (Jakinovich et al., Journal of Natural Products (1990)) e o extrato ganhou o status de GRAS nos EUA como um adoçante não nutritivo e realçador de sabor (GRAS 522). A extração de mogrosídeos do fruto pode render um produto de vários graus de pureza, muitas vezes acompanhado de gosto residual indesejável. Além disso, os rendimentos de mogrosídeo do fruto cultivado são limitados devido ao baixo rendimento das plantas e aos requisitos específicos de cultivo da planta. Os mogrosídeos estão presentes em ~1% nos frutos frescos e em ~4% nos frutos secos. Mog. V é o principal componente, com teor de 0,5% a 1,4% no fruto seco. Além disso, as dificuldades de purificação limitam a pureza de Mog. V, com produtos comerciais de extratos de plantas sendo padronizados para ~50% Mog. V. Um produto de Mog. V puro é desejável para evitar sabores estranhos e será mais fácil de formular em produtos, desde que Mog. V tenha um bom potencial de solubilidade. Portanto, é vantajoso produzir compostos doces de mogrosídeo, como Mog. V, por meio de processos biotecnológicos.
[0131] A FIGURA 1 mostra as estruturas químicas de Mog. V, Mog. VI, e Isomog. V. Mog. V tem cinco glicosilações em relação ao núcleo do mogrol, incluindo glicosilações nos grupos hidroxila C3 e C24, seguidas por adições de glicosil 1-2, 1-4 e 1-6. Essas reações de glicosilação são catalisadas por enzimas glicosiltransferase dependentes de difosfato de uridina (UGTs).
[0132] A FIGURA 2 mostra as rotas para produção de Mog. V in vivo. A transformação enzimática necessária para cada etapa é indicada, juntamente com o tipo de enzima necessária. Os números entre parênteses correspondem às estruturas químicas na FIGURA 3, nomeadamente: (1) pirofosfato de farnesila; (2) esqualeno; (3) 2,3-oxidosqualeno; (4) 2,3; 22,23-dioxidosqualeno; (5) 24,25- epoxicucurbitadienol; (6) 24,25-di-hidro-oxicucurbitadienol; (7) mogrol; (8) mogrosídeo V; (9) cucurbitadienol.
[0133] Conforme ilustrado na FIGURA 2, os mogrosídeos podem ser produzidos por processos de fermentação biossintética, usando cepas microbianas que produzem altos níveis de produtos da via MEP, juntamente com a expressão heteróloga de enzimas de biossíntese de mogrol e enzimas UGT que direcionam as reações de glicosilação a Mog. V, ou outro composto de mogrosídeo desejado. Por exemplo, em bactérias como E. coli, isopentenil pirofosfato (IPP) e dimetilalil pirofosfato (DMAPP) são produzidos a partir de glicose e são convertidos em difosfato de farnesila (FPP) (1) pela farnesil difosfato sintase recombinante (FPPS). FPP é convertido em esqualeno (2) por uma reação de condensação catalisada pela esqualeno sintase (SQS). O esqualeno é convertido em 2,3-oxidosqualeno (3) por uma reação de epoxidação catalisada por uma esqualeno epoxidase (SQE). A via pode prosseguir para 22,23-dioxidosqualeno (4) por epoxidação adicional seguida de ciclização para 24,25-epoxicucurbitadienol (5) por uma triterpeno ciclase e, em seguida, hidratação do grupo epóxi restante para 24,25-di- hidroxicucurbitadienol (6) por uma epóxido hidrolase. Uma hidroxilação adicional catalisada por uma oxidase P450 produz mogrol (7).
[0134] A via pode alternativamente prosseguir por ciclização de (3) para produzir cucurbitadienol (9), seguida por epoxidação para (5), ou hidroxilações múltiplas de cucurbitadienol para (6), ou mogrol (7).
[0135] A FIGURA 4 ilustra as rotas de glicosilação para Mog. V, e indica atividade de biotransformação in vitro observada para diferentes enzimas. A glicosilação do hidroxila C3 produz Mog. I-E, ou glicosilação da hidroxila C24 produz Mog. I-A1. Glicosilação de Mog. I-A1 em C3 ou glicosilação de Mog. I-E1 em C24 produz Mog. II-E. Glicosilação adicional 1-6 de Mog. II-E em C3 produz Mog. III-A2. Glicosilação 1-6 adicional em C24 de Mog. IIE produz Mog. III. Glicosilação 1-2 de Mog. III-A2 em C24 produz Mog. IV e depois para Mog. V com uma glicosilação 1- 6 adicional em C24. Alternativamente, as glicosilações podem prosseguir através de Mog. III, com glicosilação 1-6 em C3 e glicosilação 1-2 em C24, ou através de Siamenosídeo ou Mog. IV com glicosilações 1-6.
[0136] Embora as enzimas biossintéticas da fruta-dos-monges (Siraitia grosvenorii) tenham sido identificadas para a produção de mogrol (Ver WO 2016/038617 e US 2015/0322473, que são incorporados neste documento por referência em sua totalidade), muitas dessas enzimas não possuem a produtividade ou propriedades físicas desejadas para superexpressão em hospedeiros microbianos, particularmente para abordagens de fermentação que operam em temperaturas mais altas do que o clima natural da planta. Consequentemente, enzimas alternativas são desejadas para melhorar a produção de mogrol usando fermentação microbiana, com mogrol atuando como o substrato para a glicosilação para produzir Mog. V.
[0137] Usando uma cepa de E. coli que produz altos níveis dos produtos IPP e DMAPP da via MEP (ver US 2018/0245103 e US 2018/0216137, que são incorporados neste documento por referência), e com superexpressão de ScFPPS, as enzimas foram triadas quanto à sua capacidade de converter FPP em esqualeno (atividade de SQS), bem como a epoxidação de esqualeno para produzir 2,3- oxidosqualeno (atividade de SQE). O intermediário 2,3-oxidosqualeno pode ser ciclizado por uma triterpeno ciclase, como o CDS de Siraitia grosvenorii. Conforme demonstrado na FIGURA 5, várias enzimas foram identificadas com boa atividade em E. coli. Isso inclui AaSQS, SgSQS, EsSQS, BbSQS, ElSQS e FbSQS. Em particular, AaSQS mostrou alta atividade em E. coli em condições de cultura de 37 ° C.
[0138] Conforme mostrado na FIGURA 6, a coexpressão de SQS de Artemisia annua e MlSQE de Methylomonas lenta em E. coli forneceu um ganho substancial na titulação do intermediário 2,3-oxidosqualeno. Outras enzimas SQE estavam ativas em E. coli, incluindo BaESQE, MsSQE e MbSQE.
[0139] A FIGURA 7 mostra a coexpressão das enzimas SQS, SQE e TTC. CDS de Siraitia grosvernorii (ou triterpeno ciclase, ou “TTC”), quando coexpressa com AaSQS e MlSQE, resultou em alta produção do produto triterpenoide, cucurbitadienol (Produto 3). Esses experimentos de fermentação foram realizados a 37° C por 48 a 120 horas.
[0140] Mogrol foi usado como substrato para reações de glicosilação in vitro com enzimas UGT candidatas, para identificar enzimas candidatas que fornecem glicosilação eficiente de mogrol para Mog. V. As reações foram realizadas em tampão Tris-HCl a 50 mM (pH 7,0) contendo beta-mercaptoetanol (5 mM), cloreto de magnésio (400 uM), substrato (200 uM), UDP-glicose (5 mM) e uma fosfatase (1 U). Os resultados são mostrados na FIGURA 8A. O produto de Mog. V é observado quando as enzimas UGT 85C1 (S. rebaudiana), 85C2 (S. rebaudiana) e UGTSg94_3 são incubadas juntas. Um produto penta-glicosilado é formado quando as enzimas UGT 85C1 (S. rebaudiana), 85C2 (S. rebaudiana) e CaUGT_1,6 são incubadas juntas. FIGURA 8B, Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V+H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrosídeo II-E. FIGURA 8C, Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V+H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrol. Abreviatura: MogV, mogrosídeo V.
[0141] A FIGURA 4 e a FIGURA 9 mostram atividades de glicosiltransferase adicionais observadas em substratos específicos. A coexpressão de enzimas UGT pode ser selecionada para mover o produto para qualquer produto mogrosídeo desejado.
[0142] A FIGURA 10 é um alinhamento de aminoácidos de CaUGT_1,6 e SgUGT94_289_3 usando Clustal Omega (Versão CLUSTAL O (1,2,4). Essas sequências compartilham 54% de identidade de aminoácido. Prevê-se que a UGT_1,6 de Coffea arabica seja uma semelhante a beta-D-glicosil crocetina beta 1,6-glicosiltransferase (XP_027096357.1). Juntamente com estruturas UGT conhecidas e sequências primárias, CaUGT_1,6 pode ser adicionalmente manipulada para expressão e atividade microbiana, incluindo a manipulação de um permutante circular.
[0143] As enzimas de biossíntese podem ser adicionalmente manipulada para expressão e atividade em células microbianas, usando estruturas conhecidas e sequências primárias. A FIGURA 11 é um alinhamento de aminoácidos de esqualeno sintase (HsSQS) de Homo sapiens (acesso NCBI NP_004453.3) e AaSQS (SEQ ID NO: 11) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQS tem uma estrutura de cristal publicada (entrada PDB: 1EZF). Essas sequências compartilham 42% de identidade de aminoácido. A FIGURA 12 é um alinhamento de aminoácidos de esqualeno epoxidase (HsSQE) de Homo sapiens (acesso NCBI XP_011515548) e MlSQE (SEQ ID NO: 39) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQE tem uma estrutura de cristal publicada (entrada PDB: 6C6N). Essas sequências compartilham 35% de identidade de aminoácido.
SEQUÊNCIAS Farnesil Pirofosfato Sintase (FPPS) Saccharomyces cerevisiae FPPS (SEQ ID NO: 1)
MASEKEIRRERFLNVFPKLVEELNASLLAYGMPKEACDWYAHSLNYNTPG GKLNRGLSVVDTYAILSNKTVEQLGQEEYEKVAILGWCIELLQAYFLVADDMMDK SITRRGQPCWYKVPEVGEIAINDAFMLEAAIYKLLKSHFRNEKYYIDITELFHEVTF QTELGQLMDLITAPEDKVDLSKFSLKKHSFIVTFKTAYYSFYLPVALAMYVAGITDE KDLKQARDVLIPLGEYFQIQDDYLDCFGTPEQIGKIGTDIQDNKCSWVINKALELA SAEQRKTLDENYGKKDSVAEAKCKKIFNDLKIEQLYHEYEESIAKDLKAKISQVDE
SRGFKADVLTAFLNKVYKRSK Esqualeno Sintase (SQS) Siraitia grosvenorii SQSa (SEQ ID NO: 2)
MGSLGAILRHPDDFYPLLKLKMAARHAEKQIPPEPHWGFCYTMLHKVSRS FALVIQQLAPELRNAICIFYLVLRALDTVEDDTSIQTDIKVPILKAFHCHIYNRDWHF SCGTKDYKVLMDQFHHVSTAFLELGKGYQEAIEDITKRMGAGMAKFICKEVETVD DYDEYCHYVAGLVGLGLSKLFHASDLEDLAPDSLSNSMGLLLQKTNIIRDYLEDIN EIPKSRMFWPREIWGKYADKLEDFKYEENSVKAVQCLNDLVTNALNHVEDCLKY MSNLRDLSIFRFCAIPQIMAIGTLALCYNNVEVFRGVVKMRRGLTAKVIDRTQTMA DVYGAFFDFSVMLKAKVNSSDPNATKTLSRIEAIQKTCEQSGLLNKRKLYAVKSE
PMFNPTLIVILFSLLCIILAYLSAKRLPANQPV Siraitia grosvenorii SQSb (SEQ ID NO: 3)
MGSLGAILRHPDDFYPLLKLKMAARHAEKQIPPEPHWGFCYTMLHKVSRS FALVIQQLAPELRNAICIFYLVLRALDTVEDDTSIQTDIKVPILKAFHCHIYNRDWHF SCGTKDYKVLMDQFHHVSTAFLELGKGYQEAIEDITKRMGAGMAKFICKEVETVD DYDEYCHYVAGLVGLGLSKLFHASDLEDLAPDSLSNSMGLLLQKTNIIRDYLEDIN EIPKSRMFWPREIWGKYADKLEDFKYEENSVKAVQCLNDLVTNALNHVEDCLKY MSNLRDLSIFRFCAIPQIMAIGTLALCYNNVEVFRGVVKMRRGLTAKVIDRTQTMA DVYGAFFDFSVMLKAKVNNSDPNATKTLSRIEAIQKTCEQSGLLNKRKLYAVKSE
PMFNPTLIVILFSLLCIILAYLSAKRLPANQPV Cucumis sativus (SEQ ID NO: 4)
MGSLGAILKHPDDFYPLLKLKIAARHAEKQIPPEPHWGFCYTMLHKVSRSF ALVIQQLKPELRNAVCIFYLVLRALDTVEDDTSIQTDIKVPILKAFHCHIYNRDWHF SCGTKDYKVLMDEFHHVSTAFLELGKGYQEAIEDITKRMGAGMAKFICKEVETVD DYDEYCHYVAGLVGLGLSKLFHAAELEDLAPDSLSNSMGLFLQKTNIIRDYLEDIN EIPKSRMFWPREIWGKYADKLEDFKYEENSVKAVQCLNDLVTNALNHVEDCLKY MSNLRDLSIFRFCAIPQIMAIGTLALCYNNVEVFRGVVKMRRGLTAKVIDRTKTMA DVYGAFFDFSVMLKAKVNSNDPNASKTLSRIEAIQKTCKQSGILNRRKLYVVRSE PMFNPAVIVILFSLLCIILAYLSAKRLPANQSV
Cucumis melo (SEQ ID NO: 5)
MGSLGAILKHPDDFYPLLKLKMAARHAEKQIPPESHWGFCYTMLHKVSRS FALVIQQLKPELRNAVCIFYLVLRALDTVEDDTSIQTDIKVPILKAFHCHIYNRDWHF SCGTKDYKVLMDEFHHVSTAFLELGKGYQEAIEDITKRMGAGMAKFICKEVETVD DYDEYCHYVAGLVGLGLSKLFHAAELEDLAPDSLSNSMGLFLQKTNIIRDYLEDIN EIPKSRMFWPREIWGKYADKLEDFKYEENSVKAVQCLNDLVTNALNHVEDCLKY MSNLRDLSIFRFCAIPQIMAIGTLALCYNNVEVFRGVVKMRRGLTAKVIDRTKTMA DVYGAFFDFSVMLKAKVNSNDPNASKTLSRIEAIQQTCQQSGLMNKRKLYVVRS
EPMYNPAVIVILFSLLCIILAYLSAKRLPANQSV Cucumis melo (SEQ ID NO: 6)
MGSLGAILKHPDDFYPLLKLKMAARHAEKQIPPESHWGFCYTMLHKVSRS FALVIQQLKPELRNAVCIFYLVLRALDTVEDDTSIQTDIKVPILKAFHCHIYNRDWHF SCGTKDYKVLMDEFHHVSTAFLELGKGYQEAIEDITKRMGAGMAKFICKEVETVD DYDEYCHYVAGLVGLGLSKLFHAAELEDLAPDSLSNSMGLFLQKTNIIRDYLEDIN EIPKSRMFWPREIWGKYADKLEDFKYEENSVKAVQCLNDLVTNALNHVEDCPKY MSNLRDLSIFRFCAIPQIMAIGTLALCYNNVEVFRGVVKMRRGLTAKVIDRTKTMA DVYGAFFDFSVMLKAKVNSNDPNASKTLSRIEAIQQTCQQSGLMNKRKLYVVRS
EPMYNPAVIVILFSLLCIILAYLSAKRLPANQSV Cucurbita moschata (SEQ ID NO: 7)
MGSLGAILRHPDDIYPLLKLKMAARHAEKQIPPESHWGFCYTMLHKVSRS FALVIQQLKPELRNAVCIFYLVLRALDTVEDDTSIQTDIKVPILKAFHCHIYNRDWHF SCGTKDYKVLMDEFHHVSTAFLELGRGYQEAIEDITKRMGAGMAKFICKEVETVE DYDEYCHYVAGLVGLGLSKLFHASKSENLAPDSLSNSMGLFLQKTNIIRDYLEDIN EIPKSRMFWPREIWSKYADKLEDFKYEKNSVKAVQCLNDLVTNALTHVEDCLEY MSNLKDLSIFRFCAIPQIMAIGTLALCYNNVDVFRGVVKMRRGLTAKVIYRTKTMA DVYGAFFDFSVMLKAKVNSSDPNASKTLTRIEAIQKTCKQSGLLNKRELYAVRSE
PMCNPAAIVVLFSLLCIILAYLSAKLLPANQPV Sechium edule (SEQ ID NO: 8)
MGSLGAILSHPDDLYPLLKLKMAAKHAEKQIPPDPHWGFCFSMLHKVSRS FALVIQQLKPELRNAVCIFYLVLRALDTVEDDTGIHPDIKVPILQAFHCHIYNRDWH FSCGTKHYKVLMDEFHHVSTAFLELGKGYQEAIEDVTERMGAGMAKFICKEVET VDDYDEYCHYVAGLVGLGLSKLFHAAELEDLAPDSLSNSMGLFLQKTNIIRDYLE DINEIPKSRMFWPREIWNKYADKLEDFKYEENSVKAVQCLNDLVTNALNHVEDCL KYMSNLKDLSTFRFCAIPQIMAIGTLALCYDNVEVFRGVVKMRRGLTAKIIDRTKKI ADVYGAFFDFSVMLKAKVNSSDPNAAKTLSRIEAIEKTCKESGLLNKRKLYVIRSE
PLFNPAVLVILFSLICILLAYLSAKRLPANQPV Panax quinquefolius (SEQ ID NO: 9)
MGSLGAILKHPDDFYPLLKLKFAARHAEKQIPPEPHWAFCYSMLHKVSRS FGLVIQQLGPQLRDAVCIFYLVLRALDTVEDDTSIPTEVKVPILMAFHRHIYDKDW HFSCGTKEYKVLMDEFHHVSNAFLELGSGYQEAIEDITMRMGAGMAKFICKEVET IDDYDEYCHYVAGLVGLGLSKLFHASGAEDLATDSLSNSMGLFLQKTNIIRDYLED INEIPKSRMFWPRQIWSKYVDKLEDLKYEENSAKAVQCLNDMVTDALVHAEDCL KYMSDLRDPAIFRFCAIPQIMAIGTLALCFNNTQVFRGVVKMRRGLTAKVIDRTKT MSDVYGAFFDFSCLLKSKVDNNDPNATKTLSRLEAIQKTCKESGTLSKRKSYIIES
ESGHNSALIAIIFIILAILYAYLSSNLLLNKQ Malus domestica (SEQ ID NO: 10)
MGALSTMLKHPDDIYPLLKLKIASRQIEKQIPAEPHWAFCYTMLQKVSRSF ALVIQQLGTELRNAVCLFYLVLRALDTVEDDTSVATDVKVPILLAFHRHIYDPDWH FACGTNNYKVLMDEFHHVSTAFLELGTGYQEAIEDITKRMGAGMAKFILKEVETID DYDEYCHYVAGLVGLGLSKLFHAAGKEDLASDSLSNSMGLFLQKTNIIRDYLEDIN EIPKSRMFWPRQIWSKYVNKLEDLKYEENSEKAVQCLNDMVTNALIHMEDCLKY MAALRDPAIFKFCAIPQIMAIGTLALCYNNIEVFRGVVKMRRGLTAKVIDRTKSMD DVYGAFFDFSSILKSKVDKNDPNATKTLSRVEAVQKLCRDSGALSKRKSYIANRE
QSYNSTLIVALFIILAIIYAYLSASPRI Artemisia annua (SEQ ID NO: 11)
MSSLKAVLKHPDDFYPLLKLKMAAKKAEKQIPSQPHWAFSYSMLHKVSRS FALVIQQLNPQLRDAVCIFYLVLRALDTVEDDTSIAADIKVPILIAFHKHIYNRDWHF ACGTKEYKVLMDQFHHVSTAFLELKRGYQEAIEDITMRMGAGMAKFICKEVETVD DYDEYCHYVAGLVGIGLSKLFHSSGTEILFSDSISNSMGLFLQKTNIIRDYLEDINEI PKSRMFWPREIWSKYVNKLEDLKYEENSEKAVQCLNDMVTNALIHIEDCLKYMS QLKDPAIFRFCAIPQIMAIGTLALCYNNIEVFRGVVKLRRGLTAKVIDRTKTMADVY QAFSDFSDMLKSKVDMHDPNAQTTITRLEAAQKICKDSGTLSNRKSYIVKRESSY
SAALLALLFTILAILYAYLSANRPNKIKFTL Glycine soja (SEQ ID NO: 12)
MDQRSEDEFYPLLKLKIVARNAEKQIPPEPHWAFCYTMLHKVSRSFALVIQ QLGIELRNAVCIFYLVLRALDTVEDDTSIETDVKVPILIAFHRHIYDRDWHFSCGTK EYKVLMGQFHHVSTAFLELGKNYQEAIEDITKRMGAGMAKFICKEVETIDDYDEY CHYVAGLVGLGLSKLFHASGSEDLAPDDLSNSMGLFLQKTNIIRDYLEDINEIPKS RMFWPRQIWSEYVNKLEDLKYEENSVKAVQCLNDMVTNALMHAEDCLTYMAAL RDPPIFRFCAIPQIMAIGTLALCYNNIEVFRGVVKMRRGLTAKVIDRTKTMADVYG AFFDFASMLEPKVDKNDPNATKTLSRLEAIQKTCRESGLLSKRKSYIVNDESGYG
STMIVILVIMVSIIFAYLSANHHNS Diospyros kaki (SEQ ID NO: 13)
MGSLAAMLRHPDDVYPLVKLKMAARHAEKQIPPEPHWAFCYTMLHKVSR SFGLVIQQLGTELRNAVCIFYLVLRALDTVEDDTSIATEVKVPILLAFHHHIYDRDW HFSCGTREYKVLMDEFHHVSTAFLELGKGYQEAIEDITMRMGAGMAKFICKEVET IDDYDEYCHYVAGLVGLGLSKLFHASGLEDLAPDSLSNSMGLFLQKTNIIRDYLED INEIPKSRMFWPRQIWSKYVNKLEDLKYEKNSVKSVQCLNDMVTNALIHVDDCLK YMSALRDPAIFRFCAIPQIMAIGTLALCYNNIEVFRGVVKMRRGLTAKVIDQTKTIS DVYGAFFDFSCMLKSKVEKNDPNSTKTLSRIEAIQKTCRESGTLSKRKSYILRSKR
THNSTLIFVLFIILAILFAYLSANRPPINM Euphorbia lathyris (SEQ ID NO: 14)
MGSLGAILKHPDDFYPLLKLKMAAKHAEKQIPAQPHWGFCYSMLHKVSRS FSLVIQQLGTELRDAVCIFYLVLRALDTVEDDTSIPTDVKVPILIAFHKHIYDPEWHF SCGTKEYKVLMDQIHHLSTAFLELGKSYQEAIEDITKKMGAGMAKFICKEVETVDD YDEYCHYVAGLVGLGLSKLFDASGFEDLAPDDLSNSMGLFLQKTNIIRDYLEDINE IPKSRMFWPRQIWSKYVNKLEDLKYEENSVKAVQCLNDMVTNALIHMDDCLKYM SALRDPAIFRFCAIPQIMAIGTLALCYNNVEVFRGVVKMRRGLTAKVIDRTRTMAD VYRAFFDFSCMMKSKVDRNDPNAEKTLNRLEAVQKTCKESGLLNKRRSYINESK
PYNSTMVILLMIVLAIILAYLSKRAN Camellia oleifera (SEQ ID NO: 15)
MGSLGAILKHPDDFYPLMKLKMAARRAEKNIPPEPHWGFCYSMLHKVSR SFALVIQQLDTELRNAVCIFYLVLRALDTVEDDTSIATEVKVPILMAFHRHIYDRDW HFSCGTKEYKVLMDEFHHVSTAFSELGRGYQEAIEDITMRMGAGMAKFICKEVE TIDDYDEYCHYVAGLVGLGLSKLFHASGSEDLASDSLSNSMGLFLQVFLLTCIKTN IIRDYLEDINEIPKSRMFWPRQIWSKYVNKLEDLKDKENSVKAVECLNDMVTNALI HVEDCLTYMSALRDPSIFRFCAIPQIMAIGTLALCYNNIEVFRGVVKMRRGLTAKVI DRTKTMSDVYGGFFDFSCMLKSKVNKSDPNAMKALSRLEAIQKICRESGTLNKR
KSYIIKSEPRYNSTLVFVLFIILAILFAYL Eleutherococcus senticosus (SEQ ID NO: 16)
MGSLGAILKHPDDFYPLLKLKFAARHAEKQIPPEPHWAFCYSMLHKVSRS FGLVIQQLDAQLRDAVCIFYLVLRALDTVEDDTSIPTEVKVPILMAFHRHIYDKDWH FSCGTKEYKVLMDEFHHVSNAFLELGSGFQEAIEDITMRMGAGMAKFICKEVETI DDYDEYCHYVAGLVGLGLSKLFHASGAEDLATDSLSNSMGLFLQKTNIIRDYLEDI NEIPKSRMFWPRQIWSKYVDKLENLKYEENSAKAVQCLNDMVTNALLHAEDCLK YMSNLRDPAIFRFCAIPQIMAIGTLALCFNNIQVFRGVVKMRRGLTAKVIDRTKTM SDVYGAFFDFSCLLKSKVDNNDPNATKTLSRLEAIQKTCKESGTLSKRKSYIIESK
SAHNSALIAIIFIILAILYAYLSSNLPNNQ Flavobacteriales bacterium (SEQ ID NO: 166)
MLNNSLFSRLEEIPALLKLKLGSKDYYKNNNSETLTCDNLRYCFDTLNKVS RSFATVIKQLPNELGNNVCVFYLILRALDSIEDDMNLPKELKIKLLREFHKKNYESG WNISGVGDKKEHVELLENYDKVIQSFLAIDQKNQLIITDICRKVGAGMANFVKAEIE SVEDYNLYCHHVAGLVGIGLSRMFISSGLENDDFLNQDEISNSMGLFLQKTNIVR DYREDLDEGRMFWPKDIWHVYGSKINDFAINPTHDQSVLCLNHMLNNALTHATD CLAYLKHLRNENIFKFCAIPQVMAMATLCKIYSNPDVFIKNVKIRKGLAAKLILNTTS
MDEVIKVYKDMLLVIESKISSDNNPVSAETIQLLKQIREYFNDETLIVRKIA Bacteroidetes bacterium (SEQ ID NO: 167)
MLNSSLFSRLEEIPALLKLKLGSINNYKNNNSENLTSKNLRYCFDTLNKVSR SFASVIKQLPNELMVNVCLFYLILRALDSIEDDMNLPKDFKINLLREFLDKNYEPG WKISGVGDKKEYVELLENYDKVIQVFLDIDPKNQLIITDICRKMGAGMAHFVEAEIN SVKDYNLYCYHVAGLVGIGLSKMFLASGLENCDYLNQEEISSSMGLFLQKTNIVR DYKEDMEENRIFWPKEIWRTYASKFSDFSINPQHETSISCLNHMVNDALGHVIDC LEYLRHLRNENIFKFCAIPQVMAMATLCKVYNNPDVFIKTVKIRKGLAAKLILNTTS
MDEVIKVYKGLLLDIENKIPLHNPTSDETLRLIKNIRSYCNNETMVVSKTA Esqualeno Epoxidase Siraitia grosvenorii SQE1 (SEQ ID NO: 17)
MVDQCALGWILASALGLVIALCFFVAPRRNHRGVDSKERDECVQSAATTK GECRFNDRDVDVIVVGAGVAGSALAHTLGKDGRRVHVIERDLTEPDRIVGELLQP GGYLKLIELGLQDCVEEIDAQRVYGYALFKDGKNTRLSYPLENFHSDVSGRSFHN GRFIQRMREKAASLPNVRLEQGTVTSLLEEKGTIKGVQYKSKNGEEKTAYAPLTI VCDGCFSNLRRSLCNPMVDVPSYFVGLVLENCELPFANHGHVILGDPSPILFYQI SRTEIRCLVDVPGQKVPSIANGEMEKYLKTVVAPQVPPQIYDSFIAAIDKGNIRTM PNRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDLS DASTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSL GGIFSNGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLLPFPSVKGIWIGARLIYSA
SGIIFPIIRAEGVRQMFFPATVPAYYRSPPVFKPIV Siraitia grosvenorii SQE2 (SEQ ID NO: 18)
MVDQCALGWILASVLGAAALYFLFGRKNGGVSNERRHESIKNIATTNGEY KSSNSDGDIIIVGAGVAGSALAYTLGKDGRRVHVIERDLTEPDRIVGELLQPGGYL KLTELGLEDCVDDIDAQRVYGYALFKDGKDTRLSYPLEKFHSDVAGRSFHNGRFI QRMREKAASLPKVSLEQGTVTSLLEENGIIKGVQYKTKTGQEMTAYAPLTIVCDG CFSNLRRSLCNPKVDVPSCFVGLVLENCDLPYANHGHVILADPSPILFYRISSTEIR CLVDVPGQKVPSISNGEMANYLKNVVAPQIPSQLYDSFVAAIDKGNIRTMPNRSM PADPYPTPGALLMGDAFNMRHPLTGGGMTVALSDVVVLRDLLKPLRDLNDAPTL SKYLEAFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLGGIFS NGPVSLLSGLNPRPISLVLHFFAVAIYGVGRLLIPFPSPKRVWIGARIISGASAIIFPII
KAEGVRQMFFPATVAAYYRAPRVVKGR Momordica charantia (SEQ ID NO: 19)
MVDECALGWILAAALGAVIALCLFVAPKTNNQDGGVDSKATPECVQTTNG ECRSDGDSDVIIVGAGVAGSALAHTLGKDGRRVHVIERDLTEPDRIVGELLQPGG YLKLIELGLADCVEEIDAQRVYGYALFKDGKNTRLSYPLEKFHSDVSGRSFHNGR FIQRMREKADSLPNVRLEQGTVTSLLEEKGTIKGVQYKSKDGKEKTAYAPLTIVC DGCFSNLRRSLCNPMVDVPSCFVGLVLENCQLPFANHGHVVLGDPSPILFYPISS TEIRCLVDVPGQKVPSISNGEMEKYLKTVVAPQVPPQIYDAFIAAIDKGNIRTMPN RSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDLHDA PTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLGG MFSNGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLFPFPSPKGIWIGARLIYSAS
GIIFPIIKAEGVRQMFFPATVPAYYRSPPALKPVA Cucurbita maxima (SEQ ID NO: 20)
MVDYCAFGWILAAVLGLAIALSFFVSPRRNRRGGADSTPRSEGVRSSSTT NGECRSVDGDADVIIVGAGVAGSALAHTLGKDGRLVHVIERDLTEPDRIVGELLQ PGGYLKLIELGLQDCVEEIDAQKVYGYALFKDGKNTQLSYPLEKFQSDVSGRSFH NGRFIQRMREKAASLPNVRLEQGTVTSLLEEKGTIKGVQYKSKNGEEKTAYAPLT IVCDGCFSNLRRSLCKPMVDVPSCFVGLVLENCQLPFANHGHVVLGDPSPILFYP ISSTEIRCLVDVPGQKIPSISNGEMEKYLKTIVAPQVPPQIHDAFIAAIDKGNIRTMP NRSMPAAPQPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDLND APTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLG GIFSNGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLLPFPSPKGIWIGARLVYSAS
GIIFPIIKAEGVRQMFFPATVPAYYRSPPVHKSIA Cucurbita moschata (SEQ ID NO: 21)
MVDYCAFGWILAAVLGLAIALSFFVSPRRNRRGGADSTPRSEGVRSSSTT NGECRSVDCDADVIIVGAGVAGSALAHTLGKDGRLVHVIERDLTEPDRIVGELLQ PGGYLKLIELGLQDCVEEIDAQKVYGYALFKDGKNTQLSYPLEKFQSDVSGRSFH NGRFIQRMREKAASLPNVRLEQGTVTSLLEEKGTIKGVQYKSKNGEEKTAHAPLT IVCDGCFSNLRRSLCKPMVDVPSCFVGLVLENCQLPFANHGHVVLGDPSPILFYP ISSTEIRCLVDVPGQKVPSISNGEMEKYLKTIVAPQVPPQIHDAFIAAIDKGNIRTMP NRSMPAAPQPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDLND APTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLG GIFSNGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLLPFPSPKGIWIGARLVYSAS
GIIFPIIKAEGVRQMFFPATVPAYYRSPPVLKTIA Cucurbita moschata (SEQ ID NO: 22)
MMVDHCAFAWILDVVLGLVVAVTFFVAAPRRNRRGGTDSTASKDCVISTA IANGECKPDDADAEVIIVGAGVAGSALAYTLGKDGRRVHVIERDLTEPDRIVGEFL QPGGYLKLIELGLGDCVEEIDAQKLYGYALFKDGKNTRVSYPLGNFHSDVSGRSF HNGRFIQRMREKAASLPNVRLEQGTVTSLLETKGTIKGVQYKSKNGEEKTAYAPL TIVCDGCFSNLRRSLCKPMVDVPSCFVGLVLENCQLPFANHGHVVLGDPSPILFY PISSTEIRCLVDVPGQKVPSISNGDMEKYLKTVVAPQVPPQIHDAFIAAIEKGNVRT MPNRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDL NDASTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLS LGGVFSNGPISLLSGLNPRPSSLVLHFFAVAIYGVGRLLLPFPSLKGIWIGARLIYS
ASGIILPIIKAEGVRQMFFPATVPAYYRSPPVHKPIT Cucumis sativus (SEQ ID NO: 23)
MVDHCTFGWIFSAFLAFVIAFSFFLSPRKNRRGRGTNSTPRRDCLSSSAT TNGECRSVDGDADVIIVGAGVAGSALAHTLGKDGRRVHVIERDLTEPDRIVGELL QPGGYLKLIELGLQDCVEEIDAQKVYGYALFKDGKSTRLSYPLENFQSDVSGRSF HNGRFIQRMREKAAFLPNVRLEQGTVTSLLEEKGTITGVQYKSKNGEQKTAYAPL TIVCDGCFSNLRRSLCNPMVDVPSCFVGLVLENCQLPYANLGHVVLGDPSPILFY PISSTEIRCLVDVPGQKVPSISNGEMEKYLKTVVAPQVPPQIHDAFIAAIEKGNIRT MPNRSMPAAPQPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDL NDAPTLCKYLESFYTLRKPVASTINTLAGALYKVFCASSDQARKEMRQACFDYLS LGGIFSNGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLLPFPSPKGIWIGARLVYS
ASGIIFPIIKAEGVRQMFFPATVPAYYRTPPVFNS Cucumis melo (SEQ ID NO: 24)
MVDHCAFGWIFSALLAFPIALSLFLSPWRNRRVRGTDSTPRSASVSSSAT TNGECRSVDGDADVVIVGAGVAGSALAHTLGKDGRRVHVIERDLTEPDRIVGELL QPGGYLKLIELGLQDCVEEIDAQKVYGYALFKDGKNTRLSYPLENFHSDVSGRSF HNGRFIQRMREKAASLPNVRLEQGTVTSLLEEKGTITGVQYKSKNGEQKTAYAPL TIVCDGCFSNLRRSLCTPMVDVPSYFVGLVLENCQLPYANLGHVVLGDPSPILFY PISSTEIRCLVDVPGQKVPSISNGEMEKYLKTVVAPQVPPQIHDAFIAAIEKGNIRT MPNRSMPAAPQPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDL NDAPTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLS LGGIFSNGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLLPFPSLKGIWIGARLVYS
ASGIIFPIIKAEGVRQMFFPATVPAYYRTPPVLNS Cucurbita maxima (SEQ ID NO: 25)
MMVEHCAYGWILAAVLGLVVAVTFFVAVPRRNRRGGTDSTASKDCVISPA IANGECEPEDADADADVIIVGAGVAGSALAHTLGKDGRRVHVIERDLTEPDRIVGE FLQPGGHLKLIELGLGDCVEEIDAQKLYGYALFKDGKNTRVSYPLGNFHSDVSGR SFHNGRFIQRMREKAASLPNVRLEQGTVTSLLEKKGTIKGVQYKSKNGEEKTAYA PLTIVCDGCFSNLRRSLCKPMVDVPSCFVGLVLENCRLPFANHGHVVLGDPSPIL FYPISSTEIRCLVDVPGQKVPSIPNGDMEKYLKTVVAPQVPPQIHDAFIAAIEKGNI RTMPNRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLK DLNDAPTLCKYLESYYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDY LSLGGVFSNGPISLLSGLNPRPSCLVLHFFAVAIYGVGRLLLPFPSLKGIWIGARLI YSASGIILPIIKAEGVRQMFFPATVPAYYRSPPVHKPIT
Ziziphus jujube (SEQ ID NO: 26)
MLDQCPLGWILASVLGLFVLCNLIVKNRNSKASLEKRSECVKSIATTNGEC RSKSDDVDVIIVGAGVAGSALAHTLGKDGRRLHVIERDLTEPDRIVGELLQPGGYL KLIELGLQDCVEEIDAQRVFGYALFKDGKDTRLSYPLEKFHSDVSGRSFHNGRFI QRMREKSASLPNVRLEQGTVTSLLEEKGTIKGVQYKTKTGQELTAFAPLTIVCDG CFSNLRRSLCNPKVDVPSCFVGLVLENCELPYANHGHVILADPSPILFYPISSTEV RCLVDVPGQKVPSISNGEMAKYLKSVVAPQIPPQIYDAFIAAVDKGNIRTMPNRS MPASPFPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLLKPLGDLNDAAT LCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLGGIFS TGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLLPFPSPKRIWIGARLISGASGIIFPI
IKAEGVRQMFFPATVPAYYRAAPVE Morus alba (SEQ ID NO: 27)
MADPYTMGWILASLLGLFALYYLFVNNKNHREASLQESGSECVKSVAPVK GECRSKNGDADVIIVGAGVAGSALAHTLGKDGRRVHVIERDLAEPDRIVGELLQP GGYLKLIELGLQDCVEEIDSQRVYGYALFKDGKDTRLSYPLEKFHSDVSGRSFHN GRFIQRMREKAASLPNVQLEQGTVTSLLEENGTIKGVQYKTKTGQELTAYAPLTIV CDGCFSNLRRSLCIPKVDVPSCFVGLVLENCNLPYANHGHVVLADPSPILFYPISS TEVRCLVDVPGQKVPSISNGEMAKYLKTVVASQIPPQIYDSFVAAVDKGNIRTMP NRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLLKPLRDLND SVTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMREACFDYLSLG GVFSEGPVSLLSGLNPRPLSLVCHFFAVAIYGVGRLLLPFPSPKRLWIGARLISGA
SGIIFPIIRAEGVRQMFFPATIPAYYRAPRPN Juglans regia (JrSQE1) (SEQ ID NO: 28)
MVDPYALGWSFASVLMGLVALYILVDKKNRSRVSSEARSEGVESVTTTTS GECRLTDGDADVIIVGAGVAGSALAHTLGKDGRRVHVIERDLTEPDRIVGELLQP GGYLKLIELGLEDCVEDIDAQRVFGYALFKDGKNTRLSYPLEKFHSDVSGRSFHN GRFIQRMREKAASLLNVRLEQGTVTSLLEENGTVKGVQYKTKDGNELTAHAPLTI VCDGCFSNLRRSLCNPQVDVPSSFVGLVLENCELPYANHGHVILADPSPILFYPIS STEVRCLVDVPGKKVPSIANGEMEKYLKNMVAPQLPPEIYDSFVAAVDRGNIRTM PNRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLLKPLRDLN DAPTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDRARKEMRQACFDYLSL GGVFSMGPVSLLSGLNPRPLSLVLHFFAVAVYGVGRLLVPFPSPSRIWIGARLISG
ASAIIFPIIKAEGVRQMFFPATVPAYYRAPPVKRDH Cucumis melo (SEQ ID NO: 29)
MVDQCALGWILASVLGASALYLLFGKKNCGVLNERRRESLKNIATTNGEC KSSNSDGDIIIVGAGVAGSALAYTLAKDGRQVHVIERDLSEPDRIVGELLQPGGYL KLTELGLEDCVDDIDAQRVYGYALFKDGKDTRLSYPLEKFHSDVSGRSFHNGRFI QRMREKAASLPNVRLEQGTVTSLLEENGTIKGVQYKNKSGQEMTAYAPLTIVCD GCFSNLRRSLCNPKVDVPSCFVGLILENCDLPYANHGHVILADPSPILFYPISSTEI RCLVDVPGQKVPSISNGEMANYLKNVVAPQIPPQLYNSFIAAIDKGNIRTMPNRS MPADPYPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLLKPLRDLNDAPT LCKYLEAFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLGGIFS NGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLIPFPSPKRVWIGARLISGASAIIFP
IIKAEGVRQMFFPKTVAAYYRAPPVVRER Cucumis sativus (SEQ ID NO: 30)
MVDQCALGWILASVLGASALYLLFGKKNCGVSNERRRESLKNIATTNGEC KSSNSDGDIIIVGAGVAGSALAYTLAKDGRQVHVIERDLSEPDRIVGELLQPGGYL KLTELGLEDCVDEIDAQRVYGYALFKDGKDTRLSYPLEKFHSDVSGRSFHNGRFI QRMREKAASLPNVRLEQGTVTSLLEENGTIRGVQYKNKSGQEMTAYAPLTIVCD GCFSNLRRSLCNPKVDVPSCFVGLILENCDLPHANHGHVILADPSPILFYPISSTEI RCLVDVPGQKVPSISNGEMANYLKNVVAPQIPPQLYNSFIAAIDKGNIRTMPNRS MPADPYPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLLKPLRDLNDAPT LCKYLEAFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLGGIFS NGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLIPFPSPKRVWIGARLISGASAIIFP
IIKAEGVRQMFFPKTVAAYYRAPPIVRER Juglans regia (JrSQE2)(SEQ ID NO: 31)
MVDQYALGLILASVLGFVVLYNLMAKKNRIRVSSEARTEGVQTVITTTNGE CRSIEGDVDVIIVGAGVAGSALAHTLGKDGRKVHVIERDLSEPDRIVGELLQPGGY LKLVELGLQDSVEDIDAQRVFGYALFKDGKNTRLSYPLEKFHSDVSGRSFHNGR FIQRMREKAASLPNIRLEQGTVTSLLEENGTIKGVQYKTKDGKELAAHAPLTIVCD GCFSNLRRSLCNPQVDVPSSFVGLVLENCELPYANHGHVVLADPSPILFYPISST EVRCLVDVPGQKVPSISNGEMAKYLKTMVAPQVPPEIYDSFVAAVDRGNIRTMP NRSMPAAPQPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLLRPLRDLND APTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDRARNEMRQACFDYLSLG GVFSTGPVSLLSGLNPRPLSLVLHFFAVAVYGVGRLLVPFPSPSRMWIGARLISG
ASAIIFPIIKAEGVRQMFFPATVPAYYRAPPVNCQARSLKPDALKGL Theobroma cacao (SEQ ID NO: 32)
MADSYVWGWILGSVMTLVALCGVVLKRRKGSGISATRTESVKCVSSINGK CRSADGSDADVIIVGAGVAGSALAHTLGKDGRRVHVIERDLTEPDRIVGELLQPG GYLKLIELGLEDCVEEIDAQQVFGYALFKDGKHTRLSYPLEKFHSDVSGRSFHNG RFIQRMREKSASLPNVRLEQGTVTSLLEEKGTIRGVQYKTKDGRELTAFAPLTIVC DGCFSNLRRSLCNPKVDVPSCFVGLVLENCNLPYSNHGHVILADPSPILFYPISST EVRCLVDVPGQKVPSIANGEMANYLKTIVAPQVPPEIYNSFVAAVDKGNIRTMPN RSMPAAPYPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLLRPLRDLNDA PTLCKYLESFYTLRKPIASTINTLAGALYKVFCASPDQARKEMRQACFDYLSLGGV FSTGPISLLSGLNPRPVSLVLHFFAVAIYGVGRLLLPFPSPKRIWIGARLISGASGII
FPIIKAEGVRQMFFPATVPAYYRAPPVE Cucurbita moschata (SEQ ID NO: 33)
MMVDHCAFAWILDVVLGLVVAVTFFVAAPRRNRRGGTDSTASKDCVISTA IANGECKPDDADAEVIIVGAGVAGSALAYTLGKDGRRVHVIERDLTEPDRIVGEFL QPGGYLKLIELGLGDCVEEIDAQKLYGYALFKDGKNTRVSYPLGNFHSDVSGRSF HNGRFIQRMREKAASLPNVRLEQGTVTSLLETKGTIKGVQYKSKNGEEKTAYAPL TIVCDGCFSNLRRSLCKPMVDVPSCFVGLVLENCQLPFANHGHVVLGDPSPILFY PISSTEIRCLVDVPGQKVPSISNGDMEKYLKTVVAPQVPPQIHDAFIAAIEKGNVRT MPNRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLKDL NDASTLCKYLESFYTLRKPVASTINTLAGALYKVFCASPDQARKEMRQACFDYLS LGGVFSNGPISLLSGLNPRPSSLVLHFFAVAIYGVGRLLLPFPSLKGIWIGARLIYS
ASGIILPIIKAEGVRQMFFPATVPAYYRSPPVHKPIT Phaseolus vulgaris (SEQ ID NO: 34)
MLDTYVFGWIICAALSVFVIRNFVFAGKKCCASSETDASMCAENITTAAGE CRSSMRDGEFDVLIVGAGVAGSALAYTLGKDGRQVLVIERDLSEPDRIVGELLQP GGYLKLIELGLEDCVDKIDAQQVFGYALFKDGKHIRLSYPLEKFHSDVAGRSFHN GRFIQRMREKAASLPNVRLEQGTVTSLLEEKGVIKGVQYKTKDSQELSVCAPFTI VCDGCFSNLRRSLCDPKVDVPSCFVGLVLENCELPCANHGHVILGEPSPVLFYPI SSTEIRCLVDVPGQKVPSISNGEMAKYLKTVIAPQVPHELHNAFIAAVDKGSIRTM PNRSMPAAPYPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLRPLRDLN DAPSLCKYLESFYTLRKPVASTINTLAGALYKVFCASSDPARKEMRQACFDYLSL GGQFSEGPISLLSGLNPRPLTLVLHFFAVATYGVGRLLLPFPSPKRMWIGLRLISS
ASGIIMPIIKAEGVRQMFFPATVPAYYRNPPAA Hevea brasiliensis (SEQ ID NO: 35)
MKMADHYLLGWILASVMGLFAFYYIVYLLVKPEEDNNRRSLPQPRSDFVK TMTATNGECRSDDDSDVDVIIVGAGVAGAALAHTLGKDGRRVHVIERDLTEPDRI VGELLQPGGYLKLIELGLEDCVEEIDAQRVFGYALFKDGKHTQLAYPLEKFHSEV AGRSFHNGRFIQRMREKAASLPSVKLEQGTVTSLLEEKGTIKGVLYKTKTGEELT AFAPLTIVCDGCFSNLRRSLCNPKVDVPSCFVGLVLENCRLPYANNGHVILADPS PILFYPISSTEVRSLVDVPGQKVPSVSSGEMANYLKNVVAPQVPPEIYDSFVAAVD KGNIRTMPNRSMPASPYPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRDLL KPLRDLHDAPTLCRYLESFYTLRKPVASTINTLAGALYKVFCASPDEARKEMRQA CFDYLSLGGVFSTGPVSLLSGLNPRPLSLVLHFFAVAIYGVGRLLLPFPSPHRIWV
GARLISGASGIIFPIIKAEGVRQMFFPATVPAYYRAPPIKCN Sorghum bicolor (SEQ ID NO: 36)
MAAAAAAASGVGFQLIGAAAATLLAAVLVAAVLGRRRRRARPQAPLVEAK PAPEGGCAVGDGRTDVIIVGAGVAGSALAYTLGKDGRRVHVIERDLTEPDRIVGE LLQPGGYLKLIELGLEDCVEEIDAQRVLGYALFKDGRNTKLAYPLEKFHSDVAGR SFHNGRFIQRMRQKAASLPNVQLEQGTVTSLLEENGTVKGVQYKTKSGEELKAY APLTIVCDGCFSNLRRALCSPKVDVPSCFVGLVLENCQLPHPNHGHVILANPSPIL FYPISSTEVRCLVDVPGQKVPSIASGEMANYLKTVVAPQIPPEIYDSFIAAIDKGSIR TMPNRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPLHN LHDASSLCKYLESFYTLRKPVASTINTLAGALYKVFSASPDQARNEMRQACFDYL SLGGVFSNGPIALLSGLNPRPLSLVAHFFAVAIYGVGRLMLPLPSPKRMWIGARLI
SGACGIILPIIKAEGVRQMFFPATVPAYYRAAPMGE Zea mays (SEQ ID NO: 37)
MRKNLEEAGCAVSDGGTDVIIVGAGVAGSALAYTLGKDGRRVHVIERDLT EPDRIVGELLQPGGYLKLIELGLQDCVEEIDAQRVLGYALFKDGRNTKLAYPLEKF HSDVAGRSFHNGRFIQRMRQKAASLPNVQLEQGTVTSLLEENGTVKGVQYKTK SGEELKAYAPLTIVCDGCFSNLRRALCSPKVDVPSCFVGLVLENCQLPHPNHGH VILANPSPILFYPISSTEVRCLVDVPGQKVPSIATGEMANYLKTVVAPQIPPEIYDSF IAAIDKGSIRTMPNRSMPAAPHPTPGALLMGDAFNMRHPLTGGGMTVALSDIVVL RNLLKPLRNLHDASSLCKYLESFYTLRKPVASTINTLAGALYKVFSASPDQARNE MRQACFDYLSLGGVFSNGPIALLSGLNPRPLSLVAHFFAVAIYGVGRLMLPLPSP
KRMWIGARLISGACGIILPIIKAEGVRQMFFPATVPAYYRAAPTGEKA Medicago sativa (SEQ ID NO: 38)
MDLYNIGWILSSVLSLFALYNLIFSGKRNYHDVNDKVKDSVTSTDAGDIQS EKLNGDADVIIVGAGIAGAALAHTLGKDGRRVHIIERDLSEPDRIVGELLQPGGYLK LVELGLQDCVDNIDAQRVFGYALFKDGKHTRLSYPLEKFHSDVSGRSFHNGRFIQ RMREKAASLPNVNMEQGTVISLLEEKGTIKGVQYKNKDGQALTAYAPLTIVCDGC FSNLRRSLCNPKVDNPSCFVGLILENCELPCANHGHVILGDPSPILFYPISSTEIRC LVDVPGTKVPSISNGDMTKYLKTTVAPQVPPELYDAFIAAVDKGNIRTMPNRSMP ADPRPTPGAVLMGDAFNMRHPLTGGGMTVALSDIVVLRNLLKPMRDLNDAPTLC KYLESFYTLRKPVASTINTLAGALYKVFSASPDEARKEMRQACFDYLSLGGLFSE GPISLLSGLNPRPLSLVLHFFAVAVFGVGRLLLPFPSPKRVWIGARLLSGASGIILPI
IKAEGIRQMFFPATVPAYYRAPPVNAF Methylomonas lenta (SEQ ID NO: 39)
MKEEFDICIIGAGMAGATISAYLAPKGIKIALIDHCYKEKKRIVGELLQPGAVL SLEQMGLSHLLDGFEAQTVKGYALLQGNEKTTIPYPSQHEGIGLHNGRFLQQIRA SALENSSVTQIHGKALQLLENERNEIIGVSYRESITSQIKSIYAPLTITSDGFFSNFR AHLSNNQKTVTSYFIGLILKDCEMPFPKHGHVFLSGPTPFICYPISDNEVRLLIDFP GEQLPRKNLLQEHLDTNVTPYIPECMRSSYAQAIQEGGFKVMPNHYMAAKPIVR KGAVMLGDALNMRHPLTGGGLTAVFSDIQILSAHLLAMPDFKNTDLIHEKIEAYYR
DRKRANANLNILANALYAVMSNDLLKTAVFKYLQCGGANAQESIAVLAGLNRKHF SLIKQFCFLAVFGACNLLQQSISNIPKALKlLKDAFVIIKPLIKNELS Endossibionte de Bathymodiolus azoricus (SEQ ID NO: 168)
MHTTSEHNDLFDICIVGAGMAGATIATYLAPRGIKIALIDRDYAEKRRIVGEL LQPGAVQTLKKMGLEHLLEGFDAQPIYGYALFNKDCEFSIEYNQDKSTNYRGVGL HNGRFLQKIREDALKQPSITQIHGTVSELIEDENHVVTGVKYKEKYTRELKTVNAK LTITSDGFFSSFRKDLTNNVKTVTSFFVGIILKDCELPYPHHGHVFLSAPTPFICYPI SSTESRLLIDFPGDQAPKKEAVKHHIENNVIPFLPKEFRLCLDQALRENDYKIMPN HYMPAKPVLKKGVVLLGDALNMRHPITGGGLTAVFNDVYLLSTHLLAMPDFNDTK LIHEKVNLYYNDRYHANTNVNIMANALYGVMSNDLLKQSVFEYLRKGGDNSGGPI SLLAGLNRNPTILIKHFFSVALLCLRNLFKAHKMSLTNAFYVIKDAFCIIVPLAINELR
PSSFLKKNIHN Methyloprofundus sediment (SEQ ID NO: 169)
MNTSPEHNDLFDICIVGVGMAGATIAAYLAPRGLKIALIDREYTEKRRIVGE LLQPGAVQTLKKMGLEHLLEGFDAQPIYGYALFNNDKEFSISYNSDDSTEYHGVG LHNGRFLQKIREDVFKNETVTQIHGTVSELIEDKKGVVKGVTYREKHTREYKTVK AKLTVTSDGFFSNFRKDLSNNVKTVTSFFIGLVLNDCNLPFPNHGHVFLSAPTPFI CYPISSTETRLLIDYPGDKAPKKDEIREHILNKVAPFLPEEFKECFANAMEDDDFK VMPNHYMPAKPVLKEGAVLLGDALNMRHPLTGGGLTAVFNDVYLLSTHLLAMPD FNDPKLLHEKLELYYQDRYHANTNVNIMANALYGVMSNDLLKQGVFEYLRKGGD NSGGPITLLAGLNRNPTLLIKHFFSVAFLCICNLSGNNKMNFTNVFRVMKDAFCIIK
PLAVNELRPSSFYKKNIQL Methylomicrobium buryatense (SEQ ID NO: 170)
MESNFDICIIGAGMAGATIAAYLAPKGINIALIDHCYKEKKRIVGELLQPGAV LSLEQLGLGHLLDGIDAQPVEGYALLQGNEQTTIPYPSPNHGMGLHNGRFLQQIR ASALQNSSVTQIQGKALSLLENEQNEIIGVNYRDSVSNEIKSIYAPLTITSDGFFSN FRELLSNNEKTVTSYFIGLILKDCEIPVPKHGHVFLSGPTPFICYPISSNEVRLLIDF PGGQFPRKAFLQAHLETNVTPYIPEGMQTSYRHALQEDRLKVMPNHYMAAKPKI RKGAVMLGDALNMRHPLTGGGLTAVFSDIEILSGHLLAMPDFNNNDLIYQKIEAYY RDRQYANANLNILANALYGVMSNELLKNSVFKYLQRGGVNAKESIAILAGLNKNH YSLMKQFFFVALFGAYTLVRENITNLPKATKILSDALTIIKPLAKNELSLVGIFSDYF
KR Cucurbitadienol Sintase (CDS), Triterpeno Sintase (TTP) CDS de Siraitia grosvenorii (SEQ ID NO: 40)
MWRLKVGAESVGENDEKWLKSISNHLGRQVWEFCPDAGTQQQLLQVHK ARKAFHDDRFHRKQSSDLFITIQYGKEVENGGKTAGVKLKEGEEVRKEAVESSLE RALSFYSSIQTSDGNWASDLGGPMFLLPGLVIALYVTGVLNSVLSKHHRQEMCR YVYNHQNEDGGWGLHIEGPSTMFGSALNYVALRLLGEDANAGAMPKARAWILD HGGATGITSWGKLWLSVLGVYEWSGNNPLPPEFWLFPYFLPFHPGRMWCHCR MVYLPMSYLYGKRFVGPITPIVLSLRKELYAVPYHEIDWNKSRNTCAKEDLYYPH PKMQDILWGSLHHVYEPLFTRWPAKRLREKALQTAMQHIHYEDENTRYICLGPV NKVLNLLCCWVEDPYSDAFKLHLQRVHDYLWVAEDGMKMQGYNGSQLWDTAF SIQAIVSTKLVDNYGPTLRKAHDFVKSSQIQQDCPGDPNVWYRHIHKGAWPFST RDHGWLISDCTAEGLKAALMLSKLPSETVGESLERNRLCDAVNVLLSLQNDNGG FASYELTRSYPWLELINPAETFGDIVIDYPYVECTSATMEALTLFKKLHPGHRTKEI DTAIVRAANFLENMQRTDGSWYGCWGVCFTYAGWFGIKGLVAAGRTYNNCLAI RKACDFLLSKELPGGGWGESYLSCQNKVYTNLEGNRPHLVNTAWVLMALIEAG QAERDPTPLHRAARLLINSQLENGDFPQQEIMGVFNKNCMITYAAYRNIFPIWAL
GEYCHRVLTE Momordica charantia (SEQ ID NO: 41)
MWRLKVGAESVGENDEKWVKSISNHLGRQVWEFCPDAGTPQQLLQIEKA RKAFQDNRFHRKQTSDLLVSIQCEKGTTNGARVPGTKLKEGEEVRKEAVKSTLE RALSFYSSIQTSDGNWASDLGGPMFLLPGLVIALCVTGALNSVLSKHHRQEMCR YLYNHQNEDGGWGLHIESPSTMFGSALNYVALRLLGEDADGGEGRAMTKARAW ILGHGGATAITSWGKLWLSVLGVYEWSGNNPLPPEFWLLPYFLPFHPGRMWCH CRMVYLPMSYLYGKRFVGPITPVVLSLRKELYTVPYHEIDWNKSRNTCAKEDLYY PHSKMQDILWGSIHHMYEPLFTHWPAKRLREKALKTAMQHIHYEDENTRYICLGP VNKVLNMLCCWVEDPYSEAFKLHLQRVHDYLWVAEDGMKMQGYNGSQLWDTA FSVQAIISTKLVDNYGPTLRKAHDYVKNSQIQQDCPGEPNVWFRHIHKGAWPFST RDHGWLISDCTAEGLKASLMLSKLPSETVGEPLERNRLCDAVNVLLSLQNDNGG FASYELTRSYPWLELINPAETFGDIVIDYPYVECTSATMEALALFKKLHPGHRTKEI DTAIARAADFLENMQRTDGSWYGCWGVCFTYAGWFGIKGLVAAGRAYSNCLAI RKACDFLLSKELPGGGWGESYLSCQNKVYTNLEGNRPHLVNTAWVLMALIEAG QGERDPAPLHRAARLLINSQLENGDFPQEEIMGVFNKNCMITYAAYRNIFPIWAL
GEYCHRVLTE Cucurbita maxima (SEQ ID NO: 42)
MWRLKVGAESVGEKDEKWVKSVSNHLGRQVWEFCADAAADTPHQLLQI QNARNHFHHNRFHRKQSSDLFLAIQYEKEIAKGAKGGAVKVKEGEEVGKEAVKS TLERALGFYSAVQTSDGNWASDLGGPMFLLPGLVIALHVTGVLNSVLSKHHRVE MCRYLYNHQNEDGGWGLHIEGTSTMFGSALNYVALRLLGEDADGGDGGAMTK ARAWILERGGATAITSWGKLWLSVLGVYEWSGNNPLPPEFWLLPYSLPFHPGR MWCHCRMVYLPMSYLYGKRFVGPITPKVLSLRQELYTIPYHEIDWNKSRNTCAK EDLYYPHPKMQDILWGSIYHVYEPLFTRWPGKRLREKALQAAMKHIHYEDENSR YICLGPVNKVLNMLCCWVEDPYSDAFKLHLQRVHDYLWVAEDGMRMQGYNGS QLWDTAFSIQAIVATKLVDSYAPTLRKAHDFVKDSQIQEDCPGDPNVWFRHIHKG AWPFSTRDHGWLISDCTAEGLKASLMLSKLPSTMVGEPLEKNRLCDAVNVLLSL QNDNGGFASYELTRSYPWLELINPAETFGDIVIDYPYVECTAATMEALTLFKKLHP GHRTKEIDTAIGKAANFLEKMQRADGSWYGCWGVCFTYAGWFGIKGLVAAGRT YNSCLAIRKACEFLLSKELPGGGWGESYLSCQNKVYTNLEGNKPHLVNTAWVLM ALIEAGQGERDPAPLHRAARLLMNSQLENGDFVQQEIMGVFNKNCMITYAAYRNI
FPIWALGEYCHRVLTE Citrullus colocynthis (CcCDS1) (SEQ ID NO: 43)
MWRLKVGAESVGEKEEKWLKSISNHLGRQVWEFCADQPTASPNHLQQID NARKHFRNNRFHRKQSSDLFLAIQNEKEIANGTKGGGIKVKEEEDVRKETVKNTV ERALSFYSAIQTNDGNWASDLGGPMFLLPGLVIALYVTGVLNSVLSKHHRQEMC RYLYNHQNEDGGWGLHIEGTSTMFGSALNYVALRLLGEDADGGEGGAMTKARG WILDRGGATAITSWGKLWLSVLGVYEWSGNNPLPPEFWLLPYCLPFHPGRMWC HCRMVYLPMSYLYGKRFVGPITPIVLSLRKELYTIPYHEIDWNKSRNTCAKEDLYY PHPKMQDILWGSIYHLYEPLFTRWPGKRLREKALQMAMKHIHYEDENSRYICLGP VNKVLNMLCCWVEDPYSDAFKFHLQRVPDYLWIAEDGMRMQGYNGSQLWDTA FSVQAIISTKLIDSFGTTLKKAHDFVKDSQIQQDFPGDPNVWFRHIHKGAWPFSTR DHGWLISDCTAEGLKASLMLSKLPSKIVGEPLEKSRLCDAVNVLLSLQNENGGFA SYELTRSYPWLELINPAETFGDIVIDYPYVECTSATMEALTLFKKLHPGHRTKEIDT AVAKAANFLENMQRTDGSWYGCWGVCFTYAGWFGIKGLVAAGRTYSTCVAIRK ACDFLLSKELPGGGWGESYLSCQNKVYTNLEGNRPHLVNTAWVLMALIEAGQA ERDPAPLHRAARLLINSQLENGDFPQEEIMGVFNKNCMITYAAYRNIFPIWALGEY
FHRVLTE Citrullus colocynthis (CcCDS2) (SEQ ID NO: 44)
MWRLKVGAESVGEKEEKWLKSISNHLGRQVWEFCAHQPTASPNHLQQID NARNHFRNNRFHRKQSSDLFLAIQNEKEIANVTKGGGIKVKEEEDVRKETVKNTV ERALSFYSAIQTNDGNWASDLGGPMFLLPGLVIALYVTGVLNSVLSKHHRQEMC RYLYNHQNEDGGWGLHIEGTSTMFGSALNYVALRLLGEDADGGEGGAMTKARS WILDRGGATAITSWGKLWLSVLGVYEWSGNNPLPPEFWLLPYCLPFHPGRMWC HCRMVYLPMSYLYGKRFVGPITPIVLSLRKELYTIPYHEIDWNRSRNTCAKEDLYY PHPKMQDILWGSIYHLYEPLFTRWPGKRLREKALQMAMKHIHYEDENSRYICLGP VNKVLNMLCCWVEDPYSDAFKFHLQRVPDYLWVAEDGMRMQGYNGSQLWDT AFSVQAIISTKLIDSFGTTLKKAHDFVKDSQIQQDCPGDPNVWFRHIHKGAWPFST RDHGWLISDCTAEGLKASLMLSKLPSKIVGEPLEKSRLCDAVNVLLSLQNENGGF ASYELTRSYPWLELINPAETFGDIVIDYPYVECTSATMEALTLFKKLHPGHRTKEID IAVARAANFLENMQRTDGSWYGCWGVCFTYAGWFGIKGLVAAGRTYNSCVAIR KACDFLLSKELPGGGWGESYLSCQNKVYTNLEGNRPHLVNTAWVLMALIEAGQ AERDPAPLHRAARLLINSQLENGDFPQEEIMGVFNKNCMITYAAYRNIFPIWALGE
YFHRVLTE Cucurbita moschata (SEQ ID NO: 45)
MWRLKVGAESVGEKDEKWVKSVSNHLGRQVWEFCADAAAAATPRQLLQ IQNARNHFHRNRFHRKQSSDLFLAIQYEKEIAEGGKGGAVKVKEEEEVGKEAVKS TLERALSFYSAVQTSDGNWASDLGGPMFLLPGLVIALYVTGVLNSVLSKHHRVE MCRYLYNHQNEDGGWGLHIEGTSTMFGSALNYVALRLLGEDADGGDDGAMTK ARAWILERGGATAITSWGKLWLSVLGVYEWSGNNPLPPEFWLLPYSLPFHPGR MWCHCRMVYLPMSYLYGKRFVGPITPKVLSLRQELYTVPYHEIDWNKSRNTCAK EDLYYPHPKMQDILWGSIYHVYEPLFTRWPGKRLREKALQTAMKHIHYEDENSR YICLGPVNKVLNMLCCWVEDPYSDAFKLHLQRVHDYLWVAEDGMRMQGYNGS QLWDTAFSIQAIVATKLVDSFAPTLRKAHDFVKDSQIQEDCPGDPNVWFRHIHKG AWPFSTRDHGWLISDCTAEGLKASLMLSKLPSTMVGEPLEKNRLCDAVNVLLSL QNDNGGFASYELTRSYPWLELINPAETFGDIVIDYPYVECTAATMEALTLFKKLHP GHRTKEIDTAVGKAANFLEKMQRADGSWYGCWGVCFTYAGWFGIKGLVAAGRT YNSCLAIRKACEFLLSKELPGGGWGESYLSCQNKVYTNLEGNKPHLVNTAWVLM ALIEAGQGERDPAPLHRAARLLMNSQLENGDFVQQEIMGVFNKNCMITYAAYRNI
FPIWALGEYCHRVLTE Cucumis sativus (SEQ ID NO: 46)
MWRLKVGKESVGEKEEKWIKSISNHLGRQVWEFCAENDDDDDDEAVIHV VANSSKHLLQQQRRQSSFENARKQFRNNRFHRKQSSDLFLTIQYEKEIARNGAK NGGNTKVKEGEDVKKEAVNNTLERALSFYSAIQTSDGNWASDLGGPMFLLPGLV IALYVTGVLNSVLSKHHRQEMCRYIYNHQNEDGGWGLHIEGSSTMFGSALNYVA LRLLGEDANGGECGAMTKARSWILERGGATAITSWGKLWLSVLGVYEWSGNNP LPPEFWLLPYSLPFHPGRMWCHCRMVYLPMSYLYGKRFVGPITHMVLSLRKELY TIPYHEIDWNRSRNTCAQEDLYYPHPKMQDILWGSIYHVYEPLFNGWPGRRLRE KAMKIAMEHIHYEDENSRYIYLGPVNKVLNMLCCWVEDPYSDAFKFHLQRIPDYL WLAEDGMRMQGYNGSQLWDTAFSIQAILSTKLIDTFGSTLRKAHHFVKHSQIQED CPGDPNVWFRHIHKGAWPFSTRDHGWLISDCTAEGLKASLMLSKLPSKIVGEPL EKNRLCDAVNVLLSLQNENGGFASYELTRSYPWLELINPAETFGDIVIDYSYVECT SATMEALALFKKLHPGHRTKEIDAALAKAANFLENMQRTDGSWYGCWGVCFTY AGWFGIKGLVAAGRTYNNCVAIRKACHFLLSKELPGGGWGESYLSCQNKVYTNL EGNRPHLVNTAWVLMALIEAGQGERDPAPLHRAARLLINSQLENGDFPQQEIMG
VFNKNCMITYAAYRNIFPIWALGEYSHRVLTE Cucumis melo (SEQ ID NO: 47)
MWRLKVGKESVGEKEEKWIKSISNHLGRQVWEFCSGENENDDDEAIAVA NNSASKFENARNHFRNNRFHRKQSSDLFLAIQCEKEIIRNGAKNEGTTKVKEGED VKKEAVKNTLERALSFYSAVQTSDGNWASDLGGPMFLLPGLVIALYVTGVLNSVL SKHHRQEMCRYIYNHQNEDGGWGLHIEGSSTMFGSALNYVALRLLGEAADGGE HGAMTKARSWILERGGATAITSWGKLWLSVLGVYEWSGNNPLPPEFWLLPYSLP FHPGRMWCHCRMVYLPMSYLYGKRFVGPITPIVLSLRKELYTIPYHEIDWNRSRN TCAKEDLYYPHPKMQDILWGSIYHVYEPLFSGWPGKRLREKAMKIAMEHIHYEDE NSRYICLGPVNKVLNMLCCWVEDPYSDAFKFHLQRIPDYLWLAEDGMRMQGYN GSQLWDTAFSIQAIISTKLIDTFGPTLRKAHHFVKHSQIQEDCPGDPNVWFRHIHK GAWPFSTRDHGWLISDCTAEGLKASLMLSKLPSKIVGEPLEKNRLCDAVNVLLSL QNENGGFASYELTRSYPWLELINPAETFGDIVIDYSYVECTSATMEALALFKKLHP GHRTKEIDAAIAKAANFLENMQKTDGSWYGCWGVCFTYAGWFGIKGLVAAGRT YNNCVAIRKACNFLLSKELPGGGWGESYLSCQNKVYTNLEGNKPHLVNTAWVM MALIEAGQGERDPAPLHRAARLLINSQLESGDFPQQEIMGVFNKNCMITYAAYRN
IFPIWALGEYSHRVLDM Citrullus lanatus subsp. vulgaris (SEQ ID NO: 48)
DGNWASDLGGPMFLLPGLVIALYVTGVLNSVLSKHHRQEMCRYLYNHQN EDGGWGLHIEGTSTMFGSALNYVALRLLGEDADGGEGGAMTKARSWILDRGGA TAITSWGKLWLSVLGVYEWSGNNPLPPEFWLLPYCLPFHPGRMWCHCRMVYLP MSYLYGKRFVGPITPIVLSLRKELYTIPYHEIDWNRSRNTCAKEDLYYPHPKMQDI LWGSIYHLYEPLFTRWPGKRLREKALQMAMKHIHYEDENSRYICLGPVNKVLNM LCCWVEDPYSDAFKFHLQRVPDYLWVAEDGMRMQGYNGSQLWDTAFSVQAIIS TKLIDSFGTTLKKAHDFVKDSQIQQDCPGDPNVWFRHIHKGAWPFSTRDHGWLI SDCTAEGLKASLMLSKLPSEIVGEPLEKSRLCDAVNVLLSLQNENGGFASYELTR SYPWLELINPAETFGDIVIDYPYVECTSATMEALTLFKKLHPGRRTKEIDIAVARAA NFLENMQRTDGSWYGCWGVCFTYAGWFGIKGLVAAGRTYNSCVAIRKACDFLL SKELPGGGWGESYLSCQNKVYTNLEGNRPHLVNTAWVLMALIEAGQAERDPAP LHRAARLLINSQLENGDFPQEEIMGVFNKNCMITYAAYRNIFPIWALGEYFHRVLT
E Theobroma cacao (SEQ ID NO: 49)
MWRLKIGKESVGDNGAWLRSSNDHVGRQVWEFCPESGTPEELSKVEMA RQSFSTDRLLKKHSSDLLMRIQYAKENQFVTNFPQVKLKEFEDVKEEATLTTLRR ALNFYSTIQADDGHWPGDYGGPMFLLPGLVITLSVTGALNAVLSKEHQYEMCRY LYNHQNRDGGWGLHIEGPSTMFGTVLNYVTLRLLGEGPEGGQGAVEKACEWIL EHGSATAITSWGKMWLSVLGAYEWSGNNPLPPEVWLCPYFLPIHPGRMWCHC RMVYLPMSYLYGKRFVGPITPIILSLRKELYAVPYHEVDWNKARNTCAKEDLYYP HPLVQDILWASLHYLYEPIFTRWPCKSLREKALRTVMQHIHYEDENTRYICIGPVN KVLNMLSCWVEDPYSESFKLHLPRILDYLWIAEDGMKMQGYNGSQLWDTAFAV QAIISTGLADEYGPILRKAHDFIKYSQVLEDCPGDLNFWYRHISKGAWPFSTVDH GWPISDCTSEGLKAVLLLSTLPSESVGEPLHMMRLYDAVNVILSLQNVDGGFPTY ELTRSYQWLELINPAETFGDIVIDYPYVECTSAAIQALISFKKLFPEHRMEEIENCIG RAVEFIEKIQAADGSWYGSWGVCFTYAGWFGIKGLSAAGRTYNNSSNIRKACDF LLSKELATGGWGESYLSCQNKVYTNLEGARPHIVNTSWALLALIEAGQAERDPTP LHRAARILINSQMEDGDFPQEEIMGVFNKNCMISYSAYRNIFPIWALGEYTCRVLR
AP Ziziphus jujube (SEQ ID NO: 50)
MWKLKIGAETVGEGGSDGWLRSVNSHLGRQVWEFHPELGTPEELRQIQ DARDAFFNHRFHKQHSSDLLMRIQFAKENPCVANPPQVKVKDTDEVTEESVTTT LRRAINFYSTIQAHDGHWAGDYGGPMFLLPGLVITLSVTGALNAVLSKEHQCEMC RYIYNHQNEDGGWGLHIEGPSTMFGTVLNYVSLRLLGEGAEDGLGTIENARKWIL DHGGATAITSWGKMWLSVLGVYEWSGNNPLPPEVWLCPYTLPFHPGRMWCHC RMVYLPMSYLYGKRFVGPITPTIRSLRKELYTAPYHEIDWNRARNECAKEDLYYP HPLVQDVLWASLHYVYEPIFMRWPAKKLREKALSTVMQHIHYEDENTRYICIGPV NKVLNMLCCWVEDPNSEAFKLHLPRISDYLWIAEDGMKMQGYNGSQLWDTAFA VQAIVSTDLAEEYGPTIRKAHEYIKNSQVLEDCPGDLNFWYRHISKGAWPFSTAD HGWPISDCTAEGLKAVLLLSQLSSETVGDSLDVKRLFNAVNVILSLQNGDGGFAT YELTRSYQWLELINPAETFGDIVIDYPYVECTSAALEALTLFKKSYPGHRREEVEN CITNAAMFIENIQAKDGSWYGSWGVCFTYAGWFGIKGLVASGRTYENCPSIRKA CDFLLSKELPSGGWGESYLSCQNKVYTNLKDNKPHIVNTAWAMLALIVARQAER DPMPLHRAARILIKSQMHDGDFPQEEIMGVFNKNCMISYAAYRNIFPIWALGEYRL
HVLRSL Prunus avium (SEQ ID NO: 51)
MWKLKIGAETVGEGGYQWLKSVNNHLGRQVWEFNPELGSPEELQRIEDA RKAFWDNRFERRHSSDLLMRIQFEKENQCVTNLPQLKVKYEEEVTEEVVKTTLR RAISFYSTIQAHDGHWPGDYGGPMFLLPGLVITLSITGALNDVLSKEHQHEMCRY LYNHQNKDGGWGLHIEGPSTMFGTALNYVTLRLFGEGADDGEGAMELARKWIL DHGGVTKITSWGKMWLSVLGTYEWSGNNPLPPEVWLCPYSLPFHPGRMWCHC RMVYLPMSYLYGKRFVGPITPTIRSLRKELYGVPYHEVDWNQARNLCAKEDLYY PHPMVQDILWASLHYVYEPVFTRWPAKKLRENALQTVMQHIHYEDENTRYICIGP VNKVLNMLCCWAEDPNSDAFKLHLPRIPDYLWVAEDGMKMQGYNGSQSWDTS FAVQAIISTNLAEEFGPTLRKAHEYIKDSQVLEDCPGDLNFWYRHISKGAWPFSTA DHGWPISDCTAEGLKAVLLLSKLPTGTVGESLDMKQLYDAVNVMLSLQNEDGGF ATYELTRSYQWLELINPAETFGDIVIDYPYVECTSAAIQALTMFRKLYPGHRREEIE SCIARAAKFIEKIQATDGSWYGSWGVCFTYAGWFGIKGLAAAGRTYKDCSSIRKA CDFLLSKELPSGGWGESYLSCQNKVYTNLKDNRPHIVHTAWAMLALIGAGQAKR DPTPLHRAARVLINSQMENGDFPQKEIMGVFNKNCMISYSAYRNIFPIWALGEYR
CQVLEAL Brassica napus (SEQ ID NO: 52)
MWKLKIAEGGSPWLRTTNNHVGRQFWEFDPNLGTPEELAAVEEARKSFR ENRFAKKHSSDLLMRLQFSRESLSRPVLPQVNIKDGDDVTEKMVETTLKRGVDF YSTIQASDGHWAGDYGGPMFLLPGLIITLSITGALNTVLSEQHKAEMRRYLHNHQ NEDGGWGLHIEGPSTMFGSVLNYVTLRLLGEGPNDGDGAMEKGRDWILNHGGA TNITSWGKMWLSVLGAFEWSGNNPLPPEIWLLPYILPIHPGRMWCHCRMVYLPM SYLYGKRFVGPITSTVLSLRKELFTVPYHEVDWNEARNLCAKEDLYYPHPLVQDIL WASLHKIVEPVLTRWPGSNLREKALRTTLEHIHYEDENTRYICIGPVNKVLNMLCC WVEDPNSEAFKLHLPRIHDYLWVAEDGMKMQGYNGSQLWDTSFAVQAVLATNF VEEYGPVLKKAHSYVKNSQVSEDCPGDLSYWYRHISKGAWPFSTADHGWPISD CTAEGLKAALLLSKVPKEIVGEPVDTKRLYDAVNVIISLQNADGGFATYELTRSYP WLELINPAETFGDIVIDYPYVECTSAAIQALIAFRKLYPGHRKKEVDECIEKAVKFIE SIQESDGSWYGSWAVCFTYGTWFGVKGLEAAGKTLKNSPTVAKACEFLLSKQLP SGGWGESYLSCQDKVYSNLDGNRSHVVNTAWALLSLIGAGQVEVDQKPLHRAA
RYLINAQMESGDFPQQEIMGVFNRNCMITYAAYRNIFPIWALGEYRSKVLLQQGE Spinacia oleracea (SEQ ID NO: 53)
MWKLKIAEGGSPWLRTTNNHVGRQIWEFDPNLGTPEQIREVEEARENFW KNRFEQKHSSDLLMRMQFAQENSSNVVLPQVKVKDEDEITEETVATTLRRALSY QSTIQAHDGHWPGDYGGPMFLMPGLVIALSVTGALNAVLSKEHQKEMCRYLYN HQNKDGGWGLHIEGHSTMFGTVLTYVTLRLLGEGVDDGDGAMERGRKWTLEH GSATAITSWGKMWLSVLGVFEWAGNNPMPPETWLLPYILPVHPGRMWCHCRM VYLPMSYLYGKRFVGPITPTVLSLRRELFDVPYHEIDWDRARNECAKEDLYYPHP LVQDILWASLHKAVEPILMRWPGKKLREKALSTVMEHIHYEDENTRYICIGPVNKV LNMLCCWVEDPNSEAFKLHLPRIPDFLWIAEDGMKMQGYNGSQLWDTTFMVQA ILATNLGEEYGGTLRKAHNFIKDSQVREDCPGDLSYWYRHISKGAWPFSTADHG WPISDCTAEGLKAALLLSKVPSDIVGEPLEVKRLYDSVNVLLSLQNGDGGFATYE LTRSYPWLELINPAETFGDIVIDYPYVECTSAAIQALVSFKRLYPGHRREEIENCIK KAAKFIEDIQAADGSWYGSWAVCFTYATWFGIKGLVAAGKNYDNCPAIRKACDFL LSKQLSNGGWGESYLSCQNKVYSNIEGNKAHVVNTGWAMLALIGAGQAKRDPM PLHRAAKVLINSQMPNGDFPQQEIMGVFNRNCMITYAAYRNIFPTWALGEYRTQ
VLQK Trigonella foenum-graecum (SEQ ID NO: 54)
MWKLKVAEGGSPWLRTVNNYVGRQVWEFDPNSGSPQELDQIESVRQNF HNNRFSHKHSDDLLMRIQLAKENPMGEVIPKVRVKDVEDVNEESVTTTLRRALNF YSTLQSRDGHWPGDYGGPMFLMPGLVIALSITGALNAVLTDEHQKEMRRYLYNH QNKDGGWGLHIEGPSTMFGSVLCYVTLRLLGEGPNDGEGEMEKARDWILEHGG ATYITSWGKMWLSVLGVFEWSGNNPLPPEIWLLPYMLPIHPGRMWCHCRMVYL PMSYLYGKRFVGPITPTVLSLRKELFTVPYHDIDWNQARNLCAKEDLYYPHPLVQ DILWASLHKFVEPIFMNWPGKKLREKAVETVMEHVHYEDENTRYICIGPVNKVLN MLCCWVEDPNSEAFKLHLPRIHDFLWIAEDGMKMQGYNGSQLWDTAFAVQAXI STNLIDEFAPTLRKAHTFIKNSQVLEDCPGDLSKWYRHISKGAWPFSTADHGWPI SDCTAEGLKAVLLLSKIGPEIVGEPLDAKGFYDAVNVIISLQNEDGGLATYELTRSY KWLEIINPAETFGDIVIDYTYVECTSAAIQALSTFRKLYPGHRREEIQHCIEKAAAFI EKIQASDGSWYGSWGVCFTYGTWFGVKGLIAAGKSFSNCLSIRKACDFLLSKQL PSGGWGESYLSCQNKVYSNLESNRSHVVNTGWAMLALIEAEQAKRDPTPLHHA
AVCLINSQMENGDFPQEEIMGVFNKNCMITYAAYRNIFPIWALGEYRRHVLQA Ricinus communis (SEQ ID NO: 55)
MWKLRIAEGSGNPWLRTTNDHIGRQVWEFDSSKIGSPEELSQIENARQNF TKNRFIHKHSSDLLMRIQFSKENPICEVLPQVKVKESEQVTEEKVKITLRRALNYY SSIQADDGHWPGDYGGPMFLMPGLIIALSITGALNAILSEEHKREMCRYLYNHQN RDGGWGLHIEGPSTMFGSVLCYVSLRLLGEGPNEGEGAVERGRNWILKHGGAT AITSWGKMWLSVLGAYEWSGNNPLPPEMWLLPYILPVHPGRMWCHCRMVYLP MSYLYGKRFVGPITPTVLSLRKELYTVPYHEIDWNQARNQCAKEDLYYPHPMLQ DVLWATLHKFVEPILMHWPGKRLREKAIQTAIEHIHYEDENTRYICIGPVNKVLNM LCCWVEDPNSEAFKLHLPRLYDYLWLAEDGMKMQGYNGSQLWDTAFAVQAIVS TNLIEEYGPTLKKAHSFIKKMQVLENCPGDLNFWYRHISKGAWPFSTADHGWPIS DCTAEGIKALMLLSKIPSEIVGEGLNANRLYDAVNVVLSLQNGDGGFPTYELSRSY SWLEFINPAETFGDIVIDYPYVECTSAAIQALTSFRKSYPEHQREEIECCIKKAAKF MEKIQISDGSWYGSWGVCFTYGTWFGIKGLVAAGKSFGNCSSIRKACDFLLSKQ CPSGGWGESYLSCQKKVYSNLEGDRSHVVNTAWAMLSLIDAGQAERDPTPLHR
AARYLINAQMENGDFPQQEIMGVFNRNCMITYAAYRDIFPIWALGEYRCRVLKAS Epóxido hidrolase EPH1 de Siraitia grosvenorii (SgEPH1) (SEQ ID NO: 56)
MEKIEHSTIATNGINMHVASAGSGPAVLFLHGFPELWYSWRHQLLYLSSL GYRAIAPDLRGFGDTDAPPSPSSYTAHHIVGDLVGLLDQLGVDQVFLVGDWGAM MAWYFCLFRPDRVKALVNLSVHFTPRNPAISPLDGFRLMLGDDFYVCKFQEPGV AEADFGSVDTATMFKKFLTMRDPRPPIIPNGFRSLATPEALPSWLTEEDIDYFAAK FAKTGFTGGFNYYRAIDLTWELTAPWSGSEIKVPTKFIVGDLDLVYHFPGVKEYIH
GGGFKKDVPFLEEVVVMEGAAHFINQEKADEINSLIYDFIKQF EPH2 de Siraitia grosvenorii (SgEPH2) (SEQ ID NO: 57)
MEKIEHTTISTNGINMHVASIGSGPAVLFLHGFPELWYSWRHQLLFLSSMG YRAIAPDLRGFGDTDAPPSPSSYTAHHIVGDLVGLLDQLGIDQVFLVGHDWGAM MAWYFCLFRPDRVKALVNLSVHFLRRHPSIKFVDGFRALLGDDFYFCQFQEPGV AEADFGSVDVATMLKKFLTMRDPRPPMIPKEKGFRALETPDPLPAWLTEEDIDYF AGKFRKTGFTGGFNYYRAFNLTWELTAPWSGSEIKVAAKFIVGDLDLVYHFPGAK EYIHGGGFKKDVPLLEEVVVVDGAAHFINQERPAEISSLIYDFIKKF
EPH3 de Siraitia grosvenorii (SgEPH3) (SEQ ID NO: 58)
MDQIEHITINTNGIKMHIASVGTGPVVLLLHGFPELWYSWRHQLLYLSSVG YRAIAPDLRGYGDTDSPASPTSYTALHIVGDLVGALDELGIEKVFLVGHDWGAIIA WYFCLFRPDRIKALVNLSVQFIPRNPAIPFIEGFRTAFGDDFYMCRFQVPGEAEE DFASIDTAQLFKTSLCNRSSAPPCLPKEIGFRAIPPPENLPSWLTEEDINYYAAKFK QTGFTGALNYYRAFDLTWELTAPWTGAQIQVPVKFIVGDSDLTYHFPGAKEYIHN
GGFKKDVPLLEEVVVVKDACHFINQERPQEINAHIHDFINKF Momordica charantia (SEQ ID NO: 59)
MEKIEHSTIAANGITIHVASVGSGPAVLLLHGFPELWYSWRHQLLFLASKG YRAIAPDLRGFGDSDAPPSPSSYTPLHIVGDLVALLDHLGIDLVFLVGHDWGAMM AWHFCLLRPDRVKALVNLSVHFMPRNPAMSPLDGMRLLLGDDFYVCRFQEPGA AEADFGSVDTATMMKKFLTMRDPRPPIIPNGFRSLETPQALPPWLTEEDIDYFAA KFAKTGFTGGFNYYRAIGRTWELTAPWTGSKIKVPAKFIVGDLDMVYHLPDAKEY
IHGGGFKEDVPLLEEVVVIEGAAHFINQEKPDEISSLIYDFIKKF Cucurbita moschata (SEQ ID NO: 60)
MEKIEHSTIATNGINMHVASIGSGPPVLFLHGFPELWYSWRHQLLFLASKG FRAIAPDLRGFGDSDVPPSPSSYTPFHIIGDLIGLLDHLGIEQVFLVGHDWGAMMA WYFCLFRPDRVKALVNLSVHYNPRNPAISPLSRTRQFLGDDFYICKFQTPGVAEA DFGSVDTATMMKKFLTIRDPSPPIIPNGFKTLKTPETLPSWLTEEDIDYFASKFTKT GFTGGFNYYRAIEQTWELTGPWSGAKIKVPTKYVVGDVDMVYHLPGAKQYIHGG
GFKKDVPLLEEVVVMEGAAHFINQEKADEISAHIYDFIIKF Cucurbita maxima (SEQ ID NO: 61)
MENIEHTIVPTNGINMHIASIGSGPAVLFLHGFPELWYSWRHQLLFLASNG FRAIAPDLRGFGDTDVPPSPSSYTAHHIVGDLIGLLDHLGIDRVFLVGHDWGAMM AWYFCLFRPDRVRALVNLSVHYLHRHPSIKFVDGFRAFLGDDFYFCQFQEPGVA EADFGSVDTATMLKKFLTMRDPRPPMIPKEKGFRALETPDPLPSWLTEEDVDYF ASKFSKTGFTGGFNYYRAFDLSWELTAPWSGSQVKVPAKFIVGDLDLVYHFPGA
KEYIHGGRFKEDVPFLEEVVVIEGAAHFINQERADEISSLIYEFINKF Prunus persica (SEQ ID NO: 62)
MEKIEHTTVSTNGINMHIASIGTGPVVLFLHGFPELWYSWRHQLLSLSSLG YRCIAPDLRGFGDTDAPPSPASYSALHIVGDLIGLLDHLGIDQVFLVGHDWGAVIA WWFCLFRPDRVKALVNMSVAFSPRNPKRKPVDGFRALFGDDYYICRFQEPGEIE KEFAGYDTTSIMKKFLTGRSPKPPCLPKELGLRAWKTPETLPPWLSEEDLNYFAS KFSKTGFVGGLNYYRALNLTWELTGPWTGLQVKVPVKFIVGDLDITYHIPGVKNYI
HNGGFKRDVPFLQEVVVIEDGAHFINQERPDEISRHVYDFIQKF Morus notabilis (SEQ ID NO: 63)
MEKIEHSTVHTNGINMHVASVGTGPAILFLHGFPELWYSWRHQMISLSSL GYRCIAPDLRGYGDTDAPPSPTSYTSLHIVGDLVGLIDHLVIEKLFLVGHDWGAMI AWYFCLFRPDRIKALVNLSVPFFPRNPKINFVDGFRAELGDDFYICRFQEPGESE ADFSSDTVAVFRRILANRDPKPPLIPKEIGFRGVYEDPVALPSWLTEDDINHFANK FNETGFTGGLNYYRALNLTWELTAAWTGARVQVPTKFIMGDLDLVYYFPGMKEY
ILNGGFKRDVPLLQELVIIEGAAHFINQEKPDEISSHIHHFIQKF Ricinus communis (SEQ ID NO: 64)
MEKIEHTTVATNGINMHVAAIGTGPEILFLHGFPELWYSWRHQLLSLSSRG YRCIAPDLRGYGDTDAPESLTGYTALHIVGDLIGLLDSMGIEQVFLVGHDWGAMM AWYLCMFRPDRIKALVNTSVAYMSRNPQLKSLELFRTVYGDDYYVCRFQEPGGA EEDFAQVDTAKLIRSVFTSRDPNPPIVPKEIGFRSLPDPPSLPSWLSEEDVNYYAD KFNKKGFTGGLNYYRNIDQNWELTAPWDGLQIKVPVKFVIGDLDLTYHFPGIKDYI
HNGGFKQVVPLLQEVVVMEGVAHFINQEKPEEISEHIYDFIKKF Citrus unshiu (SEQ ID NO: 65)
MEKIEHTTVGTNGINMHVASIGTGPVVLFIHGFPELWYSWRNQLLYLSSRG YRAIAPDLRGYGDTDAPPSVTSYTALHLVGDLIGLLDKLGIHQVFLVGHDWGALIA WYFCLFRPDRVKALVNMSVPFPPRNPAVRPLNNFRAVYGDDYYICRFQEPGEIE EEFAQIDTARLMKKFLCLRIAKPLCIPKDTGLSTVPDPSALPSWLSEEDVNYYASK FNQKGFTGPVNYYRCSDLNWELMAPWTGVQLEVPVKFIVGDQDLVYNNKGMKE
YIHNGGFKKYVPYLQEVVVMEGVAHFINQEKAEEVGAHIYEFIKKF Hevea brasiliensis (SEQ ID NO: 66)
MEKIEHITVFTNGINMHIASIGTGPEILFLHGFPELWYSWRHQLLSLSSLGY RCIAPDLRGYGDTDAPQSVNQYTVLHIVGDLVGLLDSLGIQQVFLVGHDWGAFIA WYFCIFRPDRIKALVNTSVAFMPRNPQVKPLDGLRSMFGDDYYICQFQKPGKAE EDFAQVNTAKLIKLLFTSRDPRPPHFLKEVGLKALQDPPSQQSWLTEEDVNFYAA KFNQKGFRGGLNYYQNINMNWELAAAWTGVQIKVPVKFIIGDLDLTYHFPGIKEYI
HNGGFKKDVPLLQDVVVMEGVAHFLNQEKPEEVSKHIYDFIKKF Handroanthus impetiginosus (SEQ ID NO: 67)
MDKIQHKIIQTNGINIHVAEIGDGPAVLFLHGFPELWYSWRHQMLFLSSRG YRAIAPDLRGYGDSDAPPCATSYTAFHIIGDLVGLLDAMGLDRVFLVGHDWGAV MAWYFCLLRPDRIKALVNLSVVFQPRNPKRKPVESMRAKLGDDYYICRFQEPGE AEEEFARVDTARLIKKLLTTRNPAPPRLPKEVGFGCLPHKPITMPSWLSEEDVQY YAAKFNQKGFTGGLNYYRAMDLSWELAAPWTGVQIKVPVKFIVGDLDITYNTPG
VKEYIHKGRFKQHVPFLQELVILEGVAHFLNQEKPDEINQHIYDFIHKF Camelina sativa (SEQ ID NO: 68)
MEKIEHTTVSTNGINMHVASIGSGPVILFLHGFPDLWYSWRHQLLSFAALG YRAIAPDLRGYGDSDAPPSPESYTILHIVGDLVGLLDSLGVDRVFLVGHDWGAIVA WWLCMIRPDRVKALVNTSVVFNPRNPSVKPVDKFRDLFGDDYYVCRFQETGEIE EDFAQVDTKKLITRFFVSRNPRPPCIPKSVGFRGLPDPPSLPAWLTEQDVSFYGD KFSQKGFTGGLNYYRAMNLSWELTAPWAGLQIKVPVKFIVGDLDITYNIPGTKEYI
HGGGLKKHVPFLQEVVVMEGVGHFLQQEKPDEVTDHIYGFFEKFRTRETSSL Coffea canephora (SEQ ID NO: 69)
MDKIQHRQVPVNGINLHVAEIGDGPAILFLHGFPELWYSWRHQLLSLSAK GYRALAPDLRGYGDSDAPPSPSNYTALHIVGDLVGLLDSLGLDRVFLVGHDWGA VMAWYFCLLRPDRIKALVNMSVVFTPRNPKRKPLEAMRARFGDDYYICRFQEPG EAEEEFARVDTARIIKKFLTSRRPGPLCVPKEVGFGGSPHNPIQLPSWLSEDDVN YFASKFSQKGFTGGLNYYRAMDLNWELTAPWTGLQIKVPVKFIVGDLDVTFTTP
GVKEYIQKGGFKRDVPFLQELVVMEGVAHFVNQEKPEEVSAHIYDFIQKF Punica granatum (SEQ ID NO: 70)
MEKIQHTTVRTNGINMHVATAGSGPDSILFVHGFPELWYTWRHQMVSLAA LGYRTIAPDLRGYGDTDAPPSHESYTAFHIVGDLVGLLDSMGIEKVFLVGHDWGA AIAWYFCLFRPDRIKALVNMSVVFHPRNPNRKPVDGLRAILGDDYYICRFQAPGEI EEDFARADTANIIKFFLVSRNPRPPQIPKEGFSCLANSRQMDLPSWLSEEDINYYA SKFSEKGFTGGLNYYRVMNLNWELTAPFTGLQIKVPAKFMVGDLDITYNTPGTKE
FIHNGGLKKHVPFLQEVVVMEGVAHFINQEKPEEVTAHIYDFIKKF Arabidopsis lyrata subsp. lyrata (SEQ ID NO: 71)
MEKIEHTTVSTNGINMHVASIGSGPVILFLHGFPDLWYSWRHQLLSFAALG YRAIAPDLRGYGDSDAPPSRESYTILHIVGDLVGLLNSLGVDRVFLVGHDWGAIV AWWLCMIRPDRVNALVNTSVVFNPRNPSVKPVDAFRALFGDDYYICRFQEPGEI EEDFAQVDTKKLITRFFISRNPRPPCIPKSVGFRGLPDPPSLPAWLTEEDVSFYGD KFSQKGFTGGLNYYRALNLSWELTAPWAGLQIKVPVKFIVGDLDITYNIPGTKEYI
HEGGLKKHVPFLQEVVVLEGVGHFLHQEKPDEITDHIYGFFKKFRTRETASL Rhinolophus sinicus (SEQ ID NO: 72)
MDKIEHTTVSTNGINMHVASIGSGPVILFLHGFPDLWYSWRHQLLSFAGLG YRAIAPDLRGYGDSDSPPSHESYTILHIVGDLVGLLDSLGVDRVFLVGHDWGAVV AWWLCMIRPDRVNALVNTSVVFNPRNPSVKPVDAFKALFGEDYYVCRFQEPGEI EEDFAQVDTKKLINRFFTSRNPRPPCIPKTLGFRGLPDPPALPAWLTEQDVSFYA DKFSQKGFTGGLNYYRAMNLSWELTAPWAGLQIKVPVKFIVGDLDITYNIPGTKE
YIHEGGLKKHVPFLQEVVVMEGVGHFLHQEKPDEVTDHIYGFFKKF Citocromo P450 CYP87D18 de Siraitia grosvenorii (SEQ ID NO: 73)
MWTVVLGLATLFVAYYIHWINKWRDSKFNGVLPPGTMGLPLIGETIQLSRP SDSLDVHPFIQKKVERYGPIFKTCLAGRPVVVSADAEFNNYIMLQEGRAVEMWYL DTLSKFFGLDTEWLKALGLIHKYIRSITLNHFGAEALRERFLPFIEASSMEALHSWS TQPSVEVKNASALMVFRTSVNKMFGEDAKKLSGNIPGKFTKLLGGFLSLPLNFPG TTYHKCLKDMKEIQKKLREVVDDRLANVGPDVEDFLGQAFKDKESEKFISEEFIIQ LLFSISFASFESISTTLTLILKLLDEHPEVVKELEVEHEAIRKARADPDGPITWEEYK SMTFTLQVINETLRLGSVTPALLRKTVKDLQVKGKIIPEGWTIMLVTASRHRDPKV YKDPHIFNPWRWKDLDSITIQKNFMPFGGGLRHCAGAEYSKVYLCTFLHILCTKY
RWTKLGGGTIARAHILSFEDGLHVKFTPKE Cucumis melo (SEQ ID NO: 74)
MWTILLGLATLAIAYYIHWVNKWKDSKFNGVLPPGTMGLPLIGETIQLSRPS DSLDVHPFIQSKVKRYGPIFKTCLAGRPVVVSTDAEFNHYIMLQEGRAVEMWYLD TLSKFFGLDTEWLKALGLIHKYIRSITLNHFGAESLRERFLPRIEESARETLHYWST QPSVEVKESAAAMVFRTSIVKMFSEDSSKLLTAGLTKKFTGLLGGFLTLPLNVPG TTYHKCIKDMKEIQKKLKDILEERLAKGVSIDEDFLGQAIKDKESQQFISEEFIIQLLF SISFASFESISTTLTLILNFLADHPDVAKELEAEHEAIRKARADPDGPITWEEYKSM NFTLNVICETLRLGSVTPALLRKTTKEIQIKGYTIPEGWTVMLVTASRHRDPEVYK DPDTFNPWRWKELDSITIQRNFMPFGGGLRHCAGAEYSKVYLCTFLHILFTKYR
WRKLKGGKIARAHILRFEDGLYVNFTPKE Cucurbita maxima (SEQ ID NO: 75)
MWTIVVGLATLAVAYYIHWINKWKDSKFNGVLPPGTMGLPLIGETLQLSRP SDSLDVHPFIKKKVKRYGSIFKTCLAGRPVVVSTDAEFNNYIMLQEGRAVEMWYL DTLSKFFGLDTEWLKALGFIHKYIRSITLNHFGAESLRERFLPRIEESAKETLCYWA TQPSVEVKDSAAVMVFRTSMVKMVSKDSSKLLTGGLTKKFTGLLGGFLTLPINVP GTTYNKCMKDMKEIQKKLREILEGRLASGAGSDEDFLGQAVKDKGSQKFISDDFII QLLFSISFASFESISTTLTLILNYLADHPDVVKELEAEHEAIRNARADPDGPITWEEY KSMTFTLHVIFETLRLGSVTPALLRKTTKELQINGYTIPEGWTVMLVTASRHRDPA VYKDPHTFNPWRWKELDSITIQKNFMPFGGGLRHCAGAEYSKVYLCTFLHILFTK
YRWTKLKGGKVARAHILSFEDGLHMKFTPKE Cucumis sativus (SEQ ID NO: 76)
MWTILLGLATLAIAYYIHWVNKWKDSKFNGVLPPGTMGLPLIGETIQLSRPS DSLDVHPFIQRKVKRYGPIFKTCLAGRPVVVSTDAEFNHYIMLQEGRAVEMWYLD TLSKFFGLDTEWLKALGLIHKYIRSITLNHFGAESLRERFLPRIEESARETLHYWST QTSVEVKESAAAMVFRTSIVKMFSEDSSKLLTEGLTKKFTGLLGGFLTLPLNLPGT TYHKCIKDMKQIQKKLKDILEERLAKGVKIDEDFLGQAIKDKESQQFISEEFIIQLLF SISFASFESISTTLTLILNFLADHPDVVKELEAEHEAIRKARADPDGPITWEEYKSM NFTLNVICETLRLGSVTPALLRKTTKEIQIKGYTIPEGWTVMLVTASRHRDPEVYK DPDTFNPWRWKELDSITIQKNFMPFGGGLRHCAGAEYSKVYLCTFLHILFTKYR
WRKLKGGKIARAHILRFEDGLYVNFTPKE Cucurbita moschata (SEQ ID NO: 77)
MWAIVVGLATLAVAYYIHWINKWKDSKFNGVLPPGTMGLPLVGETLQLAR PSDSLDVHPFIKKKVKRYGSIFKTCLAGRPVVVSTDAEFNNYIMLQEGRAVEMWY LDTLSKFFGLDTEWLKALGFIHKYIRSITLNHFGAESLRERFLPRIEESAKETLRYW ATQPSVEVKDSAAVMVFRTSMVKMVSEDSSKLLTGGLTKKFTGLLGGFLTLPINV PGTTYNKCMKDMKEIQKKLREILEGRLASGAGSDEDFLGQAIKDKGSQQFISDDF IIQLLFSISFASFESISTTLTLVLNYLADHPDVVKELEAEHEAIRNARADPDGPITWE EYKSMTFTLHVIFETLRLGSVTPALLRKTTKELQINGYTIPEGWTVMLVTASRHRD PAVYKDPHTFNPWRWKELDSITIQKNFMPFGGGLRHCAGAEYSKVYLCTFLHILF
TKYRWTKLKGGKVARAHILSFEDGLHVKFTPKE Prunus avium (SEQ ID NO: 78)
MWTLVGLSLVALLVIYFTHWIIKWRNPKCNGVLPPGSMGLPLIGETLNLIIP SYSLDLHPFIKKRLQRYGPIFRTSLAGRPVVVTADPEFNNYIFQQEGRMVELWYL DTFSKIFVHEGDSKTNAIGMVHKYVRSIFLNHFGAERLKEKLLPQIEEFVNKSLCA WSSKASVEVKHAGSVMVFNFSAKQMISYDAEKSSDDLSEKYTKIIDGLMSFPLNI PGTAYYNCSKHQKNVTTMLRDMLKERRISPETRRGDFLDQLSIDMEKEKFLSED FSVQLVFGGLFATFESISAVIALAFSLLADHPSVVEELTAEHEAILKNRENPNSSIT WDEYKSMTFTLQVINEILRLGNVAPGLLRRALKDIPVKGFTIPEGWTIMVVTSALQ LSPNTFEDPLEFNPWRWKDLDSYAVSKNFMPFGGGMRQCAGAEYSRVFLATFL
HVLVTKYRWTTIKAARIARNPILGFGDGIHIKFEEKKT Populus trichocarpa (SEQ ID NO: 79)
MWAIGLVVVALVVIYYTHMIFKWRSPKIEGVLPPGSMGWPLIGETLQFISP GKSLDLHPFVKKRMEKYGPIFKTSLVGRPIIVSTDYEMNKYILQHEGTLVELWYLD SFAKFFALEGETRVNAIGTVHKYLRSITLNHFGVESLKESLLPKIEDMLHTNLAKW ASQGPVDVKQVISVMVFNFTANKIFGYDAENSKEKLSENYTKILNSFISLPLNIPGT SFHKCMQDREKMLKMLKDTLMERLNDPSKRRGDFLDQAIDDMKTEKFLTEDFIP QLMFGILFASFESMSTTLTLTFKFLTENPRVVEELRAEHEAIVKKRENPNSRLTWE EYRSMTFTQMVVNETLRISNIPPGLFRKALKDFQVKGYTVPAGWTVMLVTPATQL NPDTFKDPVTFNPWRWQELDQVTISKNFMPFGGGTRQCAGAEYSKLVLSTFLHI
LVTNYSFTKIRGGDVSRTPIISFGDGIHIKFTARA Prunus persica (SEQ ID NO: 80)
MWTLVGLSLVGLLVIYFTHWIIKWRNPKCNGVLPPGSMGLPFIGETLNLIIP SYSLDLHPFIKKRLQRYGPIFRTSLAGRQVVVTADPEFNNYLFQQEGRMVELWYL DTFSKIFVHEGESKTNAVGMVHKYVRSIFLNHFGAERLKEKLLPQIEEFVNKSLCA WSSKASVEVKHAGSVMVFNFSAKQMISYDAEKSSDDLSEKYTKIIDGLMSFPLNI PGTAYYNCLKHQKNVTTMLRDMLKERQISPETRRGDFLDQISIDMEKEKFLSEDF SVQLVFGGLFATFESISAVLALAFSLLAEHPSVVEELTAEHEAILKNRENLNSSLT WDEYKSMTFTLQVINEILRLGNVAPGLLRRALKDIPVKGFTIPEGWTIMVVTSALQ LSPNTFEDPLEFNPWRWKDLDSYAVSKNFMPFGGGMRQCAGAEYSRVFLATFL
HVLVTKYRWTTIKAARIARNPILGFGDGIHIKFEEKKT Populus euphratica (SEQ ID NO: 81)
MWTFVLCVVAVLVVYYTHWINKWRNPTCNGVLPPGSMGLPIIGETLELIIP SYSLDLHPFIKKRIQRYGPIFRTNILGRPAVVSADPEINSYIFQNEGKLVEMWYMD TFSKLFAQSGESRTNAFGIIHKYARSLTLTHFGSESLKERLLPQVENIVSKSLQMW SSDASVDVKPAVSIMVCDFTAKQLFGYDAENSSDKISEKFTKVIDAFMSLPLNIPG TTYHKCLKDKDSTLSILRNTLKERMNSPAESRGGDFLDQIIADMDKEKFLTEDFTV NLIFGILFASFESISAALTLSLKLIGDHPSVLEELTVEHEAILKNRENPDSPLTWAEY NSMTFSLQVINETLRLGNVAPGLLRRALQDMQVKGYTIPAGWVIMVVNSALHLNP ATFKDPLEFNPWRWKDFDSYAVSKNLMPFGGGRRQCAGSEFTKLFMAIFLHKLV
TKYRWNIIKQGNIGRNPILGFGDGIHISFSPKDI Juglans regia (SEQ ID NO: 82)
MWKVGLCVVGVIVVWFTRWINKWRNPKCNGILPPGSMGPPLIGESLQLIIP SYSLDLHPFIKKRVQRYGPIFRTSVVGQPMVVSTDVEFNHYLAKQEGRLVHFWY LDSFAEIFNLEDENAISAVGLIHKYGRSIVLNHFGTDSLKKTLLSQIEEIVNKTLQTW SSLPSVEVKHAASVMAFDLTAKQCFGYDVENSAVKMSEKFLYTLDSLISFPFNIP GTVYHKCLKDKKEVLNMLRNIVKERMNSPEKYRGDFLDQITADMNKESFLTQDFI VYLLYGLLFASFESISASLSLTLKLLAEHPAVLQQLTAEHEAILKNRDNPNSSLTWD EYKSMTFTFQVINEALRLGNVAPGLLRRALKDIEFKGYTIPAGWTIMLANSAIQLNP NTYEDPLAFNPWRWQDLDPQIVSKNFMPFGGGIRQCAGAEYSKTFLATFLHVLV
TKYRWTKVKGGKMARNPILWFADGIHINFALKHN Pyrus x bretschneideri (SEQ ID NO: 83)
MWDVVGLSFVALLVIYLTYWITQWKNPKCNGVLPPGSMGLPLIGETLNLLI PSYSLDLHPFIRKRLERYGPIFRTSLAGKPVLVSADPEFNNYVLKQEGRMVEFWY LDTFSKIFMQEGGNGTNQIGVIHKYARSIFLNHFGAECIKEKLLTQIEGSINKHLRA WSNQESVEVKKAGSIMALNFCAEHMIGYDAETATENLGEIYHRVFQGLISFPLNV PGTAYHNCLKIHKKATTMLRAMLRERRSSPEKRRGDFLDQIIDDLDQEKFLSEDF CIHLIFGGLFAIFESISTVLTLFFSLLADHPAVLQELTAEHEALLKNREDPNSALTWD EYKSMTFTLQVINETLRLVNTAPGLLRRALKDIPVKGYTIPAGWTILLVTPALHLTS NTFKDHLEFNPWRWKDLDSLVISKNFMPFGSGLRQCAGAEFSRAYLSTFLHVLV
TKYRWTTIKGARISRRPMLTFGDGAHIKFSEKKN Morus notabilis (SEQ ID NO: 84)
MWNTICLSVVGLVVIWISNWIRRWRNPKCNGVLPPGSMGFPLIGETLPLIIP TYSLDLHPFIKNRLQRYGSIFRTSIVGRPVVISADPEFNNFLFQQEGSLVELYYLDT FSKIFVHEGVSRTNEFGVVHKYIRSIFLNHFGAERLKEKLLPEIEQMVNKTLSAWS TQASVEVKHAASVLVLDFSAKQIISYDAKKSSESLSETYTRIIQGFMSFPLNIPGTA YNQCVKDQKKIIAMLRDMLKERRASPETNRGDFLDQISKDMDKEKFLSEDFVVQL IFGGLFATFESVSAVLALGFMLLSEHPSVLEEMIAEHETILKNREHPNSLLAWGEY KSMTFTLQVINETLRLGNVAPGLLRKALKDIRVKGFTIPKGWAIMMVTSALQLSPS TFKNPLEFNPWRWKDLDSLVISKNFMPFGRGMRQCAGAEYSRAFMATFFHVLLT
KYRWTTIKVGNVSRNPILRFGNGIHIKFSKKN Jatropha curcas (JcP450.1) (SEQ ID NO: 85)
MWIIGLCFASLLVIYCTHFFYKWRNPKCKGVLPPGSMGLPIIGETLQLIIPSY SLDHHPFIQKRIQRYGPIFRTNLVGRPVIVSADPEVNQYIFQQEGNSVEMWYLDA YAKIFQLDGESRLSAVGRVHKYIRSITLNNFGIENLKENLLPQIQDLVNQSLQKWS NKASVDVKQAASVMVFNLTAKQMFSYGVEKNSSEEMTEKFTGIFNSLMSLPLNIP GTTYHKCLKDREAMLKMLRDTLKQRLSSPDTHRGDFLDQAIDDMDTEKFLTGDC IPQLIFGILLAGFETTATTLTLAFKFLAEHPLVLEELTAEHEKILSKRENLESPLTWD EYKSMTFTHHVINETLRLANFLPGLLRKALKDIQVKNYTIPAGWTIMVVKSAMQLN PEIYKDPLAFNPWRWKDLDSYTVSKNFMPFGGGSRQCAGADYSKLFMTIFLHVL
VTKYRWRKIKGGDIARNPILGFGDGLHIEVSAKN Hevea brasiliensis (SEQ ID NO: 86)
MLTVVLLLVGFFIIYYTYWISKWRNPNCNGVLPPGSMGFPLIGETLQLLIPS YSLDLHPFIKKRIHRYGPIFRSNLAGRPVIVSADPEFNYYILSQEGRSVEIWYLDTF SKLFRQQGESRTNVAGYVHKYLRGAFLSQIGSENLREKLLLHIQDMVNRTLCSW SNQESVEVKHSASLAVCDFTAKVLFGYDAEKSPDNLSETFTRFVEGLISFPLNIPR TAYRQCLQDRQKALSILKNVLTDRRNSVENYRGDVLDLLLNDMGKEKFLTEDFIC LIMLGGLFASFESISTITTLLLKLFSAHPEVVQELEAEHEKILVSRHGSDSLSITWDE YKSMTFTHQVINETLRLGNVAPGLLRRAIKDVQFKGYTIPSGWTIMMVTSAQQVN PEVYKDPLVFNPWRWKDFDSITVSKNFTPFGGGTRQCVGAEYSRLTLSLFIHLLV
TKYRWTKIKEGEIRRAPMLGFGDGIHFKFSEKE Jatropha curcas (JcP450.2) (SEQ ID NO: 87)
MKRAIYICLARITKQGLSLIEMLMTELLFGAFFIIFLTYWINRWRNPKCNGVL PPGSMGLPLLGETLQLLIPRYSLDLHPFIRKRIQRYGPIFRSNVAGRPIVFTADPEL NHYIFIQERRLVELWYMDTFSNLFVLDGESRPTGATGYIHKYMRGLFLTHFGAER LKDKLLHQIQELIHTTLQSWCKQPTIEVKHAASAVICDFSAKFLFGYEAEKSPFNM SERFAKFAESLVSFPLNIPGTAYHQSLEDREKVMKLLKNVLRERRNSTKKSEEDV LKQILDDMEKENFITDDFIIQILFGALFAISESIPMTIALLVKFLSAQPSVVEELTAEH EEILKNKKEKGLDSSITWEDYKSMTFTLQVINETLRIANVAPGLLRRTLRDIHYKGY TIPAGWTIMVLTSSRHMNPEIYKDPVEFNPWRWKDLDSQTISKNFTPFGGGTRQ CAGAEYSRAFISMFLHVLVTKYRWKNVKEGKICRGPILRIEDGIHIKLYEKH
Chenopodium quinoa (SEQ ID NO: 88)
MWPTMGLYVATIVAICFILLELKRRNSREKQVVLPPGSKGFPLIGETLQLLV PSYSLDLPSFIRTRIQRYGPIFKTRLVGRPVVMSADPGFNRYIVQQEGKSVEMWY LDTFSKLFAQDGEARTTAAGLVHKYLRNLTLSHFGSESLRVNLLPHLESLVRNTLL GWSSKDTIDVKESALTMTIEFVAKQLFGYDSDKSKEKIGEKFGNISQGLFSLPLNI PGTTYHSCLKSQREVMDMMRTALKDRLTTPESYRGDFLDHALKDLSTEKFLSEE FILQIMFGLLFASSESTSMTLTLVLKLLSENPHVLKELEAEHERIIKNKESPDSPLT WAEVKSMTFTLQVINESLRLGNVSLGILRRTLKDIEINGYTIPAGWTIMLVTSACQY NSDIYKDPLTFNPWRWKEMQPDVIAKNFMPFGGGTRQCAGAEFAKVLMTIFLHN
LVTNYRWEKIKGGEIVRTPILGFRNALRVKLTKKN Spinacia oleracea (SEQ ID NO: 89)
MVLLPGSKGFPFIGETLQLLLPSYSLDLPSFIRTRIQRYGPIFQTRLVGRPV VVSADPGFNRYIVQQEGKMVEMWYLDTFSKIFAQQGEGRTNAAGLVHKYLRNIT FTHFGSQTLRDKLLPHLEILVRKTLHGWTSQESIDVKEAALTMTIEFVAKQLFGYD SDKSKERIGDKFANISQGLLSFPLNIPGTTYHSCLKSQREVMDMMRKTLKERLAS PDTCQGDFLDHALKDLNTDKFLTEDFILQIMFGLLFASSESTSITLTLILKFLSENPH VLEELEVEHERILKNRESPDSPLTWAEVKSMTFTLQVINESLRLGNVSLGLLRRTL KDIEINGYTIPAGWTIMLVTSACQYNSDVYKDPLTFNPWRWKEMQPDVIAKNFMP FGGGTRQCAGAEFAKVLMTIFLHVLVTTYRWEKIKGGEIIRTPILGFRNGLHVKLIK
KARLS Manihot esculenta (SEQ ID NO:90)
MEMWSVWLYIISLIIIIATHWIYRWRNPKCNGKLPPGSMGIPFIGETIQFLIPS KSLDVPNFIKKRMNKYGPLFRTNLVGRPVIVSSDPDFNYYLLQREGKLVERWYM DSFSKLLHHDVTQIIIKHGSIHKYLRNLVLGHFGPEPLKDKLLPQLESAISQRLQDW SKQPSIEAKSASSAMIFDFTAKILFSYEPEKSGENIGEIFSNFLQGLMSIPLNIPGTA FHRCLKNQKRAIQMITEILKERRSNPEIHKGDFLDQIVEDMKKDSFWTEEFAIYMM FGLLLASFETISSTLALAIIFLTDNPPVVQKLTEEHEAILKARENRDSGLSWKEYKSL SYTHQVVNESLRLASVAPGILRRAITDIQVDGYTIPKGWTIMVVPAAVQLNPNTFE DPLVFNPSRWEDMGAVAMAKNFIAFGGGSRSCAGAEFSRVLMSVFVHVFVTNY
RWTKIKGGDMVRSPALGFGNGFHIRVSEKQL Olea europaea var. sylvestris (SEQ ID NO: 91)
MAALDLSTVGYLIVGLLTVYITHWIYKWRNPKCNGVLPPGSMGLPLIGETIQ LVIPNASLDLPPFIKKRMKRYGPIFRTNVAGRPVIITADPEFNHFLLRQDGKLVDTW SMDTFAEVFDQASQSSRKYTRHLTLNHFGVEALREKLLPQMEDMVRTTLSNWS SQESVEVKSASVTMAIDYAARQIYSGNLENAPLKISDLFRDLVDGLMSFPINIPGT AHHRCLQTHKKVREMMKDIVKTRLEEPERQYGDMLDHMIEDMKKESFLDEDFIV QLMFGLFFVTSDSISTTLALAFKLLAEHPLVLEELTAEHEAILKKREKSESHLTWND YKSMTFTLQVINEVLRLGNIAPGFFRRALQDIPVNGYTIPSGWVIMIATAGLHLNSN QFEDPLKFNPWRWKVCKVSSVIAKCFMPFGSGMKQCAGAEYSRVLLATFIHVLT
TKYRWAIVKGGKIVRSPIIRFPDGFHYKIIEKTN Citocromo P450 Redutase Stevia rebaudiana (SrCPR1) (SEQ ID NO: 92)
MAQSDSVKVSPFDLVSAAMNGKAMEKLNASESEDPTTLPALKMLVENRE LLTLFTTSFAVLIGCLVFLMWRRSSSKKLVQDPVPQVIVVKKKEKESEVDDGKKK VSIFYGTQTGTAEGFAKALVEEAKVRYEKTSFKVIDLDDYAADDDEYEEKLKKESL AFFFLATYGDGEPTDNAANFYKWFTEGDDKGEWLKKLQYGVFGLGNRQYEHFN KIAIVVDDKLTEMGAKRLVPVGLGDDDQCIEDDFTAWKELVWPELDQLLRDEDDT SVTTPYTAAVLEYRVVYHDKPADSYAEDQTHTNGHVVHDAQHPSRSNVAFKKEL HTSQSDRSCTHLEFDISHTGLSYETGDHVGVYSENLSEVVDEALKLLGLSPDTYF SVHADKEDGTPIGGASLPPPFPPCTLRDALTRYADVLSSPKKVALLALAAHASDP SEADRLKFLASPAGKDEYAQWIVANQRSLLEVMQSFPSAKPPLGVFFAAVAPRL QPRYYSISSSPKMSPNRIHVTCALVYETTPAGRIHRGLCSTWMKNAVPLTESPDC SQASIFVRTSNFRLPVDPKVPVIMIGPGTGLAPFRGFLQERLALKESGTELGSSIF FFGCRNRKVDFIYEDELNNFVETGALSELIVAFSREGTAKEYVQHKMSQKASDIW KLLSEGAYLYVCGDAKGMAKDVHRTLHTIVQEQGSLDSSKAELYVKNLQMSGRY
LRDVW CPR1 de Arabidopsis thaliana (AtCPR1) (SEQ ID NO: 93)
MATSALYASDLFKQLKSIMGTDSLSDDVVLVIATTSLALVAGFVVLLWKKTT ADRSGELKPLMIPKSLMAKDEDDDLDLGSGKTRVSIFFGTQTGTAEGFAKALSEE IKARYEKAAVKVIDLDDYAADDDQYEEKLKKETLAFFCVATYGDGEPTDNAARFY KWFTEENERDIKLQQLAYGVFALGNRQYEHFNKIGIVLDEELCKKGAKRLIEVGLG DDDQSIEDDFNAWKESLWSELDKLLKDEDDKSVATPYTAVIPEYRVVTHDPRFTT QKSMESNVANGNTTIDIHHPCRVDVAVQKELHTHESDRSCIHLEFDISRTGITYET GDHVGVYAENHVEIVEEAGKLLGHSLDLVFSIHADKEDGSPLESAVPPPFPGPCT LGTGLARYADLLNPPRKSALVALAAYATEPSEAEKLKHLTSPDGKDEYSQWIVAS QRSLLEVMAAFPSAKPPLGVFFAAIAPRLQPRYYSISSSPRLAPSRVHVTSALVYG PTPTGRIHKGVCSTWMKNAVPAEKSHECSGAPIFIRASNFKLPSNPSTPIVMVGP GTGLAPFRGFLQERMALKEDGEELGSSLLFFGCRNRQMDFIYEDELNNFVDQGV ISELIMAFSREGAQKEYVQHKMMEKAAQVWDLIKEEGYLYVCGDAKGMARDVH
RTLHTIVQEQEGVSSSEAEAIVKKLQTEGRYLRDVW CPR2 de Arabidopsis thaliana (AtCPR2) (SEQ ID NO: 94)
MASSSSSSSTSMIDLMAAIIKGEPVIVSDPANASAYESVAAELSSMLIENRQ FAMIVTTSIAVLIGCIVMLVWRRSGSGNSKRVEPLKPLVIKPREEEIDDGRKKVTIF FGTQTGTAEGFAKALGEEAKARYEKTRFKIVDLDDYAADDDEYEEKLKKEDVAFF FLATYGDGEPTDNAARFYKWFTEGNDRGEWLKNLKYGVFGLGNRQYEHFNKVA KVVDDILVEQGAQRLVQVGLGDDDQCIEDDFTAWREALWPELDTILREEGDTAV ATPYTAAVLEYRVSIHDSEDAKFNDINMANGNGYTVFDAQHPYKANVAVKRELHT PESDRSCIHLEFDIAGSGLTYETGDHVGVLCDNLSETVDEALRLLDMSPDTYFSL HAEKEDGTPISSSLPPPFPPCNLRTALTRYACLLSSPKKSALVALAAHASDPTEAE RLKHLASPAGKDEYSKWVVESQRSLLEVMAEFPSAKPPLGVFFAGVAPRLQPRF YSISSSPKIAETRIHVTCALVYEKMPTGRIHKGVCSTWMKNAVPYEKSENCSSAPI FVRQSNFKLPSDSKVPIIMIGPGTGLAPFRGFLQERLALVESGVELGPSVLFFGCR NRRMDFIYEEELQRFVESGALAELSVAFSREGPTKEYVQHKMMDKASDIWNMIS QGAYLYVCGDAKGMARDVHRSLHTIAQEQGSMDSTKAEGFVKNLQTSGRYLRD
VW Arabidopsis thaliana (AtCPR3) (SEQ ID NO: 95)
MASSSSSSSTSMIDLMAAIIKGEPVIVSDPANASAYESVAAELSSMLIENRQ FAMIVTTSIAVLIGCIVMLVWRRSGSGNSKRVEPLKPLVIKPREEEIDDGRKKVTIF FGTQTGTAEGFAKALGEEAKARYEKTRFKIVDLDDYAADDDEYEEKLKKEDVAFF FLATYGDGEPTDNAARFYKWFTEGNDRGEWLKNLKYGVFGLGNRQYEHFNKVA KVVDDILVEQGAQRLVQVGLGDDDQCIEDDFTAWREALWPELDTILREEGDTAV ATPYTAAVLEYRVSIHDSEDAKFNDITLANGNGYTVFDAQHPYKANVAVKRELHT PESDRSCIHLEFDIAGSGLTMKLGDHVGVLCDNLSETVDEALRLLDMSPDTYFSL HAEKEDGTPISSSLPPPFPPCNLRTALTRYACLLSSPKKSALVALAAHASDPTEAE RLKHLASPAGKDEYSKWVVESQRSLLEVMAEFPSAKPPLGVFFAGVAPRLQPRF YSISSSPKIAETRIHVTCALVYEKMPTGRIHKGVCSTWMKNAVPYEKSEKLFLGRP IFVRQSNFKLPSDSKVPIIMIGPGTGLAPFRGFLQERLALVESGVELGPSVLFFGC RNRRMDFIYEEELQRFVESGALAELSVAFSREGPTKEYVQHKMMDKASDIWNMI SQGAYLYVCGDAKGMARDVHRSLHTIAQEQGSMDSTKAEGFVKNLQTSGRYLR
DVW CPR2 de Stevia rebaudiana (SrCPR2)(SEQ ID NO: 96)
MAQSESVEASTIDLMTAVLKDTVIDTANASDNGDSKMPPALAMMFEIRDLL LILTTSVAVLVGCFVVLVWKRSSGKKSGKELEPPKIVVPKRRLEQEVDDGKKKVTI FFGTQTGTAEGFAKALFEEAKARYEKAAFKVIDLDDYAADLDEYAEKLKKETYAF FFLATYGDGEPTDNAAKFYKWFTEGDEKGVWLQKLQYGVFGLGNRQYEHFNKI GIVVDDGLTEQGAKRIVPVGLGDDDQSIEDDFSAWKELVWPELDLLLRDEDDKA AATPYTAAIPEYRVVFHDKPDAFSDDHTQTNGHAVHDAQHPCRSNVAVKKELHT PESDRSCTHLEFDISHTGLSYETGDHVGVYCENLIEVVEEAGKLLGLSTDTYFSLH IDNEDGSPLGGPSLQPPFPPCTLRKALTNYADLLSSPKKSTLLALAAHASDPTEA DRLRFLASREGKDEYAEWVVANQRSLLEVMEAFPSARPPLGVFFAAVAPRLQPR YYSISSSPKMEPNRIHVTCALVYEKTPAGRIHKGICSTWMKNAVPLTESQDCSWA PIFVRTSNFRLPIDPKVPVIMIGPGTGLAPFRGFLQERLALKESGTELGSSILFFGC RNRKVDYIYENELNNFVENGALSELDVAFSRDGPTKEYVQHKMTQKASEIWNML SEGAYLYVCGDAKGMAKDVHRTLHTIVQEQGSLDSSKAELYVKNLQMSGRYLR
DVW CPR3 de Stevia rebaudiana (SrCPR3) (SEQ ID NO: 97)
MAQSNSVKISPLDLVTALFSGKVLDTSNASESGESAMLPTIAMIMENRELL MILTTSVAVLIGCVVVLVWRRSSTKKSALEPPVIVVPKRVQEEEVDDGKKKVTVFF GTQTGTAEGFAKALVEEAKARYEKAVFKVIDLDDYAADDDEYEEKLKKESLAFFF LATYGDGEPTDNAARFYKWFTEGDAKGEWLNKLQYGVFGLGNRQYEHFNKIAK VVDDGLVEQGAKRLVPVGLGDDDQCIEDDFTAWKELVWPELDQLLRDEDDTTV ATPYTAAVAEYRVVFHEKPDALSEDYSYTNGHAVHDAQHPCRSNVAVKKELHSP ESDRSCTHLEFDISNTGLSYETGDHVGVYCENLSEVVNDAERLVGLPPDTYFSIH TDSEDGSPLGGASLPPPFPPCTLRKALTCYADVLSSPKKSALLALAAHATDPSEA DRLKFLASPAGKDEYSQWIVASQRSLLEVMEAFPSAKPSLGVFFASVAPRLQPR YYSISSSPKMAPDRIHVTCALVYEKTPAGRIHKGVCSTWMKNAVPMTESQDCSW APIYVRTSNFRLPSDPKVPVIMIGPGTGLAPFRGFLQERLALKEAGTDLGLSILFFG CRNRKVDFIYENELNNFVETGALSELIVAFSREGPTKEYVQHKMSEKASDIWNLL SEGAYLYVCGDAKGMAKDVHRTLHTIVQEQGSLDSSKAELYVKNLQMSGRYLR
DVW CPR de Artemisia annua (AaCPR) (SEQ ID NO: 98)
MAQSTTSVKLSPFDLMTALLNGKVSFDTSNTSDTNIPLAVFMENRELLMIL TTSVAVLIGCVVVLVWRRSSSAAKKAAESPVIVVPKKVTEDEVDDGRKKVTVFFG TQTGTAEGFAKALVEEAKARYEKAVFKVIDLDDYAAEDDEYEEKLKKESLAFFFLA TYGDGEPTDNAARFYKWFTEGEEKGEWLDKLQYAVFGLGNRQYEHFNKIAKVV DEKLVEQGAKRLVPVGMGDDDQCIEDDFTAWKELVWPELDQLLRDEDDTSVAT PYTAAVAEYRVVFHDKPETYDQDQLTNGHAVHDAQHPCRSNVAVKKELHSPLS DRSCTHLEFDISNTGLSYETGDHVGVYVENLSEVVDEAEKLIGLPPHTYFSVHAD NEDGTPLGGASLPPPFPPCTLRKALASYADVLSSPKKSALLALAAHATDSTEADR LKFLASPAGKDEYAQWIVASHRSLLEVMEAFPSAKPPLGVFFASVAPRLQPRYYS ISSSPRFAPNRIHVTCALVYEQTPSGRVHKGVCSTWMKNAVPMTESQDCSWAPI YVRTSNFRLPSDPKVPVIMIGPGTGLAPFRGFLQERLAQKEAGTELGTAILFFGCR NRKVDFIYEDELNNFVETGALSELVTAFSREGATKEYVQHKMTQKASDIWNLLSE GAYLYVCGDAKGMAKDVHRTLHTIVQEQGSLDSSKAELYVKNLQMAGRYLRDV
W CPR (PgCPR) (SEQ ID NO: 99)
MAQSSSGSMSPFDFMTAIIKGKMEPSNASLGAAGEVTAMILDNRELVMILT TSIAVLIGCVVVFIWRRSSSQTPTAVQPLKPLLAKETESEVDDGKQKVTIFFGTQT GTAEGFAKALADEAKARYDKVTFKVVDLDDYAADDEEYEEKLKKETLAFFFLATY GDGEPTDNAARFYKWFLEGKERGEWLQNLKFGVFGLGNRQYEHFNKIAIVVDEI LAEQGGKRLISVGLGDDDQCIEDDFTAWRESLWPELDQLLRDEDDTTVSTPYTA AVLEYRVVFHDPADAPTLEKSYSNANGHSVVDAQHPLRANVAVRRELHTPASDR SCTHLEFDISGTGIAYETGDHVGVYCENLAETVEEALELLGLSPDTYFSVHADKE DGTPLSGSSLPPPFPPCTLRTALTLHADLLSSPKKSALLALAAHASDPTEADRLRH LASPAGKDEYAQWIVASQRSLLEVMAEFPSAKPPLGVFFASVAPRLQPRYYSISS SPRIAPSRIHVTCALVYEKTPTGRVHKGVCSTWMKNSVPSEKSDECSWAPIFVR QSNFKLPADAKVPIIMIGPGTGLAPFRGFLQERLALKEAGTELGPSILFFGCRNSK MDYIYEDELDNFVQNGALSELVLAFSREGPTKEYVQHKMMEKASDIWNLISQGA
YLYVCGDAKGMARDVHRTLHTIAQEQGSLDSSKAESMVKNLQMSGRYLRDVW Oxidase de ferro não heme
Acetobacter pasteurianus subsp. ascendens (ApGA2ox) (SEQ ID NO: 100)
MSVSKTTETFTSIPVIDISKLYSSDLAERKAVAEKLGDAARNIGFLYISGHNV SADLIEGVRKAARDFFAEPFEKKMEYYIGTSATHKGFVPEGEEVYSAGRPDHKEA FDIGYEVPANHPLVQAGTPLLGPNNWPDIPGFRSAAEAYYRTVFDLGRTLFRGFA LALGLNESYFDTVANFPPSKLRMIHYPYDADAQDAPGIGAHTDYECFTILLADKPG LEVMNGNGDWIDAPPIPGAFVVNIGDMLEVMTAGEFVATAHRVRKVSEERYSFP LFYACDYHTQIRPLPAFAKKIDASYETITIGEHMWAQALQTYQYLVKKVEKGELKL
PKGARKTATFGHFKRNSAA Cucurbita maxima (CmGA2ox) (SEQ ID NO: 101)
MAAASSFSAAFYSGIPLIDLSAPDAKQLIVKACEELGFFKVVKHGVPMELIS SLESESTKFFSLPLSEKQRAGPPSPFGYGNKQIGRNGDVGWVEYLLLNTHLESN SDGFLSMFGQDPQKLRSAVNDYISAVRNMAGEILELMAEGLKIQQRNVFSKLVM DEQSDSVFRVNHYPPCPDLQALKGTNMIGFGEHTDPQIISVLRSNNTSGFQISLA DGNWISVPPDHSSFFINVGDSLQVMTNGRFKSVKHRVLTNSSKSRVSMIYFGGP
PLSEKIAPLASLMQGEERSLYKEFTWFEYKRSAYNSRLADNRLVPFERIAAS Dendrobium catenatum (DcGA3ox) (SEQ ID NO: 102)
MPSLSKEHFDLYSAFHVPETHAWSSSHLHDHPIAGDGATIPVIDISDPDAA SMVGGACRSWGVFYATSHGIPADLLHQVESHARRLFSLPLHRKLQTAPRDGSLS GYGRPPISAFFPKLMWSEGFTLAGHDDHLAVTSQLSPFDSLSFCEVMEAYRKEM KKLAGRLFRLLILSLGLEEEEMGQVGPLKELSQAADAIQLNSYPTCPEPERAIGMA AHTDSAFLTVLHQTDGAGGLQVLRDQDESGSARWVDVLPRPDCLVVNVGDLLHI LSNGRFKSVRHRAVVNRADHRISAAYFIGPPAHMKVGSITKLVDMRTGPMYRPV
TWPEYLGIRTRLFDKALDSVKFQEKELEKD Cucurbita maxima (CmGA3ox) (SEQ ID NO: 103)
MATTIADVFKSFPVHIPAHKNLDFDSLHELPDSYAWIQPDSFPSPTHKHHN SILDSDSDSVPLIDLSLPNAAALIGNAFRSWGAFQVINHGVPISLLQSIESSADTLFS LPPSHKLKAARTPDGISGYGLVRISSFFPKRMWSEGFTIVGSPLDHFRQLWPHDY HKHCEIVEEYDREMRSLCGRLMWLGLGELGITRDDMKWAGPDGDFKTSPAATQ FNSYPVCPDPDRAMGLGPHTDTSLLTIVYQSNTRGLQVLREGKRWVTVEPVAG GLVVQVGDLLHILTNGLYPSALHQAVVNRTRKRLSVAYVFGPPESAEISPLKKLLG
PTQPPLYRPVTWTEYLGKKAEHFNNALSTVRLCAPITGLLDVNDHSRVKVG Cucurbita maxima (CmGA20ox) (SEQ ID NO: 104)
MHVVTSTPEARHDGAPLVFDASVLRHQHNIPKQFIWPDEEKPAATCPELE VPLIDLSGFLSGEKDAAAEAVRLVGEACEKHGFFLVVNHGVDRKLIGEAHKYMDE FFELPLSQKQSAQRKAGEHCGYASSFTGRFSSKLPWKETLSFRFAADESLNNLV LHYLNDKLGDQFAKFGRVYQDYCEAMSGLSLGIMELLGKSLGVEEQCFKNFFKD NDSIMRLNFYPPCQKPHLTLGTGPHCDPTSLTILHQDQVGGLQVFVDNQWRLITP NFDAFVVNIGDTFMALSNGRYKSCLHRAVVNSERTRKSLAFFLCPRNDKVVRPP RELVDTQNPRRYPDFTWSMLLRFTQTHYRADMKTLEAFSAWLQQEQQEQQEQ
QFNI Agapanthus praecox subsp. orientalis (ApoGA20ox) (SEQ ID NO: 105)
MVLQPFVFDAALLRDEHNIPTQFIWPEEDKPSPDASEELILPFIDLKAFLSG DPDSPFQVSKQVGEACESLGAFQVTNHGIDFDLLEEAHSCIQKFFSMPLCEKQR ALRKAGESYGYASSFTGRFCSKLPWKETLSFRYSSSSSDIVQNYFVRTLGEEFR HFGEVYQKYCESMSKLSLMIMEVLGLSLGVGRMHFREFFEGNDSTMRLNYYPP CKKPDLTLGTGPHCDPTSLTILHQDDVSGLQVFTGGKWLTVRPKTDAFVVNIGDT FTALSNGRYKSCLHRAVVNSKTARKSLAFFLCPAMNKIVRPPRELVDIDHPRAYP
DFTWSALLEFTQKHYRADMQTLNEFSKYILQAQGTLHK Arabidopsis thaliana (AtF3H) (SEQ ID NO: 106)
MAPGTLTELAGESKLNSKFVRDEDERPKVAYNVFSDEIPVISLAGIDDVDG KRGEICRQIVEACENWGIFQVVDHGVDTNLVADMTRLARDFFALPPEDKLRFDM SGGKKGGFIVSSHLQGEAVQDWREIVTYFSYPVRNRDYSRWPDKPEGWVKVTE EYSERLMSLACKLLEVLSEAMGLEKESLTNACVDMDQKIVVNYYPKCPQPDLTLG LKRHTDPGTITLLLQDQVGGLQATRDNGKTWITVQPVEGAFVVNLGDHGHFLSN GRFKNADHQAVVNSNSSRLSIATFQNPAPDATVYPLKVREGEKAILEEPITFAEM
YKRKMGRDLELARLKKLAKEERDHKEVDKPVDQIFA Chrysosplenium americanum (CaF6H) (SEQ ID NO: 107)
QEKTLNSRFVARDEDSLERPKVSAIYNGSFDEIPVLISLAGIDMTGAGTDAA ARRSEICRKIVEACEDWGIFGEIDDDHGKRAEICDKIVKACEDWGVFQPDEKLES VMSAAKKGDFVVDHGVDAEVISQWTTFAKPTSHTQFETETTRDFPNKPEGWKA TTEQYSRTLMGLACKLLGVISEAMGLEKEALTKACVDMDQKVVVNYYPKCPQPD LTLGLKRHTDPGTITLLLQDQVGGLQATRDGGKTWITVQPVKDNGWILLHIGDSN GHRHGHFLSNGRFKSHQAYRYRRPTRGSPTFGTKVSNYPPCPEQSLVRPPAGR PYGRALNALDAKKLASAKQQLESAAILLISELAVAYIILAILPSSEIIAEEGYL
Datura stramonium (DsH6H) (SEQ ID NO: 108)
MATFVSNWSTNNVSESFIAPLEKRAEKDVALGNDVPIIDLQQDHLLIVQQIT KACQDFGLFQVINHGVPEKLMVEAMEVYKEFFALPAEEKEKFQPKGEPAKFELPL EQKAKLYVEGERRCNEEFLYWKDTLAHGCYPLHEELLNSWPEKPPTYRDVIAKY SVEVRKLTMRILDYICEGLGLKLGYFDNELTQIQMLLANYYPSCPDPSSTIGSGGH YDGNLITLLQQDLVGLQQLIVKDDKWIAVEPIPTAFVVNLGLTLKVMSNEKFEGSIH RVVTHPTRNRISIGTLIGPDYSCTIEPIKELLSQENPPLYKPYPYAKFAEIYLSDKSD
YDAGVKPYKINQFPN Arabidopsis thaliana (AtH6DH) (SEQ ID NO: 109)
MENHTTMKVSSLNCIDLANDDLNHSVVSLKQACLDCGFFYVINHGISEEFM DDVFEQSKKLFALPLEEKMKVLRNEKHRGYTPVLDELLDPKNQINGDHKEGYYIG IEVPKDDPHWDKPFYGPNPWPDADVLPGWRETMEKYHQEALRVSMAIARLLAL ALDLDVGYFDRTEMLGKPIATMRLLRYQGISDPSKGIYACGAHSDFGMMTLLATD GVMGLQICKDKNAMPQKWEYVPPIKGAFIVNLGDMLERWSNGFFKSTLHRVLGN GQERYSIPFFVEPNHDCLVECLPTCKSESELPKYPPIKCSTYLTQRYEETHANLSI
YHQQT Solanum lycopersicum (SlF35H) (SEQ ID NO: 110)
MALRINELFVAAIIYIIVHIIISKLITTVRERGRRLPLPPGPTGWPVIGALPLLG SMPHVALAKMAKKYGPIMYLKVGTCGMVVASTPNAAKAFLKTLDINFSNRPPNA GATHLAYNAQDMVFAPYGPRWKLLRKLSNLHMLGGKALENWANVRANELGHML KSMFDASQDGECVVIADVLTFAMANMIGQVMLSKRVFVEKGVEVNEFKNMVVEL MTVAGYFNIGDFIPKLAWMDIQGIEKGMKNLHKKFDDLLTKMFDEHEATSNERKE NPDFLDVVMANRDNSEGERLSTTNIKALLLNLFTAGTDTSSSVIEWALAEMMKNP KIFEKAQQEMDQVIGKNRRLIESDIPNLPYLRAICKETFRKHPSTPLNLPRVSSEPC TVDGYYIPKNTRLSVNIWAIGRDPDVWENPLEFTPERFLSGKNAKIEPRGNDFELI PFGAGRRICAGTRMGIVMVEYILGTLVHSFDWKLPNNVIDINMEESFGLALQKAV
PLEAMVTPRLSLDVYRC D4H (SEQ ID NO: 111)
MPKSWPIVISSHSFCFLPNSEQERKMKDLNFHAATLSEEESLRELKAFDET KAGVKGIVDTGITKIPRIFIDQPKNLDRISVCRGKSDIKIPVINLNGLSSNSEIRREIV EKIGEASEKYGFFQIVNHGIPQDVMDKMVDGVRKFHEQDDQIKRQYYSRDRFNK NFLYSSNYVLIPGIACNWRDTMECIMNSNQPDPQEFPDVCRDILMKYSNYVRNL GLILFELLSEALGLKPNHLEEMDCAEGLILLGHYYPACPQPELTFGTSKHSDSGFL TILMQDQIGGLQILLENQWIDVPFIPGALVINIADLLQLITNDKFKSVEHRVLANKVG PRISVAVAFGIKTQTQEGVSPRLYGPIKELISEENPPIYKEVTVKDFITIRFAKRFDD
SSSLSPFRLNN Catharanthus roseus (CrD4Hlike) (SEQ ID NO: 112)
MKELNNSEEELKAFDDTKAGVKALVDSGITEIPRIFLDHPTNLDQISSKDRE PKFKKNIPVIDLDGISTNSEIRREIVEKIREASEKWGFFQIVNHGIPQEVMDDMIVGI RRFHEQDNEIKKQFYTRDRTKSFRYTSNFVLNPKIACNWRDTFECTMAPHQPNP QDLPDICRDIMMKYISYTRNLGLTLFELLSEALGLKSNRLKDMHCDEGVELVGHY YPACPQPELTLGTSKHTDTGFLTMLQQDQIGGLQVLYENHQWVDVPFIPGALIINI GDFLQIISNDKFKSAPHRVLANKNGPRISTASVFMPNFLESAEVRLYGPIKELLSE
ENPPIYEQITAKDYVTVQFSRGLDGDSFLSPFMLNKDNMEK Zea mays (ZmBX6) (SEQ ID NO: 113)
MAPTTATKDDSGYGDERRRELQAFDDTKLGVKGLVDSGVKSIPSIFHHPP EALSDIISPAPLPSSPPSGAAIPVVDLSVTRREDLVEQVRHAAGTVGFFWLVNHG VAEELMGGMLRGVRQFNEGPVEAKQALYSRDLARNLRFASNFDLFKAAAADWR DTLFCEVAPNPPPREELPEPLRNVMLEYGAAVTKLARFVFELLSESLGMPSDHLY EMECMQNLNVVCQYYPPCPEPHRTVGVKRHTDPGFFTILLQDGMGGLQVRLGN NGQSGGCWVDIAPRPGALMVNIGDLLQLVTNDRFRSVEHRVPANKSSDTARVS
VASFFNTDVRRSERMYGPIPDPSKPPLYRSVRARDFIAKFNTIGLDGRALDHFRL Hordeum vulgare subsp. vulgare (HvIDS2) (SEQ ID NO: 114)
MAKVMNLTPVHASSIPDSFLLPADRLHPATTDVSLPIIDMSRGRDEVRQAIL DSGKEYGFIQVVNHGISEPMLHEMYAVCHEFFDMPAEDKAEFFSEDRSERNKLF CGSAFETLGEKYWIDVLELLYPLPSGDTKDWPHKPQMLREVVGNYTSLARGVAM EILRLLCEGLGLRPDFFVGDISGGRVVVDINYYPPSPNPSRTLGLPPHCDRDLMT VLLPGAVPGLEIAYKGGWIKVQPVPNSLVINFGLQLEVVTNGYLKAVEHRAATNF AEPRLSVASFIVPADDCVVGPAEEFVSEDNPPRYRTLTVGEFKRKHNVVNLDSSI
NQIININNNQKGI Hordeum vulgare subsp. vulgare (HvIDS3) (SEQ ID NO: 115)
MENILHATPAPVSLPESFVFASDKVPPATKAVVSLPIIDLSCGRDEVRRSIL EAGKELGFFQVVNHGVSKQVMRDMEGMCEQFFHLPAADKASLYSEERHKPNRL FSGATYDTGGEKYWRDCLRLACPFPVDDSINEWPDTPKGLRDVIEKFTSQTRDV GKELLRLLCEGMGIRADYFEGDLSGGNVILNINHYPSCPNPDKALGQPPHCDRNL ITLLLPGAVNGLEVSYKGDWIKVDPAPNAFVVNFGQQLEVVTNGLLKSIEHRAMT NSALARTSVATFIMPTQECLIGPAKEFLSKENPPCYRTTMFRDFMRIYNVVKLGSS
LNLTTNLKNVQKEI Glicosiltransferase dependente de difosfato de uridina (UGT) UGT720-269-1 de Siraitia grosvenorii (SEQ ID NO: 116)
MEDRNAMDMSRIKYRPQPLRPASMVQPRVLLFPFPALGHVKPFLSLAELL SDAGIDVVFLSTEYNHRRISNTEALASRFPTLHFETIPDGLPPNESRALADGPLYF SMREGTKPRFRQLIQSLNDGRWPITCIITDIMLSSPIEVAEEFGIPVIAFCPCSARYL SIHFFIPKLVEEGQIPYADDDPIGEIQGVPLFEGLLRRNHLPGSWSDKSADISFSH GLINQTLAAGRASALILNTFDELEAPFLTHLSSIFNKIYTIGPLHALSKSRLGDSSSS ASALSGFWKEDRACMSWLDCQPPRSVVFVSFGSTMKMKADELREFWYGLVSS GKPFLCVLRSDVVSGGEAAELIEQMAEEEGAGGKLGMVVEWAAQEKVLSHPAV GGFLTHCGWNSTVESIAAGVPMMCWPILGDQPSNATWIDRVWKIGVERNNREW DRLTVEKMVRALMEGQKRVEIQRSMEKLSKLANEKVVRGINLHPTISLKKDTPTT
SEHPRHEFENMRGMNYEMLVGNAIKSPTLTKK UGT94-289-3 de Siraitia grosvenorii (SEQ ID NO: 117)
MTIFFSVEILVLGIAEFAAIAMDAAQQGDTTTILMLPWLGYGHLSAFLELAKS LSRRNFHIYFCSTSVNLDAIKPKLPSSFSDSIQFVELHLPSSPEFPPHLHTTNGLPP TLMPALHQAFSMAAQHFESILQTLAPHLLIYDSLQPWAPRVASSLKIPAINFNTTG VFVISQGLHPIHYPHSKFPFSEFVLHNHWKAMYSTADGASTERTRKRGEAFLYCL HASCSVILINSFRELEGKYMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKN WLDKKEPSSTVFVSFGSEYFPSKEEMEEIAHGLEASEVNFIWVVRFPQGDNTSGI EDALPKGFLERAGERGMVVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMF GVPIIGVPMHVDQPFNAGLVEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTR
EDVRKKAREMSEILRSKGEEKFDEMVAEISLLLKI UGT74-345-2 de Siraitia grosvenorii (SEQ ID NO: 118)
MDETTVNGGRRASDVVVFAFPRHGHMSPMLQFSKRLVSKGLRVTFLITTS ATESLRLNLPPSSSLDLQVISDVPESNDIATLEGYLRSFKATVSKTLADFIDGIGNP PKFIVYDSVMPWVQEVARGRGLDAAPFFTQSSAVNHILNHVYGGSLSIPAPENTA VSLPSMPVLQAEDLPAFPDDPEVVMNFMTSQFSNFQDAKWIFFNTFDQLECKKQ SQVVNWMADRWPIKTVGPTIPSAYLDDGRLEDDRAFGLNLLKPEDGKNTRQWQ WLDSKDTASVLYISFGSLAILQEEQVKELAYFLKDTNLSFLWVLRDSELQKLPHNF VQETSHRGLVVNWCSQLQVLSHRAVSCFVTHCGWNSTLEALSLGVPMVAIPQW VDQTTNAKFVADVWRVGVRVKKKDERIVTKEELEASIRQVVQGEGRNEFKHNAI
KWKKLAKEAVDEGGSSDKNIEEFVKTIA UGT75-281-2 de Siraitia grosvenorii (SEQ ID NO: 119)
MGDNGDGGEKKELKENVKKGKELGRQAIGEGYINPSLQLARRLISLGVNV TFATTVLAGRRMKNKTHQTATTPGLSFATFSDGFDDETLKPNGDLTHYFSELRR CGSESLTHLITSAANEGRPITFVIYSLLLSWAADIASTYDIPSALFFAQPATVLALYF YYFHGYGDTICSKLQDPSSYIELPGLPLLTSQDMPSFFSPSGPHAFILPPMREQA EFLGRQSQPKVLVNTFDALEADALRAIDKLKMLAIGPLIPSALLGGNDSSDASFCG DLFQVSSEDYIEWLNSKPDSSVVYISVGSICVLSDEQEDELVHALLNSGHTFLWV KRSKENNEGVKQETDEEKLKKLEEQGKMVSWCRQVEVLKHPALGCFLTHCGW NSTIESLVSGLPVVAFPQQIDQATNAKLIEDVWKTGVRVKANTEGIVEREEIRRCL
DLVMGSRDGQKEEIERNAKKWKELARQAIGEGGSSDSNLKTFLWEIDLEI UGT720-269-4 de Siraitia grosvenorii (SEQ ID NO: 120)
MAEQAHDLLHVLLFPFPAEGHIKPFLCLAELLCNAGFHVTFLNTDYNHRRL HNLHLLAARFPSLHFESISDGLPPDQPRDILDPKFFISICQVTKPLFRELLLSYKRIS SVQTGRPPITCVITDVIFRFPIDVAEELDIPVFSFCTFSARFMFLYFWIPKLIEDGQL PYPNGNINQKLYGVAPEAEGLLRCKDLPGHWAFADELKDDQLNFVDQTTASSRS SGLILNTFDDLEAPFLGRLSTIFKKIYAVGPIHSLLNSHHCGLWKEDHSCLAWLDS RAAKSVVFVSFGSLVKITSRQLMEFWHGLLNSGKSFLFVLRSDVVEGDDEKQVV KEIYETKAEGKWLVVGWAPQEKVLAHEAVGGFLTHSGWNSILESIAAGVPMISCP KIGDQSSNCTWISKVWKIGLEMEDRYDRVSVETMVRSIMEQEGEKMQKTIAELA
KQAKYKVSKDGTSYQNLECLIQDIKKLNQIEGFINNPNFSDLLRV UGT94-289-2 de Siraitia grosvenorii (SEQ ID NO: 121)
MDAQQGHTTTILMLPWVGYGHLLPFLELAKSLSRRKLFHIYFCSTSVSLDA IKPKLPPSISSDDSIQLVELRLPSSPELPPHLHTTNGLPSHLMPALHQAFVMAAQH FQVILQTLAPHLLIYDILQPWAPQVASSLNIPAINFSTTGASMLSRTLHPTHYPSSK FPISEFVLHNHWRAMYTTADGALTEEGHKIEETLANCLHTSCGVVLVNSFRELET KYIDYLSVLLNKKVVPVGPLVYEPNQEGEDEGYSSIKNWLDKKEPSSTVFVSFGT EYFPSKEEMEEIAYGLELSEVNFIWVLRFPQGDSTSTIEDALPKGFLERAGERAM VVKGWAPQAKILKHWSTGGLVSHCGWNSMMEGMMFGVPIIAVPMHLDQPFNA GLVEEAGVGVEAKRDSDGKIQREEVAKSIKEVVIEKTREDVRKKAREMDTKHGPT
YFSRSKVSSFGRLYKINRPTTLTVGRFWSKQIKMKRE UGT94-289-1 de Siraitia grosvenorii (SEQ ID NO: 122)
MDAQRGHTTTILMFPWLGYGHLSAFLELAKSLSRRNFHIYFCSTSVNLDAI KPKLPSSSSSDSIQLVELCLPSSPDQLPPHLHTTNALPPHLMPTLHQAFSMAAQH FAAILHTLAPHLLIYDSFQPWAPQLASSLNIPAINFNTTGASVLTRMLHATHYPSSK FPISEFVLHDYWKAMYSAAGGAVTKKDHKIGETLANCLHASCSVILINSFRELEEK YMDYLSVLLNKKVVPVGPLVYEPNQDGEDEGYSSIKNWLDKKEPSSTVFVSFGS EYFPSKEEMEEIAHGLEASEVHFIWVVRFPQGDNTSAIEDALPKGFLERVGERGM VVKGWAPQAKILKHWSTGGFVSHCGWNSVMESMMFGVPIIGVPMHLDQPFNAG LAEEAGVGVEAKRDPDGKIQRDEVAKLIKEVVVEKTREDVRKKAREMSEILRSKG
EEKMDEMVAAISLFLKI Momordica charantia 1 (McUGT1) (SEQ ID NO: 123)
MAQPQTQARVLVFPYPTVGHIKPFLSLAELLADGGLDVVFLSTEYNHRRIP NLEALASRFPTLHFDTIPDGLPIDKPRVIIGGELYTSMRDGVKQRLRQVLQSYNDG SSPITCVICDVMLSGPIEAAEELGIPVVTFCPYSARYLCAHFVMPKLIEEGQIPFTD GNLAGEIQGVPLFGGLLRRDHLPGFWFVKSLSDEVWSHAFLNQTLAVGRTSALII NTLDELEAPFLAHLSSTFDKIYPIGPLDALSKSRLGDSSSSSTVLTAFWKEDQACM SWLDSQPPKSVIFVSFGSTMRMTADKLVEFWHGLVNSGTRFLCVLRSDIVEGGG AADLIKQVGETGNGIVVEWAAQEKVLAHRAVGGFLTHCGWNSTMESIAAGVPM MCWQIYGDQMINATWIGKVWKIGIERDDKWDRSTVEKMIKELMEGEKGAEIQRS
MEKFSKLANDKVVKGGTSFENLELIVEYLKKLKPSN Momordica charantia 2 (McUGT2) (SEQ ID NO: 124)
MAQPRVLLFPFPAMGHVKPFLSLAELLSDAGVEVVFLSTEYNHRRIPDIGA LAARFPTLHFETIPDGLPPDQPRVLADGHLYFSMLDGTKPRFRQLIQSLNGNPRPI TCIINDVMLSSPIEVAEEFGIPVIAFCPCSARFLSVHFFMPNFIEEAQIPYTDENPM GKIEEATVFEGLLRRKDLPGLWCAKSSNISFSHRFINQTIAAGRASALILNTFDELE SPFLNHLSSIFPKIYCIGPLNALSRSRLGKSSSSSSALAGFWKEDQAYMSWLESQ PPRSVIFVSFGSTMKMEAWKLAEFWYGLVNSGSPFLFVFRPDCVINSGDAAEVM EGRGRGMVVEWASQEKVLAHPAVGGFLTHCGWNSTVESIVAGVPMMCCPIVAD QLSNATWIHKVWKIGIEGDEKWDRSTVEMMIKELMESQKGTEIRTSIEMLSKLAN EKVVKGGTSLNNFELLVEDIKTLRRPYT
Momordica charantia 3 (McUGT3) (SEQ ID NO: 125)
MEQSDSNSDDHQHHVLLFPFPAKGHIKPFLCLAQLLCGAGLQVTFLNTDH NHRRIDDRHRRLLATQFPMLHFKSISDGLPPDHPRDLLDGKLIASMRRVTESLFR QLLLSYNGYGNGTNNVSNSGRRPPISCVITDVIFSFPVEVAEELGIPVFSFATFSA RFLFLYFWIPKLIQEGQLPFPDGKTNQELYGVPGAEGIIRCKDLPGSWSVEAVAK NDPMNFVKQTLASSRSSGLILNTFEDLEAPFVTHLSNTFDKIYTIGPIHSLLGTSHC GLWKEDYACLAWLDARPRKSVVFVSFGSLVKTTSRELMELWHGLVSSGKSFLLV LRSDVVEGEDEEQVVKEILESNGEGKWLVVGWAPQEEVLAHEAIGGFLTHSGW NSTMESIAAGVPMVCWPKIGDQPSNCTWVSRVWKVGLEMEERYDRSTVARMA
RSMMEQEGKEMERRIAELAKRVKYRVGKDGESYRNLESLIRDIKITKSSN Momordica charantia 4 (McUGT4) (SEQ ID NO: 126)
MDAHQQAEHTTTILMLPWVGYGHLTAYLELAKALSRRNFHIYYCSTPVNIE SIKPKLTIPCSSIQFVELHLPSSDDLPPNLHTTNGLPSHLMPTLHQAFSAAAPLFEE ILQTLCPHLLIYDSLQPWAPKIASSLKIPALNFNTSGVSVIAQALHAIHHPDSKFPLS DFILHNYWKSTYTTADGGASEKTRRAREAFLYCLNSSGNAILINTFRELEGEYIDY LSLLLNKKVIPIGPLVYEPNQDEDQDEEYRSIKNWLDKKEPCSTVFVSFGSEYFPS NEEMEEIAPGLEESGANFIWVVRFPKLENRNGIIEEGLLERAGERGMVIKEWAPQ ARILRHGSIGGFVSHCGWNSVMESIICGVPVIGVPMRVDQPYNAGLVEEAGVGV EAKRDPDGKIQRHEVSKLIKQVVVEKTRDDVRKKVAQMSEILRRKGDEKIDEMVA
LISLLPKG Momordica charantia 5 (McUGT5) (SEQ ID NO: 127)
MDARQQAEHTTTILMLPWVGYGHLSAYLELAKALSRRNFHIYYCSTPVNIE SIKPKLTIPCSSIQFVELHLPFSDDLPPNLHTTNGLPSHLMPALHQAFSAAAPLFEA ILQTLCPHLLIYDSLQPWAPQIASSLKIPALNFNTTGVSVIARALHTIHHPDSKFPLS EIVLHNYWKATHATADGANPEKFRRDLEALLCCLHSSCNAILINTFRELEGEYIDY LSLLLNKKVTPIGPLVYEPNQDEEQDEEYRSIKNWLDKKEPYSTIFVSFGSEYFPS NEEMEEIARGLEESGANFIWVVRFHKLENGNGITEEGLLERAGERGMVIQGWAP QARILRHGSIGGFVSHCGWNSVMESIICGVPVIGVPMGLDQPYNAGLVEEAGVG VEAKRDPDGKIQRHEVSKLIKQVVVEKTRDDVRKKVAQMSEILRRKGDEKIDEMV
ALISLLLKG Cucumis sativus (SEQ ID NO: 128)
MGLSPTDHVLLFPFPAKGHIKPFFCLAHLLCNAGLRVTFLSTEHHHQKLHN LTHLAAQIPSLHFQSISDGLSLDHPRNLLDGQLFKSMPQVTKPLFRQLLLSYKDGT SPITCVITDLILRFPMDVAQELDIPVFCFSTFSARFLFLYFSIPKLLEDGQIPYPEGN SNQVLHGIPGAEGLLRCKDLPGYWSVEAVANYNPMNFVNQTIATSKSHGLILNTF DELEVPFITNLSKIYKKVYTIGPIHSLLKKSVQTQYEFWKEDHSCLAWLDSQPPRS VMFVSFGSIVKLKSSQLKEFWNGLVDSGKAFLLVLRSDALVEETGEEDEKQKELV IKEIMETKEEGRWVIVNWAPQEKVLEHKAIGGFLTHSGWNSTLESVAVGVPMVS WPQIGDQPSNATWLSKVWKIGVEMEDSYDRSTVESKVRSIMEHEDKKMENAIVE
LAKRVDDRVSKEGTSYQNLQRLIEDIEGFKLN Cucurbita maxima 1 (CmaUGT1) (SEQ ID NO: 129)
MELSHTHHVLLFPFPAKGHIKPFFSLAQLLCNAGLRVTFLNTDHHHRRIHD LNRLAAQLPTLHFDSVSDGLPPDEPRNVFDGKLYESIRQVTSSLFRELLVSYNNG TSSGRPPITCVITDVMFRFPIDIAEELGIPVFTFSTFSARFLFLIFWIPKLLEDGQLRY PEQELHGVPGAEGLIRWKDLPGFWSVEDVADWDPMNFVNQTLATSRSSGLILNT FDELEAPFLTSLSKIYKKIYSLGPINSLLKNFQSQPQYNLWKEDHSCMAWLDSQP RKSVVFVSFGSVVKLTSRQLMEFWNGLVNSGMPFLLVLRSDVIEAGEEVVREIM ERKAEGRWVIVSWAPQEEVLAHDAVGGFLTHSGWNSTLESLAAGVPMISWPQI GDQTSNSTWISKVWRIGLQLEDGFDSSTIETMVRSIMDQTMEKTVAELAERAKN
RASKNGTSYRNFQTLIQDITNIIETHI Cucurbita maxima 2 (CmaUGT2) (SEQ ID NO: 130)
MDAQKAVDTPPTTVLMLPWIGYGHLSAYLELAKALSRRNFHVYFCSTPVN LDSIKPNLIPPPSSIQFVDLHLPSSPELPPHLHTTNGLPSHLKPTLHQAFSAAAQHF EAILQTLSPHLLIYDSLQPWAPRIASSLNIPAINFNTTAVSIIAHALHSVHYPDSKFPF SDFVLHDYWKAKYTTADGATSEKIRRGAEAFLYCLNASCDVVLVNSFRELEGEY MDYLSVLLKKKVVSVGPLVYEPSEGEEDEEYWRIKKWLDEKEALSTVLVSFGSE YFPSKEEMEEIAHGLEESEANFIWVVRFPKGEESCRGIEEALPKGFVERAGERAM VVKKWAPQGKILKHGSIGGFVSHCGWNSVLESIRFGVPVIGVPMHLDQPYNAGL LEEAGIGVEAKRDADGKIQRDQVASLIKRVVVEKTREDIWKTVREMREVLRRRDD
DMIDEMVAEISVVLKI Cucurbita maxima 3 (CmaUGT3) (SEQ ID NO: 131)
MSSNLFLKISIPFGRLRDSALNCSVFHCKLHLAIAIAMDAQQAANKSPTATTI FMLPWAGYGHLSAYLELAKALSTRNFHIYFCSTPVSLASIKPRLIPSCSSIQFVELH LPSSDEFPPHLHTTNGLPSRLVPTFHQAFSEAAQTFEAFLQTLRPHLLIYDSLQP WAPRIASSLNIPAINFFTAGAFAVSHVLRAFHYPDSQFPSSDFVLHSRWKIKNTTA ESPTQAKLPKIGEAIGYCLNASRGVILTNSFRELEGKYIDYLSVILKKRVFPIGPLVY QPNQDEEDEDYSRIKNWLDRKEASSTVLVSFGSEFFLSKEETEAIAHGLEQSEAN FIWGIRFPKGAKKNAIEEALPEGFLERAGGRAMVVEEWVPQGKILKHGSIGGFVS HCGWNSAMESIVCGVPIIGIPMQVDQPFNAGILEEAGVGVEAKRDSDGKIQRDEV
AKLIKEVVVERTREDIRNKLEKINEILRSRREEKLDELATEISLLSRN Cucurbita moschata 1 (CmoUGT1) (SEQ ID NO: 132)
MELSPTHHLLLFPFPAKGHIKPFFSLAQLLCNAGARVTFLNTDHHHRRIHD LDRLAAQLPTLHFDSVSDGLPPDESRNVFDGKLYESIRQVTSSLFRELLVSYNNG TSSGRPPITCVITDCMFRFPIDIAEELGIPVFTFSTFSARFLFLFFWIPKLLEDGQLR YPEQELHGVPGAEGLIRCKDLPGFLSDEDVAHWKPINFVNQILATSRSSGLILNTF DELEAPFLTSLSKIYKKIYSLGPINSLLKNFQSQPQYNLWKEDHSCMAWLDSQPP KSVVFVSFGSVVKLTNRQLVEFWNGLVNSGKPFLLVLRSDVIEAGEEVVRENME RKAEGRWMIVSWAPQEEVLAHDAVGGFLTHSGWNSTLESLAAGVPMISWTQIG DQTSNSTWVSKVWRIGLQLEDGFDSFTIETMVRSVMDQTMEKTVAELAERAKNR
ASKNGTSYRNFQTLIQDITNIIETHI Cucurbita moschata 2 (CmoUGT2) (SEQ ID NO: 133)
MDAQKAVDTPPTTVLMLPWIGYGHLSAYLELAKALSRRNFHVYFCSTPVN LDSIKPNLIPPPPSIQFVDLHLPSSPELPPHLHTTNGLPSHLKPTLHQAFSAAAQHF EAILQTLSPHLLIYDSLQPWAPRIASSLNIPAINFNTTAVSIIAHALHSVHYPDSKFPF SDFVLHDYWKAKYTTADGATSEKTRRGVEAFLYCLNASCDVVLVNSFRELEGEY MDYLSVLLKKKVVSVGPLVYEPSEGEEDEEYWRIKKWLDEKEALSTVLVSFGSE YFPPKEEMEEIAHGLEESEANFIWVVRFPKGEESSSRGIEEALPKGFVERAGERA MVVKKWAPQGKILKHGSIGGFVSHCGWNSVLESIRFGVPVIGAPMHLDQPYNAG LLEEAGIGVEAKRDADGKIQRDQVASLIKQVVVEKTREDIWKKVREMREVLRRRD
DDDMMIDEMVAVISVVLKI Cucurbita moschata 3 (CmoUGT3) (SEQ ID NO: 134)
MDAQQAANKSPTASTIFMLPWVGYGHLSAYLELAKALSTRNFHVYFCSTP VSLASIKPRLIPSCSSIQFVELHLPSSDEFPPHLHTTNGLPAHLVPTIHQAFAAAAQ TFEAFLQTLRPHLLIYDSLQPWAPRIASSLNIPAINFFTAGAFAVSHVLRAFHYPDS QFPSSDFVLHSRWKIKNTTAESPTQVKIPKIGEAIGYCLNASRGVILTNSFRELEG KYIDYLSVILKKRVLPIGPLVYQPNQDEEDEDYSRIKNWLDRKEASSTVLVSFGSE FFLSKEETEAIAHGLEQSEANFIWGIRFPKGAKKNAIEEALPEGFLERVGGRAMVV EEWVPQGKILKHGNIGGFVSHCGWNSAMESIMCGVPVIGIPMQVDQPFNAGILE EAGVGVEAKRDSDGKIQRDEVAKLIKEVVVERTREDIRNKLEEINEILRTRREEKL
DELATEISLLCKN Prunus persica (SEQ ID NO: 135)
MAMKQPHVIIFPFPLQGHMKPLLCLAELLCHAGLHVTYVNTHHNHQRLAN RQALSTHFPTLHFESISDGLPEDDPRTLNSQLLIALKTSIRPHFRELLKTISLKAESN DTLVPPPSCIMTDGLVTFAFDVAEELGLPILSFNVPCPRYLWTCLCLPKLIENGQL PFQDDDMNVEITGVPGMEGLLHRQDLPGFCRVKQADHPSLQFAINETQTLKRAS ALILDTVYELDAPCISHMALMFPKIYTLGPLHALLNSQIGDMSRGLASHGSLWKSD LNCMTWLDSQPSKSIIYVSFGTLVHLTRAQVIEFWYGLVNSGHPFLWVMRSDITS GDHQIPAELENGTKERGCIVDWVSQEEVLAHKSVGGFLTHSGWNSTLESIVAGL PMICWPKLGDHYIISSTVCRQWKIGLQLNENCDRSNIESMVQTLMGSKREEIQSS
MDAISKLSRDSVAEGGSSHNNLEQLIEYIRNLQHQN Theobroma cacao (SEQ ID NO: 136)
MRQPHVLVLPFPAQGHIKPMLCLAELLCQAGLRVTFLNTHHSHRRLNNLQ DLSTRFPTLHFESVSDGLPEDHPRNLVHFMHLVHSIKNVTKPLLRDLLTSLSLKTD IPPVSCIIADGILSFAIDVAEELQIKVIIFRTISSCCLWSYLCVPKLIQQGELQFSDSD MGQKVSSVPEMKGSLRLHDRPYSFGLKQLEDPNFQFFVSETQAMTRASAVIFNT FDSLEAPVLSQMIPLLPKVYTIGPLHALRKARLGDLSQHSSFNGNLREADHNCIT WLDSQPLRSVVYVSFGSHVVLTSEELLEFWHGLVNSGKRFLWVLRPDIIAGEKD HNQIIAREPDLGTKEKGLLVDWAPQEEVLAHPSVGGFLTHCGWNSTLESMVAGV PMLCWPKLPDQLVNSSCVSEVWKIGLDLKDMCDRSTVEKMVRALMEDRREEVM
RSVDGISKLARESVSHGGSSSSNLEMLIQELET Corchorus capsularis (SEQ ID NO: 137)
MDSKQKKMSVLMFPWLAYGHISPFLELAKKLSKRNFHTFFFSTPINLNSIK SKLSPKYAQSIQFVELHLPSLPDLPPHYHTTNGLPPHLMNTLKKAFDMSSLQFSKI LKTLNPDLLVYDFIQPWAPLLALSNKIPAVHFLCTSAAMSSFSVHAFKKPCEDFPF PNIYVHGNFMNAKFNNMENCSSDDSISDQDRVLQCFERSTKIILVKTFEELEGKF MDYLSVLLNKKIVPTGPLTQDPNEDEGDDDERTKLLLEWLNKKSKSSTVFVSFGS EYFLSKEEREEIAYGLELSKVNFIWVIRFPLGENKTNLEEALPQGFLQRVSERGLV VENWAPQAKILQHSSIGGFVSHCGWSSVMESLKFGVPIIAIPMHLDQPLNARLVV DVGVGLEVIRNHGSLEREEIAKLIKEVVLGNGNDGEIVRRKAREMSNHIKKKGEK
DMDELVEELMLICKMKPNSCHLS Ziziphus jujube (SEQ ID NO: 138)
MMERQRSIKVLMFPWLAHGHISPFLELAKRLTDRNFQIYFCSTPVNLTSVK PKLSQKYSSSIKLVELHLPSLPDLPPHYHTTNGLALNLIPTLKKAFDMSSSSFSTIL STIKPDLLIYDFLQPWAPQLASCMNIPAVNFLSAGASMVSFVLHSIKYNGDDHDDE FLTTELHLSDSMEAKFAEMTESSPDEHIDRAVTCLERSNSLILIKSFRELEGKYLDY LSLSFAKKVVPIGPLVAQDTNPEDDSMDIINWLDKKEKSSTVFVSFGSEYYLTNEE MEEIAYGLELSKVNFIWVVRFPLGQKMAVEEALPKGFLERVGEKGMVVEDWAPQ MKILGHSSIGGFVSHCGWSSLMESLKLGVPIIAMPMQLDQPINAKLVERSGVGLE VKRDKNGRIEREYLAKVIREIVVEKARQDIEKKAREMSNIITEKGEEEIDNVVEELA
KLCGM Vitis vinifera (SEQ ID NO: 139)
MDARQSDGISVLMFPWLAHGHISPFLQLAKKLSKRNFSIYFCSTPVNLDPI KGKLSESYSLSIQLVKLHLPSLPELPPQYHTTNGLPPHLMPTLKMAFDMASPNFS NILKTLHPDLLIYDFLQPWAPAAASSLNIPAVQFLSTGATLQSFLAHRHRKPGIEFP FQEIHLPDYEIGRLNRFLEPSAGRISDRDRANQCLERSSRFSLIKTFREIEAKYLDY VSDLTKKKMVTVGPLLQDPEDEDEATDIVEWLNKKCEASAVFVSFGSEYFVSKE EMEEIAHGLELSNVDFIWVVRFPMGEKIRLEDALPPGFLHRLGDRGMVVEGWAP QRKILGHSSIGGFVSHCGWSSVMEGMKFGVPIIAMPMHLDQPINAKLVEAVGVG REVKRDENRKLEREEIAKVIKEVVGEKNGENVRRKARELSETLRKKGDEEIDVVV
EELKQLCSY Juglans regia (SEQ ID NO: 140)
MDTARKRIRVVMLPWLAHGHISPFLELSKKLAKRNFHIYFCSTPVNLSSIKP KLSGKYSRSIQLVELHLPSLPELPPQYHTTKGLPPHLNATLKRAFDMAGPHFSNIL KTLSPDLLIYDFLQPWAPAIAASQNIPAINFLSTGAAMTSFVLHAMKKPGDEFPFP EIHLDECMKTRFVDLPEDHSPSDDHNHISDKDRALKCFERSSGFVMMKTFEELE GKYINFLSHLMQKKIVPVGPLVQNPVRGDHEKAKTLEWLDKRKQSSAVFVSFGT EYFLSKEEMEEIAYGLELSNVNFIWVVRFPEGEKVKLEEALPEGFLQRVGEKGMV VEGWAPQAKILMHPSIGGFVSHCGWSSVMESIDFGVPIVAIPMQLDQPVNAKVV EQAGVGVEVKRDRDGKLEREEVATVIREVVMGNIGESVRKKEREMRDNIRKKGE EKMDGVAQELVQLYGNGIKNV
Hevea brasiliensis (SEQ ID NO: 141)
METLQRRKISVLMFPWLAHGHLSPFLELSKKLNKRNFHVYFCSTPVNLDSI KPKLSAEYSFSIQLVELHLPSSPELPLHYHTTNGLPPHLMKNLKNAFDMASSSFF NILKTLKPDLLIYDFIQPWAPALASSLNIPAVNFLCTSMAMSCFGLHLNNQEAKFPF PGIYPRDYMRMKVFGALESSSNDIKDGERAGRCMDQSFHLILAKTFRELEGKYID YLSVKLMKKIVPVGPLVQDPIFEDDEKIMDHHQVIKWLEKKERLSTVFVSFGTEYF LSTEEMEEIAYGLELSKAHFIWVVRFPTGEKINLEESLPKRYLERVQERGKIVEGW APQQKILRHSSIGGFVSHCGWSSIMESMKFGVPIIAMPMNLDQPVNSRIVEDAGV GIEVRRNKSGELEREEIAKTIRKVVVEKDGKNVSRKAREMSDTIRKKGEEEIDGVV
DELLQLCDVKTNYLQ Manihot esculenta (SEQ ID NO: 142)
MATAQTRKISVLMFPWLAHGHLSPFLELSKKLANRNFHVYFCSTPVNLDSI KPKLSPEYHFSIQFVELHLPSSPELPSHYHTTNGLPPHLMKTLKKAFDMASSSFF NILKTLNPDLLIYDFLQPWAPALASSLNIPAVNFLCSSMAMSCFGLNLNKNKEIKFL FPEIYPRDYMEMKLFRVFESSSNQIKDGERAGRCIDQSFHVILAKTFRELEGKYID YVSVKCNKKIVPVGPLVEDTIHEDDEKTMDHHHHHHDEVIKWLEKKERSTTVFVS FGSEYFLSKEEMEEIAHGLELSKVNFIWVVRFPKGEKINLEESLPEGYLERIQERG KIVEGWAPQRKILGHSSIGGFVSHCGWSSIMESMKLGVPIIAMPMNLDQPINSRIV EAAGVGIEVSRNQSGELEREEMAKTIRKVVVEREGVYVRRKAREMSDVLRKKGE
EEIDGVVDELVQLCDMKTNYL Cephalotus follicularis (SEQ ID NO: 143)
MDLKRRSIRVLMLPWLAHGHISPFLELAKKLTNRNFLIYFCSTPINLNSIKPK LSSKYSFSIQLVELHLPSLPELPPHYHTTNGLPLHLMNTLKTAFDMASPSFLNILKT LKPDLLICDHLQPWAPSLASSLNIPAIIFPTNSAIMMAFSLHHAKNPGEEFPFPSINI NDDMVKSINFLHSASNGLTDMDRVLQCLERSSNTMLLKTFRQLEAKYVDYSSALL KKKIVLAGPLVQVPDNEDEKIEIIKWLDSRGQSSTVFVSFGSEYFLSKEEREDIAH GLELSKVNFIWVVRFPVGEKVKLEEALPNGFAERIGERGLVVEGWAPQAMILSHS SIGGFVSHCGWSSMMESMKFGVPIIAMPMHIDQPLNARLVEDVGVGLEIKRNKD GRFEREELARVIKEVLVYKNGDAVRSKAREMSEHIKKNGDQEIDGVADALVKLCE
MKTNSLNQD Stevia rebaudiana UGT74G1 (SEQ ID NO: 144)
MAEQQKIKKSPHVLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTL NHSNTTTTSIEIQAISDGCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTT IDAIIYDSMTEWVLDVAIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVP GFPVLQRWETPLILQNHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIE WTRKIWNLKVIGPTLPSMYLDKRLDDDKDNGFNLYKANHHECMNWLDDKPKES VVYVAFGSLVKHGPEQVEEITRALIDSDVNFLWVIKHKEEGKLPENLSEVIKTGKG LIVAWCKQLDVLAHESVGCFVTHCGFNSTLEAISLGVPVVAMPQFSDQTTNAKLL DEILGVGVRVKADENGIVRRGNLASCIKMIMEEERGVIIRKNAVKWKDLAKVAVHE
GGSSDNDIVEFVSELIKA UGT76G1 de Stevia rebaudiana (SEQ ID NO: 145)
MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKP KTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLML ASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELG YLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILGKMIKQTKASSGVIWNS FKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLY VSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGER GRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNAR YMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMK
GGSSYESLESLVSYISSL UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146)
MDAMATTEKKPHVIFIPFPAQSHIKAMLKLAQLLHHKGLQITFVNTDFIHNQ FLESSGPHCLDGAPGFRFETIPDGVSHSPEASIPIRESLLRSIETNFLDRFIDLVTKL PDPPTCIISDGFLSVFTIDAAKKLGIPVMMYWTLAACGFMGFYHIHSLIEKGFAPLK DASYLTNGYLDTVIDWVPGMEGIRLKDFPLDWSTDLNDKVLMFTTEAPQRSHKV SHHIFHTFDELEPSIIKTLSLRYNHIYTIGPLQLLLDQIPEEKKQTGITSLHGYSLVKE EPECFQWLQSKEPNSVVYVNFGSTTVMSLEDMTEFGWGLANSNHYFLWIIRSNL VIGENAVLPPELEEHIKKRGFIASWCSQEKVLKHPSVGGFLTHCGWGSTIESLSA GVPMICWPYSWDQLTNCRYICKEWEVGLEMGTKVKRDEVKRLVQELMGEGGH
KMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN UGT91D1 de Stevia rebaudiana (SEQ ID NO: 147)
MYNVTYHQNSKAMATSDSIVDDRKQLHVATFPWLAFGHILPFLQLSKLIAE KGHKVSFLSTTRNIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIQYLK KAVDGLQPEVTRFLEQHSPDWIIYDFTHYWLPSIAASLGISRAYFCVITPWTIAYLA PSSDAMINDSDGRTTVEDLTTPPKWFPFPTKVCWRKHDLARMEPYEAPGISDGY RMGMVFKGSDCLLFKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDET WVSIKKWLDGKQKGSVVYVALGSEALVSQTEVVELALGLELSGLPFVWAYRKPK GPAKSDSVELPDGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVE GLMFGHPLIMLPIFCDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVV
ENEGEIYKANARALSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES UGT91D2 de Stevia rebaudiana (SEQ ID NO: 148)
MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTR NIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTR FLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMINGSD GRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVLKGSDC LLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEVPGDEKDETWVSIKKWLDGK QKGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELP DGFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIML PIFGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVEKEGEIYKANA
RELSKIYNDTKVEKEYVSQFVDYLEKNTRAVAIDHES UGT91D2e de Stevia rebaudiana (SEQ ID NO: 149)
MATSDSIVDDRKQLHVATFPWLAFGHILPYLQLSKLIAEKGHKVSFLSTTR NIQRLSSHISPLINVVQLTLPRVQELPEDAEATTDVHPEDIPYLKKASDGLQPEVTR FLEQHSPDWIIYDYTHYWLPSIAASLGISRAHFSVTTPWAIAYMGPSADAMINGSD GRTTVEDLTTPPKWFPFPTKVCWRKHDLARLVPYKAPGISDGYRMGLVLKGSDC LLSKCYHEFGTQWLPLLETLHQVPVVPVGLLPPEIPGDEKDETWVSIKKWLDGKQ KGSVVYVALGSEVLVSQTEVVELALGLELSGLPFVWAYRKPKGPAKSDSVELPD GFVERTRDRGLVWTSWAPQLRILSHESVCGFLTHCGSGSIVEGLMFGHPLIMLPI FGDQPLNARLLEDKQVGIEIPRNEEDGCLTKESVARSLRSVVVEKEGEIYKANAR
ELSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES OsUGT1-2 (SEQ ID NO: 150)
MDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVS TPRNISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRR AFDGLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAHMIASI ADRRLERAETESPAAAGQGRPAAAPTFEVARMKLIRTKGSSGMSLAERFSLTLS RSSLVVGRSCVEFEPETVPLLSTLRGKPITFLGLMPPLHEGRREDGEDATVRWL DAQPAKSVVYVALGSEVPLGVEKVHELALGLELAGTRFLWALRKPTGVSDADLL PAGFEERTRGRGVVATRWVPQMSILAHAAVGAFLTHCGWNSTIEGLMFGHPLIM LPIFGDQGPNARLIEAKNAGLQVARNDGDGSFDREGVAAAIRAVAVEEESSKVFQ
AKAKKLQEIVADMACHERYIDGFIQQLRSYKD Arabidopsis thaliana AAN72025.1 (SEQ ID NO: 151)
MGSISEMVFETCPSPNPIHVMLVSFQGQGHVNPLLRLGKLIASKGLLVTFV TTELWGKKMRQANKIVDGELKPVGSGSIRFEFFDEEWAEDDDRRADFSLYIAHL ESVGIREVSKLVRRYEEANEPVSCLINNPFIPWVCHVAEEFNIPCAVLWVQSCAC FSAYYHYQDGSVSFPTETEPELDVKLPCVPVLKNDEIPSFLHPSSRFTGFRQAILG QFKNLSKSFCVLIDSFDSLEREVIDYMSSLCPVKTVGPLFKVARTVTSDVSGDICK STDKCLEWLDSRPKSSVVYISFGTVAYLKQEQIEEIAHGVLKSGLSFLWVIRPPPH DLKVETHVLPQELKESSAKGKGMIVDWCPQEQVLSHPSVACFVTHCGWNSTME SLSSGVPVVCCPQWGDQVTDAVYLIDVFKTGVRLGRGATEERVVPREEVAEKLL EATVGEKAEELRKNALKWKAEAEAAVAPGGSSDKNFREFVEKLGAGVTKTKDN
GY Arabidopsis thaliana AAF87256.1 (SEQ ID NO: 152)
MGSHVAQKQHVVCVPYPAQGHINPMMKVAKLLYAKGFHITFVNTVYNHN RLLRSRGPNAVDGLPSFRFESIPDGLPETDVDVTQDIPTLCESTMKHCLAPFKELL RQINARDDVPPVSCIVSDGCMSFTLDAAEELGVPEVLFWTTSACGFLAYLYYYRF IEKGLSPIKDESYLTKEHLDTKIDWIPSMKNLRLKDIPSFIRTTNPDDIMLNFIIREAD RAKRASAIILNTFDDLEHDVIQSMKSIVPPVYSIGPLHLLEKQESGEYSEIGRTGSN LWREETECLDWLNTKARNSVVYVNFGSITVLSAKQLVEFAWGLAATGKEFLWVI RPDLVAGDEAMVPPEFLTATADRRMLASWCPQEKVLSHPAIGGFLTHCGWNST LESLCGGVPMVCWPFFAEQQTNCKFSRDEWEVGIEIGGDVKREEVEAVVRELM
DEEKGKNMREKAEEWRRLANEATEHKHGSSKLNFEMLVNKVLLGE Columba livia ClUGT1 (SEQ ID NO: 153)
MIHCGKKHICAFVTCILISASILMYSWKDPQLQNNITRKIFQATSALPASQLC RGKPAQNVITALEDNRTFIISPYFDDRESKVTRVIGIVHHEDVKQLYCWFCCQPD GKIYVARAKIDVHSDRFGFPYGAADIVCLEPENCNPTHVSIHQSPHANIDQLPSFKI KNRKSETFSVDFTVCISAMFGNYNNVLQFIQSVEMYKILGVQKVVIYKNNCSQLM EKVLKFYMEEGTVEIIPWPINSHLKVSTKWHFSMDAKDIGYYGQITALNDCIYRNM QRSKFVVLNDADEIILPLKHLDWKAMMSSLQEQNPGAGIFLFENHIFPKTVSTPVF NISSWNRVPGVNILQHVHREPDRKEVFNPKKMIIDPRQVVQTSVHSVLRAYGNSV
NVPADVALVYHCRVPLQEELPRESLIRDTALWRYNSSLITNVNKVLHQTVL Haemophilus ducreyi LgtF Q9L875 (SEQ ID NO: 154)
MPTLTVAMIVKNEAQDLAECLKTVDGWVDEIVIVDSGSTDDTLKIATQFNA KVYVNSDWQGFGPQRQFAQQYVTSDYVLWLDADERVTPELKASILQAVQHNQK NTVYKVSRLSEIFGKEIRYSGWYPDYVVRLYPTYLAKYGDELVHEKVHYPADSRV EKLQGDLLHFTYKNIHHYLVKSASYAKAWAMQRAKAGKKASLLDGVTHAIACFLK
MYLFKAGFLDGKQGFLLAVLSAHSTFVKYADLWDRTRS Neisseria gonorrhoeae Q5F735 (SEQ ID NO: 155)
MKKVSVLIVAKNEANHIRECIESCRFDKEVIVIDDHSADNTAEIAEGLGAKV FRRHLNGDFGAQKTFAIEQAGGEWVFLIDADERCTPELSDEISKIVRTGDYAAYF VERRNLFPNHPATHGAMRPDSVCRLMPKKGGSVQGKVHETVQTPYPERRLKHF MYHYTYDNWEQYFNKFNKYTSISAEKYREQGKPVSFVRDIILRPIWGFFKIYILNK
GFLDGKMGWIMSVNHSYYTMIKYVKLYYLYKSGGKF Rhizobium meliloti (cepa 1021) ExoM P33695 (SEQ ID NO: 156)
MPNETLHIDIGVCTYRRPELAETLRSLAAMNVPERARLRVIVADNDAEPSA RALVEGLRPEMPFDILYVHCPHSNISIARNCCLDNSTGDFLAFLDDDETVSGDWL TRLLETARTTGAAAVLGPVRAHYGPTAPRWMRSGDFHSTLPVWAKGEIRTGYTC NALLRRDAASLLGRRFKLSLGKSGGEDTDFFTGMHCAGGTIAFSPEAWVHEPVP ENRASLAWLAKRRFRSGQTHGRLLAEKAHGLRQAWNIALAGAKSGFCATAAVLC
FPSAARRNRFALRAVLHAGVISGLLGLKEIEQYGAREVTSA Rhizobium radiobacter Q44418 (SEQ ID NO: 157)
MCRCGRAVRSRPVCRPGQLVVRRSPRPRSRNHSRCRPLRLSVFPRPHR RVRHHCQRDLRWEPGRWIAVRWKAARSHRRFRRCPFPRQLVWPVRERHRDA GDRRNQRERRRRDAYHEISEPKFRTRKRTESFWMNKAITVIVWLLVSLCVLAIITM PVSLQTHLVATAISLILLATIKSFNGQGAWRLVALGFGTAIVLRYVYWRTTSTLPPV NQLENFIPGFLLYLAEMYSVVMLGLSLVIVSMPLPSRKTRPGSPDYRPTVDVFVP SYNEDAELLANTLAAAKNMDYPADRFTVWLLDDGGSVQKRNAANIVEAQAAQR RHEELKKLCEDLDVRYLTRERNVHAKAGNLNNGLAHSTGELVTVFDADHAPARD FLLETVGYFDEDPRLFLVQTPHFFVNPDPIERNLRTFETMPSENEMFYGIIQRGLD KWNGAFFCGSAAVLRREALQDSDGFSGVSITEDCETALALHSRGWNSVYVDKP LIAGLQPATFASFIGQRSRWAQGMMQILIFRQPLFKRGLSFTQRLCYMSSTLFWL FPFPRTIFLFAPLFYLFFDLQIFVASGGEFLAYTAAYMLVNLMMQNYLYGSFRWP WISELYEYVQTVHLLPAVVSVIFNPGKPTFKVTAKDESIAEARLSEISRPFFVIFALL LVAMAFAVWRIYSEPYKADVTLVVGGWNLLNLIFAGCALGVVSERGDKSASRRIT VKRRCEVQLGGSDTWVPASIDNVSVHGLLINIFDSATNIEKGATAIVKVKPHSEGV PETMPLNVVRTVRGEGFVSIGCTFSPQRAVDHRLIADLIFANSEQWSEFQRVRRK
KPGLIRGTAIFLAIALFQTQRGLYYLVRARRPAPKSAKPVGAVK Streptococcus agalactiae cpsI O87183 (SEQ ID NO: 158)
MIKKIEKDLISVIVPIYNVEDYLVECIESLIVQTYRNIEILLINDGSTDNCATIAK EFSERDCRVIYIEKSNGGLSEARNYGIYHSKGKYLTFVDSDDKVSSDYIANLYNAI QKHDSSIAIGGYLEFYERHNSIRNYEYLDKVIPVEEALLNMYDIKTYGSIFITAWGK LFHKSIFNDLEFALNKYHEDEFFNYKAYLKANSITYIDKPLYHYRIRVGSIMNNSDN VIIARKKLDVLSALDERIKLITSLRKYSVFLQKTEIFYVNQYFRTKKFLKQQSVMFKE
DNYIDAYRMYGRLLRKVKLVDKLKLIKNRFF Streptococcus pneumoniae cps3S Q54611 (SEQ ID NO: 159)
MYTFILMLLDFFQNHDFHFFMLFFVFILIRWAVIYFHAVRYKSYSCSVSDEK LFSSVIIPVVDEPLNLFESVLNRISRHKPSEIIVVINGPKNERLVKLCHDFNEKLENN MTPIQCYYTPVPGKRNAIRVGLEHVDSQSDITVLVDSDTVWTPRTLSELLKPFVC DKKIGGVTTRQKILDPERNLVTMFANLLEEIRAEGTMKAMSVTGKVGCLPGRTIAF RNIVERVYTKFIEETFMGFHKEVSDDRSLTNLTLKKGYKTVMQDTSVVYTDAPTS WKKFIRQQLRWAEGSQYNNLKMTPWMIRNAPLMFFIYFTDMILPMLLISFGVNIFL LKILNITTIVYTASWWEIILYVLLGMIFSFGGRNFKAMSRMKWYYVFLIPVFIIVLSIIM
CPIRLLGLMRCSDDLGWGTRNLTE MbUGTc13 (SEQ ID NO: 160)
MADAMATTEKKPHVIFIPFPAQSHIKAMLKLAQLLHHKGLQITFVNTDFIHN QFLESSGPHCLDGAPGFRFETIPDGVSHSPEASIPIRESLLRSIETNFLDRFIDLVT KLPDPPTCIISDGFLSVFTIDAAKKLGIPVMMYWTLAACGFMGFYHIHSLIEKGFAP LKDASYLTNGYLDTVIDWVPGMEGIRLKDFPLDWSTDLNDKVLMFTTEATQRSH KVSHHIFHTFDELEPSIIKTLSLRYNHIYTIGPLQLLLDQIPEEKKQTGITSLHGYSLV KEEPECFQWLQSKEPNSVVYVNFGSTTVMSLEDMTEFGWGLANSNHYFLWIIRS NLVIGENAVLPPELEEHIKKRGFIASWCSQEKVLKHPSVGGFLTHCGWGSTIESL SAGVPMICWPYSWDQLTNCRYICKEWEVGLEMGTKVKRDEVKRLVQELMGEG GHKMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN
MbUGTc19 (SEQ ID NO: 161)
MANHHECMNWLDDKPKESVVYVAFGSLVKHGPEQVEEITRALIDSDVNFL WVIKHKEEGKLPENLSEVIKTGKGLIVAWCKQLDVLAHESVGCFVTHCGFNSTLE AISLGVPVVAMPQFSDQTTNAKLLDEILGVGVRVKADENGIVRRGNLASCIKMIME EERGVIIRKNAVKWKDLAKVAVHEGGSSDNDIVEFVSELIKAGSGEQQKIKKSPH VLLIPFPLQGHINPFIQFGKRLISKGVKTTLVTTIHTLNSTLNHSNTTTTSIEIQAISD GCDEGGFMSAGESYLETFKQVGSKSLADLIKKLQSEGTTIDAIIYDSMTEWVLDV AIEFGIDGGSFFTQACVVNSLYYHVHKGLISLPLGETVSVPGFPVLQRWETPLILQ NHEQIQSPWSQMLFGQFANIDQARWVFTNSFYKLEEEVIEWTRKIWNLKVIGPTL
PSMYLDKRLDDDKDNGFNLYKA MbUGT1-3 (SEQ ID NO: 162)
MENKTETTVRRRRRIILFPVPFQGHINPILQLANVLYSKGFSITIFHTNFNKP KTSNYPHFTFRFILDNDPQDERISNLPTHGPLAGMRIPIINEHGADELRRELELLML ASEEDEEVSCLITDALWYFAQSVADSLNLRRLVLMTSSLFNFHAHVSLPQFDELG YLDPDDKTRLEEQASGFPMLKVKDIKSAYSNWQILKEILGKMIKQTKASSGVIWNS FKELEESELETVIREIPAPSFLIPLPKHLTASSSSLLDHDRTVFQWLDQQPPSSVLY VSFGSTSEVDEKDFLEIARGLVDSKQSFLWVVRPGFVKGSTWVEPLPDGFLGER GRIVKWVPQQEVLAHGAIGAFWTHSGWNSTLESVCEGVPMIFSDFGLDQPLNAR YMSDVLKVGVYLENGWERGEIANAIRRVMVDEEGEYIRQNARVLKQKADVSLMK
GGSSYESLESLVSYISSL MbUGT1-2 (SEQ ID NO: 163)
MATKGSSGMSLAERFWLTLSRSSLVVGRSCVEFEPETVPLLSTLRGKPIT FLGLMPPLHEGRREDGEDATVRWLDAQPAKSVVYVALGSEVPLGVEKVHELAL GLELAGTRFLWALRKPTGVSDADLLPAGFEERTRGRGVVATRWVPQMSILAHAA VGAFLTHCGWNSTIEGLMFGHPLIMLPIFGDQGPNARLIEAKNAGLQVARNDGD GSFDREGVAAAIRAVAVEEESSKVFQAKAKKLQEIVADMACHERYIDGFIQQLRS YKDDSGYSSSYAAAAGMHVVICPWLAFGHLLPCLDLAQRLASRGHRVSFVSTPR NISRLPPVRPALAPLVAFVALPLPRVEGLPDGAESTNDVPHDRPDMVELHRRAFD GLAAPFSEFLGTACADWVIVDVFHHWAAAAALEHKVPCAMMLLGSAEMIASIADE
RLEHAETESPAAAGQGRPAAAPTFEVARMKLIR Coffea arabica (SEQ ID NO: 164)
MENHATFNVLMLPWLAHGHVSPYLELAKKLTARNFNVYLCSSPATLSSVR SKLTEKFSQSIHLVELHLPKLPELPAEYHTTNGLPPHLMPTLKDAFDMAKPNFCN VLKSLKPDLLIYDLLQPWAPEAASAFNIPAVVFISSSATMTSFGLHFFKNPGTKYP YGNAIFYRDYESVFVENLTRRDRDTYRVINCMERSSKIILIKGFNEIEGKYFDYFSC LTGKKVVPVGPLVQDPVLDDEDCRIMQWLNKKEKGSTVFVSFGSEYFLSKKDME EIAHGLEVSNVDFIWVVRFPKGENIVIEETLPKGFFERVGERGLVVNGWAPQAKIL THPNVGGFVSHCGWNSVMESMKFGLPIIAMPMHLDQPINARLIEEVGAGVEVLR DSKGKLHRERMAETINKVMKEASGESVRKKARELQEKLELKGDEEIDDVVKELV
QLCATKNKRNGLHYY UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165)
MDQMAKIDEKKPHVVFIPFPAQSHIKCMLKLARILHQKGLYITFINTDTNHE RLVASGGTQWLENAPGFWFKTVPDGFGSAKDDGVKPTDALRELMDYLKTNFFD LFLDLVLKLEVPATCIICDGCMTFANTIRAAEKLNIPVILFWTMAACGFMAFYQAKV LKEKEIVPVKDETYLTNGYLDMEIDWIPGMKRIRLRDLPEFILATKQNYFAFEFLFE TAQLADKVSHMIIHTFEELEASLVSEIKSIFPNVYTIGPLQLLLNKITQKETNNDSYS LWKEEPECVEWLNSKEPNSVVYVNFGSLAVMSLQDLVEFGWGLVNSNHYFLWII RANLIDGKPAVMPQELKEAMNEKGFVGSWCSQEEVLNHPAVGGFLTHCGWGSII ESLSAGVPMLGWPSIGDQRANCRQMCKEWEVGMEIGKNVKRDEVEKLVRMLM EGLEGERMRKKALEWKKSATLATCCNGSSSLDVEKLANEIKKLSRN

Claims (76)

REIVINDICAÇÕES
1. Método para produção de um triterpenoide, caracterizado pelo fato de que compreende: fornecer uma célula hospedeira microbiana recombinante que expressa uma via enzimática heteróloga que catalisa a conversão de isopentenil pirofosfato (IPP) e dimetilalil pirofosfato (DMAPP) em um ou mais triterpenoides, com a via compreendendo uma farnesil difosfato sintase (FPPS) e uma esqualeno sintase (SQS), em que a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 2 a 16, 166, e 167; e cultivar a célula hospedeira em condições para a produção do triterpenoide.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Artemisia annua (SEQ ID NO: 11).
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 11.
4. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 11, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
5. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 2, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 166 ou SEQ ID NO: 167.
6. Método, de acordo com qualquer uma das reivindicações de 1 a 5, caracterizado pelo fato de que o triterpenoide é o esqualeno.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a célula hospedeira microbiana é procariótica ou eucariótica, e é opcionalmente uma bactéria selecionada dentre Escherichia coli, Bacillus subtilis,
Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida; ou é opcionalmente uma levedura selecionada de uma espécie dentre Saccharomyces, Pichia, ou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastoris e Yarrowia lipolytica.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que a célula hospedeira microbiana é E. coli.
9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que E. coli produz produtos da via MEP em maior quantidade e tem uma superexpressão de uma ou mais enzimas da via MEP.
10. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma esqualeno epoxidase (SQE).
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a qualquer uma das SEQ ID NOS: 17 a 39, 168, 169 ou
170.
12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39).
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a SQE compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 39.
14. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a SQE compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 39, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
15. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a célula hospedeira é uma bactéria que coexpressa uma enzima SQS compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à
SQS de Artemisia annua (SEQ ID NO: 11), e uma esqualeno epoxidase compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39).
16. Método, de acordo com qualquer uma das reivindicações de 1 a 15, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma triterpeno ciclase.
17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que a triterpeno ciclase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 40 a 55.
18. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que a triterpeno ciclase é uma cucurbitadienol sintase (CDS).
19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a CDS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos da SEQ ID NO: 40.
20. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que a CDS compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 40.
21. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que a CDS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 40, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
22. Método, de acordo com qualquer uma das reivindicações de 1 a 21, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma epóxido hidrolase (EPH).
23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que a EPH compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 56 a 72.
24. Método, de acordo com qualquer uma das reivindicações de 1 a 23, caracterizado pelo fato de que a via heteróloga compreende ainda uma ou mais oxidases.
25. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que pelo menos uma oxidase é uma enzima do citocromo P450.
26. Método, de acordo com a reivindicação 25, caracterizado pelo fato de que pelo menos uma enzima do citocromo P450 compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 73 a 91.
27. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que pelo menos uma oxidase é uma oxidase de ferro não-heme.
28. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que a oxidase de ferro não-heme compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 100 a 115.
29. Método, de acordo com qualquer uma das reivindicações de 24 a 28, caracterizado pelo fato de que a célula hospedeira microbiana expressa uma ou mais proteínas de transferência de elétrons selecionadas dentre uma citocromo P450 redutase (CPR), flavodoxina redutase (FPR) e ferredoxina redutase (FDXR) suficientes para regenerar a uma ou mais oxidases.
30. Método, de acordo com qualquer uma das reivindicações de 1 a 29, caracterizado pelo fato de que a via enzimática heteróloga produz mogrol.
31. Método, de acordo com a reivindicação 30, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma ou mais enzimas glicosiltransferases dependentes de uridina difosfato (UGT), produzindo, assim, um ou mais glicosídeos de mogrol.
32. Método, de acordo com a reivindicação 31, caracterizado pelo fato de que o um ou mais glicosídeos de mogrol são selecionados de Mog. II-E, Mog. III-A-2, Mog. III-E, Mog. IIIx, Mog. IV-A, Mog. IV-E, Siamenosídeo, Isomog. IV e Mog. V.
33. Método, de acordo com a reivindicação 32, caracterizado pelo fato de que o um ou mais glicosídeos de mogrol incluem Mog. VI, Isomog. V e Mog. V.
34. Método, de acordo com a reivindicação 33, caracterizado pelo fato de que a célula hospedeira produz Mog. V.
35. Método, de acordo com qualquer uma das reivindicações de 31 a 34,
caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 116 a 165.
36. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165).
37. Método, de acordo com a reivindicação 35 ou 36, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
165.
38. Método, de acordo com a reivindicação 37, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 165, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
39. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146).
40. Método, de acordo com a reivindicação 39, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 146.
41. Método, de acordo com a reivindicação 40, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 146, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
42. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164).
43. Método, de acordo com a reivindicação 42, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 164.
44. Método, de acordo com a reivindicação 43, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 164, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
45. Método, de acordo com a reivindicação 31, caracterizado pelo fato de que pelo menos uma enzima UTG é um permutante circular de uma enzima UGT do tipo selvagem ou um derivado do mesmo.
46. Método, de acordo com a reivindicação 45, caracterizado pelo fato de que pelo menos uma enzima UTG é um permutante circular da SEQ ID NO: 146, SEQ ID NO: 164 ou SEQ ID NO: 165 ou um derivado do mesmo.
47. Método, de acordo com qualquer uma das reivindicações de 31 a 45, caracterizado pelo fato de que compreende pelo menos uma enzima UGT capaz de catalisar a adição em beta 1,2 de uma molécula de glicose.
48. Método, de acordo com a reivindicação 47, caracterizado pelo fato de que a enzima UGT compreende a sequência de aminoácidos da SEQ ID NO: 117, ou um permutante circular da mesma.
49. Método, de acordo com a reivindicação 47 ou 48, caracterizado pelo fato de que a via enzimática heteróloga compreende quatro enzimas UGT: uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 165 ou um derivado do mesmo; uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 146 ou um derivado do mesmo; uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 164 ou um derivado do mesmo; e uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Siraitia grosvenorii (SEQ ID NO: 117), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 117 ou um derivado do mesmo.
50. Método, de acordo com qualquer uma das reivindicações de 31 a 49, caracterizado pelo fato de que a célula hospedeira microbiana tem uma ou mais modificações genéticas que aumentam a produção ou disponibilidade de UDP- glicose.
51. Método, de acordo com a reivindicação 50, caracterizado pelo fato de que a uma ou mais modificações genéticas incluem uma ou mais ΔgalE, ΔgalT, ΔgalK, ΔgalM, ΔushA, Δagp, Δpgm, duplicação ou superexpressão de GALU de E coli, expressão de UGPA de Bacillus subtillus e expressão de SPL de Bifidobacterium adolescentis.
52. Método para produção de Mog. V, caracterizado pelo fato de que compreende: reagir um glicosídeo de mogrol com uma glicosiltransferase dependente de uridina difosfato (UGT) compreendendo uma sequência de aminoácidos que seja pelo menos 70% idêntica à SEQ ID NO: 164, ou compreendendo uma sequência de aminoácidos que seja um permutante circular da SEQ ID NO: 164 possuindo opcionalmente de 1 a 20 substituições, deleções e/ou inserções de aminoácidos em relação à posição correspondente da SEQ ID NO: 164.
53. Método, de acordo com a reivindicação 52, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 164 ou a um permutante circular da mesma.
54. Método, de acordo com a reivindicação 52, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 164, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
55. Método, de acordo com qualquer uma das reivindicações de 52 a 64, caracterizado pelo fato de que o substrato do glicosídeo de mogrol compreende Mog. IIE, Mog. III, Mog. IV ou Siamenosídeo.
56. Método, de acordo com a reivindicação 55, caracterizado pelo fato de que o Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade com UGT85C1 (SEQ ID NO: 165), ou um permutante circular da mesma.
57. Método, de acordo com a reivindicação 56, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 165 ou a um permutante circular da mesma.
58. Método, de acordo com a reivindicação 56, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 165, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 165.
59. Método, de acordo com qualquer uma das reivindicações de 55 a 58, caracterizado pelo fato de que o Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IA ou Mog, IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade com UGT85C2 (SEQ ID NO: 146), ou um permutante circular da mesma.
60. Método, de acordo com a reivindicação 59, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 146, ou a um permutante circular da mesma.
61. Método, de acordo com a reivindicação 59, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 146, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 146.
62. Método, de acordo com qualquer uma das reivindicações de 52 a 61, caracterizado pelo fato de que o mogrol é reagido com: uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou um permutante circular da mesma; uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou um permutante circular da mesma; e uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou um permutante circular da mesma; e uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Siraitia grosvenorii (SEQ ID NO: 117), ou um permutante circular da mesma.
63. Método, de acordo com qualquer uma das reivindicações de 52 a 62, caracterizado pelo fato de que compreende ainda a recuperação e/ou purificação do glicosídeo de mogrol.
64. Método, de acordo com a reivindicação 63, caracterizado pelo fato de que o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
65. Método, de acordo com qualquer uma das reivindicações de 52 a 64, caracterizado pelo fato de que a reação é realizada em uma célula microbiana, e as enzimas UGT são expressas de forma recombinante na célula.
66. Método, de acordo com a reivindicação 65, caracterizado pelo fato de que o mogrol é produzido na célula por uma via heteróloga de síntese de mogrol.
67. Método, de acordo com a reivindicação 65, caracterizado pelo fato de que o mogrol ou os glicosídeos de mogrol são introduzidos nas células para glicosilação.
68. Método, de acordo com qualquer uma das reivindicações de 52 a 64, caracterizado pelo fato de que a reação é realizada in vitro usando enzima UGT purificada, enzima UGT parcialmente purificada, ou lisados de células recombinantes.
69. Método, de acordo com qualquer uma das reivindicações de 64 a 68, caracterizado pelo fato de que a célula hospedeira microbiana é procariótica ou eucariótica, e é opcionalmente uma bactéria selecionada dentre Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida; ou é opcionalmente uma levedura selecionada de uma espécie dentre Saccharomyces, Pichia, ou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastoris e Yarrowia lipolytica.
70. Método, de acordo com a reivindicação 69, caracterizado pelo fato de que a célula hospedeira microbiana é E. coli.
71. Método, de acordo com a reivindicação 69 ou 70, caracterizado pelo fato de que os produtos de glicosídeo de mogrol são recuperados do meio extracelular.
72. Método para produção de um produto que compreende um glicosídeo de mogrol, caracterizado pelo fato de que compreende: produzir um glicosídeo de mogrol de acordo com qualquer uma das reivindicações de 1 a 71, e incorporar o glicosídeo de mogrol em um produto.
73. Método, de acordo com a reivindicação 72, caracterizado pelo fato de que o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
74. Método, de acordo com a reivindicação 72 ou 73, caracterizado pelo fato de que o produto é uma composição adoçante, composição aromatizante, alimento, bebida, goma de mascar, texturizante, composição farmacêutica, produto de tabaco, composição nutracêutica, ou composição para higiene bucal.
75. Método, de acordo com qualquer uma das reivindicações de 72 a 74, caracterizado pelo fato de que o produto compreende ainda um ou mais dentre um glicosídeo de esteviol, aspartame e neotame.
76. Método, de acordo com a reivindicação 75, caracterizado pelo fato de que o glicosídeo de esteviol compreende um ou mais dentre RebM, RebB, RebD, RebA, RebE e RebI.
BR112020017490-4A 2018-02-27 2019-02-27 Produção microbiana de triterpenoides incluindo mogrosídeos BR112020017490A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862635751P 2018-02-27 2018-02-27
US62/635,751 2018-02-27
PCT/US2019/019886 WO2019169027A2 (en) 2018-02-27 2019-02-27 Microbial production of triterpenoids including mogrosides

Publications (1)

Publication Number Publication Date
BR112020017490A2 true BR112020017490A2 (pt) 2020-12-22

Family

ID=66542535

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020017490-4A BR112020017490A2 (pt) 2018-02-27 2019-02-27 Produção microbiana de triterpenoides incluindo mogrosídeos

Country Status (8)

Country Link
US (1) US20210032669A1 (pt)
EP (1) EP3759230A4 (pt)
JP (2) JP7382946B2 (pt)
KR (1) KR20200136911A (pt)
CN (1) CN112041457A (pt)
BR (1) BR112020017490A2 (pt)
MX (1) MX2020008922A (pt)
WO (1) WO2019169027A2 (pt)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201805576D0 (en) * 2018-04-04 2018-05-16 Optibiotix Ltd Sweeteners and methods of production thereof
CN110592040A (zh) * 2019-09-18 2019-12-20 江苏施宇甜生物科技有限公司 一种用于生产upd糖基转移酶的重组枯草芽孢杆菌的工艺
EP4077649A4 (en) * 2019-12-16 2024-07-10 Manus Bio Inc MICROBIAL PRODUCTION OF MOGROL AND MOGROSIDES
CN115605081A (zh) * 2020-03-17 2023-01-13 可口可乐公司(Us) 新的罗汉果苷生产系统和方法
CA3177183A1 (en) * 2020-05-13 2021-11-18 Ginkgo Bioworks, Inc. Biosynthesis of mogrosides
CN111518817B (zh) * 2020-05-14 2022-08-23 云南农业大学 雪胆三萜合成酶HcOSC6基因及其工程菌和在制备葫芦二烯醇中的应用
CN112063647B (zh) * 2020-09-17 2023-05-02 云南农业大学 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用
AU2021373879A1 (en) * 2020-11-06 2023-06-08 The Medical College Of Wisconsin, Inc. Peptide inhibitors of human mitochondrial fission protein 1 and methods of use
CN112877355A (zh) * 2021-01-22 2021-06-01 杜云龙 一种利用烟草表达三七皂苷的方法
US20240240222A1 (en) * 2021-06-29 2024-07-18 Firmenich Incorporated Methods for making high intensity sweeteners
CN114107332B (zh) * 2022-01-27 2022-12-06 中国中医科学院中药研究所 共表达的核酸及其应用
CN114774503B (zh) * 2022-06-20 2022-10-14 中国中医科学院中药研究所 角鲨烯环氧化酶及其编码基因与应用

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2074214A2 (en) * 2006-09-28 2009-07-01 Microbia, Inc. Production of sterols in oleaginous yeast and fungi
WO2013061341A1 (en) * 2011-10-28 2013-05-02 Sujoy Kumar Guha An improved intra-uterine contraceptive device
BR112015013129A2 (pt) * 2012-12-04 2017-07-11 Evolva Sa métodos e materiais para a biossíntese de compostos mogrosida
CN104017797B (zh) * 2014-06-04 2016-03-16 中国医学科学院药用植物研究所 一种罗汉果SgCAS基因的突变体及其用途
SG11201701278RA (en) * 2014-08-21 2017-03-30 Manus Biosynthesis Inc Methods for production of oxygenated terpenes
WO2016038617A1 (en) * 2014-09-11 2016-03-17 The State Of Israel, Ministry Of Agriculture & Rural Development, Agricultural Research Organization (Aro) (Volcani Center) Methods of producing mogrosides and compositions comprising same and uses thereof

Also Published As

Publication number Publication date
US20210032669A1 (en) 2021-02-04
MX2020008922A (es) 2021-01-08
WO2019169027A2 (en) 2019-09-06
JP2024020310A (ja) 2024-02-14
EP3759230A2 (en) 2021-01-06
WO2019169027A3 (en) 2019-10-03
JP7382946B2 (ja) 2023-11-17
JP2021513867A (ja) 2021-06-03
CN112041457A (zh) 2020-12-04
EP3759230A4 (en) 2022-05-25
KR20200136911A (ko) 2020-12-08

Similar Documents

Publication Publication Date Title
JP7382946B2 (ja) モグロシドを含むトリテルペノイドの微生物生産
US11819042B2 (en) Uridine diphosphate-dependent glycosyltransferase circular permutants
JP2020103292A (ja) レバウディオサイドdおよびレバウディオサイドmの改良された産生方法
US20240229094A9 (en) Biosynthetic production of steviol glycosides and processes therefore
US11788070B2 (en) Uridine diphosphate-dependent glycosyltransferase enzyme
US20230042171A1 (en) Microbial production of mogrol and mogrosides
BR112015018872B1 (pt) Método para produção de uma composição de glicosídeo de esteviol, célula hospedeira recombinante, métodos para produção de rebaudiosídeo m, cultura de células, lisado de cultura de células e mistura reacional

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]