BR112020017490A2 - Produção microbiana de triterpenoides incluindo mogrosídeos - Google Patents
Produção microbiana de triterpenoides incluindo mogrosídeos Download PDFInfo
- Publication number
- BR112020017490A2 BR112020017490A2 BR112020017490-4A BR112020017490A BR112020017490A2 BR 112020017490 A2 BR112020017490 A2 BR 112020017490A2 BR 112020017490 A BR112020017490 A BR 112020017490A BR 112020017490 A2 BR112020017490 A2 BR 112020017490A2
- Authority
- BR
- Brazil
- Prior art keywords
- amino acid
- seq
- acid sequence
- fact
- mog
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/44—Preparation of O-glycosides, e.g. glucosides
- C12P19/60—Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
- C12P5/026—Unsaturated compounds, i.e. alkenes, alkynes or allenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/007—Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L2/00—Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
- A23L2/52—Adding ingredients
- A23L2/60—Sweeteners
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0014—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0071—Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
- C12N9/0083—Miscellaneous (1.14.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1051—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/18—Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P33/00—Preparation of steroids
- C12P33/20—Preparation of steroids containing heterocyclic rings
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
- C12Y204/01017—Glucuronosyltransferase (2.4.1.17)
-
- A—HUMAN NECESSITIES
- A23—FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
- A23L—FOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
- A23L27/00—Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
- A23L27/30—Artificial sweetening agents
- A23L27/33—Artificial sweetening agents containing sugars or derivatives
- A23L27/36—Terpene glycosides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y114/00—Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
- C12Y114/99—Miscellaneous (1.14.99)
- C12Y114/99007—Squalene monooxygenase (1.14.99.7)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/01—Hexosyltransferases (2.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01021—Squalene synthase (2.5.1.21), i.e. farnesyl-disphosphate farnesyltransferase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y303/00—Hydrolases acting on ether bonds (3.3)
- C12Y303/02—Ether hydrolases (3.3.2)
- C12Y303/02003—Epoxide hydrolase (3.3.2.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y504/00—Intramolecular transferases (5.4)
- C12Y504/99—Intramolecular transferases (5.4) transferring other groups (5.4.99)
- C12Y504/99033—Cucurbitadienol synthase (5.4.99.33)
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- Nutrition Science (AREA)
- Food Science & Technology (AREA)
- Polymers & Plastics (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Medicinal Preparation (AREA)
- Steroid Compounds (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
Abstract
a presente invenção fornece células hospedeiras e métodos para a produção de glicosídeos de mogrol, incluindo mogrosídeo v (mog. v), mogrosídeo vi (mog. vi), iso-mogrosídeo v (isomog. v), e produtos de glicosilação que são produtos secundários em siraitiagrosvenorii. a invenção fornece enzimas manipuladas e células hospedeiras manipuladas para a produção de produtos de glicosilação de mogrol, tais como mog. v, mog. vi e isomog. v, com pureza e/ou rendimento elevados. a presente tecnologia fornece ainda métodos de produção de produtos contendo glicosídeos de mogrol, tais como mog. v, mog. vi e isomog. v, incluindo produtos alimentícios, bebidas, produtos para higiene bucal, adoçantes e aromatizantes.
Description
[0001] Mogrosídeos são metabólitos secundários especializados derivados do triterpeno, encontrados no fruto da planta Siraitia grosvenorii da família Cucurbitaceae (também conhecida como fruta-dos-monges ou Luohan Guo). Sua biossíntese no fruto envolve um número de glicosilações consecutivas do mogrol de aglicona para os produtos doces finais Mogrosídeo V (Mog. V). A indústria de alimentos está aumentando o uso do extrato de fruto de mogrosídeo como um adoçante alimentar natural sem açúcar. Por exemplo, Mog. V tem uma capacidade adoçante que é ~ 250 vezes a da sacarose (Kasai et al., Agric Biol Chem (1989)). Além disso, benefícios adicionais dos mogrosídeos para a saúde foram revelados em estudos recentes (Li et al., Chin J Nat Med (2014)). Uma variedade de fatores está promovendo um aumento no interesse na pesquisa e comercialização de mogrosídeos e da fruta-dos-monges em geral, incluindo, por exemplo, a explosão na popularidade e na demanda por adoçantes naturais; as dificuldades no fornecimento escalonável do atual adoçante natural principal, rebaudiosídeo M (RebM), da planta Stevia; o desempenho de sabor superior do mogrosídeo V em relação a outros produtos adoçantes naturais e artificiais no mercado; e o potencial medicinal da planta e do fruto.
[0002] Mog. V purificado foi aprovado como um adoçante de alta intensidade no Japão (Jakinovich et al., Journal of Natural Products (1990)) e o extrato ganhou o status de GRAS nos EUA como um adoçante não nutritivo e intensificador de sabor (GRAS 522). A extração de mogrosídeos do fruto pode render um produto de vários graus de pureza, muitas vezes acompanhado de gosto residual indesejável. Além disso, os rendimentos de mogrosídeo do fruto cultivado são limitados devido ao baixo rendimento das plantas e aos requisitos específicos de cultivo da planta. Os mogrosídeos estão presentes em cerca de 1% nos frutos frescos e cerca de 4% nos frutos secos (Li HB, et al., 2006). Mog. V é o principal componente, com teor de 0,5% a 1,4% no fruto seco. Além disso, as dificuldades de purificação limitam a pureza de Mog. V, com produtos comerciais de extratos de plantas sendo padronizados para cerca de 50% Mog. V. É altamente provável que um produto de Mog. V puro terá maior sucesso comercial do que a mistura, uma vez que é menos provável que tenha sabores estranhos, será mais fácil de formular em produtos e tem um bom potencial de solubilidade. Portanto, é vantajoso ser capaz de produzir compostos doces de mogrosídeo por meio de processos biotecnológicos.
[0003] A presente invenção, em vários aspectos e modalidades, fornece um método para produzir glicosídeos de mogrol, bem como outros compostos triterpenoides, usando processos microbianos recombinantes. Em outros aspectos, a invenção fornece métodos para produzir produtos, incluindo alimentos, bebidas e adoçantes (entre outros), incorporando os glicosídeos de mogrol produzidos de acordo com os métodos descritos neste documento.
[0004] Em um aspecto, a invenção fornece um método para preparar um composto triterpenoide. O método compreende o fornecimento de uma célula hospedeira microbiana recombinante que expressa uma via de enzima heteróloga que catalisa a conversão de isopentenil pirofosfato (IPP) e/ou dimetilalil pirofosfato (DMAPP) em um ou mais compostos triterpenoides. A via enzimática heteróloga compreende uma farnesil difosfato sintase (FPPS) e uma esqualeno sintase (SQS), que são expressas de forma recombinante. Em várias modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 2 a 16, 166 e 167. A célula hospedeira é cultivada em condições para a produção do triterpenoide.
[0005] A célula hospedeira microbiana em várias modalidades pode ser procariótica ou eucariótica. Em algumas modalidades, a célula hospedeira microbiana é uma bactéria, como Escherichia coli, ou a célula microbiana pode ser uma célula de levedura. Em algumas modalidades, a célula hospedeira é uma célula hospedeira bacteriana ou de levedura manipulada para aumentar a produção de IPP e DMAPP a partir da glicose.
[0006] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Artemisia annua (SEQ ID NO: 11). AaSQS tem alta atividade em E. coli. Outras enzimas SQS que são ativas em E. coli (incluindo com condições de cultura a 37° C) incluem SQS de Siraitia grosvenorii (SEQ ID NO: 2), SQS de Euphorbia lathyris (SEQ ID NO: 14), SQS de Eleutherococcus senticosus (SEQ ID NO: 16), SQS de Flavobacteriales bacterium (SEQ ID NO: 166) e SQS de Bacteroietes bacterium (SEQ ID NO: 167).
[0007] Em várias modalidades, a via de enzima heteróloga produz esqualeno, que é opcionalmente um intermediário que atua como um substrato para enzimas adicionais da via a jusante. Em algumas modalidades, o esqualeno é recuperado da cultura e pode ser recuperado das células microbianas e/ou pode ser recuperado dos meios e/ou de uma camada orgânica.
[0008] Em várias modalidades, a célula hospedeira expressa uma ou mais enzimas que produzem mogrol a partir do esqualeno. Por exemplo, a célula hospedeira pode expressar um ou mais dentre esqualeno epoxidase (SQE), cucurbitadienol sintase (CDS), epóxido hidrolase (EPH), citocromo P450 oxidases (CYP450), oxigenases não heme dependentes de ferro e citocromo P450 reductases (CPR).
[0009] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma esqualeno epoxidase (SQE). Por exemplo, a via de enzima heteróloga pode compreender uma SQE que produz 2,3-oxidosqualeno. Esqualeno epoxidases exemplares podem compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a qualquer uma das SEQ ID NOS: 17 a 39, 168, 169 e
170. Por exemplo, a esqualeno epoxidase pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39). MlSQE tem alta atividade em E. coli. Além disso, quando coexpresso com AaSQS, foi observado uma alta titulação do produto epoxilado único (2,3-oxidosqualeno). Consequentemente, a coexpressão de AaSQS (ou um derivado manipulado) com MsSQE (ou um derivado manipulado) tem um bom potencial para biomanipulação da via de mogrol. Enzimas SQE alternativas de acordo com a divulgação incluem esqualeno epoxidase endossinbionte de Bathymodiolus azoricus (SEQ ID NO: 168), esqualeno epoxidase de Methyloprofundus sediment (SEQ ID NO: 169), esqualeno epoxidase de Methylomicrobium buryatense (SEQ ID NO: 170), e derivados manipulados destas.
[0010] Em várias modalidades, a via de enzima heteróloga compreende ainda uma triterpeno ciclase. Em algumas modalidades, onde a célula microbiana coexpressa FPPS, SQS, SQE e a triterpeno ciclase, a célula microbiana produz cucurbitadienol. O cucurbitadienol pode ser o substrato para enzimas a jusante na via heteróloga ou é, alternativamente, recuperado da cultura (seja de células microbianas, ou dos meios de cultura ou camada orgânica). Em algumas modalidades, a triterpeno ciclase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 40 a 55. Em algumas modalidades, a triterpeno ciclase tem atividade de cucurbitadienol sintetase (CDS). A CDS em várias modalidades compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos da SEQ ID NO: 40 (Siraitia grosvenorii).
[0011] Em algumas modalidades, a via de enzima heteróloga compreende ainda um epóxido hidrolase (EPH). Enzimas EPH exemplares compreendem uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos selecionada das SEQ ID NOS: 56 a 72. Em algumas modalidades, a EPH pode empregar como substrato 24,25-epoxicucurbitadienol, para a produção de 24,25-di-hidroxicucurbitadienol.
[0012] Em algumas modalidades, a via heteróloga compreende ainda uma ou mais oxidases. A uma ou mais oxidases podem ser ativas em cucurbitadienol ou produtos oxigenados deste como um substrato, adicionando (coletivamente) hidroxilações em C11, C24 e 25, produzindo assim mogrol. Enzimas oxidase exemplares são descritas neste documento.
[0013] Em várias modalidades, a via de enzima heteróloga produz mogrol, que pode ser um intermediário para enzimas a jusante na via heteróloga ou, em algumas modalidades, é recuperado da cultura. O mogrol pode ser recuperado das células hospedeiras em algumas modalidades ou, em algumas modalidades, pode ser recuperado dos meios de cultura ou da camada orgânica.
[0014] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma ou mais enzimas glicosiltransferases dependentes de difosfato de uridina (UGT), produzindo assim um ou mais glicosídeos de mogrol (ou "mogrosídeos"). O glicosídeo de mogrol pode ser pentaglicosilado ou hexaglicosilado em algumas modalidades. Em outras modalidades, o glicosídeo de mogrol tem duas, três ou quatro glicosilações. O um ou mais glicosídeos de mogrol podem ser selecionados de Mog. II-E, Mog. III-A-2, Mog. III-E, Mog. IIIx, Mog. IV-A, Mog. IV-E, Siamenosídeo, Isomog. IV e Mog. V. Em algumas modalidades, o mogrosídeo é um mogrosídeo pentaglicosilado ou hexaglicosilado.
[0015] Em algumas modalidades, a célula hospedeira expressa uma enzima UGT que catalisa a glicosilação primária de mogrol em grupos hidroxila C24 e/ou C3. Em algumas modalidades, a enzima UGT catalisa glicosilações de ramificação beta 1,2 e/ou beta 1,6 de glicosídeos de mogrol nos grupos gluscosil C3 e C24 primários. Enzimas UGT exemplares são divulgadas neste documento (SEQ ID NOS: 116 a 165). Por exemplo, em algumas modalidades, a célula microbiana expressa pelo menos quatro enzimas UGT, resultando na glicosilação de mogrol no grupo hidroxila C3, o grupo hidroxila C24, bem como uma glicosilação 1,6 adicional no grupo glicosil C3, e uma glicosilação adicional 1,6 e uma glicosilação 1,2 adicional no grupo glicosil C24. O produto de tais reações de glicosilação é Mog. V.
[0016] Por exemplo, pelo menos uma enzima UGT expressa pela célula microbiana pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165). UGT85C1, e derivados destas, fornecem glicosilação da hidroxila C3 de mogrol ou Mog. 1A.
[0017] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146). UGT85C2, e derivados destas, fornecem glicosilação da hidroxila C24 de mogrol ou Mog. 1E.
[0018] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a Coffea arabica UGT (CaUGT_1,6) (SEQ ID NO: 164). CaUGT_1,6, e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3.
[0019] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT94-289-3 de Siraitia grosvenorii (SEQ ID NO: 117). UGT94-289-3 ("Sg94_3"), e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3, bem como glicosilação beta 1,2 no grupo glicosil C24.
[0020] Em algumas modalidades, a célula microbiana expressa pelo menos uma enzima UGT capaz de catalisar a adição de beta 1,2 de uma molécula de glicose pelo menos ao grupo glicosil C24 (por exemplo, de Mog. IVA, ver FIGURA 4). Enzimas UGT exemplares de acordo com estas modalidades incluem UGT94- 289-3 de Siraitia grosvenorii (SEQ ID NO: 117), UGT91D1 de Stevia rebaudiana (SEQ ID NO: 147), UGT91D2 de Stevia rebaudiana (SEQ ID NO: 148), UGT91D2e de Stevia rebaudiana (SEQ ID NO: 149), OsUGT1-2 (SEQ ID NO: 150) ou MbUGT1-2 (SEQ ID NO: 163) ou derivados destas.
[0021] Em algumas modalidades, pelo menos uma enzima UGT é um permutante circular de uma enzima UGT de tipo selvagem, opcionalmente com substituições, deleções e/ou inserções de aminoácidos em relação à posição correspondente da enzima de tipo selvagem. Os permutantes circulares podem fornecer novas e desejáveis especificidades de substrato, perfis de produto e cinética de reação sobre as enzimas de tipo selvagem. Em algumas modalidades, pelo menos uma enzima UTG é um permutante circular de SEQ ID NO: 146, SEQ ID NO: 164 ou SEQ ID NO: 165, SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163 ou um derivado destas.
[0022] Os glicosídeos de mogrol podem ser recuperados da cultura microbiana. Por exemplo, os glicosídeos de mogrol podem ser recuperados de células microbianas ou, em algumas modalidades, são predominantemente transportados para o meio extracelular, onde podem ser recuperados ou sequestrados.
[0023] Em alguns aspectos, a invenção fornece um método para produzir um mogrosídeo pentaglicosilado ou hexaglicosilado, como Mog V. Em várias modalidades, a invenção compreende a reação de um glicosídeo de mogrol com uma pluralidade de enzimas glicosiltransferase dependentes de difosfato de uridina (UGT). Por exemplo, em algumas modalidades, uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SEQ ID NO: 164 (ou seu permutante circular), onde a enzima UGT catalisa a adição de beta 1,6 de uma glicose. Outras enzimas UGT, conforme descritas neste documento, serão coexpressas para glicosilar o substrato desejado para Mog. V.
[0024] Em algumas modalidades, o mogrol reage com cerca de quatro enzimas UGT. Uma primeira enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou um permutante circular desta Uma segunda enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou um permutante circular desta. Uma terceira enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou um permutante circular desta. Uma quarta enzima UGT é capaz de catalisar a adição de beta 1,2 de uma molécula de glicose, como SgUGT94_289_3 (SEQ ID NO: 117) ou um derivado ou permutante circular deste.
[0025] O glicosídeo de mogrol pode ser recuperado e/ou purificado da reação ou cultura. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
[0026] Em várias modalidades, a reação é realizada em uma célula microbiana e as enzimas UGT são expressas de forma recombinante na célula. Em algumas modalidades, o mogrol é produzido na célula por uma via de síntese de mogrol heteróloga, conforme descrito neste documento. Em outras modalidades, os glicosídeos de mogrol ou mogrol são alimentados às células para glicosilação. Em ainda outras modalidades, a reação é realizada in vitro usando enzima UGT purificada, enzima UGT parcialmente purificada ou lisados de células recombinantes.
[0027] Em outros aspectos, a invenção fornece um método para produzir um produto que compreende um glicosídeo de mogrol. O método compreende a produção de um glicosídeo de mogrol de acordo com esta divulgação e a incorporação do glicosídeo de mogrol em um produto. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V. Em algumas modalidades, o produto é uma composição adoçante, composição aromatizante, alimento, bebida, goma de mascar, texturizante, composição farmacêutica, produto de tabaco, composição nutracêutica ou composição de higiene oral.
[0028] O produto pode ser uma composição adoçante compreendendo uma mistura de adoçantes artificiais e/ou naturais. Por exemplo, a composição pode compreender ainda um ou mais de um glicosídeo de esteviol, aspartame e neotame.
Glicosídeos de esteviol exemplares compreendem um ou mais dentre RebM, RebB, RebD, RebA, RebE e RebI.
[0029] Outros aspectos e modalidades da invenção serão evidentes a partir da descrição detalhada seguinte.
[0030] A FIGURA 1 mostra as estruturas químicas de Mog. V, Mog. VI, e Isomog. V. O tipo de reação de glicosilação é mostrada dentro de cada fração de glicose (por exemplo, glicosilação central C3 ou C24 e as adições de glicosilação 1-2, 1-4 ou 1-6).
[0031] A FIGURA 2 mostra rotas para a produção de mogrosídeo V in vivo. A transformação enzimática necessária para cada etapa é indicada, juntamente com o tipo de enzima necessária. Os números entre parênteses correspondem às estruturas químicas na FIGURA 3. Abreviaturas: FPP, farnesil pirofosfato; SQS, esqualeno sintase; SQE, esqualeno epoxidase; TTC, triterpeno ciclase; EPH, epóxido hidrolase; CYP450, citocromo P450 com parceiro redutase; UGTs, glicosiltransferases de difosfato de uridina.
[0032] A FIGURA 3 representa estruturas químicas de metabólitos envolvidos na biossíntese de mogrosídeo V: (1) pirofosfato de farnesila; (2) esqualeno; (3) 2,3-oxidosqualeno; (4) 2,3; 22,23-dioxidosqualeno; (5) 24,25- epoxicucurbitadienol; (6) 24,25-di-hidroxicucurbitadienol; (7) mogrol; (8) mogrosídeo V; (9) cucurbitadienol.
[0033] A FIGURA 4 ilustra as rotas de glicosilação para mogrosídeo V e a atividade de biotransformação in vitro observada para várias enzimas UGT. As estruturas das bolhas representam diferentes mogrosídeos. O núcleo tetracíclico branco representa mogrol. Os números abaixo de cada estrutura indicam o mogrosídeo glicosilado particular, enquanto a notação com as setas indica as enzimas observadas para exibir a atividade de glicosilação. Os círculos pretos representam as glicosilações C3 ou C24. Os círculos verticais cinza-escuros representam glicosilações 1,6. Círculos horizontais cinza claro representam glicosilações 1,2. Abreviaturas: Mog, mogrol; sia, siamenosídeo.
[0034] A FIGURA 5 mostra resultados para a produção in vivo de esqualeno em E. coli usando diferentes esqualeno sintases. O asterisco denota uma construção de plasmídeo diferente e experimento executado em um dia diferente dos outros mostrados. Abreviaturas: SQS, esqualeno sintase; Sg, Siratia grosvenorii; Aa, Artemesia annua; Es, Eleutherococcus senticosus; El, Euphorbia lathyris; Fb, Flavobacteriales bacterium; Bb, Bacteroidetes bacterium.
[0035] A FIGURA 6 mostra resultados para a produção in vivo de esqualeno, 2,3-oxidosqualeno e 2,3; 22,23-dioxidosqualeno usando diferentes esqualeno epoxidases. Abreviaturas: SQS, esqualeno sintase; SQE, esqualeno epoxidase; Sg, Siratia grosvenorii; Aa, Artemesia annua; BaE, endossimbionte de Bathymodiolus azoricus; Ms, Methyloprofundus sedimenti; Mb, Methylomicrobium buryatense; Ml, Methylomonas lenta.
[0036] A FIGURA 7 mostra resultados para a produção in vivo do produto de triterpeno ciclizado. As reações envolvem um número crescente de enzimas expressas em uma linhagem celular de E. coli com uma superexpressão de enzimas da via MEP. Os asteriscos representam experimentos de fermentação incubados por um quarto do tempo do que os outros experimentos. Conforme mostrado, a coexpressão de AaSQS, MlSQE e SgTTC resultou em alta produção do produto triterpenoide, cucurbitadienol. Abreviaturas: SQS, esqualeno sintase; SQE, esqualeno epoxidase; TTC, triterpeno ciclase; Sg, Siratia grosvenorii; Aa, Artemesia annua; Ml, Methylomonas lenta.
[0037] A FIGURA 8 mostra a produção de Mogrosídeo V usando uma combinação de diferentes enzimas. (A) Produtos penta-glicosilados são observados quando 85C1, 85C2 e Sg94_3 ou CaUGT_1,6 são incubados junto com mogrol como substrato. Os substratos de mogrosídeo foram incubados em tampão Tris contendo cloreto de magnésio, beta-mercaptoetanol, UDP-glicose, UGT única e uma fosfatase. (B) Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V + H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrosídeo II-E. (C) Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V + H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrol. Abreviatura: MogV, mogrosídeo V.
[0038] A FIGURA 9 mostra ensaios in vitro mostrando a conversão de substratos de mogrosídeo em produtos mais glicosilados. Os substratos de mogrosídeo foram incubados em tampão Tris contendo cloreto de magnésio, beta- mercaptoetanol, UDP-glicose, UGT única e uma fosfatase. Os painéis correspondem ao uso de diferentes substratos: (A) mogrol; (B) mogrosídeo I-A; (C) mogrosídeo I-E; (D) mogrosídeo II-E; (E) mogrosídeo III; (F) mogrosídeo IV-A; (G) mogrosídeo IV; (H) siamenosídeo.
[0039] A FIGURA 10 é um alinhamento de aminoácidos de CaUGT_1,6 e SgUGT94_289_3 usando Clustal Omega (Versão CLUSTAL O (1,2,4). Essas sequências compartilham 54% de identidade de aminoácido.
[0040] A FIGURA 11 é um alinhamento de aminoácidos de Homo sapiens esqualeno sintase (HsSQS) (acesso NCBI NP_004453.3) e AaSQS (SEQ ID NO: 11) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQS tem uma estrutura de cristal publicada (entrada PDB: 1EZF). Essas sequências compartilham 42% de identidade de aminoácido.
[0041] A FIGURA 12 é um alinhamento de aminoácidos de Homo sapiens esqualeno epoxidase (HsSQE) (acesso NCBI XP_011515548) e MlSQE (SEQ ID NO: 39) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQE tem uma estrutura de cristal publicada (entrada PDB: 6C6N). Essas sequências compartilham 35% de identidade de aminoácido.
[0042] A presente invenção, em vários aspectos e modalidades, fornece um método para produzir glicosídeos de mogrol, bem como outros compostos triterpenoides, usando processos microbianos recombinantes. Em outros aspectos, a invenção fornece métodos para produzir produtos, incluindo alimentos, bebidas e adoçantes (entre outros), incorporando os glicosídeos de mogrol produzidos de acordo com os métodos descritos neste documento.
[0043] Conforme usado neste documento, os termos "terpeno ou triterpeno" são usados alternadamente com os termos "terpenoide" ou "triterpenoide", respectivamente.
[0044] Em um aspecto, a invenção fornece um método para preparar um composto triterpenoide. O método compreende o fornecimento de uma célula hospedeira microbiana recombinante que expressa uma via de enzima heteróloga que catalisa a conversão de isopentenil pirofosfato (IPP) e/ou dimetilalil pirofosfato (DMAPP) em um ou mais compostos triterpenoides. A via enzimática heteróloga compreende uma farnesil difosfato sintase (FPPS) e uma esqualeno sintase (SQS), que são expressas de forma recombinante. Em várias modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 2 a 16, 166 e 167. A célula hospedeira é cultivada em condições para a produção do triterpenoide.
[0045] A título de exemplo não limitativo, a FPPS pode ser Saccharomyces cerevisiae farnesil pirofosfato sintase (ScFPPS) (SEQ ID NO: 1), ou suas variantes modificadas. As variantes modificadas podem compreender uma sequência de aminoácidos que é pelo menos 70% idêntica à SEQ ID NO: 1). Por exemplo, a FPPS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 1. Em algumas modalidades, a FPPS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos ou possuindo de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 1, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Numerosas outras enzimas FPPS são conhecidas na técnica e podem ser empregadas para a conversão de IPP e/ou DMAPP em difosfato de farnesil de acordo com este aspecto.
[0046] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Artemisia annua (SEQ ID NO: 11). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 11. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 11, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, AaSQS tem alta atividade em E. coli.
[0047] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Siraitia grosvenorii (SEQ ID NO: 2). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 2. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 2, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, SgSQS tem alta atividade em E. coli.
[0048] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Euphorbia lathyris (SEQ ID NO: 14). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 14. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 14, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, ElSQS foi ativa em E. coli.
[0049] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Eleutherococcus senticosus (SEQ ID NO: 16). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
16. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 16, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, EsSQS foi ativa em E. coli.
[0050] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Flavobacteriales bacterium (SEQ ID NO: 166). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
166. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 166, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, FbSQS foi ativa em E. coli.
[0051] Em algumas modalidades, a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Bacteroidetes bacterium (SEQ ID NO: 167). Por exemplo, a SQS pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
167. Em algumas modalidades, a SQS compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 167, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima. Conforme mostrado na FIGURA 5, BbSQS foi ativa em E. coli.
[0052] As modificações de aminoácidos na enzima SQS podem ser guiadas por estruturas enzimáticas disponíveis e modelos de homologia, incluindo aqueles descritos em Aminfar e Tohidfar, In silico analysis of squalene synthase in Fabaceae family using bioinformtics tools, J. Genetic Engineer. and Biotech. 16 (2018) 739-
747. A estrutura de cristal publicamente disponível para HsSQE (entrada PDB: 6C6N) pode ser usada para informar as modificações de aminoácidos. Um alinhamento entre AaSQS e HsSQS é mostrado na FIGURA 11 As enzimas têm 42% de identidade de aminoácidos.
[0053] Em várias modalidades, a via de enzima heteróloga produz esqualeno, que é opcionalmente um intermediário que atua como um substrato para enzimas adicionais da via a jusante. Em algumas modalidades, o esqualeno é recuperado da cultura e pode ser recuperado das células microbianas e/ou pode ser recuperado dos meios e/ou de uma camada orgânica.
[0054] A célula hospedeira microbiana em várias modalidades pode ser procariótica ou eucariótica. Em algumas modalidades, a célula hospedeira microbiana é uma bactéria selecionada de Escherichia spp., Bacillus spp., Corynebacterium spp., Rhodobacter spp., Zymomonas spp., Vibrio spp., e Pseudomonas spp. Por exemplo, em algumas modalidades, a célula hospedeira bacteriana é uma espécie selecionada dentre Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida. Em algumas modalidades, a célula hospedeira bacteriana é E. coli. Alternativamente, a célula microbiana pode ser uma célula de levedura, tal como, mas não se limitando a uma espécie de Saccharomyces, Pichiaou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastorise Yarrowia lipolytica.
[0055] A célula microbiana produzirá produtos MEP ou MVA, que atuam como substratos para a via enzimática heteróloga. A via MEP (2-C-metil-D-eritritol 4-fosfato), também chamada via MEP/DOXP (2-C-metil-D-eritritol 4-fosfato/l- desoxi-D-xilulose 5-fosfato) ou a via não-mevalonato ou a via independente do ácido mevalônico refere-se à via que converte gliceraldeído-3-fosfato e piruvato em IPP e DMAPP. A via, que está presente nas bactérias, envolve tipicamente a ação das seguintes enzimas: 1-desoxi-D-xilulose-5-fosfato sintase (Dxs), 1-desoxi-D- xilulose-5-fosfato reductoisomerase (IspC), 4-difosfocitidil-2 -C-metil-D-eritritol- sintase (IspD), 4-difosfocitidil-2-C-metil-D-eritritol quinase (IspE), 2C-metil-D-eritritol 2,4-ciclodifosfato sintase (IspF), 1-hidroxi-2-metil-2-(E)-butenil-4-difosfato-sintase (IspG) e isopentenil-difosfato isomerase (IspH). A via de MEP e os genes e enzimas que constituem a via de MEP são descritos na US 8,512,988, que é incorporada neste documento por referência na sua totalidade. Por exemplo, os genes que constituem a via MEP incluem dxs, ispC, ispD, ispE, ispF, ispG, ispH, idi e ispA. Em algumas modalidades, a célula hospedeira expressa ou superexpressa um ou mais dentre dxs, ispC, ispD, ispE, ispF, ispG, ispH, idi, ispA ou variantes modificadas desta, o que resulta no aumento da produção de IPP e DMAPP. Em algumas modalidades, o triterpenoide (por exemplo, esqualeno, mogrol ou outro intermediário descrito neste documento) é produzido pelo menos em parte por fluxo metabólico através de uma via MEP, e em que a célula hospedeira tem pelo menos uma cópia de gene adicional de um ou mais dentre dxs, ispC, ispD, ispE, ispF, ispG, ispH, idi, ispA ou variantes destes modificadas.
[0056] A via MVA se refere à via biossintética que converte acetil-CoA em IPP. A via do mevalonato, que estará presente na levedura, compreende tipicamente enzimas que catalisam as seguintes etapas: (a) condensar duas moléculas de acetil-CoA em acetoacetil-CoA (por exemplo, pela ação da acetoacetil-CoA tiolase); (b) condensar acetoacetil-CoA com acetil-CoA para formar hidroximetilglutaril-CoenzimaA (HMG-CoA) (por exemplo, por ação de HMG-CoA sintase (HMGS)); (c) conversão de HMG-CoA em mevalonato (por exemplo, por ação da HMG-CoA redutase (HMGR)); (d) fosforilação do mevalonato em mevalonato 5-fosfato (por exemplo, por ação da mevalonato quinase (MK)); (e) conversão de mevalonato 5-fosfato em mevalonato 5-pirofosfato (por exemplo, por ação da fosfomevalonato quinase (PMK)); e (f) conversão de mevalonato 5- pirofosfato em isopentenil pirofosfato (por exemplo, por ação da mevalonato pirofosfato descarboxilase (MPD)). A via MVA e os genes e enzimas que constituem a via MVA são descritos na US 7,667,017, que é incorporada neste documento por referência na sua totalidade. Em algumas modalidades, a célula hospedeira expressa ou superexpressa uma ou mais de acetoacetil-CoA tiolase, HMGS, HMGR, MK, PMK e MPD ou variantes modificadas destas, o que resulta no aumento da produção de IPP e DMAPP. Em algumas modalidades, o triterpenoide (por exemplo, mogrol ou esqualeno) é produzido pelo menos em parte por fluxo metabólico através de uma via MVA, e em que a célula hospedeira tem pelo menos uma cópia de gene adicional de um ou mais de acetoacetil-CoA tiolase, HMGS, HMGR, MK, PMK, MPD ou variantes modificadas destas.
[0057] Em algumas modalidades, a célula hospedeira é uma célula hospedeira bacteriana manipulada para aumentar a produção de IPP e DMAPP a partir da glicose, conforme descrito na US 2018/0245103 e US 2018/0216137, cujos conteúdos são incorporados neste documento por referência em sua totalidade. Por exemplo, em algumas modalidades, a célula hospedeira superexpressa enzimas da via MEP, com expressão equilibrada para empurrar/puxar o fluxo de carbono para IPP e DMAP. Em algumas modalidades, a célula hospedeira é manipulada para aumentar a disponibilidade ou atividade das proteínas do cluster Fe-S, de modo a suportar uma atividade mais elevada de IspG e IspH, que são enzimas Fe- S. Em alguns aspectos, a célula hospedeira é manipulada para superexpressar IspG e IspH, de modo a fornecer um aumento do fluxo de carbono para o intermediário 1-hidroxi-2-metil-2-(E)-butenil-4-difosfato (HMBPP), mas com expressão equilibrada para evitar o acúmulo de HMBPP em uma quantidade que reduz o crescimento ou viabilidade celular, ou em uma quantidade que inibe o fluxo de via MEP e/ou a produção de terpenoides. Em algumas modalidades, a célula hospedeira exibe maior atividade de IspH em relação a IspG. Em algumas modalidades, a célula hospedeira é manipulada para regular negativamente a via de biossíntese da ubiquinona, por exemplo, reduzindo a expressão ou atividade de IspB, que usa substrato IPP e FPP.
[0058] Em várias modalidades, a célula hospedeira expressa uma ou mais enzimas que produzem mogrol a partir do esqualeno. Por exemplo, a célula hospedeira pode expressar um ou mais dentre esqualeno epoxidase (SQE), cucurbitadienol sintase (CDS), epóxido hidrolase (EPH), citocromo P450 oxidases (CYP450), oxigenases não heme dependentes de ferro e citocromo P450 reductases (CPR). Conforme mostrado na FIGURA 2, a via heteróloga pode prosseguir por várias rotas para o mogrol, que pode envolver uma ou duas epoxidações do substrato central. Em algumas modalidades, a via prossegue através do cucurbitadienol e, em algumas modalidades, não envolve uma etapa de epoxidação adicional. Em algumas modalidades, um ou mais dentre SQE, CDS, EPH, CYP450, oxigenases não heme dependentes de ferro, flavodoxina redutases (FPR), ferredoxina redutases (FDXR) e enzimas CPR são manipuladas para aumentar o fluxo para mogrol.
[0059] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma esqualeno epoxidase (SQE). Por exemplo, a via de enzima heteróloga pode compreender um SQE que produz 2,3-oxidosqualeno (intermediário (3) na FIGURA 2). Em algumas modalidades, a SQE produzirá 22,23-dioxidosqualeno (intermediário (4) na FIGURA 2). Por exemplo, a esqualeno epoxidase pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a qualquer uma das SEQ ID NOS: 17 a 39, 168-170.
[0060] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 39. Em algumas modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 39, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, MlSQE teve boa atividade em E. coli. Além disso, quando coexpresso com AaSQS, foram observados altos níveis do produto epoxilado único (2,3-oxidosqualeno). Consequentemente, a coexpressão de AaSQS (ou um derivado manipulado) com MlSQE (ou um derivado manipulado) tem um bom potencial para biomanipulação da via de mogrol. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima SQE na célula microbiana ou para aumentar a produtividade da enzima.
[0061] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a esqualeno epoxidase endossimbionte de Bathymodiolus azoricus (SEQ ID NO: 168). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 168. Em algumas modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 168, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, BaESQE teve boa atividade em E. coli. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0062] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methyloprofundus sediment (SEQ ID NO: 169). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 169. Em algumas modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 169, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, MsSQE teve boa atividade em E. coli. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0063] Em algumas modalidades, a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomicrobium buryatense (SEQ ID NO: 170). Por exemplo, a SQE pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 170. Em várias modalidades, a SQE compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 170, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Conforme mostrado na FIGURA 6, MbSQE teve boa atividade em E. coli. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0064] Outras enzimas SEQ testadas não mostraram atividade em E. coli.
[0065] As modificações de aminoácidos podem ser guiadas por estruturas de enzimas disponíveis e modelos de homologia, incluindo aqueles descritos em Padyana AK, et al., Structure and inhibition mechanism of the catalytic domain of human squalene epoxidase, Nat. Com. (2019) Vol. 10 (97): 1-10; ou Ruckenstulh et al., Structure-Function Correlations of Two Highly Conserved Motifs in Saccharomyces cerevisiae Squalene Epoxidase, Antimicrob. Agentes e Chemo. (2008) Vol. 52(4): 1496-1499. A FIGURA 12 mostra um alinhamento de HsSQE e MlSEQ, que é útil para guiar a manipulação das enzimas para expressão, estabilidade e produtividade em células hospedeiras microbianas. As duas enzimas têm 35% de identidade.
[0066] Em várias modalidades, a via de enzima heteróloga compreende ainda uma triterpeno ciclase. Em algumas modalidades, onde a célula microbiana coexpressa FPPS, SQS, SQE e a triterpeno ciclase, a célula microbiana produz cucurbitadienol (composto (9) na FIGURA 2). O cucurbitadienol pode ser o substrato para enzimas a jusante na via heteróloga ou é, alternativamente, recuperado da cultura (seja de células microbianas, ou dos meios de cultura ou camada orgânica).
[0067] Em algumas modalidades, a triterpeno ciclase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 40 a 55. Em algumas modalidades, a triterpeno ciclase tem atividade de cucurbitadienol sintetase (CDS). A CDS em várias modalidades compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos de SEQ ID NO: 40 e pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 40. Por exemplo, CDS pode compreender uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos ou tendo de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 40, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0068] As modificações de aminoácidos podem ser guiadas por estruturas de enzimas disponíveis e modelos de homologia, incluindo aqueles descritos em Itkin M., et al., The biosynthetic pathway of the nonsugar, high-intensity sweetener mogroside V from Siraitia grosvenorii, PNAS (2016) Vol 113( 47): E7619-E7628. Por exemplo, a CDS pode ser modelada usando a estrutura da lanosterol sintase humana (oxidosqualeno ciclase) (PDB 1W6K).
[0069] Em algumas modalidades, a via de enzima heteróloga compreende ainda um epóxido hidrolase (EPH). A EPH pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos selecionada das SEQ ID NOS: 56 a 72. Em algumas modalidades, a EPH pode empregar como substrato 24,25-epoxicucurbitadienol (intermediário (5) da FIGURA 2), para a produção de 24,25-di-hidroxicucurbitadienol (intermediário (6) da FIGURA 2). Em algumas modalidades, a EPH compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 56 a 72. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima.
[0070] Em algumas modalidades, a via heteróloga compreende ainda uma ou mais oxidases. A uma ou mais oxidases podem ser ativas em cucurbitadienol ou produtos oxigenados deste como um substrato, adicionando (coletivamente) hidroxilações em C11, C24 e 25, produzindo assim mogrol (ver FIGURA 2).
[0071] Em algumas modalidades, pelo menos uma oxidase é uma enzima do citocromo P450. Enzimas do citocromo P450 exemplares compreendem uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos selecionada das SEQ ID NOS: 73 a 91. Em algumas modalidades, pelo menos uma enzima P450 compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 73 a 91.
[0072] Em algumas modalidades, particularmente nas modalidades em que a célula microbiana é uma bactéria, a CYP450 e/ou CPR é modificada conforme descrito na US 2018/0251738, cujos conteúdos são incorporados neste documento por referência em sua totalidade. Por exemplo, em algumas modalidades, a enzima CYP450 tem uma deleção de toda ou parte da região transmembranar P450 N- terminal do tipo selvagem e a adição de um domínio transmembranar derivado de uma E. coli ou membrana bacteriana interna, proteína citoplasmática C-terminal. Em algumas modalidades, o domínio transmembranar é um domínio transmembranar de passagem única. Em algumas modalidades, o domínio transmembrana é um domínio transmembrana de múltiplas passagens (por exemplo, 2, 3 ou mais hélices transmembranares).
[0073] Em algumas modalidades, pelo menos uma oxidase é uma oxidase de ferro não heme. Oxidases de ferro não heme exemplares compreendem uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada das SEQ ID NOS: 100 a 115. Em algumas modalidades, a oxidase de ferro não heme compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 100 a
115.
[0074] Em várias modalidades, a célula hospedeira microbiana expressa uma ou mais proteínas de transferência de elétrons selecionadas de uma citocromo P450 redutase (CPR), flavodoxina redutase (FPR) e ferredoxina redutase (FDXR) suficiente para regenerar uma ou mais oxidases. Proteínas CPR exemplares são fornecidas neste documento como SEQ ID NOS: 92 a 99.
[0075] Em várias modalidades, a via de enzima heteróloga produz mogrol, que pode ser um intermediário para enzimas a jusante na via heteróloga ou, em algumas modalidades, é recuperado da cultura. O mogrol pode ser recuperado das células hospedeiras em algumas modalidades ou, em algumas modalidades, pode ser recuperado dos meios de cultura ou da camada orgânica.
[0076] Em algumas modalidades, a via de enzima heteróloga compreende ainda uma ou mais enzimas glicosiltransferases dependentes de difosfato de uridina (UGT), produzindo assim um ou mais glicosídeos de mogrol (ou "mogrosídeos"). O glicosídeo de mogrol pode ser pentaglicosilado ou hexaglicosilado em algumas modalidades. Em outras modalidades, o glicosídeo de mogrol tem duas, três ou quatro glicosilações. O um ou mais glicosídeos de mogrol podem ser selecionados de Mog. II-E, Mog. III-A-2, Mog. III-E, Mog. IIIx, Mog. IV-A, Mog. IV-E, Siamenosídeo, Isomog. IV e Mog. V. Em algumas modalidades, o mogrosídeo é um mogrosídeo pentaglicosilado ou hexaglicosilado. Em algumas modalidades, o um ou mais glicosídeos de mogrol incluem Mog. VI, Isomog. V e Mog. V. Em algumas modalidades, a célula hospedeira produz Mog. V.
[0077] Em algumas modalidades, a célula hospedeira expressa uma enzima UGT que catalisa a glicosilação primária de mogrol em grupos hidroxila C24 e/ou C3. Em algumas modalidades, a enzima UGT catalisa glicosilações de ramificação beta 1,2 e/ou beta 1,6 de glicosídeos de mogrol nos grupos gluscosil C3 e C24 primários. Em algumas modalidades, a enzima UGT catalisa glicosilação de beta 1,2 Mog IV-A, glicosilação beta 1,6 de Mog. IV e/ou glicosilação beta 1,6 de Siamenoside para Mog. V. Em algumas modalidades, a enzima UGT catalisa a glicosilação beta 1,6 de Mog. V para Mog. VI. Em algumas modalidades, a enzima UGT catalisa a glicosilação beta 1,4 de Siamenosídeo e/ou a glicosilação beta 1,6 de Isomog. IV para Isomog. V,
[0078] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada de SEQ ID NOS: 116 a 165. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma das SEQ ID NOS: 116 a
165. Por exemplo, em algumas modalidades, a célula microbiana expressa pelo menos quatro enzimas UGT, resultando na glicosilação de mogrol no grupo hidroxila C3, o grupo hidroxila C24, bem como uma glicosilação 1,6 adicional no grupo glicosil C3, e uma glicosilação 1,6 adicional e uma glicosilação 1,2 adicional no grupo glicosil C24. O produto de tais reações de glicosilação é Mog. V (FIGURA 4).
[0079] Por exemplo, pelo menos uma enzima UGT expressa pela célula microbiana pode compreender uma sequência de aminoácidos que é pelo menos 70% idêntica a UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165). UGT85C1, e derivados destas, fornecem glicosilação da hidroxila C3 de mogrol ou Mog. 1A. Outras reações de glicosiltransferase detectadas para UGT85C1 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT pode compreender uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 165. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 165, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0080] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146). UGT85C2, e derivados destas, fornecem glicosilação da hidroxila C24 de mogrol ou Mog. 1E. Outras reações de glicosiltransferase detectadas para UGT85C2 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 146. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 146, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0081] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (CaUGT_1,6) (SEQ ID NO: 164). CaUGT_1,6, e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3. Outras reações de glicosiltransferase detectadas para CaUGT_1,6 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 164. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 164, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0082] Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT94-289-3 de Siraitia grosvenorii(SEQ ID NO: 117). UGT94-289-3 ("Sg94_3"), e derivados destas, fornecem glicosilação beta 1,6 adicional nos grupos glicosil C24 e C3, bem como glicosilação beta 1,2 no grupo glicosil C24. Reações de glicosiltransferase detectadas para Sg94_3 são mostradas na FIGURA 4. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos pelo menos 99% idêntica à SEQ ID NO: 117. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 117, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos.
[0083] Em algumas modalidades, a célula microbiana expressa pelo menos uma enzima UGT capaz de catalisar a adição de beta 1,2 de uma molécula de glicose pelo menos ao grupo glicosil C24 (por exemplo, de Mog. IVA, ver FIGURA 4). Enzimas UGT exemplares de acordo com estas modalidades incluem UGT94- 289-3 de Siraitia grosvenorii (SEQ ID NO: 117), UGT91D1 de Stevia rebaudiana (SEQ ID NO: 147), UGT91D2 de Stevia rebaudiana (SEQ ID NO: 148), UGT91D2e de Stevia rebaudiana (SEQ ID NO: 149), OsUGT1-2 (SEQ ID NO: 150) ou MbUGT1-2 (SEQ ID NO: 163) ou derivados destas. Derivados incluem enzimas que compreendem a sequência de aminoácidos que são pelo menos 70% idênticas a uma ou mais das SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163. Em algumas modalidades, a enzima UGT que catalisa a adição de beta 1,2 de uma molécula de glicose a pelo menos o grupo glicosil C24 compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica a uma ou mais das SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO:
163. Em algumas modalidades, pelo menos uma enzima UGT compreende uma sequência de aminoácidos com 1 a 20 modificações de aminoácidos ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Modificações de aminoácidos podem ser feitas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos.
[0084] Em algumas modalidades, pelo menos uma enzima UGT é um permutante circular de uma enzima UGT de tipo selvagem, opcionalmente com substituições, deleções e/ou inserções de aminoácidos em relação à posição correspondente da enzima de tipo selvagem. Os permutantes circulares podem fornecer novas e desejáveis especificidades de substrato, perfis de produto e cinética de reação sobre as enzimas de tipo selvagem. Um permutante circular retém a mesma dobra básica da enzima parental, mas tem uma posição diferente do terminal N (por exemplo, "sítio de corte"), com os terminais N e C originais conectados, opcionalmente por uma sequência de ligação. Por exemplo, nos permutantes circulares, a metionina N-terminal está posicionada em um sítio na proteína diferente do terminal N natural. Os permutantes circulares UGT são descritos na US 2017/0332673, que é incorporado neste documento por referência em sua totalidade. Em algumas modalidades, pelo menos uma enzima UTG é um permutante circular de SEQ ID NO: 146, SEQ ID NO: 164 ou SEQ ID NO: 165, SEQ ID NO: 117, SEQ ID NO: 147, SEQ ID NO: 148, SEQ ID NO: 149, SEQ ID NO: 150 e SEQ ID NO: 163. Em algumas modalidades, o permutante circular possui ainda uma ou mais modificações de aminoácidos (por exemplo, substituições, deleções e/ou inserções de aminoácidos) em relação à enzima UGT parental. Nessas modalidades, o permutante circular terá pelo menos cerca de 70%, ou pelo menos cerca de 80%, ou pelo menos cerca de 90%, ou pelo menos cerca de 95%, ou pelo menos cerca de 98% de identidade com a enzima parental, quando as sequências de aminoácidos correspondentes são alinhadas (isto é, sem levar em conta o novo terminal N do permutante circular).
[0085] Em algumas modalidades, a via de enzima heteróloga compreende três ou quatro enzimas UGT. Uma primeira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165) (ou derivado desta conforme descrito acima), ou compreende uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 165 ou derivado deste (conforme descrito acima). Uma segunda enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146) (ou derivado conforme descrito acima), ou compreende uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 146 (ou derivado conforme descrito acima). Uma terceira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT94-289-3 de Siraitia grosvenorri (SEQ ID NO: 117) (ou derivado ou permutante circular conforme descrito acima). Em algumas modalidades, UGT94- 289-3 é substituída por outra enzima UGT capaz de atividade de beta 1,2 glicosiltransferase (conforme descrito acima), juntamente com uma quarta enzima UGT. A quarta enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a CaUGT_1,6 (SEQ ID NO: 164) (ou derivado conforme descrito acima), ou compreende uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 164 (ou derivado conforme descrito acima). A expressão dessas enzimas na célula hospedeira converte mogrol em produtos predominantemente tetra e pentaglicosilados, incluindo Mog. V. Ver FIGURA 4, FIGURA 8, FIGURA 9.
[0086] Em algumas modalidades, a célula hospedeira microbiana tem uma ou mais modificações genéticas que aumentam a produção de UDP-glicose, o cofator empregado pelas enzimas UGT. Essas modificações genéticas podem incluir um ou mais, ou dois ou mais (ou todos) dentre ΔgalE, ΔgalT, ΔgalK, ΔgalM, ΔushA, Δagp, Δpgm, duplicação de GALU de E coli, expressão de UGPA de Bacillus subtillus e expressão de SPL de Bifidobacterium adolescentis.
[0087] Os glicosídeos de mogrol podem ser recuperados da cultura microbiana. Por exemplo, os glicosídeos de mogrol podem ser recuperados de células microbianas ou, em algumas modalidades, são predominantemente transportados para o meio extracelular, onde podem ser recuperados ou sequestrados.
[0088] Em alguns aspectos, a invenção fornece um método para produzir um mogrosídeo pentaglicosilado ou hexaglicosilado. Em algumas modalidades, o mogrosídeo é Mog V. Em várias modalidades, a invenção compreende a reação de um glicosídeo de mogrol com uma pluralidade de enzimas glicosiltransferases dependentes de difosfato de uridina (UGT). Por exemplo, em algumas modalidades, uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SEQ ID NO: 164, onde a enzima UGT catalisa a adição de beta 1,6 de uma glicose. Alternativamente, a enzima UGT compreende uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 164 ou um derivado desta (descrito acima).
[0089] Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 164. Em algumas modalidades, a enzima UGT pode compreender uma sequência de aminoácidos com 1 a 20 ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 164, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos. Em algumas modalidades, a enzima UGT é um permutante circular de SEQ ID NO: 164 ou um derivado desta. Modificações de aminoácidos podem ser produzidas para aumentar a expressão ou estabilidade da enzima na célula microbiana ou para aumentar a produtividade da enzima para substratos específicos de mogrosídeo, tal como Mog. IV ou Siamenosídeo.
[0090] Outras enzimas UGT serão coexpressas para glicosilar o substrato desejado em Mog. V.
[0091] Em algumas modalidades, o substrato de glicosídeo de mogrol compreende Mog. IIE. Em algumas modalidades, Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade com UGT85C1 (SEQ ID NO: 165), ou um permutante circular compreendendo uma sequência de aminoácidos que é um permutante circular de SEQ ID NO: 165, incluindo derivados de UGT85C1 ou permutantes circulares conforme descrito. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 165. Por exemplo, a enzima UGT pode compreender uma sequência de aminoácidos com 1 a 20 ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 165, as modificações de aminoácidos sendo independentemente selecionadas a partir de substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 165.
[0092] Em algumas modalidades, Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IA ou Mog, IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade à UGT85C2 (SEQ ID NO: 146), ou um derivado ou permutante circular de UGT85C2 conforme descrito neste documento. Em algumas modalidades, a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 146. Por exemplo, a enzima UGT pode compreender uma sequência de aminoácidos com 1 a 20 ou de 1 a 10 modificações de aminoácidos em relação à SEQ ID NO: 146, as modificações de aminoácidos sendo independentemente selecionadas de substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 146.
[0093] Em algumas modalidades, o mogrol reage com cerca de quatro enzimas UGT. Uma primeira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou um derivado de permutante circular conforme descrito. Uma segunda enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou um derivado ou permutante circular conforme descrito. Uma terceira enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou um derivado ou permutante circular conforme descrito. Uma quarta enzima UGT é capaz de catalisar a adição de beta 1,2 de uma molécula de glicose, como SgUGT94_289_3 (SEQ ID NO: 117) ou um derivado ou permutante circular conforme descrito.
[0094] O glicosídeo de mogrol pode ser recuperado e/ou purificado da reação ou cultura. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
[0095] Em várias modalidades, a reação é realizada em uma célula microbiana e as enzimas UGT são expressas de forma recombinante na célula. Em algumas modalidades, o mogrol é produzido na célula por uma via de síntese de mogrol heteróloga, conforme descrito neste documento. Em outras modalidades, os glicosídeos de mogrol ou mogrol são alimentados às células para glicosilação. Em ainda outras modalidades, a reação é realizada in vitro usando enzima UGT purificada, enzima UGT parcialmente purificada ou lisados de células recombinantes.
[0096] Conforme descrito neste documento, a célula hospedeira microbiana pode ser procariótica ou eucariótica e é opcionalmente uma bactéria selecionada de Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida. Em algumas modalidades, a célula microbiana é uma levedura selecionada de uma espécie de Saccharomyces, Pichiaou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastorise Yarrowia lipolytica. Em algumas modalidades, a célula hospedeira microbiana é E. coli.
[0097] A célula hospedeira bacteriana é cultivada para produzir o produto triterpenoide (por exemplo, mogrosídeo). Em algumas modalidades, substratos de carbono, como substratos de carbono C1, C2, C3, C4, C5 e/ou C6, são empregados para a fase de produção. Em modalidades exemplificativas, a fonte de carbono é glicose, sacarose, frutose, xilose e/ou glicerol. As condições de cultura são geralmente selecionadas dentre aeróbica, microaeróbica e anaeróbica.
[0098] Em várias modalidades, a célula hospedeira bacteriana pode ser cultivada a uma temperatura entre 22° C e 37° C. Enquanto a biossíntese comercial em bactérias tais como E. coli pode ser limitada pela temperatura na qual as enzimas superexpressas e/ou exóticas (por exemplo, enzimas derivadas das plantas) ficam estáveis, enzimas recombinantes podem ser manipuladas para permitir que as culturas sejam mantidas em temperaturas mais altas, resultando em maiores rendimentos e maior produtividade geral. Em algumas modalidades, a cultura é conduzida a cerca de 22°C ou mais, cerca de 23°C ou mais, cerca de 24°C ou mais, cerca de 25°C ou mais, cerca de 26°C ou mais, cerca de 27°C ou mais, cerca de 28°C ou mais, cerca de 29°C ou mais, cerca de 30°C ou mais, cerca de 31°C ou mais, cerca de 32°C ou mais, cerca de 33°C ou mais, cerca de 34°C ou mais, cerca de 35° C ou mais, cerca de 36°C ou mais, ou cerca de 37°C.
[0099] Em algumas modalidades, as células hospedeiras bacterianas são ainda adequadas para produção comercial, à escala comercial. Em algumas modalidades, o tamanho da cultura é de pelo menos cerca de 100 L, pelo menos cerca de 200 L, pelo menos cerca de 500 L, pelo menos cerca de 1,000 L, ou pelo menos cerca de 10,000 L, ou pelo menos cerca de 100,000 L, ou pelo menos cerca de 500,000 L, ou pelo menos cerca de 600,000 L. Em uma modalidade, a cultura pode ser conduzida em cultura descontínua, cultura contínua ou cultura semicontínua.
[0100] Em várias modalidades, os métodos incluem ainda recuperar o produto da cultura de células ou dos lisados celulares. Em algumas modalidades, a cultura produz pelo menos cerca de 100 mg/L, ou pelo menos cerca de 200 mg/L,
ou pelo menos cerca de 500 mg/L, ou pelo menos cerca de 1 g/L, ou pelo menos cerca de 2 g/L, ou pelo menos cerca de 5 g/L, ou pelo menos cerca de 10 g/L, ou pelo menos cerca de 20 g/L, ou pelo menos cerca de 30 g/L, ou pelo menos cerca de 40 g/L do terpenoide ou produto de glicosídeo de terpenoide.
[0101] Em algumas modalidades, a produção de indol (incluindo indol prenilado) é utilizada como marcador substituto para a produção de terpenoides e/ou a acumulação de indol na cultura é controlada para aumentar a produção. Por exemplo, em várias modalidades, a acumulação de indol na cultura é controlada abaixo de cerca de 100 mg/L, ou abaixo de cerca de 75 mg/L, ou abaixo de cerca de 50 mg/L, ou abaixo de cerca de 25 mg/L, ou abaixo 10 mg/L. A acumulação de indol pode ser controlada equilibrando a expressão e a atividade da proteína utilizando a abordagem modular multivariada conforme descrito na Pat. U.S. Nº 8,927,241 (que é incorporado neste documento por referência), e/ou é controlado por meios químicos.
[0102] Outros marcadores para produção eficiente de terpenos e terpenoides, incluem o acúmulo de DOX ou ME no meio de cultura. Geralmente, as cepas bacterianas podem ser manipuladas para acumularem menos destas espécies químicas, que se acumulam na cultura a menos do que cerca de 5 g/L, ou menos de cerca de 4 g/L, ou menos de cerca de 3 g/L, ou menos de cerca de 2 g/L ou menos de cerca de 1 g/L, ou menos de cerca de 500 mg/L, ou menos de cerca de 100 mg/L.
[0103] Não se espera que a otimização da produção de terpenos ou terpenoides pela manipulação dos genes da via MEP, bem como a manipulação das vias a montante e a jusante, seja um processo linear ou aditivo simples. Em vez disso, por meio de análise combinatória, a otimização é obtida por meio do equilíbrio de componentes da via MEP, bem como pelas vias a montante e a jusante. O acúmulo de indol (incluindo o indol prenilado) e o acúmulo de metabólito MEP (por exemplo, DOX, ME, MEcPP e / ou farnesol) na cultura podem ser usados como marcadores substitutos para guiar esse processo.
[0104] Por exemplo, em algumas modalidades, a estirpe bacteriana tem pelo menos uma cópia adicional de dxs e idi expressa como um operon/módulo; ou dxs, ispD, ispF e idi expressos como um operon ou módulo (ou em um plasmídeo ou integrado no genoma), com complementação adicional da via MEP descrita neste documento para melhorar o carbono MEP. Por exemplo, a cepa bacteriana pode ter uma cópia adicional de dxr e ispG e/ou ispH, opcionalmente com uma cópia adicional de ispE e/ou idi, com expressões desses genes sintonizadas para aumentar carbono MEP e/ou melhorar a titulação de terpeno ou terpenoide. Em várias modalidades, a cepa bacteriana tem uma cópia adicional de pelo menos dxr, ispE, ispG e ispH, opcionalmente com uma cópia adicional de idi, com expressões destes genes sintonizadas para aumentar o carbono MEP e/ou melhorar a titulação de terpeno ou terpenoide.
[0105] Manipulação da expressão de genes e/ou proteínas, incluindo módulos genéticos, pode ser conseguida através de vários métodos. Por exemplo, a expressão dos genes ou operações pode ser regulada através da seleção de promotores, tais como promotores induzíveis ou constitutivos, com diferentes intensidades (por exemplo, forte, intermediário ou fraco). Vários exemplos não- limitativos de promotores de diferentes intensidades incluem Trc, T5 e T7. Adicionalmente, a expressão de genes ou operações pode ser regulada através da manipulação do número de cópias do gene ou operon na célula. Em algumas modalidades, a expressão de genes ou operons pode ser regulada através da manipulação da ordem dos genes dentro de um módulo, em que os genes transcritos em primeiro lugar são geralmente expressos a um nível superior. Em algumas modalidades, a expressão de genes ou operons é regulada através da integração de um ou mais genes ou operons no cromossomo.
[0106] A otimização da expressão proteica também pode ser alcançada através da seleção de promotores apropriados e sítios de ligação ribossômicos. Em algumas modalidades, isto pode incluir a seleção de plasmídeos com elevado número de cópias, ou plasmídeos com número único, baixo ou médio de cópia. A etapa de terminação da transcrição também pode ser direcionada para a regulação da expressão gênica, através da introdução ou eliminação de estruturas tais como haste-alças.
[0107] Os vectores de expressão contendo todos os elementos necessários para a expressão estão disponíveis comercialmente e são conhecidos dos versados na técnica. Ver, por exemplo, Sambrook et al., Molecular Cloning: A
Laboratory Manual, Segunda Edição, Cold Spring Harbor Laboratory Press, 1989. As células são geneticamente manipuladas pela introdução nas células do DNA heterólogo. O DNA heterólogo é colocado sob controle operável de elementos transcricionais para permitir a expressão do DNA heterólogo na célula hospedeira.
[0108] Em algumas modalidades, os genes endógenos são editados, em vez de passar por complementação gênica. A edição pode modificar os promotores endógenos, as sequências de ligação ribossomal ou outras sequências de controle da expressão, e/ou, em algumas modalidades, modifica os fatores de ação trans e/ou cis na regulação do gene. A edição de genoma pode ser feita usando técnicas de edição de genoma CRISPR/Cas, ou técnicas similares empregando nucleases de dedo de zinco e TALENs. Em algumas modalidades, os genes endógenos são substituídos por recombinação homóloga.
[0109] Em algumas modalidades, os genes são superexpressos, pelo menos em parte, pelo controle do número de cópias do gene. Embora o número de cópias de genes possa ser convenientemente controlado utilizando plasmídeos com número de cópias variável, a duplicação de genes e a integração cromossômica podem também ser empregadas. Por exemplo, um processo para duplicação de genes em série geneticamente estável é descrito na US 2011/0236927, que é incorporada neste documento por referência na sua totalidade.
[0110] O terpeno ou produto terpeno pode ser recuperado por qualquer processo adequado, incluindo a partição do produto desejado numa fase orgânica ou fase hidrofóbica. Alternativamente, a fase aquosa pode ser recuperada, e/ou toda a biomassa celular pode ser recuperada, para posterior processamento. A produção do produto desejado pode ser determinada e/ou quantificada, por exemplo, por cromatografia gasosa (por exemplo, GC-MS). O produto desejado pode ser produzido em sistemas de biorreatores contínuos ou descontínuos. A produção do produto, recuperação e/ou análise do produto pode ser feita conforme descrito na US 2012/0246767, que é incorporada neste documento por referência na sua totalidade. Por exemplo, em algumas modalidades, o óleo de produto é extraído do meio reacional aquoso utilizando um solvente orgânico, tal como um alcano tal como heptano ou dodecano, ou óleo vegetal (por exemplo, óleo de cártamo) seguido por destilação fracionada. Em outras modalidades, o óleo de produto é extraído a partir de meio reacional aquoso utilizando uma fase hidrofóbica, tal como um óleo vegetal, seguido de extração com solvente orgânico e destilação fracionada. Os componentes terpeno e terpenoides das frações podem ser medidos quantitativamente por GC/MS, seguido por mistura de frações para gerar um perfil de produto desejado.
[0111] A semelhança das sequências de nucleotídeos e aminoácidos, isto é, a porcentagem de identidade de sequência, pode ser determinada através de alinhamentos de sequências. Esses alinhamentos podem ser realizados com vários algoritmos conhecidos na técnica, como com o algoritmo matemático de Karlin e Altschul (Karlin & Altschul (1993) Proc. Natl. Acad. Sci. EUA 90: 5873-5877), com hmmalign (HMMER package, http://hmmer.wustl.edu/) ou com o algoritmo CLUSTAL (Thompson, J.D., Higgins, D.G. & Gibson, T.J. (1994) Nucleic Acids Res. 22, 4673-80). O grau de identidade de sequência (correspondência de sequência) pode ser calculado usando, por exemplo, BLAST, BLAT ou BlastZ (ou BlastX). Um algoritmo semelhante é incorporado nos programas BLASTN e BLASTP de Altschul et al (1990) J. Mol. Biol. 215: 403-410. As pesquisas de polinucleotídeos BLAST podem ser realizadas com o programa BLASTN, pontuação = 100, comprimento da palavra = 12.
[0112] Pesquisas de proteína BLAST podem ser realizadas com o programa BLASTP, pontuação = 50, comprimento da palavra = 3. Para obter os alinhamentos com lacunas para fins de comparação, o Gapped BLAST pode ser utilizado conforme descrito em Altschul et al., (1997) Nucleic Acids Res. 25: 3389-3402. Ao utilizar os programas BLAST e Gapped BLAST, os parâmetros padrão dos respectivos programas podem ser usados. A análise de correspondência de sequências pode ser suplementada por técnicas de mapeamento de homologia estabelecidas, como os campos aleatórios de Shuffle-LAGAN (Brudno M., Bioinformatics 2003b, 19 Suppl 1: 154-162) ou Markov.
[0113] As "substituições conservativas" podem ser feitas, por exemplo, com base na semelhança em polaridade, carga, tamanho, hidrofobicidade, hidrofilicidade e/ou na natureza anfipática dos resíduos de aminoácidos envolvidos. Os 20 aminoácidos de ocorrência natural podem ser agrupados nos seguintes seis grupos padrão de aminoácidos:
(1) hidrofóbicos: Met, Ala, Val, Leu, Ile; (2) hidrofílicos neutros: Cys, Ser, Thr, Asn, Gln; (3) ácidos: Asp, Glu; (4) básicos: His, Lys, Arg; (5) resíduos que influenciam a orientação de cadeia: Gli, Pro; e (6) aromáticos: Trp, Tyr, Phe.
[0114] Como usado neste documento, “substituições conservativas” são definidas como trocas de um aminoácido por outro aminoácido listado dentro do mesmo grupo dos seis grupos de aminoácido padrão mostrados acima. Por exemplo, a troca de Asp por Glu mantém uma carga negativa no polipeptídeo assim modificado. Além disso, a glicina e a prolina podem ser substituídas entre si com base na sua capacidade de interromper as α-hélices. Algumas substituições conservativas preferidas dentro dos seis grupos acima são trocas dentro dos seguintes subgrupos: (i) Ala, Val, Leu e Ile; (ii) Ser e Thr; (ii) Asn e Gln; (iv) Lys e Arg; e (v) Tyr e Phe.
[0115] Conforme utilizado neste documento, "substituições não- conservativas" são definidas como trocas de um aminoácido por outro aminoácido listado em um grupo diferente dos seis grupos de aminoácidos padrão (1) a (6) mostrados acima.
[0116] Modificações de enzimas conforme descritas neste documento podem incluir mutações conservativas e/ou não-conservativas.
[0117] Em algumas modalidades, o "design racional" está envolvido na construção de mutações específicas em enzimas. Design racional refere-se à incorporação do conhecimento da enzima, ou enzimas relacionadas, tais como a termodinâmica e cinética da reação, sua estrutura tridimensional, seu(s) local(is) ativo(s), seu(s) substrato(s) e / ou interação entre a enzima e o substrato, no design da mutação específica. Com base em uma abordagem de design racional, mutações podem ser criadas em uma enzima que pode então ser rastreada para aumentar a produção de um terpeno ou terpenoide em relação aos níveis de controle. Em algumas modalidades, as mutações podem ser racionalmente projetadas com base na modelagem de homologia. Conforme utilizado neste documento, "modelagem de homologia" refere-se ao processo de construção de um modelo de resolução atômica de uma proteína a partir da sua sequência de aminoácidos e de uma estrutura tridimensional de uma proteína homóloga relacionada.
[0118] Em outros aspectos, a invenção fornece um método para produzir um produto que compreende um glicosídeo de mogrol. O método compreende a produção de um glicosídeo de mogrol de acordo com esta divulgação e a incorporação do glicosídeo de mogrol em um produto. Em algumas modalidades, o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V. Em algumas modalidades, o produto é uma composição adoçante, composição aromatizante, alimento, bebida, goma de mascar, texturizante, composição farmacêutica, produto de tabaco, composição nutracêutica ou composição de higiene oral.
[0119] O produto pode ser uma composição adoçante compreendendo uma mistura de adoçantes artificiais e/ou naturais. Por exemplo, a composição pode compreender ainda um ou mais de um glicosídeo de esteviol, aspartame e neotame. Glicosídeos de esteviol exemplares compreendem um ou mais dentre RebM, RebB, RebD, RebA, RebE e RebI.
[0120] Exemplos não limitativos de sabores para os quais os produtos podem ser usados em combinação incluem sabores de lima, limão, laranja, fruta, banana, uva, pera, abacaxi, manga, amêndoa amarga, cola, canela, açúcar, algodão doce e baunilha. Exemplos não limitativos de outros ingredientes alimentares incluem aromas, acidulantes e aminoácidos, agentes corantes, agentes de volume, amidos modificados, gomas, texturizantes, conservantes, antioxidantes, emulsionantes, estabilizantes, espessantes e agentes gelificantes.
[0121] Glicosídeos de mogrol obtidos de acordo com esta invenção podem ser incorporados como um adoçante natural de alta intensidade em alimentos, bebidas, composições farmacêuticas, cosméticos, gomas de mascar, produtos de mesa, cereais, produtos lácteos, pastas de dente e outras composições para cavidade oral, etc.
[0122] Os glicosídeos de mogrol obtidos de acordo com esta invenção podem ser usados em combinação com várias substâncias fisiologicamente ativas ou ingredientes funcionais. Ingredientes funcionais geralmente são classificados em categorias como carotenoides, fibra alimentar, ácidos graxos, saponinas,
antioxidantes, nutracêuticos, flavonoides, isotiocianatos, fenóis, esteróis vegetais e estanóis (fitoesteróis e fitoestanóis); polióis; prebióticos, probióticos; fitoestrogênios; proteína de soja; sulfetos/tióis; aminoácidos; proteínas; vitaminas; e minerais. Ingredientes funcionais também podem ser classificados com base em seus benefícios à saúde, como cardiovasculares, redutores do colesterol e anti- inflamatórios.
[0123] Glicosídeos de mogrol obtidos de acordo com esta invenção podem ser aplicados como um adoçante de alta intensidade para produzir zero caloria, calorias reduzidas ou bebidas para diabéticos e produtos alimentícios com características de sabor melhoradas. Também pode ser usado em bebidas, alimentos, produtos farmacêuticos e outros produtos nos quais o açúcar não pode ser usado. Além disso, glicosídeo(s) de mogrol alvo altamente purificado(s), particularmente, Mog. V, Mog. VI, ou Isomog. V, podem ser utilizados como adoçante não apenas em bebidas, alimentos e outros produtos destinados ao consumo humano, mas também em rações e forragens com características melhoradas.
[0124] Exemplos de produtos nos quais glicosídeo(s) de mogrol podem ser usados como um composto edulcorante incluem, mas não estão limitados a, bebidas alcoólicas como vodca, vinho, cerveja, licor e saquê, etc.; sucos naturais; bebidas refrescantes; refrigerantes carbonatados; bebidas dietéticas; bebidas com zero calorias; bebidas e alimentos com calorias reduzidas; bebidas à base de iogurte; sucos instantâneos; café instantâneo; bebidas instantâneas do tipo em pó; produtos enlatados; xaropes; pasta de soja fermentada; molho de soja; vinagre; molhos; maionese; ketchups; curry; sopa; caldo instantâneo; molho de soja em pó; vinagre em pó; tipos de biscoitos; biscoito de arroz; bolachas; pão; chocolates; caramelo; doce; goma de mascar; gelatina; pudim; frutas e vegetais em conserva; natas frescas; geleia; marmelada; pasta de flores; leite em pó; sorvete; sorbet; vegetais e frutas embalados em recipientes; feijão enlatado e cozido; carne e alimentos cozidos em molho adoçado; produtos alimentares vegetais agrícolas; frutos do mar; presunto; linguiça; presunto de peixe; salsicha de peixe; pasta de peixe; produtos de peixe frito; produtos de frutos do mar secos; produtos alimentares congelados; algas marinhas em conserva; carne em conserva; tabaco;
medicamentos; e muitos outros.
[0125] Durante a fabricação de produtos como alimentos, bebidas, produtos farmacêuticos, cosméticos, produtos de mesa e goma de mascar, os métodos convencionais, como mistura, amassamento, dissolução, decapagem, permeação, percolação, aspersão, atomização, infusão e outros métodos podem ser usados.
[0126] Conforme utilizado neste relatório descritivo e nas reivindicações anexas, as formas singulares "um", "uma" e "o(a)" incluem referentes plurais, a menos que o contexto indique claramente o contrário. Assim, por exemplo, a referência a “uma célula” inclui uma combinação de duas ou mais células e similares.
[0127] Conforme usado neste documento, o termo "cerca de" em referência a um número é geralmente considerado como incluindo números que se enquadram dentro de um intervalo de 10% em qualquer direção (maior ou menor que) do número.
[0128] Sua biossíntese de mogrosídeos no fruto envolve um número de glicosilações consecutivas do mogrol de aglicona nos produtos doces finais, incluindo mogrosídeo V (Mog. V). Mog. V tem uma capacidade adoçante que é cerca de 250 vezes a da sacarose (Kasai et al., Agric Biol Chem (1989)). Os mogrosídeos também apresentam benefícios para a saúde (Li et al., Chin J Nat Med (2014)).
[0129] Uma variedade de fatores está promovendo um aumento no interesse em mogrosídeos e da fruta-dos-monges em geral, incluindo a explosão na demanda por adoçantes naturais, as dificuldades no fornecimento escalonável do atual adoçante natural principal, rebaudiosídeo M (RebM), da planta Stevia, o desempenho de sabor superior do mogrosídeo V em relação a outros produtos adoçantes naturais e artificiais no mercado; e o potencial medicinal da planta e do fruto.
[0130] Mog. V purificado foi aprovado como um adoçante de alta intensidade no Japão (Jakinovich et al., Journal of Natural Products (1990)) e o extrato ganhou o status de GRAS nos EUA como um adoçante não nutritivo e realçador de sabor (GRAS 522). A extração de mogrosídeos do fruto pode render um produto de vários graus de pureza, muitas vezes acompanhado de gosto residual indesejável. Além disso, os rendimentos de mogrosídeo do fruto cultivado são limitados devido ao baixo rendimento das plantas e aos requisitos específicos de cultivo da planta. Os mogrosídeos estão presentes em ~1% nos frutos frescos e em ~4% nos frutos secos. Mog. V é o principal componente, com teor de 0,5% a 1,4% no fruto seco. Além disso, as dificuldades de purificação limitam a pureza de Mog. V, com produtos comerciais de extratos de plantas sendo padronizados para ~50% Mog. V. Um produto de Mog. V puro é desejável para evitar sabores estranhos e será mais fácil de formular em produtos, desde que Mog. V tenha um bom potencial de solubilidade. Portanto, é vantajoso produzir compostos doces de mogrosídeo, como Mog. V, por meio de processos biotecnológicos.
[0131] A FIGURA 1 mostra as estruturas químicas de Mog. V, Mog. VI, e Isomog. V. Mog. V tem cinco glicosilações em relação ao núcleo do mogrol, incluindo glicosilações nos grupos hidroxila C3 e C24, seguidas por adições de glicosil 1-2, 1-4 e 1-6. Essas reações de glicosilação são catalisadas por enzimas glicosiltransferase dependentes de difosfato de uridina (UGTs).
[0132] A FIGURA 2 mostra as rotas para produção de Mog. V in vivo. A transformação enzimática necessária para cada etapa é indicada, juntamente com o tipo de enzima necessária. Os números entre parênteses correspondem às estruturas químicas na FIGURA 3, nomeadamente: (1) pirofosfato de farnesila; (2) esqualeno; (3) 2,3-oxidosqualeno; (4) 2,3; 22,23-dioxidosqualeno; (5) 24,25- epoxicucurbitadienol; (6) 24,25-di-hidro-oxicucurbitadienol; (7) mogrol; (8) mogrosídeo V; (9) cucurbitadienol.
[0133] Conforme ilustrado na FIGURA 2, os mogrosídeos podem ser produzidos por processos de fermentação biossintética, usando cepas microbianas que produzem altos níveis de produtos da via MEP, juntamente com a expressão heteróloga de enzimas de biossíntese de mogrol e enzimas UGT que direcionam as reações de glicosilação a Mog. V, ou outro composto de mogrosídeo desejado. Por exemplo, em bactérias como E. coli, isopentenil pirofosfato (IPP) e dimetilalil pirofosfato (DMAPP) são produzidos a partir de glicose e são convertidos em difosfato de farnesila (FPP) (1) pela farnesil difosfato sintase recombinante (FPPS). FPP é convertido em esqualeno (2) por uma reação de condensação catalisada pela esqualeno sintase (SQS). O esqualeno é convertido em 2,3-oxidosqualeno (3) por uma reação de epoxidação catalisada por uma esqualeno epoxidase (SQE). A via pode prosseguir para 22,23-dioxidosqualeno (4) por epoxidação adicional seguida de ciclização para 24,25-epoxicucurbitadienol (5) por uma triterpeno ciclase e, em seguida, hidratação do grupo epóxi restante para 24,25-di- hidroxicucurbitadienol (6) por uma epóxido hidrolase. Uma hidroxilação adicional catalisada por uma oxidase P450 produz mogrol (7).
[0134] A via pode alternativamente prosseguir por ciclização de (3) para produzir cucurbitadienol (9), seguida por epoxidação para (5), ou hidroxilações múltiplas de cucurbitadienol para (6), ou mogrol (7).
[0135] A FIGURA 4 ilustra as rotas de glicosilação para Mog. V, e indica atividade de biotransformação in vitro observada para diferentes enzimas. A glicosilação do hidroxila C3 produz Mog. I-E, ou glicosilação da hidroxila C24 produz Mog. I-A1. Glicosilação de Mog. I-A1 em C3 ou glicosilação de Mog. I-E1 em C24 produz Mog. II-E. Glicosilação adicional 1-6 de Mog. II-E em C3 produz Mog. III-A2. Glicosilação 1-6 adicional em C24 de Mog. IIE produz Mog. III. Glicosilação 1-2 de Mog. III-A2 em C24 produz Mog. IV e depois para Mog. V com uma glicosilação 1- 6 adicional em C24. Alternativamente, as glicosilações podem prosseguir através de Mog. III, com glicosilação 1-6 em C3 e glicosilação 1-2 em C24, ou através de Siamenosídeo ou Mog. IV com glicosilações 1-6.
[0136] Embora as enzimas biossintéticas da fruta-dos-monges (Siraitia grosvenorii) tenham sido identificadas para a produção de mogrol (Ver WO 2016/038617 e US 2015/0322473, que são incorporados neste documento por referência em sua totalidade), muitas dessas enzimas não possuem a produtividade ou propriedades físicas desejadas para superexpressão em hospedeiros microbianos, particularmente para abordagens de fermentação que operam em temperaturas mais altas do que o clima natural da planta. Consequentemente, enzimas alternativas são desejadas para melhorar a produção de mogrol usando fermentação microbiana, com mogrol atuando como o substrato para a glicosilação para produzir Mog. V.
[0137] Usando uma cepa de E. coli que produz altos níveis dos produtos IPP e DMAPP da via MEP (ver US 2018/0245103 e US 2018/0216137, que são incorporados neste documento por referência), e com superexpressão de ScFPPS, as enzimas foram triadas quanto à sua capacidade de converter FPP em esqualeno (atividade de SQS), bem como a epoxidação de esqualeno para produzir 2,3- oxidosqualeno (atividade de SQE). O intermediário 2,3-oxidosqualeno pode ser ciclizado por uma triterpeno ciclase, como o CDS de Siraitia grosvenorii. Conforme demonstrado na FIGURA 5, várias enzimas foram identificadas com boa atividade em E. coli. Isso inclui AaSQS, SgSQS, EsSQS, BbSQS, ElSQS e FbSQS. Em particular, AaSQS mostrou alta atividade em E. coli em condições de cultura de 37 ° C.
[0138] Conforme mostrado na FIGURA 6, a coexpressão de SQS de Artemisia annua e MlSQE de Methylomonas lenta em E. coli forneceu um ganho substancial na titulação do intermediário 2,3-oxidosqualeno. Outras enzimas SQE estavam ativas em E. coli, incluindo BaESQE, MsSQE e MbSQE.
[0139] A FIGURA 7 mostra a coexpressão das enzimas SQS, SQE e TTC. CDS de Siraitia grosvernorii (ou triterpeno ciclase, ou “TTC”), quando coexpressa com AaSQS e MlSQE, resultou em alta produção do produto triterpenoide, cucurbitadienol (Produto 3). Esses experimentos de fermentação foram realizados a 37° C por 48 a 120 horas.
[0140] Mogrol foi usado como substrato para reações de glicosilação in vitro com enzimas UGT candidatas, para identificar enzimas candidatas que fornecem glicosilação eficiente de mogrol para Mog. V. As reações foram realizadas em tampão Tris-HCl a 50 mM (pH 7,0) contendo beta-mercaptoetanol (5 mM), cloreto de magnésio (400 uM), substrato (200 uM), UDP-glicose (5 mM) e uma fosfatase (1 U). Os resultados são mostrados na FIGURA 8A. O produto de Mog. V é observado quando as enzimas UGT 85C1 (S. rebaudiana), 85C2 (S. rebaudiana) e UGTSg94_3 são incubadas juntas. Um produto penta-glicosilado é formado quando as enzimas UGT 85C1 (S. rebaudiana), 85C2 (S. rebaudiana) e CaUGT_1,6 são incubadas juntas. FIGURA 8B, Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V+H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrosídeo II-E. FIGURA 8C, Cromatograma de íons extraídos (EIC) para 1285,4 Da (mogrosídeo V+H) de reações contendo 85C1 + 85C2 e Sg94_3 (linha cinza escuro sólido) ou CaUGT_1,6 (linha cinza claro) quando incubado com mogrol. Abreviatura: MogV, mogrosídeo V.
[0141] A FIGURA 4 e a FIGURA 9 mostram atividades de glicosiltransferase adicionais observadas em substratos específicos. A coexpressão de enzimas UGT pode ser selecionada para mover o produto para qualquer produto mogrosídeo desejado.
[0142] A FIGURA 10 é um alinhamento de aminoácidos de CaUGT_1,6 e SgUGT94_289_3 usando Clustal Omega (Versão CLUSTAL O (1,2,4). Essas sequências compartilham 54% de identidade de aminoácido. Prevê-se que a UGT_1,6 de Coffea arabica seja uma semelhante a beta-D-glicosil crocetina beta 1,6-glicosiltransferase (XP_027096357.1). Juntamente com estruturas UGT conhecidas e sequências primárias, CaUGT_1,6 pode ser adicionalmente manipulada para expressão e atividade microbiana, incluindo a manipulação de um permutante circular.
[0143] As enzimas de biossíntese podem ser adicionalmente manipulada para expressão e atividade em células microbianas, usando estruturas conhecidas e sequências primárias. A FIGURA 11 é um alinhamento de aminoácidos de esqualeno sintase (HsSQS) de Homo sapiens (acesso NCBI NP_004453.3) e AaSQS (SEQ ID NO: 11) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQS tem uma estrutura de cristal publicada (entrada PDB: 1EZF). Essas sequências compartilham 42% de identidade de aminoácido. A FIGURA 12 é um alinhamento de aminoácidos de esqualeno epoxidase (HsSQE) de Homo sapiens (acesso NCBI XP_011515548) e MlSQE (SEQ ID NO: 39) usando Clustal Omega (Versão CLUSTAL O (1.2.4)). HsSQE tem uma estrutura de cristal publicada (entrada PDB: 6C6N). Essas sequências compartilham 35% de identidade de aminoácido.
SEQUÊNCIAS Farnesil Pirofosfato Sintase (FPPS) Saccharomyces cerevisiae FPPS (SEQ ID NO: 1)
SRGFKADVLTAFLNKVYKRSK Esqualeno Sintase (SQS) Siraitia grosvenorii SQSa (SEQ ID NO: 2)
PMFNPTLIVILFSLLCIILAYLSAKRLPANQPV Siraitia grosvenorii SQSb (SEQ ID NO: 3)
PMFNPTLIVILFSLLCIILAYLSAKRLPANQPV Cucumis sativus (SEQ ID NO: 4)
Cucumis melo (SEQ ID NO: 5)
EPMYNPAVIVILFSLLCIILAYLSAKRLPANQSV Cucumis melo (SEQ ID NO: 6)
EPMYNPAVIVILFSLLCIILAYLSAKRLPANQSV Cucurbita moschata (SEQ ID NO: 7)
PMCNPAAIVVLFSLLCIILAYLSAKLLPANQPV Sechium edule (SEQ ID NO: 8)
PLFNPAVLVILFSLICILLAYLSAKRLPANQPV Panax quinquefolius (SEQ ID NO: 9)
ESGHNSALIAIIFIILAILYAYLSSNLLLNKQ Malus domestica (SEQ ID NO: 10)
QSYNSTLIVALFIILAIIYAYLSASPRI Artemisia annua (SEQ ID NO: 11)
SAALLALLFTILAILYAYLSANRPNKIKFTL Glycine soja (SEQ ID NO: 12)
STMIVILVIMVSIIFAYLSANHHNS Diospyros kaki (SEQ ID NO: 13)
THNSTLIFVLFIILAILFAYLSANRPPINM Euphorbia lathyris (SEQ ID NO: 14)
PYNSTMVILLMIVLAIILAYLSKRAN Camellia oleifera (SEQ ID NO: 15)
KSYIIKSEPRYNSTLVFVLFIILAILFAYL Eleutherococcus senticosus (SEQ ID NO: 16)
SAHNSALIAIIFIILAILYAYLSSNLPNNQ Flavobacteriales bacterium (SEQ ID NO: 166)
MDEVIKVYKDMLLVIESKISSDNNPVSAETIQLLKQIREYFNDETLIVRKIA Bacteroidetes bacterium (SEQ ID NO: 167)
MDEVIKVYKGLLLDIENKIPLHNPTSDETLRLIKNIRSYCNNETMVVSKTA Esqualeno Epoxidase Siraitia grosvenorii SQE1 (SEQ ID NO: 17)
SGIIFPIIRAEGVRQMFFPATVPAYYRSPPVFKPIV Siraitia grosvenorii SQE2 (SEQ ID NO: 18)
KAEGVRQMFFPATVAAYYRAPRVVKGR Momordica charantia (SEQ ID NO: 19)
GIIFPIIKAEGVRQMFFPATVPAYYRSPPALKPVA Cucurbita maxima (SEQ ID NO: 20)
GIIFPIIKAEGVRQMFFPATVPAYYRSPPVHKSIA Cucurbita moschata (SEQ ID NO: 21)
GIIFPIIKAEGVRQMFFPATVPAYYRSPPVLKTIA Cucurbita moschata (SEQ ID NO: 22)
ASGIILPIIKAEGVRQMFFPATVPAYYRSPPVHKPIT Cucumis sativus (SEQ ID NO: 23)
ASGIIFPIIKAEGVRQMFFPATVPAYYRTPPVFNS Cucumis melo (SEQ ID NO: 24)
ASGIIFPIIKAEGVRQMFFPATVPAYYRTPPVLNS Cucurbita maxima (SEQ ID NO: 25)
Ziziphus jujube (SEQ ID NO: 26)
IKAEGVRQMFFPATVPAYYRAAPVE Morus alba (SEQ ID NO: 27)
SGIIFPIIRAEGVRQMFFPATIPAYYRAPRPN Juglans regia (JrSQE1) (SEQ ID NO: 28)
ASAIIFPIIKAEGVRQMFFPATVPAYYRAPPVKRDH Cucumis melo (SEQ ID NO: 29)
IIKAEGVRQMFFPKTVAAYYRAPPVVRER Cucumis sativus (SEQ ID NO: 30)
IIKAEGVRQMFFPKTVAAYYRAPPIVRER Juglans regia (JrSQE2)(SEQ ID NO: 31)
ASAIIFPIIKAEGVRQMFFPATVPAYYRAPPVNCQARSLKPDALKGL Theobroma cacao (SEQ ID NO: 32)
FPIIKAEGVRQMFFPATVPAYYRAPPVE Cucurbita moschata (SEQ ID NO: 33)
ASGIILPIIKAEGVRQMFFPATVPAYYRSPPVHKPIT Phaseolus vulgaris (SEQ ID NO: 34)
ASGIIMPIIKAEGVRQMFFPATVPAYYRNPPAA Hevea brasiliensis (SEQ ID NO: 35)
GARLISGASGIIFPIIKAEGVRQMFFPATVPAYYRAPPIKCN Sorghum bicolor (SEQ ID NO: 36)
SGACGIILPIIKAEGVRQMFFPATVPAYYRAAPMGE Zea mays (SEQ ID NO: 37)
KRMWIGARLISGACGIILPIIKAEGVRQMFFPATVPAYYRAAPTGEKA Medicago sativa (SEQ ID NO: 38)
IKAEGIRQMFFPATVPAYYRAPPVNAF Methylomonas lenta (SEQ ID NO: 39)
DRKRANANLNILANALYAVMSNDLLKTAVFKYLQCGGANAQESIAVLAGLNRKHF SLIKQFCFLAVFGACNLLQQSISNIPKALKlLKDAFVIIKPLIKNELS Endossibionte de Bathymodiolus azoricus (SEQ ID NO: 168)
PSSFLKKNIHN Methyloprofundus sediment (SEQ ID NO: 169)
PLAVNELRPSSFYKKNIQL Methylomicrobium buryatense (SEQ ID NO: 170)
KR Cucurbitadienol Sintase (CDS), Triterpeno Sintase (TTP) CDS de Siraitia grosvenorii (SEQ ID NO: 40)
GEYCHRVLTE Momordica charantia (SEQ ID NO: 41)
GEYCHRVLTE Cucurbita maxima (SEQ ID NO: 42)
FPIWALGEYCHRVLTE Citrullus colocynthis (CcCDS1) (SEQ ID NO: 43)
FHRVLTE Citrullus colocynthis (CcCDS2) (SEQ ID NO: 44)
YFHRVLTE Cucurbita moschata (SEQ ID NO: 45)
FPIWALGEYCHRVLTE Cucumis sativus (SEQ ID NO: 46)
VFNKNCMITYAAYRNIFPIWALGEYSHRVLTE Cucumis melo (SEQ ID NO: 47)
IFPIWALGEYSHRVLDM Citrullus lanatus subsp. vulgaris (SEQ ID NO: 48)
E Theobroma cacao (SEQ ID NO: 49)
AP Ziziphus jujube (SEQ ID NO: 50)
HVLRSL Prunus avium (SEQ ID NO: 51)
CQVLEAL Brassica napus (SEQ ID NO: 52)
RYLINAQMESGDFPQQEIMGVFNRNCMITYAAYRNIFPIWALGEYRSKVLLQQGE Spinacia oleracea (SEQ ID NO: 53)
VLQK Trigonella foenum-graecum (SEQ ID NO: 54)
AVCLINSQMENGDFPQEEIMGVFNKNCMITYAAYRNIFPIWALGEYRRHVLQA Ricinus communis (SEQ ID NO: 55)
AARYLINAQMENGDFPQQEIMGVFNRNCMITYAAYRDIFPIWALGEYRCRVLKAS Epóxido hidrolase EPH1 de Siraitia grosvenorii (SgEPH1) (SEQ ID NO: 56)
GGGFKKDVPFLEEVVVMEGAAHFINQEKADEINSLIYDFIKQF EPH2 de Siraitia grosvenorii (SgEPH2) (SEQ ID NO: 57)
EPH3 de Siraitia grosvenorii (SgEPH3) (SEQ ID NO: 58)
GGFKKDVPLLEEVVVVKDACHFINQERPQEINAHIHDFINKF Momordica charantia (SEQ ID NO: 59)
IHGGGFKEDVPLLEEVVVIEGAAHFINQEKPDEISSLIYDFIKKF Cucurbita moschata (SEQ ID NO: 60)
GFKKDVPLLEEVVVMEGAAHFINQEKADEISAHIYDFIIKF Cucurbita maxima (SEQ ID NO: 61)
KEYIHGGRFKEDVPFLEEVVVIEGAAHFINQERADEISSLIYEFINKF Prunus persica (SEQ ID NO: 62)
HNGGFKRDVPFLQEVVVIEDGAHFINQERPDEISRHVYDFIQKF Morus notabilis (SEQ ID NO: 63)
ILNGGFKRDVPLLQELVIIEGAAHFINQEKPDEISSHIHHFIQKF Ricinus communis (SEQ ID NO: 64)
HNGGFKQVVPLLQEVVVMEGVAHFINQEKPEEISEHIYDFIKKF Citrus unshiu (SEQ ID NO: 65)
YIHNGGFKKYVPYLQEVVVMEGVAHFINQEKAEEVGAHIYEFIKKF Hevea brasiliensis (SEQ ID NO: 66)
HNGGFKKDVPLLQDVVVMEGVAHFLNQEKPEEVSKHIYDFIKKF Handroanthus impetiginosus (SEQ ID NO: 67)
VKEYIHKGRFKQHVPFLQELVILEGVAHFLNQEKPDEINQHIYDFIHKF Camelina sativa (SEQ ID NO: 68)
HGGGLKKHVPFLQEVVVMEGVGHFLQQEKPDEVTDHIYGFFEKFRTRETSSL Coffea canephora (SEQ ID NO: 69)
GVKEYIQKGGFKRDVPFLQELVVMEGVAHFVNQEKPEEVSAHIYDFIQKF Punica granatum (SEQ ID NO: 70)
FIHNGGLKKHVPFLQEVVVMEGVAHFINQEKPEEVTAHIYDFIKKF Arabidopsis lyrata subsp. lyrata (SEQ ID NO: 71)
HEGGLKKHVPFLQEVVVLEGVGHFLHQEKPDEITDHIYGFFKKFRTRETASL Rhinolophus sinicus (SEQ ID NO: 72)
YIHEGGLKKHVPFLQEVVVMEGVGHFLHQEKPDEVTDHIYGFFKKF Citocromo P450 CYP87D18 de Siraitia grosvenorii (SEQ ID NO: 73)
RWTKLGGGTIARAHILSFEDGLHVKFTPKE Cucumis melo (SEQ ID NO: 74)
WRKLKGGKIARAHILRFEDGLYVNFTPKE Cucurbita maxima (SEQ ID NO: 75)
YRWTKLKGGKVARAHILSFEDGLHMKFTPKE Cucumis sativus (SEQ ID NO: 76)
WRKLKGGKIARAHILRFEDGLYVNFTPKE Cucurbita moschata (SEQ ID NO: 77)
TKYRWTKLKGGKVARAHILSFEDGLHVKFTPKE Prunus avium (SEQ ID NO: 78)
HVLVTKYRWTTIKAARIARNPILGFGDGIHIKFEEKKT Populus trichocarpa (SEQ ID NO: 79)
LVTNYSFTKIRGGDVSRTPIISFGDGIHIKFTARA Prunus persica (SEQ ID NO: 80)
HVLVTKYRWTTIKAARIARNPILGFGDGIHIKFEEKKT Populus euphratica (SEQ ID NO: 81)
TKYRWNIIKQGNIGRNPILGFGDGIHISFSPKDI Juglans regia (SEQ ID NO: 82)
TKYRWTKVKGGKMARNPILWFADGIHINFALKHN Pyrus x bretschneideri (SEQ ID NO: 83)
TKYRWTTIKGARISRRPMLTFGDGAHIKFSEKKN Morus notabilis (SEQ ID NO: 84)
KYRWTTIKVGNVSRNPILRFGNGIHIKFSKKN Jatropha curcas (JcP450.1) (SEQ ID NO: 85)
VTKYRWRKIKGGDIARNPILGFGDGLHIEVSAKN Hevea brasiliensis (SEQ ID NO: 86)
TKYRWTKIKEGEIRRAPMLGFGDGIHFKFSEKE Jatropha curcas (JcP450.2) (SEQ ID NO: 87)
Chenopodium quinoa (SEQ ID NO: 88)
LVTNYRWEKIKGGEIVRTPILGFRNALRVKLTKKN Spinacia oleracea (SEQ ID NO: 89)
KARLS Manihot esculenta (SEQ ID NO:90)
RWTKIKGGDMVRSPALGFGNGFHIRVSEKQL Olea europaea var. sylvestris (SEQ ID NO: 91)
TKYRWAIVKGGKIVRSPIIRFPDGFHYKIIEKTN Citocromo P450 Redutase Stevia rebaudiana (SrCPR1) (SEQ ID NO: 92)
LRDVW CPR1 de Arabidopsis thaliana (AtCPR1) (SEQ ID NO: 93)
RTLHTIVQEQEGVSSSEAEAIVKKLQTEGRYLRDVW CPR2 de Arabidopsis thaliana (AtCPR2) (SEQ ID NO: 94)
VW Arabidopsis thaliana (AtCPR3) (SEQ ID NO: 95)
DVW CPR2 de Stevia rebaudiana (SrCPR2)(SEQ ID NO: 96)
DVW CPR3 de Stevia rebaudiana (SrCPR3) (SEQ ID NO: 97)
DVW CPR de Artemisia annua (AaCPR) (SEQ ID NO: 98)
W CPR (PgCPR) (SEQ ID NO: 99)
YLYVCGDAKGMARDVHRTLHTIAQEQGSLDSSKAESMVKNLQMSGRYLRDVW Oxidase de ferro não heme
Acetobacter pasteurianus subsp. ascendens (ApGA2ox) (SEQ ID NO: 100)
PKGARKTATFGHFKRNSAA Cucurbita maxima (CmGA2ox) (SEQ ID NO: 101)
PLSEKIAPLASLMQGEERSLYKEFTWFEYKRSAYNSRLADNRLVPFERIAAS Dendrobium catenatum (DcGA3ox) (SEQ ID NO: 102)
TWPEYLGIRTRLFDKALDSVKFQEKELEKD Cucurbita maxima (CmGA3ox) (SEQ ID NO: 103)
PTQPPLYRPVTWTEYLGKKAEHFNNALSTVRLCAPITGLLDVNDHSRVKVG Cucurbita maxima (CmGA20ox) (SEQ ID NO: 104)
QFNI Agapanthus praecox subsp. orientalis (ApoGA20ox) (SEQ ID NO: 105)
DFTWSALLEFTQKHYRADMQTLNEFSKYILQAQGTLHK Arabidopsis thaliana (AtF3H) (SEQ ID NO: 106)
YKRKMGRDLELARLKKLAKEERDHKEVDKPVDQIFA Chrysosplenium americanum (CaF6H) (SEQ ID NO: 107)
Datura stramonium (DsH6H) (SEQ ID NO: 108)
YDAGVKPYKINQFPN Arabidopsis thaliana (AtH6DH) (SEQ ID NO: 109)
YHQQT Solanum lycopersicum (SlF35H) (SEQ ID NO: 110)
PLEAMVTPRLSLDVYRC D4H (SEQ ID NO: 111)
SSSLSPFRLNN Catharanthus roseus (CrD4Hlike) (SEQ ID NO: 112)
ENPPIYEQITAKDYVTVQFSRGLDGDSFLSPFMLNKDNMEK Zea mays (ZmBX6) (SEQ ID NO: 113)
VASFFNTDVRRSERMYGPIPDPSKPPLYRSVRARDFIAKFNTIGLDGRALDHFRL Hordeum vulgare subsp. vulgare (HvIDS2) (SEQ ID NO: 114)
NQIININNNQKGI Hordeum vulgare subsp. vulgare (HvIDS3) (SEQ ID NO: 115)
LNLTTNLKNVQKEI Glicosiltransferase dependente de difosfato de uridina (UGT) UGT720-269-1 de Siraitia grosvenorii (SEQ ID NO: 116)
SEHPRHEFENMRGMNYEMLVGNAIKSPTLTKK UGT94-289-3 de Siraitia grosvenorii (SEQ ID NO: 117)
EDVRKKAREMSEILRSKGEEKFDEMVAEISLLLKI UGT74-345-2 de Siraitia grosvenorii (SEQ ID NO: 118)
KWKKLAKEAVDEGGSSDKNIEEFVKTIA UGT75-281-2 de Siraitia grosvenorii (SEQ ID NO: 119)
DLVMGSRDGQKEEIERNAKKWKELARQAIGEGGSSDSNLKTFLWEIDLEI UGT720-269-4 de Siraitia grosvenorii (SEQ ID NO: 120)
KQAKYKVSKDGTSYQNLECLIQDIKKLNQIEGFINNPNFSDLLRV UGT94-289-2 de Siraitia grosvenorii (SEQ ID NO: 121)
YFSRSKVSSFGRLYKINRPTTLTVGRFWSKQIKMKRE UGT94-289-1 de Siraitia grosvenorii (SEQ ID NO: 122)
EEKMDEMVAAISLFLKI Momordica charantia 1 (McUGT1) (SEQ ID NO: 123)
MEKFSKLANDKVVKGGTSFENLELIVEYLKKLKPSN Momordica charantia 2 (McUGT2) (SEQ ID NO: 124)
Momordica charantia 3 (McUGT3) (SEQ ID NO: 125)
RSMMEQEGKEMERRIAELAKRVKYRVGKDGESYRNLESLIRDIKITKSSN Momordica charantia 4 (McUGT4) (SEQ ID NO: 126)
LISLLPKG Momordica charantia 5 (McUGT5) (SEQ ID NO: 127)
ALISLLLKG Cucumis sativus (SEQ ID NO: 128)
LAKRVDDRVSKEGTSYQNLQRLIEDIEGFKLN Cucurbita maxima 1 (CmaUGT1) (SEQ ID NO: 129)
RASKNGTSYRNFQTLIQDITNIIETHI Cucurbita maxima 2 (CmaUGT2) (SEQ ID NO: 130)
DMIDEMVAEISVVLKI Cucurbita maxima 3 (CmaUGT3) (SEQ ID NO: 131)
AKLIKEVVVERTREDIRNKLEKINEILRSRREEKLDELATEISLLSRN Cucurbita moschata 1 (CmoUGT1) (SEQ ID NO: 132)
ASKNGTSYRNFQTLIQDITNIIETHI Cucurbita moschata 2 (CmoUGT2) (SEQ ID NO: 133)
DDDMMIDEMVAVISVVLKI Cucurbita moschata 3 (CmoUGT3) (SEQ ID NO: 134)
DELATEISLLCKN Prunus persica (SEQ ID NO: 135)
MDAISKLSRDSVAEGGSSHNNLEQLIEYIRNLQHQN Theobroma cacao (SEQ ID NO: 136)
RSVDGISKLARESVSHGGSSSSNLEMLIQELET Corchorus capsularis (SEQ ID NO: 137)
DMDELVEELMLICKMKPNSCHLS Ziziphus jujube (SEQ ID NO: 138)
KLCGM Vitis vinifera (SEQ ID NO: 139)
EELKQLCSY Juglans regia (SEQ ID NO: 140)
Hevea brasiliensis (SEQ ID NO: 141)
DELLQLCDVKTNYLQ Manihot esculenta (SEQ ID NO: 142)
EEIDGVVDELVQLCDMKTNYL Cephalotus follicularis (SEQ ID NO: 143)
MKTNSLNQD Stevia rebaudiana UGT74G1 (SEQ ID NO: 144)
GGSSDNDIVEFVSELIKA UGT76G1 de Stevia rebaudiana (SEQ ID NO: 145)
GGSSYESLESLVSYISSL UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146)
KMRNKAKDWKEKARIAIAPNGSSSLNIDKMVKEITVLARN UGT91D1 de Stevia rebaudiana (SEQ ID NO: 147)
ENEGEIYKANARALSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES UGT91D2 de Stevia rebaudiana (SEQ ID NO: 148)
RELSKIYNDTKVEKEYVSQFVDYLEKNTRAVAIDHES UGT91D2e de Stevia rebaudiana (SEQ ID NO: 149)
ELSKIYNDTKVEKEYVSQFVDYLEKNARAVAIDHES OsUGT1-2 (SEQ ID NO: 150)
AKAKKLQEIVADMACHERYIDGFIQQLRSYKD Arabidopsis thaliana AAN72025.1 (SEQ ID NO: 151)
GY Arabidopsis thaliana AAF87256.1 (SEQ ID NO: 152)
DEEKGKNMREKAEEWRRLANEATEHKHGSSKLNFEMLVNKVLLGE Columba livia ClUGT1 (SEQ ID NO: 153)
NVPADVALVYHCRVPLQEELPRESLIRDTALWRYNSSLITNVNKVLHQTVL Haemophilus ducreyi LgtF Q9L875 (SEQ ID NO: 154)
MYLFKAGFLDGKQGFLLAVLSAHSTFVKYADLWDRTRS Neisseria gonorrhoeae Q5F735 (SEQ ID NO: 155)
GFLDGKMGWIMSVNHSYYTMIKYVKLYYLYKSGGKF Rhizobium meliloti (cepa 1021) ExoM P33695 (SEQ ID NO: 156)
FPSAARRNRFALRAVLHAGVISGLLGLKEIEQYGAREVTSA Rhizobium radiobacter Q44418 (SEQ ID NO: 157)
KPGLIRGTAIFLAIALFQTQRGLYYLVRARRPAPKSAKPVGAVK Streptococcus agalactiae cpsI O87183 (SEQ ID NO: 158)
DNYIDAYRMYGRLLRKVKLVDKLKLIKNRFF Streptococcus pneumoniae cps3S Q54611 (SEQ ID NO: 159)
CPIRLLGLMRCSDDLGWGTRNLTE MbUGTc13 (SEQ ID NO: 160)
MbUGTc19 (SEQ ID NO: 161)
PSMYLDKRLDDDKDNGFNLYKA MbUGT1-3 (SEQ ID NO: 162)
GGSSYESLESLVSYISSL MbUGT1-2 (SEQ ID NO: 163)
RLEHAETESPAAAGQGRPAAAPTFEVARMKLIR Coffea arabica (SEQ ID NO: 164)
QLCATKNKRNGLHYY UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165)
Claims (76)
1. Método para produção de um triterpenoide, caracterizado pelo fato de que compreende: fornecer uma célula hospedeira microbiana recombinante que expressa uma via enzimática heteróloga que catalisa a conversão de isopentenil pirofosfato (IPP) e dimetilalil pirofosfato (DMAPP) em um ou mais triterpenoides, com a via compreendendo uma farnesil difosfato sintase (FPPS) e uma esqualeno sintase (SQS), em que a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 2 a 16, 166, e 167; e cultivar a célula hospedeira em condições para a produção do triterpenoide.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à SQS de Artemisia annua (SEQ ID NO: 11).
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 11.
4. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 11, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
5. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que a SQS compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 2, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 166 ou SEQ ID NO: 167.
6. Método, de acordo com qualquer uma das reivindicações de 1 a 5, caracterizado pelo fato de que o triterpenoide é o esqualeno.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a célula hospedeira microbiana é procariótica ou eucariótica, e é opcionalmente uma bactéria selecionada dentre Escherichia coli, Bacillus subtilis,
Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida; ou é opcionalmente uma levedura selecionada de uma espécie dentre Saccharomyces, Pichia, ou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastoris e Yarrowia lipolytica.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que a célula hospedeira microbiana é E. coli.
9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que E. coli produz produtos da via MEP em maior quantidade e tem uma superexpressão de uma ou mais enzimas da via MEP.
10. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma esqualeno epoxidase (SQE).
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a qualquer uma das SEQ ID NOS: 17 a 39, 168, 169 ou
170.
12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que a esqualeno epoxidase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39).
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a SQE compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 39.
14. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a SQE compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 39, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
15. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a célula hospedeira é uma bactéria que coexpressa uma enzima SQS compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à
SQS de Artemisia annua (SEQ ID NO: 11), e uma esqualeno epoxidase compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à esqualeno epoxidase de Methylomonas lenta (SEQ ID NO: 39).
16. Método, de acordo com qualquer uma das reivindicações de 1 a 15, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma triterpeno ciclase.
17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que a triterpeno ciclase compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 40 a 55.
18. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que a triterpeno ciclase é uma cucurbitadienol sintase (CDS).
19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a CDS compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à sequência de aminoácidos da SEQ ID NO: 40.
20. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que a CDS compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 40.
21. Método, de acordo com a reivindicação 19, caracterizado pelo fato de que a CDS compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 40, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
22. Método, de acordo com qualquer uma das reivindicações de 1 a 21, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma epóxido hidrolase (EPH).
23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que a EPH compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 56 a 72.
24. Método, de acordo com qualquer uma das reivindicações de 1 a 23, caracterizado pelo fato de que a via heteróloga compreende ainda uma ou mais oxidases.
25. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que pelo menos uma oxidase é uma enzima do citocromo P450.
26. Método, de acordo com a reivindicação 25, caracterizado pelo fato de que pelo menos uma enzima do citocromo P450 compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 73 a 91.
27. Método, de acordo com a reivindicação 24, caracterizado pelo fato de que pelo menos uma oxidase é uma oxidase de ferro não-heme.
28. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que a oxidase de ferro não-heme compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 100 a 115.
29. Método, de acordo com qualquer uma das reivindicações de 24 a 28, caracterizado pelo fato de que a célula hospedeira microbiana expressa uma ou mais proteínas de transferência de elétrons selecionadas dentre uma citocromo P450 redutase (CPR), flavodoxina redutase (FPR) e ferredoxina redutase (FDXR) suficientes para regenerar a uma ou mais oxidases.
30. Método, de acordo com qualquer uma das reivindicações de 1 a 29, caracterizado pelo fato de que a via enzimática heteróloga produz mogrol.
31. Método, de acordo com a reivindicação 30, caracterizado pelo fato de que a via enzimática heteróloga compreende ainda uma ou mais enzimas glicosiltransferases dependentes de uridina difosfato (UGT), produzindo, assim, um ou mais glicosídeos de mogrol.
32. Método, de acordo com a reivindicação 31, caracterizado pelo fato de que o um ou mais glicosídeos de mogrol são selecionados de Mog. II-E, Mog. III-A-2, Mog. III-E, Mog. IIIx, Mog. IV-A, Mog. IV-E, Siamenosídeo, Isomog. IV e Mog. V.
33. Método, de acordo com a reivindicação 32, caracterizado pelo fato de que o um ou mais glicosídeos de mogrol incluem Mog. VI, Isomog. V e Mog. V.
34. Método, de acordo com a reivindicação 33, caracterizado pelo fato de que a célula hospedeira produz Mog. V.
35. Método, de acordo com qualquer uma das reivindicações de 31 a 34,
caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica a uma sequência de aminoácidos selecionada dentre as SEQ ID NOS: 116 a 165.
36. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165).
37. Método, de acordo com a reivindicação 35 ou 36, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO:
165.
38. Método, de acordo com a reivindicação 37, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 165, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
39. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146).
40. Método, de acordo com a reivindicação 39, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 146.
41. Método, de acordo com a reivindicação 40, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 146, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
42. Método, de acordo com a reivindicação 35, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164).
43. Método, de acordo com a reivindicação 42, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 164.
44. Método, de acordo com a reivindicação 43, caracterizado pelo fato de que pelo menos uma enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 164, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
45. Método, de acordo com a reivindicação 31, caracterizado pelo fato de que pelo menos uma enzima UTG é um permutante circular de uma enzima UGT do tipo selvagem ou um derivado do mesmo.
46. Método, de acordo com a reivindicação 45, caracterizado pelo fato de que pelo menos uma enzima UTG é um permutante circular da SEQ ID NO: 146, SEQ ID NO: 164 ou SEQ ID NO: 165 ou um derivado do mesmo.
47. Método, de acordo com qualquer uma das reivindicações de 31 a 45, caracterizado pelo fato de que compreende pelo menos uma enzima UGT capaz de catalisar a adição em beta 1,2 de uma molécula de glicose.
48. Método, de acordo com a reivindicação 47, caracterizado pelo fato de que a enzima UGT compreende a sequência de aminoácidos da SEQ ID NO: 117, ou um permutante circular da mesma.
49. Método, de acordo com a reivindicação 47 ou 48, caracterizado pelo fato de que a via enzimática heteróloga compreende quatro enzimas UGT: uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 165 ou um derivado do mesmo; uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 146 ou um derivado do mesmo; uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 164 ou um derivado do mesmo; e uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Siraitia grosvenorii (SEQ ID NO: 117), ou compreendendo uma sequência de aminoácidos que é um permutante circular da SEQ ID NO: 117 ou um derivado do mesmo.
50. Método, de acordo com qualquer uma das reivindicações de 31 a 49, caracterizado pelo fato de que a célula hospedeira microbiana tem uma ou mais modificações genéticas que aumentam a produção ou disponibilidade de UDP- glicose.
51. Método, de acordo com a reivindicação 50, caracterizado pelo fato de que a uma ou mais modificações genéticas incluem uma ou mais ΔgalE, ΔgalT, ΔgalK, ΔgalM, ΔushA, Δagp, Δpgm, duplicação ou superexpressão de GALU de E coli, expressão de UGPA de Bacillus subtillus e expressão de SPL de Bifidobacterium adolescentis.
52. Método para produção de Mog. V, caracterizado pelo fato de que compreende: reagir um glicosídeo de mogrol com uma glicosiltransferase dependente de uridina difosfato (UGT) compreendendo uma sequência de aminoácidos que seja pelo menos 70% idêntica à SEQ ID NO: 164, ou compreendendo uma sequência de aminoácidos que seja um permutante circular da SEQ ID NO: 164 possuindo opcionalmente de 1 a 20 substituições, deleções e/ou inserções de aminoácidos em relação à posição correspondente da SEQ ID NO: 164.
53. Método, de acordo com a reivindicação 52, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 164 ou a um permutante circular da mesma.
54. Método, de acordo com a reivindicação 52, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 164, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos.
55. Método, de acordo com qualquer uma das reivindicações de 52 a 64, caracterizado pelo fato de que o substrato do glicosídeo de mogrol compreende Mog. IIE, Mog. III, Mog. IV ou Siamenosídeo.
56. Método, de acordo com a reivindicação 55, caracterizado pelo fato de que o Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade com UGT85C1 (SEQ ID NO: 165), ou um permutante circular da mesma.
57. Método, de acordo com a reivindicação 56, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 165 ou a um permutante circular da mesma.
58. Método, de acordo com a reivindicação 56, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 165, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 165.
59. Método, de acordo com qualquer uma das reivindicações de 55 a 58, caracterizado pelo fato de que o Mog. IIE é o produto da glicosiltransferase de uma reação de mogrol ou Mog. IA ou Mog, IE com uma enzima UGT compreendendo uma sequência de aminoácidos que tem pelo menos 70% de identidade com UGT85C2 (SEQ ID NO: 146), ou um permutante circular da mesma.
60. Método, de acordo com a reivindicação 59, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos que é pelo menos 80%, ou pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% idêntica à SEQ ID NO: 146, ou a um permutante circular da mesma.
61. Método, de acordo com a reivindicação 59, caracterizado pelo fato de que a enzima UGT compreende uma sequência de aminoácidos possuindo de 1 a 20 modificações de aminoácidos em relação à SEQ ID NO: 146, com as modificações de aminoácidos sendo independentemente selecionadas dentre substituições, deleções e inserções de aminoácidos em relação às posições correspondentes na SEQ ID NO: 146.
62. Método, de acordo com qualquer uma das reivindicações de 52 a 61, caracterizado pelo fato de que o mogrol é reagido com: uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C1 de Stevia rebaudiana (SEQ ID NO: 165), ou um permutante circular da mesma; uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT85C2 de Stevia rebaudiana (SEQ ID NO: 146), ou um permutante circular da mesma; e uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Coffea arabica (SEQ ID NO: 164), ou um permutante circular da mesma; e uma enzima UGT compreendendo uma sequência de aminoácidos que é pelo menos 70% idêntica à UGT de Siraitia grosvenorii (SEQ ID NO: 117), ou um permutante circular da mesma.
63. Método, de acordo com qualquer uma das reivindicações de 52 a 62, caracterizado pelo fato de que compreende ainda a recuperação e/ou purificação do glicosídeo de mogrol.
64. Método, de acordo com a reivindicação 63, caracterizado pelo fato de que o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
65. Método, de acordo com qualquer uma das reivindicações de 52 a 64, caracterizado pelo fato de que a reação é realizada em uma célula microbiana, e as enzimas UGT são expressas de forma recombinante na célula.
66. Método, de acordo com a reivindicação 65, caracterizado pelo fato de que o mogrol é produzido na célula por uma via heteróloga de síntese de mogrol.
67. Método, de acordo com a reivindicação 65, caracterizado pelo fato de que o mogrol ou os glicosídeos de mogrol são introduzidos nas células para glicosilação.
68. Método, de acordo com qualquer uma das reivindicações de 52 a 64, caracterizado pelo fato de que a reação é realizada in vitro usando enzima UGT purificada, enzima UGT parcialmente purificada, ou lisados de células recombinantes.
69. Método, de acordo com qualquer uma das reivindicações de 64 a 68, caracterizado pelo fato de que a célula hospedeira microbiana é procariótica ou eucariótica, e é opcionalmente uma bactéria selecionada dentre Escherichia coli, Bacillus subtilis, Corynebacterium glutamicum, Rhodobacter capsulatus, Rhodobacter sphaeroides, Zymomonas mobilis, Vibrio natriegens, ou Pseudomonas putida; ou é opcionalmente uma levedura selecionada de uma espécie dentre Saccharomyces, Pichia, ou Yarrowia, incluindo Saccharomyces cerevisiae, Pichia pastoris e Yarrowia lipolytica.
70. Método, de acordo com a reivindicação 69, caracterizado pelo fato de que a célula hospedeira microbiana é E. coli.
71. Método, de acordo com a reivindicação 69 ou 70, caracterizado pelo fato de que os produtos de glicosídeo de mogrol são recuperados do meio extracelular.
72. Método para produção de um produto que compreende um glicosídeo de mogrol, caracterizado pelo fato de que compreende: produzir um glicosídeo de mogrol de acordo com qualquer uma das reivindicações de 1 a 71, e incorporar o glicosídeo de mogrol em um produto.
73. Método, de acordo com a reivindicação 72, caracterizado pelo fato de que o glicosídeo de mogrol é Mog. V, Mog. VI, ou Isomog. V.
74. Método, de acordo com a reivindicação 72 ou 73, caracterizado pelo fato de que o produto é uma composição adoçante, composição aromatizante, alimento, bebida, goma de mascar, texturizante, composição farmacêutica, produto de tabaco, composição nutracêutica, ou composição para higiene bucal.
75. Método, de acordo com qualquer uma das reivindicações de 72 a 74, caracterizado pelo fato de que o produto compreende ainda um ou mais dentre um glicosídeo de esteviol, aspartame e neotame.
76. Método, de acordo com a reivindicação 75, caracterizado pelo fato de que o glicosídeo de esteviol compreende um ou mais dentre RebM, RebB, RebD, RebA, RebE e RebI.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862635751P | 2018-02-27 | 2018-02-27 | |
US62/635,751 | 2018-02-27 | ||
PCT/US2019/019886 WO2019169027A2 (en) | 2018-02-27 | 2019-02-27 | Microbial production of triterpenoids including mogrosides |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112020017490A2 true BR112020017490A2 (pt) | 2020-12-22 |
Family
ID=66542535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112020017490-4A BR112020017490A2 (pt) | 2018-02-27 | 2019-02-27 | Produção microbiana de triterpenoides incluindo mogrosídeos |
Country Status (8)
Country | Link |
---|---|
US (1) | US20210032669A1 (pt) |
EP (1) | EP3759230A4 (pt) |
JP (2) | JP7382946B2 (pt) |
KR (1) | KR20200136911A (pt) |
CN (1) | CN112041457A (pt) |
BR (1) | BR112020017490A2 (pt) |
MX (1) | MX2020008922A (pt) |
WO (1) | WO2019169027A2 (pt) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201805576D0 (en) * | 2018-04-04 | 2018-05-16 | Optibiotix Ltd | Sweeteners and methods of production thereof |
CN110592040A (zh) * | 2019-09-18 | 2019-12-20 | 江苏施宇甜生物科技有限公司 | 一种用于生产upd糖基转移酶的重组枯草芽孢杆菌的工艺 |
EP4077649A4 (en) * | 2019-12-16 | 2024-07-10 | Manus Bio Inc | MICROBIAL PRODUCTION OF MOGROL AND MOGROSIDES |
CN115605081A (zh) * | 2020-03-17 | 2023-01-13 | 可口可乐公司(Us) | 新的罗汉果苷生产系统和方法 |
CA3177183A1 (en) * | 2020-05-13 | 2021-11-18 | Ginkgo Bioworks, Inc. | Biosynthesis of mogrosides |
CN111518817B (zh) * | 2020-05-14 | 2022-08-23 | 云南农业大学 | 雪胆三萜合成酶HcOSC6基因及其工程菌和在制备葫芦二烯醇中的应用 |
CN112063647B (zh) * | 2020-09-17 | 2023-05-02 | 云南农业大学 | 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用 |
AU2021373879A1 (en) * | 2020-11-06 | 2023-06-08 | The Medical College Of Wisconsin, Inc. | Peptide inhibitors of human mitochondrial fission protein 1 and methods of use |
CN112877355A (zh) * | 2021-01-22 | 2021-06-01 | 杜云龙 | 一种利用烟草表达三七皂苷的方法 |
US20240240222A1 (en) * | 2021-06-29 | 2024-07-18 | Firmenich Incorporated | Methods for making high intensity sweeteners |
CN114107332B (zh) * | 2022-01-27 | 2022-12-06 | 中国中医科学院中药研究所 | 共表达的核酸及其应用 |
CN114774503B (zh) * | 2022-06-20 | 2022-10-14 | 中国中医科学院中药研究所 | 角鲨烯环氧化酶及其编码基因与应用 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2074214A2 (en) * | 2006-09-28 | 2009-07-01 | Microbia, Inc. | Production of sterols in oleaginous yeast and fungi |
WO2013061341A1 (en) * | 2011-10-28 | 2013-05-02 | Sujoy Kumar Guha | An improved intra-uterine contraceptive device |
BR112015013129A2 (pt) * | 2012-12-04 | 2017-07-11 | Evolva Sa | métodos e materiais para a biossíntese de compostos mogrosida |
CN104017797B (zh) * | 2014-06-04 | 2016-03-16 | 中国医学科学院药用植物研究所 | 一种罗汉果SgCAS基因的突变体及其用途 |
SG11201701278RA (en) * | 2014-08-21 | 2017-03-30 | Manus Biosynthesis Inc | Methods for production of oxygenated terpenes |
WO2016038617A1 (en) * | 2014-09-11 | 2016-03-17 | The State Of Israel, Ministry Of Agriculture & Rural Development, Agricultural Research Organization (Aro) (Volcani Center) | Methods of producing mogrosides and compositions comprising same and uses thereof |
-
2019
- 2019-02-27 US US16/971,740 patent/US20210032669A1/en active Pending
- 2019-02-27 KR KR1020207027034A patent/KR20200136911A/ko not_active Application Discontinuation
- 2019-02-27 JP JP2020544815A patent/JP7382946B2/ja active Active
- 2019-02-27 BR BR112020017490-4A patent/BR112020017490A2/pt unknown
- 2019-02-27 EP EP19760267.5A patent/EP3759230A4/en active Pending
- 2019-02-27 WO PCT/US2019/019886 patent/WO2019169027A2/en unknown
- 2019-02-27 MX MX2020008922A patent/MX2020008922A/es unknown
- 2019-02-27 CN CN201980028158.0A patent/CN112041457A/zh active Pending
-
2023
- 2023-11-07 JP JP2023189958A patent/JP2024020310A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20210032669A1 (en) | 2021-02-04 |
MX2020008922A (es) | 2021-01-08 |
WO2019169027A2 (en) | 2019-09-06 |
JP2024020310A (ja) | 2024-02-14 |
EP3759230A2 (en) | 2021-01-06 |
WO2019169027A3 (en) | 2019-10-03 |
JP7382946B2 (ja) | 2023-11-17 |
JP2021513867A (ja) | 2021-06-03 |
CN112041457A (zh) | 2020-12-04 |
EP3759230A4 (en) | 2022-05-25 |
KR20200136911A (ko) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7382946B2 (ja) | モグロシドを含むトリテルペノイドの微生物生産 | |
US11819042B2 (en) | Uridine diphosphate-dependent glycosyltransferase circular permutants | |
JP2020103292A (ja) | レバウディオサイドdおよびレバウディオサイドmの改良された産生方法 | |
US20240229094A9 (en) | Biosynthetic production of steviol glycosides and processes therefore | |
US11788070B2 (en) | Uridine diphosphate-dependent glycosyltransferase enzyme | |
US20230042171A1 (en) | Microbial production of mogrol and mogrosides | |
BR112015018872B1 (pt) | Método para produção de uma composição de glicosídeo de esteviol, célula hospedeira recombinante, métodos para produção de rebaudiosídeo m, cultura de células, lisado de cultura de células e mistura reacional |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] |