ES2906310T3 - Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos - Google Patents

Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos Download PDF

Info

Publication number
ES2906310T3
ES2906310T3 ES17757641T ES17757641T ES2906310T3 ES 2906310 T3 ES2906310 T3 ES 2906310T3 ES 17757641 T ES17757641 T ES 17757641T ES 17757641 T ES17757641 T ES 17757641T ES 2906310 T3 ES2906310 T3 ES 2906310T3
Authority
ES
Spain
Prior art keywords
seq
amino acid
acid sequence
certain embodiments
udp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17757641T
Other languages
English (en)
Inventor
Lishan Zhao
Wenzong Li
Gale Wichmann
Aditi Khankhoje
De Gonzalo Chantal Garcia
Tina Mahatdejkul-Meadows
Shaina Jackson
Michael Leavell
Darren Platt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Amyris Inc
Original Assignee
Amyris Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amyris Inc filed Critical Amyris Inc
Application granted granted Critical
Publication of ES2906310T3 publication Critical patent/ES2906310T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L2/00Non-alcoholic beverages; Dry compositions or concentrates therefor; Their preparation
    • A23L2/52Adding ingredients
    • A23L2/60Sweeteners
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • A23L27/30Artificial sweetening agents
    • A23L27/33Artificial sweetening agents containing sugars or derivatives
    • A23L27/36Terpene glycosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01017Glucuronosyltransferase (2.4.1.17)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L27/00Spices; Flavouring agents or condiments; Artificial sweetening agents; Table salts; Dietetic salt substitutes; Preparation or treatment thereof
    • A23L27/30Artificial sweetening agents
    • A23L27/33Artificial sweetening agents containing sugars or derivatives
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2250/00Food ingredients
    • A23V2250/24Non-sugar sweeteners
    • A23V2250/262Stevioside

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Food Science & Technology (AREA)
  • Polymers & Plastics (AREA)
  • Nutrition Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Seasonings (AREA)

Abstract

Una célula hospedadora genéticamente modificada que comprende un ácido nucleico heterólogo que codifica una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que tiene al menos el 80 %, 85 %, 90 % o 95 % de identidad de secuencia con SEQ ID NO: 1 o SEQ ID NO: 11, en donde la célula hospedadora genéticamente modificada es capaz de convertir RebA a RebD con una eficiencia superior al 90 %, 95 %, 96 % o 97 %.

Description

DESCRIPCIÓN
Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos
1. Campo de la invención
La presente descripción se refiere a ciertas glicosiltransferasas dependientes de uridina difosfato (UGTs), composiciones que comprenden las mismas, células hospedadoras que comprenden las mismas, y métodos de su uso para la producción de rebaudiósidos incluyendo el rebaudiósido D y el rebaudiósido M.
2. Antecedentes de la invención
Los edulcorantes de cero calorías derivados de fuentes naturales se desean para limitar los efectos nocivos del alto consumo de azúcar (por ejemplo, diabetes y obesidad). El rebaudiósido M (RebM), es uno de los muchos compuestos de sabor dulce producidos por la planta de stevia (Stevia rebaudiana Bertoni). De todos los rebaudiósidos, RebM tiene la potencia más alta (aproximadamente 200 a 300 veces más dulce que la sacarosa) y es la de sabor más limpio. Sin embargo, la planta de Stevia produce solo RebM en pequeñas cantidades y solo representa una pequeña fracción del contenido total de glucósidos de esteviol (< 1,0 %). Ohta et al., 2010, J. Appl. Glycosci., 57, 199-209 (2010). Como tal, es deseable producir RebM usando rutas biotecnológicas que permitan la producción en grandes cantidades y con alta pureza. El uso del RebM como edulcorante también se describe en Prakash et al., 2014, Foods, 3(1), 162-175.
Para producir económicamente un producto usando biotecnología, cada paso en la bioconversión de la materia prima hasta el producto tiene ventajosamente una alta eficiencia de conversión (idealmente > 90 %). En la ingeniería de levadura para producir RebM, una limitación fue identificada en el penúltimo paso biosintético, es decir, la conversión de rebaudiósido A (RebA) a rebaudiósido D (RebD) Véase Figura 1A. Se observó que la enzima nativa (Ono, EP 2 826 861 A1, UGT91D_like3, o un homólogo cercano) convierte aproximadamente el 3 % de RebA a RebD. Se han identificado otras dos enzimas UGT que son capaces de convertir RebA a RebD. Uno es Os_UGT_91C1 de Oryza sativa (también conocido como e Ug T11 en Houghton-Larsen et al., WO 2013/022989 A2), y el otro es Sl_UGT_101249881 de Solanum lycopersicum (también conocido como UGTSL2 en Markosyan et al., WO2014/198888) A1). Sin embargo, los inventores observaron inicialmente que tanto Os_UGT_91C1 como S1_UGT_101249881 tenían eficiencias de conversión inferiores a las deseadas de aproximadamente 53 % y 70 %, respectivamente. Las tres enzimas, UGT91D_like3, Os_UGT_91C1 y SL_UGT_101249881, son glicosiltransferasas dependientes de uridina difosfato (UGT) que transfieren una porción de glucosa a la posición C-2' del residuo 19-O-glucosa a través de la formación de un enlace beta (1- > 2) (Figura 1A). El documento WO2014/12227 describe las UDP-glicosiltransferasas UGT85C2, UGT74G1, UGT76G1, UGT91d2 y EUGT11 para la producción de glucósidos de esteviol.
Para producir RebM de manera eficiente y con alta pureza, se necesitan enzimas mejoradas capaces de convertir RebA a RebD con alta eficiencia. Las composiciones y métodos provistos en el presente documento abordan esta necesidad y proveen también ventajas relacionadas.
3. Sumario de la invención
En este documento se proveen composiciones y métodos para la conversión mejorada de RebA a RebD y para la producción mejorada de RebD y/o RebM. Estas composiciones y métodos se basan en parte en el sorprendente descubrimiento de ciertas glicosiltransferasas dependientes de uridina difosfato (UGT) que son capaces de convertir RebA a RebD con una eficiencia notablemente alta. Incluso una mejora moderada en el rendimiento de la tensión (por ejemplo, el diez por ciento) con las nuevas UGT puede ahorrar potencialmente más de diez millones de dólares en costos de producción en el futuro, suponiendo que la demanda en el mercado para RebM sea de 5000 millones de toneladas por año.
Ciertas UGT descritas en el presente documento también son capaces de producir RebM con poco o nada de glucósidos no naturales, tales como el producto secundario RebM2 (es decir, un isómero de RebM). Ver Ceunen S. et al. Steviol Glycosides: Chemical Diversity, Metabolism, and Function. J. Nat. Prod., 76, 1201-1228 (2013) para obtener una lista de los glucósidos de Stevia actualmente conocidos. Las composiciones y métodos descritos en el presente documento pueden reducir los costos del procesamiento posterior para obtener una composición con RebM de alta pureza.
En un aspecto, en el presente documento se provee una célula hospedadora genéticamente modificada que comprende: un ácido nucleico heterólogo que codifica una UDP-glicosiltransferasa (UGT40087, también denominada Si_UGT_40087). En algunas modalidades, la célula hospedadora genéticamente modificada comprende además una o más rutas enzimáticas capaces de producir esteviol y/o glucósidos de esteviol.
La invención provee células hospedadoras genéticamente modificadas que comprenden un ácido nucleico heterólogo que codifica una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con la secuencia de UGT40087 (por ejemplo, SEQ ID NO: 1 o SEQ ID NO: 11) en donde la célula hospedadora genéticamente modificada es capaz de convertir RebA a RebD con una eficiencia superior a 90 %, 95 %, 96 % o 97 %. En ciertas modalidades, la célula hospedadora genéticamente modificada comprende una UDP-glicosiltransferasa que comprende un dominio aceptor de azúcar, en donde la secuencia de aminoácidos del dominio aceptor de azúcar tiene al menos 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con la secuencia de aminoácidos del dominio aceptor de azúcar de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, la célula hospedadora genéticamente modificada comprende una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos de bucle1, una secuencia variante de aminoácidos de bucle1, una secuencia de aminoácidos de bucle2, una secuencia de aminoácidos de bucle2 variante, una secuencia de aminoácidos de bucle3_1, una secuencia de aminoácidos de bucle3_1 variante, una secuencia de aminoácidos de bucle3_2, una secuencia de aminoácidos de bucle3_2 variante, una secuencia de aminoácidos de bucle4_1, una secuencia de aminoácidos de bucle4_1 variante, una secuencia de aminoácidos de bucle4_2, o cualquier combinación de las mismas. En ciertas modalidades, la célula hospedadora genéticamente modificada comprende una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que tiene al menos 61 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % de identidad de secuencia con el dominio aceptor de azúcar de SEQ ID NO: 1 o SEQ ID NO: 11, y además comprende la secuencia de aminoácidos de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11.
En otro aspecto, en el presente documento se proveen métodos para producir un glucósido de esteviol heterólogo, que comprende: cultivar una población de células hospedadoras genéticamente modificadas que se provee en el presente documento, capaz de producir el glucósido de esteviol como se describe en el presente documento, en un medio con una fuente de carbono bajo condiciones adecuadas para hacer dicho compuesto de glucósido de esteviol; y recuperando dicho glucósido de esteviol del medio. En este aspecto, el glucósido de esteviol heterólogo es RebM.
En otro aspecto, en el presente documento se proveen métodos para producir RebM, el método comprendiendo: cultivar una población de células hospedadoras genéticamente modificadas de la invención, capaces de producir RebM como se describe en el presente documento, en un medio con una fuente de carbono bajo condiciones adecuadas para hacer dicho RebM; y recuperar dicho RebM del medio.
En otro aspecto, en el presente documento se proveen métodos para producir RebM, el método comprendiendo: poner en contacto a RebA con glucosa y una UDP-glicosiltransferasa descrita en el presente documento, capaz de convertir RebA a RebD, bajo condiciones adecuadas para formar RebD, y con una UDP-glicosiltransferasa descrita en el presente documento, capaz de convertir RebD en RebM.
En algunas modalidades, la célula hospedadora es una célula de levadura. En algunas modalidades, la levadura es Saccharomyces cerevisiae. En algunas modalidades, la célula hospedadora produce RebD o RebM con alta eficiencia. En algunas modalidades, la célula hospedadora produce una cantidad aumentada de RebD o RebM en comparación con una célula de levadura que no comprende la enzima UGT40087. En algunas modalidades, la célula hospedadora produce una cantidad aumentada de RebM en relación con RebM2 en comparación con una célula de levadura que no comprende la enzima UGT40087.
4. Breve descripción de las figuras
La Figura 1A provee una representación esquemática de la conversión de RebA a RebD a RebM.
La Figura 1B provee la estructura de RebM2.
La Figura 1C provee un diagrama esquemático de la vía del mevalonato.
La Figura 2A provee una vía ilustrativa de farnesil pirofosfato (FPP) a esteviol.
La Figura 2B provee una vía ilustrativa de esteviol a RebM.
La Figura 2C provee una vía ilustrativa para la producción enzimática de RebM.
La Figura 3 provee la relación de conversión de RebA a RebD in vivo, medida por micromoles de Reb (D+M)/micromoles de Reb (A+D+M). La cepa de control principal es 91D_like3 etiquetada (de Stevia rebaudiana; esta cepa contiene UGT: 85C2, 74G1, 91D_like3 y 76G1 solamente, además de una plataforma de aterrizaje vacía. Se observa que 91D_like3 tiene una conversión de RebA a RebD muy baja (~ 3 %, ver la Tabla 5). Se insertó una sola copia de cada enzima UGT en la cepa de control principal y se seleccionó para mejorar la conversión de RebA a RebD. Se muestra que seis enzimas UGT tienen conversión de RebA a RebD que son al menos equivalentes o mejores que, las enzimas conocidas anteriores Os_UGT_91C1 y S1_UGT_101249881. Tres enzimas UGT (Si_UGT_40087, Ob_UGT91B1_like, y Hv_UGT_V1 son mejores que las dos enzimas UGT anteriormente identificadas en la conversión de RebA a RebD. Las barras de error son errores estándar.
La Figura 4 provee un diagrama esquemático del diseño de "plataforma de aterrizaje" usado para insertar enzimas UGT individuales para cribado para la conversión de RebA a RebD en levadura.
Las Figuras 5a-5h ilustran los cromatogramas de RebA, RebD, RebM, RebM2 producidos in vivo para cada gen UGT usado para generar los datos descritos en la Tabla 5 y la Figura 3. Los picos del cromatograma se seleccionan para mostrar los picos asociados con RebA, RebD, RebM y RebM2. Cada figura muestra el tiempo de retención versus el % de intensidad para los estándares auténticos, la cepa progenitora de control Y31062 y Y31062 con una enzima UGT adicional. Y31062 es la cepa de control principal y contiene UGT74G1, UGT85C2, UGT91D_like3 y UGT76G1 con una plataforma de aterrizaje vacía. Figura 5a: datos para Si_UGT_40087; Esta figura también incluye un cromatograma para un estándar auténtico de RebE. Figura 5b: datos para Ob_UGT91B1_like. Figura 5c: datos para Hv_UGT_V1. Figura 5d: datos para Sl_UGT_101249881. Figura 5e: datos para UGT_g252778.
Figura 5f: datos para Os_UGT_91C1. Figura 5g: datos para Bd_UGT10850. Figura 5h: datos para Bd_UGT10840. La Figura 5i muestra una vista ampliada del cromatograma solo para el pico RebE de Si_UGT_40087 en comparación con el estándar auténtico para confirmar que este pico es RebE.
La Figura 6 ilustra un modelo de homología de estructura UGT40087. Sus dominios N-terminal y C-terminal se muestran en gris claro y oscuro, y los cuatro bucles usados en el experimento de intercambio de bucles también están etiquetados en la estructura.
La Figura 7 ilustra una vista general esquemática de las construcciones de intercambio de dominios de UGT. La Figura 8 ilustra la alineación de secuencia de cuatro UDP-glicosiltransferasas (UGT40087 (SEQ ID NO: 1); Os_UGT_91C1 (SEQ ID NO: 8); 91Dlike3 (SEQ ID NO: 7); Si91Dlike (SEQ ID NO: 12))
La Figura 9a ilustre un cromatograma de glucósidos de esteviol producidos in vivo para la célula de control original (que comprende UGT74G1, UT85C2, UGT76G1 y UGT91D_like3). La Figura 9b ilustra un cromatograma de glucósidos de esteviol producidos in vivo para la cepa de control progenitora con UGT40087. La Figura 9c ilustra un cromatograma de glucósidos de esteviol producidos in vivo para la cepa de control principal con similar a Ob _UGT91B1_like.
5. Descripción detallada de las modalidades
5.1 Terminología
Como se usa en el presente documento, el término "heterólogo" se refiere a lo que normalmente no se encuentra en la naturaleza. El término "secuencia de nucleótidos heteróloga" se refiere a una secuencia de nucleótidos que normalmente no se encuentra en una célula dada en la naturaleza. Como tal, una secuencia de nucleótidos heteróloga puede ser: (a) extraña a su célula hospedadora (es decir, es "exógena" a la célula); (b) se encuentra de forma natural en la célula hospedadora (es decir, "endógena") pero está presente en una cantidad no natural en la célula (es decir, mayor o menor cantidad que la que se encuentra naturalmente en la célula hospedadora); o (c) se encuentra de forma natural en la célula hospedadora, pero está ubicada fuera de su lugar natural. El término "enzima heteróloga" se refiere a una enzima que normalmente no se encuentra en una célula dada en la naturaleza. El término abarca una enzima que es: (a) exógena a una célula dada (es decir, codificada por una secuencia de nucleótidos que no está presente naturalmente en la célula hospedadora o no está presente naturalmente en un contexto dado en la célula hospedadora); y b) encontrada naturalmente en la célula hospedadora (por ejemplo, la enzima es codificada por una secuencia de nucleótidos que es endógena a la célula) pero se produce en una cantidad no natural (por ejemplo, mayor o menor que la que se encuentra naturalmente) en la célula hospedadora.
Por otro lado, el término "nativo" o "endógeno" como se usa en el presente documento con referencia a moléculas, y en particular a enzimas y ácidos nucleicos, indica moléculas que se expresan en el organismo en el que se originaron o se encuentran en la naturaleza, independientemente de el nivel de expresión que puede ser más bajo, igual o más alto que el nivel de expresión de la molécula en el microorganismo nativo. Se entiende que la expresión de enzimas o polinucleótidos nativos puede modificarse en microorganismos recombinantes.
Como se usa en el presente documento, el término "célula progenitora" se refiere a una célula que tiene un fondo genético idéntico al de una célula hospedadora genéticamente modificada descrita en el presente documento, excepto que no comprende una o más modificaciones genéticas particulares modificadas por ingeniería genética en la célula hospedadora modificada, por ejemplo, una o más modificaciones seleccionadas del grupo que consiste en: expresión heteróloga de una enzima de una vía de esteviol, expresión heteróloga de una enzima de una vía de glucósido de esteviol, expresión heteróloga de una geranilgeranil difosfato sintasa, expresión heteróloga de una copalil difosfato sintasa, expresión heteróloga de una caureno sintasa, expresión heteróloga de una caureno oxidasa, expresión heteróloga de una esteviol sintasa (ácido caurenoico hidroxilasa), expresión heteróloga de una reductasa del citocromo P450, expresión heteróloga de una UGT74G1, expresión heteróloga de una UGT76G1, expresión heteróloga de una UGT85C2, expresión heteróloga de una UGT91D, y expresión heteróloga de una UGT40087.
Como se usa en el presente documento, el término "que ocurre naturalmente" se refiere a lo que se encuentra en la naturaleza. Por ejemplo, una UDP-glicosiltransferasa que está presente en un organismo que puede aislarse de una fuente en la naturaleza y que no ha sido modificada intencionalmente por un humano en el laboratorio es la UDP-glicosiltransferasa natural. A la inversa, como se usa en el presente documento, el término "que no ocurre naturalmente" se refiere a lo que no se encuentra en la naturaleza, sino que es creado por la intervención humana.
El término "medio" se refiere a un medio de cultivo y/o medio de fermentación.
El término "composición de fermentación" se refiere a una composición que comprende células hospedadoras genéticamente modificadas y productos o metabolitos producidos por las células hospedadoras genéticamente modificadas. Un ejemplo de una composición de fermentación es un caldo de células completo, que puede ser el contenido completo de un recipiente (por ejemplo, un matraz, placa o fermentador), incluidas las células, la fase acuosa y los compuestos producidos a partir de las células hospedadoras genéticamente modificadas.
Como se usa en el presente documento, el término "producción" generalmente se refiere a una cantidad de esteviol o glucósido de esteviol producido por una célula hospedadora genéticamente modificada provista en el presente documento. En algunos casos, la producción es expresada como un rendimiento de esteviol o glucósido de esteviol por la célula hospedadora. En otros casos, la producción es expresada como una productividad de la célula hospedadora para producir el esteviol o el glucósido de esteviol.
Como se usa en el presente documento, el término "productividad" se refiere a la producción de un esteviol o glucósido de esteviol por una célula hospedadora, expresada como la cantidad de esteviol o glucósido de esteviol producido (en peso) por cantidad de caldo de fermentación en el que se cultiva la célula hospedadora (por volumen) a lo largo del tiempo (por hora).
Como se usa en el presente documento, el término "rendimiento" se refiere a la producción de un esteviol o glucósido de esteviol por una célula hospedadora, expresada como la cantidad de esteviol o glucósido de esteviol producido por cantidad de fuente de carbono consumida por la célula hospedadora, en peso.
Como se usa en el presente documento, el término "un nivel indetectable" de un compuesto (por ejemplo, RebM2, glucósidos de esteviol u otros compuestos) significa un nivel de un compuesto que es demasiado bajo para ser medido y/o analizado por una técnica estándar para medir el compuesto. Por ejemplo, el término incluye el nivel de un compuesto que no es detectable por los métodos analíticos descritos en el Ejemplo 7.
Como se usa en el presente documento, el término "glucósido(s) de esteviol" se refiere a un esteviol enzimáticamente alterado por la adición de una o más porciones de azúcar, tales como un glucósido de esteviol, que incluye, pero no se limita a, glucósidos de esteviol naturales, por ejemplo, esteviolmonósido, esteviolbiósido, rubusósido, dulcósido B, dulcósido A, rebaudiósido B, rebaudiósido G, esteviósido, rebaudiósido C, rebaudiósido F, rebaudiósido A, rebaudiósido I, rebaudiósido E, rebaudiósido H, rebaudiósido L, rebaudiósido K, rebaudiósido J, rebaudiósido M, rebaudiósido D, rebaudiósido N, rebaudiósido O, glucósidos de esteviol sintéticos, por ejemplo, glucósidos de esteviol enzimáticamente glucosilados y combinaciones de los mismos.
Como se usa en el presente documento, el término "uridina difosfato (UDP)-glicosiltransferasa" o "glicosiltransferasa dependiente de UDP" se refiere a una enzima que tiene una actividad de transferencia de una porción monosacárido de un donante de glicosilo a un aceptor de glicosilo, en particular, una enzima utiliza un azúcar UDP como un donante de glicosilo. El término "UDP-glicosiltransferasa" se puede usar indistintamente con "UGT".
Como se usa en el presente documento, el término "un dominio funcional" significa "un dominio aceptor de azúcar" o "un dominio donante de azúcar" de una UDP-glicosiltransferasa. La planta UDP-glicosiltransferasa (UGT) pertenece a la Familia 1 de la superfamilia de glicosiltransferasa. Adoptan el pliegue estructural GT-B. Esta característica estructural compartida por UGT consiste en dos dominios, un C-terminal y un N-terminal con pliegues similares a Rossmann, separados por un enlazador entre dominios. El dominio C-terminal se une a UDP-glucosa ("el donante de azúcar") y, por lo tanto, también se denomina dominio donante de azúcar, mientras que el dominio N-terminal se une al sustrato que no es azúcar ("el aceptor") y, por lo tanto, también se denomina dominio aceptor.
Como se usa en el presente documento, el término "variante" se refiere a un polipéptido que se diferencia de un polipéptido de "referencia" específicamente mencionado (por ejemplo, una secuencia de tipo silvestre) por inserciones, deleciones, mutaciones y/o sustituciones de aminoácidos, pero conserva una actividad que es sustancialmente similar al polipéptido de referencia. Por ejemplo, una variante UGT40087 retiene una actividad que es sustancialmente similar a la referencia UGT40087 con SEQ ID NO: 11, en el sentido de que una variante UGT40087 también es capaz de catalizar una reacción para convertir RebA a RebD y/o esteviósido en RebE. En algunos casos, la variante se crea mediante técnicas de ADN recombinante, como la mutagénesis. En algunas modalidades, un polipéptido variante difiere de su polipéptido de referencia por la sustitución de un residuo básico por otro (es decir, Arg para Lys), la sustitución de un residuo hidrofóbico por otro (es decir, Leu por Ile), o la sustitución de un residuo aromático por otro (es decir Phe para Tyr), etc. En algunas modalidades, las variantes incluyen análogos en los que se obtienen sustituciones conservativas que dan como resultado una analogía estructural sustancial de la secuencia de referencia. Ejemplos de esas sustituciones conservativas, sin limitación, incluyen ácido glutámico para el ácido aspártico y viceversa; glutamina para asparagina y viceversa; serina para treonina y viceversa; lisina para arginina y viceversa; o cualquiera de isoleucina, valina o leucina entre sí.
Como se usa en el presente documento, el término secuencia variante de aminoácidos de "bucle1 variante" se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle1 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11 (o una secuencia de bucle1 modificada de UGT40087 que tiene la secuencia de SEQ ID NO: 28) por, una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve o diez inserciones, deleciones, mutaciones y/o sustituciones de aminoácidos, pero permite una UDP-glicosiltransferasa que comprende una secuencia variante de aminoácidos de bucle1, insertada en una ubicación que corresponde a la ubicación de la secuencia de aminoácidos de bucle1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente, para catalizar la conversión de RebA a RebD y/o el esteviósido a RebE.
Como se usa en el presente documento, el término secuencia de aminoácidos de "bucle2 variante" se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle2 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11 por una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve o diez inserciones, deleciones, mutaciones y/o sustituciones de aminoácidos, pero permite una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos de bucle2 variante, insertada en una ubicación que corresponde a la ubicación de la secuencia de aminoácidos de bucle2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente, para catalizar la conversión de RebA a RebD y/o esteviósido a RebE.
Como se usa en el presente documento, el término secuencia de aminoácidos de "bucle3_1 variante" se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle 3_1 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11 por una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve o diez inserciones, deleciones, mutaciones y/o sustituciones de aminoácidos, pero permite una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos de bucle3_1 variante, insertada en una ubicación que corresponde a la ubicación de la secuencia de aminoácidos de bucle3_1 de SEQ ID NO: 1 o SEQ ID NO: 11, para catalizar la conversión de RebA a RebD y/o esteviósido a RebE. Como se usa en el presente documento, el término secuencia variante de aminoácidos de "bucle3_2 variante" se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle3_2 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11 por una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve o diez inserciones, deleciones, mutaciones y/o sustituciones de aminoácidos, pero permite una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos de bucle3_2 variante, insertada en una ubicación que corresponde a la ubicación de la secuencia de aminoácidos de bucle3_2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente, para catalizar la conversión de RebA a RebD y/o esteviósido a RebE. En ciertas modalidades, una secuencia de aminoácidos de bucle3_2 variante difiere de la secuencia de aminoácidos de bucle3_2 de referencia en una, dos, tres, cuatro, cinco, siete, ocho, nueve, diez o hasta treinta inserciones de aminoácidos, deleciones, mutaciones, y/o sustituciones.
Como se usa en el presente documento, el término secuencia de "bucle4_1 variante" se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle4_1 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11 por una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez o hasta 30 inserciones, deleciones, mutaciones y/o sustituciones de aminoácidos, pero permite una UDP-glicosiltransferasa que comprende una secuencia de bucle4_1 variante, insertada en una ubicación que corresponde a la ubicación de aminoácidos de bucle4_1 de SEQ ID NO: 11, para catalizar la conversión de RebA a RebD y/o esteviósido a RebE. Como se usa en el presente documento, el término "identidad de secuencia" o "porcentaje de identidad", en el contexto o dos o más secuencias de ácidos nucleicos o proteínas, se refiere a dos o más secuencias o subsecuencias que son iguales o tienen un porcentaje específico de residuos de aminoácidos o nucleótidos que son los mismos. Por ejemplo, la secuencia puede tener un porcentaje de identidad de al menos 60 %, al menos 65 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, al menos 91 % al menos 92 %, al menos 93 %, al menos 94 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, al menos 99 % o una identidad más alta en una región específica para una secuencia de referencia cuando se compara y alinea para una correspondencia máxima sobre una ventana de comparación, o región designada según lo medido usando un algoritmo de comparación de secuencia o por alineación manual e inspección visual. Por ejemplo, el porcentaje de identidad se determina calculando la relación del número de nucleótidos idénticos (o residuos de aminoácidos) en la secuencia dividida por la longitud de los nucleótidos totales (o residuos de aminoácidos) menos las longitudes de cualesquiera espacios.
Por conveniencia, el grado de identidad entre dos secuencias se puede determinar usando un programa informático y algoritmos matemáticos conocidos en la técnica. Dichos algoritmos que calculan el porcentaje de identidad de secuencia generalmente tienen en cuenta los espacios de secuencia y los desajustes en la región de comparación. Programas que comparan y alinean secuencias, como Clustal W (Thompson et al., (1994) Nucleic Acids Res., 22: 4673-4680), Clustal Omega (Sievers et al., (2011) Molecular Systems Biology., 7: 539), ALIGN (Myers et al., (1988) CABIOS, 4: 11-17), FASTA (Pearson et al., (1988) PNAS, 85: 2444-2448; Pearson (1990), Methods Enzymol., 183: 63-98) y BLAST con espacios (Altschul et al., (1997) Nucleic Acids Res., 25: 3389-3402) son útiles para este propósito. El BlASt o BLAST 2.0 (Altschul et al., J. Mol. Biol. 215: 403-10, 1990) está disponible en varias fuentes, incluido el Centro Nacional de Información Biológica (NCBI) y en Internet, para uso en conexión con los programas de análisis de secuencia BLASTP, BLASTN, BLASTX, TBlAs TN y TBLASTX. Se puede encontrar información adicional en el sitio web de NCBI.
Los alineamientos de secuencia y los cálculos de porcentaje de identidad se pueden determinar usando el programa BLAST usando sus parámetros estándar predeterminados. Para la alineación de secuencias de nucleótidos y los cálculos de identidad de secuencias, el programa BLASTN se usa con sus parámetros predeterminados (penalización de apertura de espacio = 5, penalización de extensión de espacio = 2, coincidencia nucleica = 2, falta de coincidencia de nucleica = -3, valor de expectativa = 10,0, tamaño de palabra = 11, Máximo de coincidencias en un rango de consulta = 0). Para la alineación de secuencias de nucleótidos y los cálculos de identidad de secuencias, el programa BLASTN se usa con estos parámetros (penalización de apertura de espacio = 5, penalización de extensión de espacio = 2, concordancia nucleica = 1, falta de coincidencia de nucleica = -3, valor de expectativa = 10,0, tamaño de palabra = 11). Para la alineación de secuencias de polipéptidos y los cálculos de identidad de secuencias, el programa BLASTP se usa con sus parámetros predeterminados (matriz de alineación = BLOSUM62; costos de espacio: existencia = 11, extensión = 1; ajustes de composición = puntaje de composición condicional, ajuste de matriz; valor de expectativa = 10,0; tamaño de palabra = 6; máximo de coincidencias en un rango de consulta = 0. Alternativamente, se usan el siguiente programa y los parámetros: Align Plus software de Clone Manager Suite, versión 5 (Sci-Ed Software); comparación de ADN: comparación global, matriz de puntuación lineal estándar, penalización por falta de coincidencia = 2, penalización por espacio abierto = 4, penalización por intervalo por extensión = 1. En las modalidades aquí descritas, la identidad de secuencia se calcula usando los programas BLASTN o BLASTP usando sus parámetros predeterminados. En las modalidades descritas en el presente documento, la secuencia de alineación de dos o se realizan más secuencias usando Clustal Omega usando los parámetros predeterminados sugeridos (secuencias de entrada de Dealign: no; árbol-guía de agolpamiento similar a Mbed: sí; iteración de agrupamiento similar a Mbed: sí; número de iteraciones combinadas: por defecto (0); iteraciones máximas de árbol de guía: por defecto; iteraciones máximas de HMM: por defecto; Orden: alineado).
5.2 Células hospedadoras
En el presente documento se proveen células hospedadoras capaces de producir rebaudiósido D (RebD) a partir de rebaudiósido A (RebA) con alta eficiencia. En ciertas modalidades, las células hospedadoras pueden producir RebD a partir de RebA como material de partida. En modalidades preferidas, las células hospedadoras pueden producir RebA a partir de una fuente de carbono en un medio de cultivo y pueden producir además RebD a partir de RebA. En modalidades particulares, las células hospedadoras pueden además producir rebaudiósido M (RebM) a partir de RebD.
En modalidades particulares, las células hospedadoras comprenden la actividad enzimática de la uridina difosfato glicosiltransferasa 87 (UGT40087). Una enzima UGT40087 es capaz de convertir RebA a RebD con alta eficiencia. En ciertas modalidades, una enzima UGT40087 es capaz de convertir RebA a RebD con una eficiencia superior al 90 %. En ciertas modalidades, una enzima UGT40087 es capaz de convertir RebA a RebD con una eficiencia superior al 95 %. En ciertas modalidades, una enzima UGT40087 es capaz de convertir RebA a RebD con una eficiencia superior al 96%. En ciertas modalidades, una enzima UGT40087 es capaz de convertir RebA a RebD con una eficiencia de aproximadamente 97 %. En ciertas modalidades, una enzima UGT40087 es capaz de convertir esteviósido a RebE.
La célula hospedadora es capaz de convertir RebA a RebD con una eficiencia superior al 90 %. En ciertas modalidades, la célula hospedadora es capaz de convertir RebA a RebD con una eficiencia superior al 95 %. En ciertas modalidades, la célula hospedadora es capaz de convertir RebA a RebD con una eficiencia superior al 96 %. En ciertas modalidades, la célula hospedadora es capaz de convertir RebA a RebD con una eficiencia de aproximadamente el 97 %. En ciertas modalidades, la célula hospedadora es capaz de convertir esteviósido a RebE.
La eficiencia de conversión se puede medir mediante cualquier técnica evidente para los expertos en la técnica. Por ejemplo, la eficiencia de conversión puede medirse poniendo en contacto RebA con una enzima o célula hospedadora bajo condiciones adecuadas para formar RebD. La eficiencia puede medirse comparando la cantidad molar de RebD producida en comparación con la cantidad total de RebA y RebD en la composición resultante. La eficiencia también puede medirse comparando la cantidad total de RebD y los productos posteriores de RebD con la cantidad total de RebA, RebD y los productos posteriores de RebD en la composición resultante. Por ejemplo, la eficiencia también se puede medir al comparar la cantidad total de RebD, RebM y RebM2 en comparación con la cantidad total de RebA, RebD, RebM y RebM2 en la composición resultante.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UGT40087 que comprenden la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos sustancialmente idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 80 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 85 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 95 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 96% idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 97 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 98% idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 99 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11.
En ciertas modalidades, en el presente documento se proveen las células hospedadoras que comprenden una UDPglicosiltransferasa que comprende una secuencia de aminoácidos descrita en el presente documento, y es capaz de beta-glicosilación de la posición C-2' de la glucosa 19-O de un glucósido de esteviol. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa capaz de convertir RebA a RebD con una eficiencia superior al 90 %, 95 %, 96 % o 97 %, y en la que la UDP-glicosiltransferasa comprende una secuencia de aminoácidos que tiene al menos 95 % de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica una UGT40087 que comprende la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos sustancialmente idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 80 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 85 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 95 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 96 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 97 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 98 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 99 % idéntica a la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico heterólogo que comprende una secuencia de nucleótidos de SEQ ID NO: 13 que codifica a UGT40087 que tiene la secuencia de SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico heterólogo que comprende una secuencia de nucleótidos que es al menos 80 %, al menos 85 %, al menos 90 %, al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, al menos 99% idéntica a la secuencia de nucleótidos de SEQ ID NO: 13. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico heterólogo que comprende una secuencia de nucleótidos que es al menos 90 %, al menos 99 % idéntica a la secuencia de nucleótidos de SEQ ID NO: 11.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un dominio funcional de una UGT40087, en donde la UGT40087 comprende la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende el dominio aceptor de azúcar N-terminal de una UGT40087 que comprende la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende el dominio donante de azúcar C-terminal de una UGT40087 que comprende la secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, el dominio aceptor de azúcar de una UGT40087 comprende aproximadamente las posiciones de aminoácidos 1 a 214 de SEQ Id NO: 11 (que corresponden a las posiciones de aminoácidos 1 a 215 de SEQ ID NO: 1). En ciertas modalidades, el dominio donante de azúcar de UGT40087 comprende aproximadamente las posiciones de aminoácidos 215 a 435 de SEQ ID NO: 11 (que corresponden a las posiciones de aminoácidos 216 a 436 de SEQ ID NO: 1). En ciertas modalidades, el dominio aceptor de azúcar de UGT40087 comprende aproximadamente las posiciones de aminoácidos 1 a 215 de SEQ ID NO: 1. En ciertas modalidades, el dominio donante de azúcar comprende aproximadamente las posiciones de aminoácidos de 216 a 436 de SEQ ID NO: 1. En ciertas modalidades, el dominio aceptor de azúcar y el dominio donante de azúcar de una UGT40087 comprenden un intervalo más estrecho de residuos de aminoácidos que 1 a 214 o 215 a 435, respectivamente, en relación con SEQ ID NO: 11. En ciertas modalidades, el dominio aceptor de azúcar y el dominio donante de azúcar de una UGT40087 comprenden un intervalo más estrecho de residuos de aminoácidos que 1 a 215 o 216 a 436, respectivamente, en relación con SEQ ID NO: 1.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos sustancialmente idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 60 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 65 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o la SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 70 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 75 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 80 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 85 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 95 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 96 % idéntica a la secuencia de aminoácidos de el dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 97 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 98 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 99 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 60 %, al menos 99 %, o cualquier porcentaje entre el 60 % y el 99 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica una UGT40087 que comprende la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos sustancialmente idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 60 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 65 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 70 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 75 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 80 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 85 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 95 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 96 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 97 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 98 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 99 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11.
En ciertos casos, cuando se compararon y analizaron estructuras modeladas tridimensionales de UGT40087 y otra UDP-glicosiltransferasa, que reveló cuatro bucles (es decir, bucle1, bucle2, bucle3, y bucle4) que poseen diferencias conformacionales significativas en el dominio aceptor de azúcar N-terminal. Véase Figura 6 y Ejemplo 12. Los resultados experimentales de los intercambios de secuencias de bucle correspondientes entre las dos u Gt indicaron que el bucle1, el bucle2, el bucle3_1, el bucle3_2 y el bucle4_1 de UGT40087 pueden sustituirse por sus respectivas secuencias de bucle correspondientes de otras UDP-glicosiltransferasas que son capaces de convertir RebA a RebD. En estas modalidades, se diseñaron dos versiones de bucle3 (es decir, bucle3_1 y bucle3_2) y bucle_4 (es decir, bucle4_1 y bucle4_2) para tener en cuenta dos posibles longitudes de bucle.
Por lo tanto, en ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico heterólogo que codifica una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, la UDP-glicosiltransferasa comprende además una secuencia de aminoácidos de bucle1 de UGT40087 (es decir, la SEQ ID NO: 1 o SEQ ID NO: 11), en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación del bucle 1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. En ciertas modalidades, la secuencia de aminoácidos de bucle1 de SEQ ID NO: 1 o SEQ ID NO: 11 tiene la secuencia de aminoácidos de SEQ ID NO: 30. En ciertas modalidades, la secuencia de aminoácidos de bucle1 tiene la secuencia de SEQ ID NO: 28. En ciertas modalidades, la UDP-glicosiltransferasa comprende además una secuencia variante de aminoácidos de bucle1, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación del bucle1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. La secuencia variante de aminoácidos de bucle1 se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos del bucle1 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11o la secuencia de aminoácidos de bucle 1 que tiene la SEQ ID NO: 28, pero permite la UDP glicosiltransferasa que comprende el aminoácido de bucle1 variante para conservar su actividad para convertir RebA a RebD y, opcionalmente, para convertir esteviósido en RebE.
En ciertas modalidades, la UDP-glicosiltransferasa comprende además la secuencia de aminoácidos de bucle2 de UGT40087 (es decir, SEQ ID NO: 1 o SEQ ID NO: 11), en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. En ciertas modalidades, la secuencia de aminoácidos de bucle2 de SEQ ID NO: 1 o SEQ ID NO: 1 tiene la secuencia de aminoácidos de SEQ ID NO: 19. En ciertas modalidades, la UDP-glicosiltransferasa comprende además una secuencia de aminoácidos de bucle2 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle 2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. La secuencia de aminoácidos del bucle2 variante se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos del bucle2 de referencia SEQ ID NO: 1 o SEQ ID NO: 11, pero permite que la UDP-glicosiltransferasa que comprende el aminoácido de bucle2 variante retenga su actividad para convertir RebA a RebD y, opcionalmente, para convertir esteviósido en RebE.
En ciertas modalidades, la UDP-glicosiltransferasa comprende además la secuencia de aminoácidos de bucle3_1 de UGT40087 (es decir, SEQ ID NO: 1 o SEQ ID NO: 11), en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle3_1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. En ciertas modalidades, la secuencia de aminoácidos de bucle3_1 de SEQ ID NO: 1 o SEQ ID NO: 11 tiene la secuencia de aminoácidos de SEQ ID NO: 20. En ciertas modalidades, la UDP-glicosiltransferasa comprende además una secuencia de aminoácidos de bucle3_1 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle3_1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. La secuencia de aminoácidos de bucle3_1 variante se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle3_1 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11, pero permite que la UDP-glicosiltransferasa que comprende el aminoácido de bucle2_1 variante retenga su actividad para convertir RebA a RebD y, opcionalmente, para convertir esteviósido en RebE.
En ciertas modalidades, la UDP-glicosiltransferasa comprende además la secuencia de aminoácidos de bucle3_2 de UGT40087 (es decir, SEQ ID NO: 1 o SEQ ID NO: 11), en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle3_2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. En ciertas modalidades, la secuencia de aminoácidos de bucle3_2 de SEQ ID NO: 1 o SEQ ID NO: 11 tiene la secuencia de aminoácidos de SEQ ID NO: 21. En ciertas modalidades, la UDP-glicosiltransferasa comprende además una secuencia de aminoácidos de bucle3_2 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle3_2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. La secuencia de aminoácidos de bucle 3_2 variante se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle 3_2 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11, pero permite que la UDP-glicosiltransferasa que comprende el aminoácido variante bucle3_2 retenga su actividad para convertir RebA a RebD y, opcionalmente, para convertir esteviósido a RebE.
En ciertas modalidades, la UDP-glicosiltransferasa comprende además la secuencia de aminoácidos de bucle4_1 de UGT40087 (es decir, SEQ ID NO: 1 o SEQ ID NO: 11), en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. En ciertas modalidades, la secuencia de aminoácidos de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11 tiene la secuencia de aminoácidos de SEQ ID NO: 22. En ciertas modalidades, la UDP-glicosiltransferasa comprende además una secuencia de aminoácidos de bucle4_1 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. La secuencia de aminoácidos de bucle4_1 variante se refiere a una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de bucle4_1 de referencia de SEQ ID NO: 1 o SEQ ID NO: 11, pero permite que la UDP-glicosiltransferasa que comprende la variante de aminoácido bucle4_1 retenga su actividad para convertir RebA a RebD y, opcionalmente, convertir esteviósido a RebE.
En ciertas modalidades, la UDP-glicosiltransferasa comprende además la secuencia de aminoácidos de bucle4_2 de UGT40087 (es decir, SEQ ID NO: 1 o SEQ ID NO: 11), en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle4_2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente. La secuencia de aminoácidos de bucle4_2 de SEQ ID NO: 1 o SEQ ID NO: 11 tiene la secuencia de aminoácidos de SEQ ID NO: 23.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11, o un ácido nucleico heterólogo que codifica la UDP-glicosiltransferasa de la misma, y que comprende además cualquier combinación de los siguientes:
(a) La secuencia de aminoácidos de bucle1 de SEQ ID NO: 1 o SEQ ID NO: 11, la secuencia de aminoácidos de SEQ ID NO: 28, o una secuencia variante de aminoácidos de bucle1, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente; (b) la secuencia de aminoácidos de bucle2 de SEQ ID NO: 1 o SEQ ID NO: 11, o una secuencia de aminoácidos de bucle2 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente;
(c) la secuencia de aminoácidos de bucle3_1 de SEQ ID NO: 1 o SEQ ID NO: 11, o una secuencia de aminoácidos de bucle3_1 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle 3_1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente;
(d) la secuencia de aminoácidos de bucle3_2 de SEQ ID NO: 1 o SEQ ID NO: 11, o una secuencia de aminoácidos de bucle3_2 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle3_2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente;
(e) la secuencia de aminoácidos de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11, o una secuencia de aminoácidos de bucle4_1 variante, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente; y
(f) la secuencia de aminoácidos de bucle4_2 de SEQ ID NO: 1 o SEQ ID NO: 11, en una ubicación de la UDP-glicosiltransferasa que corresponde a la ubicación de bucle4_2 de SEQ ID NO: 1 o SEQ ID NO: 11, respectivamente.
En ciertos casos, cuando se compararon y analizaron estructuras modeladas tridimensionales de UDP-glicosiltransferasas capaces de convertir RebA a RebD, se descubrió que bucle4_1 de UGT40087, cuando se incorporó en la ubicación de bucle4_1 correspondiente de otra UDP-glicosiltransferasa (y reemplazando su secuencia de aminoácidos de bucle4_1 nativa) condujo a una actividad superior de una UDP-glicosiltransferasa variante en términos de su capacidad para convertir RebA a RebD. Ver el Ejemplo 12. Estos resultados indican que la secuencia de aminoácidos de bucle4_1 de cualquier UDP-glicosiltransferasa puede sustituirse con la secuencia de aminoácidos de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11 para convertir RebA a RebD.
Por lo tanto, en ciertas modalidades, en el presente documento se proveen las células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 61 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, o 95 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11, y además comprende la secuencia de aminoácidos de bucle4_1 (es decir, SEQ ID NO: 22) de UGT40087 (es decir, SEQ ID NO: 1 o SEQ ID NO: 11). En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico heterólogo que codifica una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 61 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, o 95 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11, y además comprende la secuencia de aminoácidos de bucle4_1 (por ejemplo, SEQ ID NO: 22) de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, cualquier UDP-glicosiltransferasa adecuada que comprenda una secuencia de aminoácidos que sea al menos 80 %, 85 %, 90 % o 95 % para SEQ ID NO: 1 o SEQ ID NO: 11 se puede usar para integrar la secuencia de aminoácidos de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11 en su ubicación bucle4_1 correspondiente (reemplazando su secuencia de aminoácidos del bucle4_1 nativo). Por ejemplo, Si91Dlike se puede usar como una base para integrar la secuencia de aminoácidos de bucle4_1 de SEQ ID NO: 1 o SEQ ID NO: 11 en su ubicación de bucle4_1 correspondiente.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos sustancialmente idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 60 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 65 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 70 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 75 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 80 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 85 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 95 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 96 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 97 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 98 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un polipéptido que comprende una secuencia de aminoácidos que es al menos 99 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID n O: 1 o SEQ ID NO: 11.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica una UGT40087 que comprende la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos sustancialmente idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 60 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 65 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 70 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 75 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 80 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 85 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 90 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 95 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 96 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 97 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 98 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico que codifica un polipéptido que comprende una secuencia de aminoácidos que es al menos 99 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11.
En ciertas modalidades, los dominios aceptores de azúcar N-terminales y los dominios donante de azúcar C-terminales se recombinaron para alterar la especificidad de sustrato o la actividad catalítica. Como se describe en detalle en el Ejemplo 11, se determinó que cuando un dominio donante de azúcar de otra UDP-glicosiltransferasa capaz de convertir RebA a RebD se recombinó con el dominio aceptor de azúcar de SEQ ID NO: 1 o SEQ ID NO: 11, las UDP-glicosiltransferasas quiméricas conservaron su capacidad para convertir RebA a RebD.
Por lo tanto, en ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, o 95 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden un ácido nucleico heterólogo que codifica una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 % idéntica a la secuencia de aminoácidos del dominio donante de azúcar C-terminal de SEQ ID NO: 1 o SEQ ID NO: 11. Como se muestra en el Ejemplo 11, el dominio donante de azúcar C-terminal es relativamente intercambiable con otra UDP-glicosiltransferasa que comprende una identidad de secuencia de al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 % o 95 %. En ciertas modalidades, la UDP-glicosiltransferasa comprende además un dominio donante de azúcar C-terminal de otra UDP-glicosiltransferasa. Ejemplos de otras UDP-glicosiltransferasas con dominios donantes de azúcar C-terminal adecuados incluyen Ob_UGT91B_like, Hv_UGT_V1, SI_UGT_101249881, Sr.UGT_g252778, Os_UGT_91C1, Bd_UGT10840, Bd_UGT10850 o Si91Dlike.
En ciertas modalidades, se descubrió que ciertos residuos de aminoácidos en el dominio aceptor de azúcar N-terminal pueden restaurar la actividad catalítica de una UDP-glicosiltransferasa putativa, no funcional, en una UDP-glicosiltransferasa activa. Por lo tanto, en el presente documento se proveen células hospedadoras que comprenden una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que es al menos 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % idéntica a la secuencia de aminoácidos del dominio aceptor de azúcar N-terminal de SEQ ID NO: 1 o SEQ ID NO: 11, y además comprende uno o más de los siguientes residuos de aminoácidos:
(a) valina en una posición de aminoácido de la UDP-glicosiltransferasa que corresponde a la posición de aminoácido 11 de SEQ ID NO: 11;
(b) isoleucina en una posición de aminoácido de la UDP-glicosiltransferasa que corresponde a la posición de aminoácido 12 de SEQ ID NO: 11;
(c) prolina en una posición de aminoácido de la UDP-glicosiltransferasa que corresponde a la posición de aminoácido 55 de s Eq ID NO: 11;
(d) ácido glutámico en una posición de aminoácido de la UDP-glicosiltransferasa que corresponde a la posición de aminoácido 90 de SEQ ID NO: 11;
(e) serina en una posición de aminoácido de la UDP-glicosiltransferasa que corresponde a la posición de aminoácido 203 de Se Q ID NO: 11;
(f) ácido glutámico en una posición de aminoácido de la UDP-glicosiltransferasa que corresponde a la posición de aminoácido 223 de SEQ iD NO: 11; o
(g) valina en una posición de aminoácido de la UDP-glicosiltransferasa que corresponde a la posición de aminoácido 413 de SEQ ID NO: 11,
en donde las posiciones de aminoácidos de la UDP-glicosiltransferasa que corresponden a las posiciones de aminoácidos de SEQ ID NO: 11 se determinan por alineación de secuencias.
En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden una UDPglicosiltransferasa que comprende una secuencia de aminoácidos de SEQ ID NO: 24.
En ciertas modalidades, la célula hospedadora comprende una variante del polipéptido UGT40087 descrito anteriormente. En ciertas modalidades, la variante puede comprender hasta 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 o 1 sustituciones de aminoácidos en relación con el polipéptido UGT40087. En ciertas modalidades, la variante puede comprender hasta 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 o 1 sustituciones conservativas de aminoácidos en relación con el polipéptido UGT40087. En ciertas modalidades, cualquiera de los ácidos nucleicos descritos en el presente documento puede optimizarse para la célula hospedadora, por ejemplo, el codón optimizado.
En las modalidades descritas en el presente documento, se puede usar cualquier método adecuado para determinar las posiciones de aminoácidos correspondientes o ubicaciones de bucle de dos polipéptidos correspondientes. En ciertos casos, las secuencias de una UDP-glicosiltransferasa y la secuencia de referencia SEQ ID NO: 11 pueden alinearse usando Clustal Omega usando sus parámetros predeterminados. En otros casos, las secuencias de una UDP-glicosiltransferasa y la secuencia de referencia s Eq ID NO: 11 se pueden alinear usando alineaciones estructurales tales como SWISS-MODEL, que es un servidor de modelado de homología de estructura de proteínas, accesible a través del servidor web ExPASy, o del programa DeepView (Swiss Pdb-Viewer).
Mientras que SEQ ID NO: 11 se refiere como la secuencia de referencia para la determinación de posiciones de aminoácidos o sitios de bucle correspondientes para una UDP-glicosiltransferasa, en ciertas modalidades, SEQ ID NO: 1 también se puede usar como secuencia de referencia para la alineación de secuencia.
RebA es como se muestra en la Figura 1A. En ciertas modalidades, una UGT40087 o una UGT40087 variante es capaz de catalizar la reacción de un residuo de azúcar, formando el enlace p, a la posición C-2' de la 19-O-glucosa de RebA para producir RebD como se muestra en la Figura 1A. En ciertas modalidades, la UGT40087 o la UGT40087 variante es capaz de catalizar la reacción de un residuo de hexosa, en la formación p, a la C-2' de la 19-O-glucosa de RebA. En ciertas modalidades, la UGT40087 es capaz de catalizar la reacción de un residuo de glucosa, en la formación p, a la C-2' de la 19-O-glucosa de RebA.
RebE es como se muestra en la Figura 2B. En ciertas modalidades, una UGT40087 o una UGT40087 variante es capaz de catalizar la reacción de un residuo de azúcar, formando el enlace p, a la posición C-2' de la 19-O-glucosa de esteviósido para producir RebE como se muestra en la Figura 2B. En ciertas modalidades, la UGT40087 o la UGT40087 variante es capaz de catalizar la reacción de un residuo de hexosa, en la formación p, a la C-2' de la 19-O-glucosa del esteviósido. En ciertas modalidades, la UGT40087 o la UGT40087 variante es capaz de catalizar la reacción de un residuo de glucosa, en la formación p, a la C-2' de la 19-O-glucosa del esteviósido.
En ciertas modalidades, una UGT40087 o una UGT40087 variante no cataliza la reacción de adición de una segunda porción de azúcar a esteviolmonósido (es decir, glucósido de 13-O-esteviol) a un nivel detectable. En ciertas modalidades, la UGT40087 o la UGT40087 variante no catalizan la reacción de agregar una segunda porción de azúcar a rubusósido (es decir, glucósido de 19-O-esteviol) a un nivel detectable.
RebD es como se muestra en la Figura 1A. En ciertas modalidades, la célula hospedadora comprende además una o más enzimas capaces de convertir RebA a RebD. En ciertas modalidades, la célula hospedadora comprende una UGT40087 y/o una UGT40087 variante para la conversión de RebA a RebD.
UGT76G1 es capaz de catalizar la reacción de un residuo de azúcar para convertir RebD a RebM como se muestra en la Figura 1A. En ciertas modalidades, las células hospedadoras comprenden además una o más enzimas capaces de convertir RebD a RebM. En ciertas modalidades, la célula hospedadora comprende además una UGT76G1 capaz de convertir RebD a RebM.
RebM2 se muestra en la Figura 1B. RebM2 es un isómero de RebM con un solo enlace de glucosa incorrecto como se muestra en la Figura 1B. RebM2 tiene Glq8(1-2)[Glq8 (1-6)]Glq61- en la posición de 19 carbonos (COOH) en lugar de la GlqS (1-2)[Glq6 (1-3)]Glq61- deseada para RebM.
Los expertos reconocerán que, en ciertas aplicaciones, RebM2 podría ser un producto secundario no deseado. Ventajosamente, en ciertas modalidades, la UGT40087 (o la UGT40087 variante) y las células hospedadoras documento que se proveen en el presente son capaces de producir poco o nada de RebM2. La cantidad de RebM2 se puede expresar como una relación de RebM a RebM2. En ciertas modalidades, la relación de RebM a RebM2 es al menos 2:1. En ciertas modalidades, la relación de RebM a RebM2 es de al menos 3:1. En ciertas modalidades, la relación de RebM a RebM2 es de al menos 4:1. En ciertas modalidades, la relación de RebM a RebM2 es de al menos 5:1. En ciertas modalidades, la relación de RebM a RebM2 es de al menos 10:1. En ciertas modalidades, la relación de RebM a RebM2 es de al menos 100:1. En ciertas modalidades, la relación de RebM a RebM2 es de al menos 1000:1. En ciertas modalidades, la relación de RebM a RebM2 es de al menos 10000:1. En ciertas modalidades, la UGT40087 (o la UGT40087 variante) y las células hospedadoras provistas en el presente documento producen un nivel indetectable de RebM2.
Si bien la UGT40087 o cualquier UGT40087 variante de las células hospedadoras aceptan RebA como sustrato, la fuente de RebA puede ser cualquier fuente que se considere adecuada para los expertos. En ciertas modalidades, la UGT40087 o cualquier UGT40087 variante pueden ponerse en contacto con RebA. En ciertas modalidades, la célula hospedadora puede ponerse en contacto con RebA. En ciertas modalidades, la UGT40087 o cualquier variante de UGT40087 puede ponerse en contacto con una composición que comprende uno o más glucósidos de esteviol. En ciertas modalidades, la composición comprende RebA. En ciertas modalidades, la composición comprende esteviósido. En ciertas modalidades, la composición se deriva de productos naturales aislados de hojas de Stevia rebaudiana. En ciertas modalidades, la composición se deriva de microbios. En ciertas modalidades, la célula hospedadora puede ponerse en contacto con una composición que comprende uno o más glucósidos de esteviol.
En ciertos casos, cualquier UGT40087 variante adecuada para catalizar una reacción deseada puede seleccionarse para cualquier método adecuado conocido en la técnica. Por ejemplo, una UGT40087 variante adecuada puede analizarse in vivo expresando un ácido nucleico heterólogo que codifica una UGT40087 variante y seleccionando células que producen la UGT40087 variante funcional capaz de agregar un azúcar en una ubicación deseada de un sustrato (por ejemplo, la posición C-2' de la 19-O-glucosa de un glucósido de esteviol u otros sustratos). Los métodos de selección ilustrativos se describen en los Ejemplos 3-7 a continuación. En otro ejemplo, una UGT40087 variante adecuada puede seleccionarse in vitro poniendo en contacto una UGT40087 variante con un sustrato tal como RebA. En este ejemplo, el análisis para la presencia de RebD se puede usar como prueba para determinar si una UGT40087 variante es una enzima adecuada. La reacción se puede analizar mediante LC-MS u otros métodos conocidos en la técnica. Véase, por ejemplo, el documento WO 2013/022989.
En ciertas modalidades, una UGT40087 variante se considera adecuada para convertir RebA a RebD (o de cualquier sustrato adecuado para su producto mediante glicosilación) si es capaz de convertir RebA a RebD con una eficiencia superior a 90 %, 95 %, 96 % o 97 % in vivo.
En algunas modalidades, otras UDP-glicosiltransferasas adecuadas descubiertas en la presente solicitud pueden usarse además a UGT40087. Estas incluyen, por ejemplo, UDP-glicosiltransferasas sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850 y Ob_UGT91B1_like. En ciertas modalidades, la UDP-glicosiltransferasa sr.UGT_9252778 comprende SEQ ID NO: 2. En ciertas modalidades, la UDP-glicosiltransferasa Bd_UGT10840 comprende SEQ ID NO: 3. En ciertas modalidades, la UDP-glicosiltransferasa Hv_UGT_V1 comprende SEQ ID NO: 4. En ciertas modalidades La UDP-glicosiltransferasa Bd_UGT10850 comprende SEQ ID NO: 5. En ciertas modalidades, la UDP-glicosiltransferasa Ob_UGT91B1_like comprende s Eq ID NO: 6. Cualquier discusión relacionada con las composiciones y métodos pertinentes para la UGT40087 descrita en el presente documento también se puede aplicar a estas otras UDP-glicosiltransferasas.
Por ejemplo, en algunas modalidades, las células hospedadoras de la invención comprenden además la actividad enzimática de la uridina difosfato glicosiltransferasa sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850 y/u Ob_UGT91B1_like. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 40 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 45 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 50 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 55 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 60 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 65 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 70 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 75 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 80 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 85 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 90 %. En ciertas modalidades, una o más de estas enzimas son capaces de convertir RebA a RebD con una eficiencia superior a 95 %.
En ciertas modalidades, en el presente documento se proveen las células hospedadoras de la invención que comprenden además cualquiera o más de sr.UGT_9252778, Bd_UGT10840, Hv_UGT_V1, Bd_UGT10850, y/o Ob_UGT91B1_like que comprende una secuencia de aminoácidos de SEQ ID NOS: 2, 3, 4, 5, o 6, respectivamente. En ciertas modalidades, en el presente documento se proveen células hospedadoras que comprenden además un polipéptido que comprende una secuencia de aminoácidos que es al menos 60 %, al menos 70 %, al menos 75 %, al menos 80 %, al menos 85 %, al menos 90 %, en al menos 95 %, al menos 96 %, al menos 97 %, al menos 98 %, al menos 99 % o el 100 % idéntica a la secuencia de aminoácidos de las SEQ ID NO: 2, 3, 4, 5 o 6.
En modalidades ventajosas, la célula hospedadora puede comprender una o más rutas enzimáticas capaces de hacer RebA, tomándose dichas vías individualmente o juntas. En ciertas modalidades, las células hospedadoras comprenden una o más enzimas capaces de convertir geranilgeranil difosfato en RebA. Las enzimas útiles y los ácidos nucleicos que codifican las enzimas son conocidos por los expertos en la técnica. Las enzimas y ácidos nucleicos particularmente útiles se describen en las secciones a continuación y se describen con más detalle, por ejemplo, en los documentos US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, WO 2016/038095 A2 y US 2016/0198748 A1.
En modalidades adicionales, las células hospedadoras comprenden además una o más enzimas capaces de preparar geranilgeranil difosfato a partir de una fuente de carbono. Estas incluyen enzimas de la vía DXP y enzimas de la vía MEV. Las enzimas útiles y los ácidos nucleicos que codifican las enzimas son conocidos por los expertos en la técnica. Las enzimas ilustrativas de cada vía se describen a continuación y se describen con más detalle, por ejemplo, en US 2016/0177341 A1. La vía MEV también se muestra en la Figura 1C.
En ciertas modalidades, las enzimas adicionales son nativas. En modalidades ventajosas, las enzimas adicionales son heterólogas. En ciertas modalidades, dos enzimas se pueden combinar en un polipéptido.
5.3 Polipéptidos y ácidos nucleicos de la UDP-glucosiltransferasa que no ocurren naturalmente
En otro aspecto, en el presente documento se proveen UDP-glicosiltransferasas variantes que no ocurren naturalmente que incluyen modificación(es) de residuos de aminoácidos en comparación con una secuencia de referencia (por ejemplo, SEQ ID NO: 1) y aún así conserva la actividad como UDP glicosiltransferasa para convertir RebA a RebD y, opcionalmente, de esteviósido a RebE. En ciertas modalidades, las UDP-glicosiltransferasas variantes que no ocurren naturalmente pueden incluir hasta 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 o 1 sustituciones, deleciones, adiciones y/o inserciones de aminoácidos en ciertas posiciones o ubicaciones de aminoácidos en comparación con una secuencia de referencia (por ejemplo, SEQ ID NO: 1 o SEQ ID NO: 11). En ciertas modalidades, las UDP-glicosiltransferasas variantes que no ocurren naturalmente comprenden cualquiera de las UDP-glicosiltransferasas variantes descritas en el presente documento, en particular las descritas en la Sección 6.2, siempre que estén dentro del alcance de las reivindicaciones.
En otros aspectos, en el presente documento se proveen UDP-glicosiltransferasas variantes que no ocurren naturalmente que incluyen modificación(es) de residuos de ácido nucleico en comparación con una secuencia de referencia (por ejemplo, SEQ ID NO: 26), y aún así, cuando se traducen en una proteína, la proteína retiene la actividad como una UDP-glicosiltransferasa para convertir RebA a RebD y, opcionalmente, para convertir el esteviósido en RebE. En ciertas modalidades, las UDP-glicosiltransferasas variantes que no ocurren naturalmente pueden codificar cualquiera de las UDP-glicosiltransferasas variantes descritas en el presente documento, en particular las descritas en la Sección 6.2, siempre que estén dentro del alcance de las reivindicaciones.
5.4 Cepas celulares
Las células hospedadoras, composiciones y métodos útiles provistos en el presente documento incluyen células arqueas, procarióticas o eucariotas.
Los hospederos procarióticos adecuados incluyen, pero no se limitan, a cualquiera de varias bacterias gram-positivas, gram-negativas o gram-variables. Ejemplos incluyen, pero no se limitan a, células pertenecientes a los géneros: Agrobacterium, Alicydobacillus, Anabaena, Anacystis, Arthrobacter, Azobacter, Bacillus, Brevibacterium, Chromatium, Clostridium, Corynebacterium, Enterobacter, Erwinia, Escherichia, Lactobacillus, Lactococcus, Mesorhizobium, Methylobacterium, Microbacterium, Phormidium, Pseudomonas, Rhodobacter, Rhodopseudomonas, Rhodospirillum, Rhodococcus, Salmonella, Scenedesmun, Serratia, Shigella, Staphlococcus, Strepromyces, Synnecoccus y Zymomonas. Ejemplos de cepas procariotas incluyen, pero no se limitan a: Bacillus subtilis, Bacillus amyloliquefacines, Brevibacterium ammoniagenes, Brevibacterium immariophilum, Clostridium beigerinckii, Enterobacter sakazakii, Escherichia coli, Lactococcus lactis, Mesorhizobium loti, Pseudomonas aeruginosa, Pseudomonas mevalonii, Pseudomonas pudica, Rhodobacter capsulatus, Rhodobacter sphaeroides, Rhodospirillum rubrum, Salmonella enterica, Salmonella typhi, Salmonella typhimurium, Shigella dysenteriae, Shigella flexneri, Shigella sonnei y Staphylococcus aureus. En una modalidad particular, la célula hospedadora es una célula de Escherichia coli.
Los hospederos arqueas adecuados incluyen, pero no se limitan a, células pertenecientes a los géneros: Aeropyrum, Archaeglobus, Halobacterium, Methanococcus, Methanobacterium, Pyrococcus, Sulfolobus y Thermoplasma. Ejemplos de cepas de archae incluyen, pero no se limitan a: Archaeoglobus fulgidus, Halobacterium sp., Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Thermoplasma acidophilum, Thermoplasma volcanium, Pyrococcus horikoshii, Pyrococcus abyssi y Aeropyrum pernix.
Los hospederos eucariotas adecuados incluyen, pero no se limitan a, células de hongos, células de algas, células de insectos y células de plantas. En algunas modalidades, las levaduras útiles en los presentes métodos incluyen levaduras que se han depositado en depósitos de microorganismos (por ejemplo, IFO, ATCC, etc.) y pertenecen a los géneros Aciculoconidium, Ambrosiozyma, Arthroascus, Arxiozyma, Ashbya, Babjevia, Bensingtonia, Botryoascus, Botryozyma, Brettanomyces, Bullera, Bulleromyces, Candida, Citeromyces, Clavispora, Cryptococcus, Cystofilobasidium, Debaryomyces, Dekkara, Dipodascopsis, Dipodascus, Eeniella, Endomycopsella, Eremascus, Eremothecium, Erythrobasidium, Fellomyces, Filobasidium, Galactomyces, Geotrichum, Guilliermondella, Hanseniaspora, Hansenula, Hasegawaea, Holtermannia, Hormoascus, Hyphopichia, Issatchenkia, Kloeckera, Kloeckeraspora, Kluyveromyces, Kondoa, Kuraishia, Kurtzmanomyces, Leucosporidium, Lipomyces, Lodderomyces, Malassezia, Metschnikowia, Mrakia, Myxozyma, Nadsonia, Nakazawaea, Nematospora, Ogataea, Oosporidium, Pachysolen, Phachytichospora, Phaffia, Pichia, Rhodosporidium, Rhodotorula, Saccharomyces, Saccharomycodes, Saccharomycopsis, Saitoella, Sakaguchia, Saturnospora, Schizoblastosporion, Schizosaccharomyces, Schwanniomyces, Sporidiobolus, Sporobolomyces, Sporopachydermia, Stephanoascus, Sterigmatomyces, Sterigmatosporidium, Symbiotaphrina, Sympodiomyces, Sympodiomycopsis, Torulaspora, Trichosporiella, Trichosporon, Trigonopsis, Tsuchiyaea, Udeniomyces, Waltomyces, Wickerhamia, Wickerhamiella, Williopsis, Yamadazyma, Yarrowia, Zygoascus, Zygosaccharomyces, Zygowilliopsis y Zygozyma, entre otras.
En algunas modalidades, el microbio hospedero es Saccharomyces cerevisiae, Pichia pastoris, Schizosaccharomyces pombe, Dekkera bruxellensis, Kluyveromyces lactis (anteriormente llamado Saccharomyces lactis), Kluveromyces marxianus, Arxula adeninivorans o Hansenula polymorpha (ahora conocido como Pichia angusta). En algunas modalidades, el microbio hospedero es una cepa del género Candida, tal como Candida lipolytica, Candida guilliermondii, Candida krusei, Candida pseudotropicalis o Candida utilis.
En una modalidad particular, el microbio hospedero es Saccharomyces cerevisiae. En algunas modalidades, el hospedero es una cepa de Saccharomyces cerevisiae seleccionada del grupo que consiste en levadura de Baker, CBS 7959, CBS 7960, CBS 7961, CBS 7962, CBS 7963, CBS 7964, IZ-1904, TA, BG-1, CR-1, SA-1, M-26, Y-904, PE-2, PE-5, VR-1, BR-1, BR-2, ME-2, VR-2, MA-3, MA-4, CAT-1, CB-1, NR-1, BT-1, y AL-1. En algunas modalidades, el microbio hospedero es una cepa de Saccharomyces cerevisiae seleccionada del grupo que consiste en PE-2, CAT-1, VR-1, BG-1, CR-1 y SA-1. En una modalidad particular, la cepa de Saccharomyces cerevisiae es PE-2. En otra modalidad particular, la cepa de Saccharomyces cerevisiae es CAT-1. En otra modalidad particular, la cepa de Saccharomyces cerevisiae es BG-1.
En algunas modalidades, el microbio hospedero es un microbio que es adecuado para la fermentación industrial. En modalidades particulares, el microbio está preparado para subsistir bajo una alta concentración de solvente, alta temperatura, utilización de sustrato expandido, limitación de nutrientes, estrés osmótico debido al azúcar y sales, acidez, contaminación por sulfitos y bacterias, o combinaciones de los mismos, que son condiciones de estrés reconocidas del ambiente de fermentación industrial.
5.5 Las vías de biosíntesis de esteviol y glucósidos de esteviol
En algunas modalidades, una vía de biosíntesis de esteviol y/o una vía de biosíntesis de glucósidos de esteviol se activa en las células hospedadoras genéticamente modificadas provistas en el presente documento mediante ingeniería genética de las células para expresar polinucleótidos y/o polipéptidos que codifican una o más enzimas de la vía. La Figura 2A ilustra una vía de biosíntesis de esteviol ilustrativa. La Figura 2B ilustra un ejemplo de vía de biosíntesis de glucósidos de esteviol a partir de esteviol a varios glucósidos de esteviol.
Por lo tanto, en algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad geranilgeranil difosfato sintasa (GGPPS). En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene copalil difosfato sintasa o ent-copalil pirofosfato sintasa (CDPS; también denominada actividad de ent-copalil pirofosfato sintasa o CPS). En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad de caureno sintasa (KS; también conocida como ent-caureno sintasa). En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad de caureno oxidasa (KO; también conocida como ent-caureno 19-oxidasa). En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene esteviol sintasa (también denominada actividad de ácido 13-hidroxilasa o KAH del ácido caurenoico). En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad de la citocromo P450 reductasa (CPR).
En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad UGT74G1. En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad UGT76G1. En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad UGT85C2. En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad de UGT91D. En algunas modalidades, las células hospedadoras genéticamente modificadas provistas en el presente documento comprenden un polinucleótido heterólogo que codifica un polipéptido que tiene actividad de UGT40087.
En ciertas modalidades, la célula hospedadora comprende una variante. En ciertas modalidades, la variante puede comprender hasta 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 o 1 sustituciones de aminoácidos en relación con el polipéptido relevante. En ciertas modalidades, la variante puede comprender hasta 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 o 1 sustituciones conservadoras de aminoácidos con respecto al polipéptido de referencia. En ciertas modalidades, cualquiera de los ácidos nucleicos descritos en el presente documento puede optimizarse para la célula hospedadora, por ejemplo, el codón optimizado.
Los ácidos nucleicos y enzimas ilustrativas de una vía de biosíntesis de esteviol y/o una vía de biosíntesis de glucósidos de esteviol se describen a continuación.
5.5.1 Geranilgeranil difosfato sintasa (GGPPS)
La geranilgeranil difosfato sintasa (EC 2.5.1.29) cataliza la conversión de farnesil pirofosfato a geranilgeranil difosfato (también conocido como geranilgeranil pirofosfato). Ejemplos ilustrativos de enzimas incluyen los de Stevia rebaudiana (Acceso N.° ABD92926), Gibberella fujikuroi (Acceso N.° CAA75568), Mus musculus (Acceso N.° AAH69913), Thalassiosira pseudonana (Acceso N.° XP_o02288339), Streptomyces clavuligerus (Acceso N.° ZP_05004570), Sulfulobus acidocaldarius (Acceso N.° BAA43200), Synechococcus sp. (Acceso N.° ABC98596), Arabidopsis thaliana (Acceso N.° NP_195399), Blakeslea trispora (Acceso N.° AFC92798.1) y US 2014/0329281 A1. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos de GGPPS. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 %, 95 % con al menos una de estas enzimas GGPPS.
5.5.2 Copalil difosfato sintasa (CDPS)
La copalil difosfato sintasa (EC 5.5.1.13) cataliza la conversión de geranilgeranil difosfato a copalil difosfato. Ejemplos ilustrativos de enzimas incluyen los de Stevia rebaudiana (Acceso N.° AAB87091), Streptomyces clavuligerus (Acceso N.° EDY51667), Bradyrhizobium japonicum (Acceso N.° a Ac 28895.1), Zea mays (Acceso N.° AY562490), Arabidopsis thaliana (Acceso N.° Nm_116512), Oryza sativa (Acceso N.° Q5MQ85.1) y US 2014/0329281 A1. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos CDPS. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 95 %, 90 % o 95 % con al menos una de estas enzimas CDPS.
5.5.3 Caureno sintasa (KS)
Las caureno sintasas (EC 4.2.3.19) catalizan la conversión de copalil difosfato en caureno y difosfato. Ejemplos ilustrativos de enzimas incluyen los de Bradyrhizobium japonicum (Acceso N.° AAC28895.1), Phaeosphaeria sp. (Acceso N.° O13284), Arabidopsis thaliana (Acceso N.° Q9SAK2), Picea glauca (Acceso N.° ADB55711.1) y US 2014/0329281 A1. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos de KS. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 85 %, 90 % o 95 % con al menos una de estas enzimas KS.
5.5.4 Copalil difosfato sintasa bifuncional (CDPS) y caureno sintasa (KS)
También se pueden usar las enzimas bifuncionales CDPS-KS (EC 5.5.1.13 y EC 4.2.3.19). Ejemplos ilustrativos de enzimas incluyen los de Phomopsis amygdali (Acceso N.° BAG30962), Physcomitrella patens (Acceso N.° BAF61135), Gibberella fujikuroi (Acceso N.°Q9UVY5.1) y US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188, y WO 2016/038095 A2. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos de CDPS-KS. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas CDPS-KS.
5.5.5 Ent-Caureno oxidasa (KO)
Las ent-caureno oxidasas (EC 1.14.13.78; también denominadas caureno oxidasas en el presente documento) catalizan la conversión de caureno en ácido caurenoico. Ejemplos ilustrativos de enzimas incluyen los de Oryza sativa (Acceso N.° Q5Z5R4), Gibberella fujikuroi (Acceso N.° O94142), Arabidopsis thaliana (Acceso N.° Q93ZB2), Stevia rebaudiana (Acceso N.° AAQ63464.1), Pisum sativum (Uniprot N.° Q6XAF4) y US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188 y WO 2016/038095 a 2. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos KO. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas KO.
5.5.6 Esteviol sintasa (KAH)
Las esteviol sintasas, o ácido caurenoico hidroxilasas (KAH), (EC 1.14.13) catalizan la conversión del ácido caurenoico en esteviol. Ejemplos ilustrativos de enzimas incluyen las de Stevia rebaudiana (Acceso N.° ACD93722), Stevia rebaudiana (SEQ ID NO: 10) Arabidopsis thaliana (Acceso N.° NP_197872), Vitis vinifera (Acceso N.°XP_002282091), Medicago trunculata (Acceso N.° ABC59076), y US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188 y WO 2016/038095 A2. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos KAH. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia del 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas kA h .
5.5.7 Citocromo P450 reductasa (CPR)
Las citocromo P450 reductasas (EC 1.6.2.4) son capaces de ayudar o facilitar la actividad de KO y/o KAH anteriores. Ejemplos ilustrativos de enzimas incluyen las de Stevia rebaudiana (Acceso N.° ABB88839) Arabidopsis thaliana (Acceso N.° NP_194183), Gibberella fujikuroi (Acceso N.° CAE09055), Artemisia annua (Acceso N.° ABC47946.1) y US 2014/0329281 A1, US 2014/0357588 A1, US 2015/0159188 y WO 2016/038095 A2. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos de CPR. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas CPR.
5.5.8 UDP Glicosiltransferasa 74G1 (UGT74G1)
Una UGT74G1 es capaz de funcionar como una uridina 5'-difosfo glucosil:esteviol 19-COOH transferasa y como una uridina 5'-difosfo glucosil:esteviol-13-O-glucósido 19-COOH transferasa. Como se muestra en la Figura 2B, una UGT74G1 es capaz de convertir el esteviol a 19-glucósido. Una UGT74G1 también es capaz de convertir esteviolmonósido a rubusósido. Una UGT74G1 también puede ser capaz de convertir esteviolbiósido a esteviósido. Ejemplos ilustrativos de enzimas incluyen las de Stevia rebaudiana (por ejemplo, los de Richman et al., 2005, Plant J.
41: 56-67 y US 2014/0329281 y WO 2016/038095 A2 y Acceso N.° AAR06920.1). Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90% o 95% de identidad de secuencia con al menos uno de estos ácidos nucleicos UGT74G1. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas UGT74G1.
5.5.9 UDP glicosiltransferasa 76G1 (UGT76G1)
Una UGT76G1 es capaz de transferir una porción de glucosa al C-3' de la C-13-O-glucosa de la molécula aceptora, un esteviol 1,2-glucósido. Por lo tanto, una UGT76G1 es capaz de funcionar como una uridina 5'-difosfo glucosil:esteviol 13-O-1,2 glucósido C-3' glucosil transferasa y una uridina 5'-difosfo glucosil:esteviol-19-O-glucosa, 13-O-1,2 biósido C-3' glucosil transferasa. Como se muestra en la Figura 2A, una UGT76G1 es capaz de convertir esteviolbiósido a RebB. Una UGT76G1 también es capaz de convertir esteviósido a RebA. Una UGT76G1 también es capaz de convertir RebD a RebM. Ejemplos ilustrativos de enzimas incluyen las de Stevia rebaudiana (p. ej., los de Richman et al., 2005, Plant J. 41: 56-67 y US 2014/0329281 A1 y WO 2016/038095 A2 y Acceso N.° AAR06912.1). Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos UGT76G1. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas UGT76G1.
5.5.10 UDP glicosiltransferasa 85C2 (UGT85C2)
Una UGT85C2 es capaz de funcionar como una uridina 5'-difosfosucosil:esteviol 13-OH transferasa, y una uridina 5'-difosfo glucosil:esteviol-19-O-glucósido 13-OH transferasa. Por lo tanto, como se muestra en la Figura 2B, una UGT85C2 es capaz de convertir el esteviol en esteviolmonósido, y también es capaz de convertir el 19-glucósido en rubusósido. Ejemplos ilustrativos de enzimas incluyen los de Stevia rebaudiana (por ejemplo, los de Richman et al., 2005, Plant J. 41: 56-67 y US 2014/0329281 A1 y WO 2016/038095 A2 y acceso N.° AAR06916.1). Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos UGT85C2. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia del 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas UGT85C2.
5.5.11 UDP-glicosiltransferasa 91D (UGT91D)
Una UGT91D es capaz de funcionar como una uridina 5'-difosfo glucosil:esteviol-13-O-glucósido transferasa, transfiriendo una porción de glucosa a la C-2' de la 13-O-glucosa de la molécula aceptora, esteviol-13-O-glucósido (esteviolmonósido) para producir esteviobiósido. Una UGT91D también es capaz de funcionar como una uridina 5'-difosfo glucosil:rubusósido transferasa, transfiriendo una porción de glucosa al C-2' de la 13-O-glucosa de la molécula aceptora, rubusósido, para proveer esteviósido como se muestra en la Figura 2B. UGT91D también es capaz de transferir una porción de glucosa a la posición C-2' de la 19-O-glucosa de RebA para producir RebD como se muestra en la Figura 2B. Una UGT91D también se conoce como UGT91D2, UGT91D2e o UGT91D-like3. Ejemplos ilustrativos de las enzimas UGT91D incluyen las de Stevia rebaudiana (por ejemplo, las de la secuencia UGT con el Acceso N.° ACE87855.1, US 2014/0329281 A1, WO 2016/038095 A2, y SEQ ID NO: 7). Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos uno de estos ácidos nucleicos UGT91D. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 % o 95 % con al menos una de estas enzimas UGT91D.
5.5.12 UDP-glicosiltransferasa 40087 (UGT40087)
Una UGT40087 es capaz de transferir una porción de glucosa a la posición C-2' de la 19-O-glucosa de RebA para producir RebD como se muestra en la Figura 2B. Una UGT40087 también es capaz de transferir una porción de glucosa a la posición C-2' de la 19-O-glucosa de esteviósido para producir RebE. Ejemplos ilustrativos de UGT40087 se describieron anteriormente en la Sección 5.2. Cualquier variante de UGT40087 descrita en el presente documento puede usarse en las composiciones y métodos descritos en el presente documento. Los ácidos nucleicos que codifican estas enzimas son útiles en las células y los métodos provistos en el presente documento. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que tiene al menos 80 %, 85 %, 90 % o 95 % de identidad de secuencia con al menos una de las enzimas UGT40087. En ciertas modalidades, en el presente documento se proveen células y métodos que usan un ácido nucleico que codifica un polipéptido que tiene al menos una identidad de secuencia de 80 %, 85 %, 90 % o 95 % con al menos una de las enzimas UGT40087. En ciertas modalidades, en el presente documento se provee un ácido nucleico que codifica una UGT40087 variante descrita en el presente documento.
5.5.13 Conversión de Acetil-CoA en Acetoacetil-CoA
Las acetoacetil-CoA sintasas también son útiles en las composiciones y métodos provistos en el presente documento e incluyen aquellas moléculas que se dice que son "derivados" de cualquiera de las acetoacetil-CoA sintasas descritas en el presente documento. Dicho "derivado" tiene las siguientes características: (1) comparte una homología sustancial con cualquiera de las acetoacetil-CoA sintasas descritas en el presente documento; y (2) es capaz de catalizar la condensación irreversible de acetil-CoA con malonil-CoA para formar acetoacetil-CoA. Se dice que un derivado de una acetoacetil-CoA sintasa comparte una "homología sustancial" con acetoacetil-CoA sintasa si las secuencias de aminoácidos del derivado son al menos 80 %, y muy preferiblemente al menos 90 %, y muy preferiblemente al menos 95 %, la misma que la de la acetoacetil-CoA sintasa.
5.5.14 Conversión de HMG-CoA a mevalonato
Las HMG-CoA reductasas (EC 1.1.1.34; EC 1.1.1.88) catalizan la desacilación reductiva de (S)-HMG-CoA a (R)-mevalonato, y pueden clasificarse en dos clases, clase I y clase II de HMGrs. La clase I incluye las enzimas de los eucariotas y la mayoría de las arqueas, y la clase II incluye las HMG-CoA reductasas de ciertos procariotas y arqueas. Además de la divergencia en las secuencias, las enzimas de las dos clases también difieren con respecto a su especificidad de cofactor. A diferencia de las enzimas de clase I, que utilizan NADPH exclusivamente, las HMG-CoA reductasas de clase II varían en la capacidad de discriminar entre NADPH y NADH. Ver, por ejemplo, Hedl et al., Journal of Bacteriology 186 (7): 1927-1932 (2004). Las especificidades de los cofactores para las HMG-CoA reductasas de clase II seleccionadas se proveen a continuación.
-
Figure imgf000021_0001
Las HMG-CoA reductasas útiles incluyen HMG-CoA reductasas que son capaces de utilizar NADH como cofactor, por ejemplo, la HMG-CoA reductasa de P. mevalonii, A. fulgidus o S. aureus. La secuencia del gen mvaA de tipo silvestre de Pseudomonas mevalonii, que codifica la HMG-CoA reductasa (EC 1.1.1.88), se ha descrito anteriormente. Ver Beach y Rodwell, J. Bacteriol. 171: 2994-3001 (1989). Las secuencias de nucleótidos mvaA representativas de Pseudomonas mevalonii incluyen el Acceso N.° M24015. Las secuencias representativas de la proteína HMG-CoA reductasa de Pseudomonas mevalonii incluyen los accesos N.° AAA25837, P13702, MVAA_PSe Mv .
Las secuencias de nucleótidos de HMG-CoA reductasa representativas de Silicibacter pomeroyi incluyen el Acceso N.° NC_006569.1. Las secuencias representativas de la proteína HMG-CoA reductasa de Silicibacter pomeroyi incluyen el Acceso N.° YP_164994.
Las secuencias de nucleótidos de HMG-CoA reductasa representativas de Delftia acidovorans incluyen NC_010002 REGIÓN: complemento (319980..321269). Las secuencias de la proteína HMG-CoA reductasa representativas de Delftia acidovorans incluyen el Acceso N.° YP_001561318.
Las HMG-CoA reductasas que usan NADH también son útiles en las composiciones y los métodos provistos en el presente documento incluyen aquellas moléculas que se dice que son "derivados" de cualquiera de las HMG-CoA reductadas que usan NADH que se describen en el presente documento, por ejemplo, de P. mevalonii, S. pomeroyi y D. acidovorans. Dicho "derivado" tiene las siguientes características: (1) comparte una homología sustancial con cualquiera de las HMG-CoA reductadas que usan NADH descritas en el presente documento; y (2) es capaz de catalizar la desacilación reductiva de (S)-HMG-CoA a (R)-mevalonato mientras se usa preferentemente NADH como cofactor. Se dice que un derivado de una HMG-CoA reductasa que usa NADH comparte una "homología sustancial" con la HAD-reductasa HMG-CoA que usa NADH si las secuencias de aminoácidos del derivado son al menos 80 %, y muy preferiblemente al menos 90 %, y muy preferiblemente aún al menos 95 %, la misma que la de HADG-CoA reductasa que usa NADH.
Como se usa en el presente documento, la frase "que usa NADH" significa que el inhibidor de la HMG-CoA reductasa que usa NADH es selectivo para NADH sobre NADPH como cofactor, por ejemplo, mediante la demostración de una actividad específica más alta para NADH que para NADPH. En algunas modalidades, la selectividad para NADH como cofactor se expresa como una relación fcat(NADH)/ f c a t(NADPH). En algunas modalidades, la HMG-CoA reductasa que usa NADH tiene una relación de relación fcat(NADH)/ f c a t(NADPH) de al menos 5, 10, 15, 20, 25 o mayor que 25. En algunas modalidades, la HMG-CoA reductasa que usa NADH usa NADH exclusivamente. Por ejemplo, una HMG-CoA reductasa que usa NADH que usa NADH exclusivamente muestra alguna actividad con NADH suministrado como único cofactor in vitro, y no muestra actividad detectable cuando se suministra NADPH como único cofactor. Se puede utilizar cualquier método para determinar la especificidad del cofactor conocida en la técnica para identificar HMG-CoA reductadas que tienen una preferencia por NADH como cofactor, incluidas las descritas por Kim et al., Protein Science 9: 1226-1234 (2000); y Wilding et al., J. Bacteriol. 182 (18): 5147-52 (2000), cuyos contenidos se incorporan en el presente documento en su totalidad.
Los métodos para diseñar la selectividad NADH se describen en Watanabe et al., Microbiology 153: 3044-3054 (2007), y los métodos para determinar la especificidad del cofactor de las HMG-CoA reductasas se describen en Kim et al., Protein Sci. 9: 1226-1234 (2000).
Los procariotas capaces de crecer en mevalonato como su única fuente de carbono han sido descritos por: Anderson et al., J. Bacteriol, 171 (12): 6468-6472 (1989); Neacj et al., J. Bacteriol. 171: 2994-3001 (1989); Bensch et al., J. Biol. Chem. 245: 3755-3762; Fimongnari et al., Biochemistry 4: 2086-2090 (1965); Siddiqi et al., Biochem. Biofis Res. Commun. 8: 110-113 (1962); Siddiqi et al., J. Bacteriol. 93: 207-214 (1967); y Takatsuji et al., Biochem. Biofis. Res. Commun. 110: 187-193 (1983).
Ejemplos ilustrativos de secuencias de nucleótidos que codifican una HMG-CoA reductasa que usa NADPH incluyen, pero no se limitan a: (NM_206548; Drosophila melanogaster), (SAV2545 NC_002758, etiqueta de Locus, ID de gen 1122570; Staphylococcus aureus), (AB015627; Streptomyces sp. KO 3988), (AX128213, que provee la secuencia que codifica una HMG-CoA reductasa truncada; Saccharomyces cerevisiae), y (Nc_001145: complemento (115734.118898; Saccharomyces cerevisiae).
5.5.15 Conversión de mevalonato a mevalonato-5-fosfato
Ejemplos ilustrativos de secuencias de nucleótidos que codifican dicha enzima incluyen, pero sin limitarse a: (L77688; Arabidopsis thaliana), y (X55875; Saccharomyces cerevisiae).
5.5.16 Conversión de mevalonato-5-fosfato a mevalonato-5-pirofosfato
Ejemplos ilustrativos de secuencias de nucleótidos que codifican dicha enzima incluyen, pero sin limitarse a: (AF429385; Hevea brasiliensis), (NM_006556; Homo sapiens) y (NC_001145. Complemento 712315.713670; Saccharomyces cerevisiae).
5.5.17 Conversión de mevalonato-5-pirofosfato a IPP
Ejemplos ilustrativos de secuencias de nucleótidos que codifican dicha enzima incluyen, pero sin limitarse a: (X97557; Saccharomyces cerevisiae), (AF290095; Enterococcus faecium) y (U49260; Homo sapiens).
5.5.18 Conversión de IPP a DMAPP
Ejemplos ilustrativos de secuencias de nucleótidos que codifican dicha enzima incluyen, pero sin limitarse a: (Nc_000913, 3031087.3031635; Escherichia coli), y (AF082326; Haematococcus pluvialis).
5.5.19 Polipropileno sintasas
Ejemplos ilustrativos de secuencias de nucleótidos que codifican dicha enzima incluyen, pero no se limitan a: (AF513111; Abies grandis), (AF513112; Abies grandis), (AF513113; Abies grandis), (AY534686; Antirrhinum majus), (AY534687; Antirrhinum majus), (Y17376; Arabidopsis thaliana), (AE016877, Locus AP11092; Bacillus cereus; ATc C 14579), (AJ243739; Citrus sinensis), (AY534745; Clarkia breweri), (AY953508; Ips pini), (DQ286930; Lycopersicon esculentum), (AF182828; Mentha x piperita), (AF182827; Mentha x piperita), (MPI249453; Mentha x piperita), (PZE431697, Locus CAD24425; Paracoccus zeaxanthinifaciens), (AY866498; Picrorhiza kurrooa), (AY351862; Vitis vinifera), y (AF203881, Locus AAF12843; Zymomonas mobilis).
Ejemplos ilustrativos de secuencias de nucleótidos que codifican dicha enzima incluyen, pero no se limitan a: (At U80605; Arabidopsis thaliana), (ATHFPS2R; Arabidopsis thaliana), (AAU36376; Artemisia annua), (AF461050; Bos taurus), (D00694; Escherichia coli K-12), (AE009951, Locus AAL95523; Fusobacterium nucleatum subsp. nucleatum ATCC 25586), (GFFPPSGEN; Gibberella fujikuroi), (CP000009, Locus AAW60034; Gluconobacter oxydans 621H), (AF019892; Helianthus annuus), (HUMFAPS; Homo sapiens), (KLPFPSQCR; Kluyveromyces lactis), (LAU15777; Lupinus albus), (LAU20771; Lupinus albus), (AF309508; Mus musculus), (NCFPPSGEN; Neurospora crassa), (PAFPS1; Parthenium argentatum), (PAFPS2; Parthenium argentatum), (rAt Fa PS; Rattus norvegicus), (YSCFPP; Saccharomyces cerevisiae), (D89104; Schizosaccharomyces pombe), (CP000003, Locus AAT87386; Streptococcus pyogenes), (CP000017, Locus AAZ51849; Streptococcus pyogenes), (NC_008022, Locus YP_598856; Streptococcus pyogenes MGAS10270), (NC_008023, Locus YP_600845; Streptococcus pyogenes MGAS2096), (NC_008024, Locus YP_602832; Streptococcus pyogenes MGAS10750), (MZEFPS; Zea mays), (AE000657, Locus AAC06913; Aquifex aeolicus VF5), (Nm_202836; Arabidopsis thaliana), (D84432, Locus BAA12575; Bacillus subtilis), (U12678, Locus AAC28894; Bradyrhizobium japonicum USDA 110), (BACFDPS; Geobacillus stearothermophilus), (Nc_002940, Locus NP_873754; Haemophilus ducreyi 35000HP), (l42023, Locus AAC23087; Haemophilus influenzae Rd KW20), (J05262; Homo sapiens), (YP_395294; Lactobacillus sakei subsp. sakei 23K), (NC_005823, Locus YP_000273; Leptospira interrogans serovar Copenhageni str. Fiocruz L1-130), (AB003187; Micrococcus luteus), (NC_002946, Locus YP_208768; Neisseria gonorrhoeae FA 1090), (U00090, Locus AAB91752; Rhizobium sp. NGR234), (J05091; Saccharomyces cerevisae), (CP000031, Locus AAV93568; Silicibacter pomeroyi DSS-3), (AE008481, Locus AAK99890; Streptococcus pneumoniae R6), y (NC_004556, Locus NP 779706; Xylella fastidiosa Temecula1).
En algunas modalidades, la célula hospedadora comprende además una secuencia de nucleótidos heteróloga que codifica una enzima que puede combinar IPP y DMAPP o IPP y FPP para formar geranilgeranil pirofosfato ("GGPP"). Ejemplos ilustrativos de secuencias de nucleótidos que codifican una enzima tal incluyen, pero no se limitan a: (At HGERPYRS; Arabidopsis thaliana), (BT005328; Arabidopsis thaliana), (NM_119845; Arabidopsis thaliana), (NZ_AAJM01000380, Locus ZP_00743052; Bacillus thuringiensis serovar israelensis, ATCC 35646 sq1563), (CRGGPPS; Catharanthus roseus), (NZ_AABF02000074, Locus ZP_00144509; Fusobacterium nucleatum subsp. vincentii, ATCC 49256), (GFGGPPSGN; Gibberella fujikuroi), (AY371321; Ginkgo biloba), (AB055496; Hevea brasiliensis), (AB017971; Homo sapiens), (MCI276129; Mucor circinelloides f. lusitanicus), (AB016044; Mus musculus), (AABX01000298, Locus NCU01427; Neurospora crassa), (NCU20940; Neurospora crassa), (NZ_AAKL01000008, Locus ZP_00943566; Ralstonia solanacearum UW551), (AB118238; Rattus norvegicus), (SCU31632; Saccharomyces cerevisiae), (AB016095; Synechococcus elongates), (SAGGPS; Sinapis alba), (SSOGDS; Sulfolobus acidocaldarius), (NC_007759, Locus YP_461832; Syntrophus aciditrophicus SB), (n C_006840, Locus YP_204095; Vibrio fischeri ES114), (NM_112315; Arabidopsis thaliana), (ERWCRTE; Pantoea agglomerans), (D90087, Locus BAA14124; Pantoea ananatis), (X52291, Locus CAA36538; Rhodobacter capsulatus), (AF195122, Locus AAF24294; Rhodobacter sphaeroides), y (Nc_004350, Locus NP_721015; Streptococcus mutans UA159).
5.6 Métodos de producción de glucósidos de esteviol
En otro aspecto, en el presente documento se proporciona un método para la producción de un RebM, el método comprendiendo los pasos de: (a) cultivar una población de cualquiera de las células hospedadoras genéticamente modificadas de la invención en un medio con una fuente de carbono bajo condiciones adecuadas para preparar RebM; y (b) recuperar dicho compuesto de glucósido de esteviol del medio.
5.7 Medios y condiciones de cultivo
Los materiales y métodos para el mantenimiento y crecimiento de cultivos microbianos son bien conocidos por los expertos en la técnica de microbiología o ciencia de la fermentación (ver, por ejemplo, Bailey et al., Biochemical Engineering Fundamentals, segunda edición, McGraw Hill, New York, 1986). Se debe considerar el medio de cultivo apropiado, el pH, la temperatura y los requisitos para las condiciones aeróbicas, microaeróbicas o anaeróbicas, según los requerimientos específicos de la célula hospedadora, la fermentación y el proceso.
Los métodos de producción de glucósidos de esteviol provistos en el presente documento puede realizarse en un medio de cultivo adecuado (por ejemplo, con o sin suplementación con pantotenato) en un recipiente adecuado, incluyendo, pero no limitado a una placa de cultivo celular, un matraz, o un fermentador. Además, los métodos pueden realizarse a cualquier escala de fermentación conocida en la técnica para soportar la producción industrial de productos microbianos. Se puede usar cualquier fermentador adecuado, incluido un fermentador de tanque agitado, un fermentador de transporte aéreo, un fermentador de burbujas, o cualquier combinación de los mismos. En modalidades particulares que utilizan Saccharomyces cerevisiae como la célula hospedadora, las cepas pueden crecer en un fermentador, como se describe en detalle en Kosaric, et al., en Ullmann's Encyclopedia of Industrial Chemistry, sexta edición, volumen 12, páginas 398-473, Wiley-VCH Verlag GmbH & Co. KDaA, Weinheim, Alemania.
En algunas modalidades, el medio de cultivo es cualquier medio de cultivo en el cual un microorganismo genéticamente modificado capaz de producir un glucósido de esteviol puede subsistir, es decir, mantener el crecimiento y la viabilidad. En algunas modalidades, el medio de cultivo es un medio acuoso que comprende fuentes de carbono, nitrógeno y fosfato asimilables. Dicho medio también puede incluir sales, minerales, metales y otros nutrientes apropiados. En algunas modalidades, la fuente de carbono y cada uno de los nutrientes celulares esenciales, se agregan en incrementos o en forma continua a los medios de fermentación, y cada nutriente requerido se mantiene esencialmente al nivel mínimo necesario para una asimilación eficiente por las células en crecimiento, por ejemplo, de acuerdo con una curva de crecimiento celular predeterminada basada en la función metabólica o respiratoria de las células que convierten la fuente de carbono en una biomasa.
Las condiciones adecuadas y los medios adecuados para el cultivo de microorganismos son bien conocidos en la técnica. En algunas modalidades, el medio adecuado se complementa con uno o más agentes adicionales, tales como, por ejemplo, un inductor (por ejemplo, cuando una o más secuencias de nucleótidos que codifican un producto genético están bajo el control de un promotor inducible), un represor (por ejemplo, cuando una o más secuencias de nucleótidos que codifican un producto genético están bajo el control de un promotor reprimible, o un agente de selección (por ejemplo, un antibiótico para seleccionar microorganismos que comprenden las modificaciones genéticas).
En algunas modalidades, la fuente de carbono es un monosacárido (azúcar simple), un disacárido, un polisacárido, una fuente de carbono no fermentable, o una o más combinaciones de los mismos. Ejemplos no limitantes de monosacáridos adecuados incluyen glucosa, manosa, fructosa, xilosa, ribosa y combinaciones de los mismos. Ejemplos no limitantes de disacáridos adecuados incluyen sacarosa, lactosa, maltosa, galactosa, trehalosa, celobiosa y combinaciones de los mismos. Ejemplos no limitantes de polisacáridos adecuados incluyen almidón, glucógeno, celulosa, quitina y combinaciones de los mismos. Ejemplos no limitantes de fuentes de carbono no fermentables adecuadas incluyen acetato y glicerol.
La concentración de una fuente de carbono, tal como glucosa, en el medio de cultivo debe promover el crecimiento celular, pero no tan elevada como para reprimir el crecimiento del microorganismo usado. Por lo general, los cultivos de fermentación se realizan con una fuente de carbono, tal como glucosa, que se agrega a niveles para lograr el nivel deseado de crecimiento y biomasa, pero a niveles indetectables (con límites de detección de aproximadamente <0,1 g/l). En otras modalidades, la concentración de una fuente de carbono, tal como glucosa, en el medio de cultivo es mayor que aproximadamente 1 g/l, preferiblemente mayor que aproximadamente 2 g/l, y muy preferiblemente mayor que aproximadamente 5 g/l. Además, la concentración de una fuente de carbono, tal como glucosa, en el medio de cultivo es generalmente menor que aproximadamente 100 g/l, preferiblemente menor que aproximadamente 50 g/l, y muy preferiblemente menor que aproximadamente 20 g/l. Cabe señalar que las referencias a las concentraciones de los componentes del cultivo pueden referirse tanto a las concentraciones de los componentes iniciales como a las actuales. En algunos casos, puede ser deseable permitir que el medio de cultivo se agote de una fuente de carbono durante el cultivo.
Las fuentes de nitrógeno asimilable que se pueden usar en un medio de cultivo adecuado incluyen, pero no se limitan a, fuentes de nitrógeno simples, fuentes de nitrógeno orgánico y fuentes de nitrógeno complejas. Dichas fuentes de nitrógeno incluyen amoníaco anhidro, sales de amonio y sustancias de origen animal, vegetal y/o microbiano. Las fuentes de nitrógeno adecuadas incluyen, pero no se limitan a, hidrolizados de proteínas, hidrolizados de biomasa microbiana, peptona, extracto de levadura, sulfato de amonio, urea y aminoácidos. Generalmente, la concentración de las fuentes de nitrógeno en el medio de cultivo es mayor que aproximadamente 0,1 g/l, preferiblemente mayor que aproximadamente 0,25 g/l, y muy preferiblemente mayor que aproximadamente 1,0 g/l. Sin embargo, más allá de ciertas concentraciones, la adición de una fuente de nitrógeno al medio de cultivo no es ventajosa para el crecimiento de los microorganismos. Como resultado, La concentración de las fuentes de nitrógeno en el medio de cultivo es menor que aproximadamente 20 g/l, preferiblemente menor que aproximadamente 10 g/l y muy preferiblemente menor que aproximadamente 5 g/l. Además, en algunos casos puede ser deseable permitir que el medio de cultivo se agote de las fuentes de nitrógeno durante el cultivo.
El medio de cultivo efectivo puede contener otros compuestos tales como sales inorgánicas, vitaminas, metales traza o promotores del crecimiento. Esos otros compuestos también pueden estar presentes en fuentes de carbono, nitrógeno o minerales en el medio efectivo o pueden agregarse específicamente al medio.
El medio de cultivo puede contener también una fuente de fosfato adecuada. Dichas fuentes de fosfato incluyen fuentes de fosfato tanto inorgánico como orgánico. Las fuentes de fosfato preferidas incluyen, pero no se limitan a, sales de fosfato tales como fosfatos de sodio y potasio mono o dibásicos, fosfato de amonio y mezclas de los mismos. Generalmente, la concentración de fosfato en el medio de cultivo es mayor que aproximadamente 1,0 g/l, preferiblemente mayor que aproximadamente 2,0 g/l y muy preferiblemente mayor que aproximadamente 5,0 g/l. Sin embargo, más allá de ciertas concentraciones, la adición de fosfato al medio de cultivo no es ventajosa para el crecimiento de los microorganismos. Por consiguiente, la concentración de fosfato en el medio de cultivo es generalmente menor que aproximadamente 20 g/l, preferiblemente menor que aproximadamente 15 g/l y muy preferiblemente menor que aproximadamente 10 g/l.
Un medio de cultivo adecuado puede incluir también una fuente de magnesio, preferiblemente en forma de una sal fisiológicamente aceptable, tal como sulfato de magnesio heptahidratado, aunque se pueden usar otras fuentes de magnesio en concentraciones que contribuyen con cantidades similares de magnesio. Generalmente, la concentración de magnesio en el medio de cultivo es mayor que aproximadamente 0,5 g/l, preferiblemente mayor que aproximadamente 1,0 g/l, y muy preferiblemente mayor que aproximadamente 2,0 g/l. Más allá de ciertas concentraciones, sin embargo, la adición de magnesio al medio de cultivo no es ventajosa para el crecimiento de los microorganismos. Por consiguiente, la concentración de magnesio en el medio de cultivo es generalmente menor que aproximadamente 10 g/l, preferiblemente menor que aproximadamente 5 g/l, y muy preferiblemente menor que aproximadamente 3 g/l. Además, en algunos casos puede ser deseable permitir que el medio de cultivo se agote de una fuente de magnesio durante el cultivo.
En algunas modalidades, el medio de cultivo también puede incluir un agente quelante biológicamente aceptable, tal como el dihidrato de citrato trisódico. En tal caso, la concentración de un agente quelante en el medio de cultivo es mayor que aproximadamente 0,2 g/l, preferiblemente mayor que aproximadamente 0,5 g/l, y muy preferiblemente mayor que aproximadamente 1 g/l. Sin embargo, más allá de ciertas concentraciones, la adición de un agente quelante al medio de cultivo no es ventajosa para el crecimiento de los microorganismos. Por consiguiente, la concentración de un agente quelante en el medio de cultivo es generalmente menor que aproximadamente 10 g/l, preferiblemente menor que aproximadamente 5 g/l, y muy preferiblemente menor que aproximadamente 2 g/l.
El medio de cultivo puede también incluir inicialmente un ácido o base biológicamente aceptable para mantener el pH deseado del medio de cultivo. Los ácidos biológicamente aceptables incluyen, pero no se limitan a, ácido clorhídrico, ácido sulfúrico, ácido nítrico, ácido fosfórico y mezclas de los mismos. Las bases biológicamente aceptables incluyen, pero no se limitan a, hidróxido de amonio, hidróxido de sodio, hidróxido de potasio y mezclas de los mismos. En algunas modalidades, la base usada es hidróxido de amonio.
El medio de cultivo también puede incluir una fuente de calcio biológicamente aceptable, incluyendo, pero sin limitarse a, cloruro de calcio. Generalmente, la concentración de la fuente de calcio, tal como cloruro de calcio, dihidrato, en el medio de cultivo está dentro del intervalo de aproximadamente 5 mg/L a aproximadamente 2000 mg/L, preferiblemente dentro del intervalo de aproximadamente 20 mg/L a aproximadamente 1000 mg/L, y muy preferiblemente en el intervalo de aproximadamente 50 mg/L a aproximadamente 500 mg/L.
El medio de cultivo también puede incluir cloruro de sodio. Generalmente, la concentración de cloruro de sodio en el medio de cultivo está dentro del intervalo de aproximadamente 0,1 g/l a aproximadamente 5 g/l, preferiblemente dentro del intervalo de aproximadamente 1 g/l a aproximadamente 4 g/l, y muy preferiblemente en el intervalo de aproximadamente 2 g/l a aproximadamente 4 g/l.
En algunas modalidades, el medio de cultivo también puede incluir metales traza. Dichos metales traza se pueden agregar al medio de cultivo como una solución madre que, por conveniencia, se puede preparar por separado del resto del medio de cultivo. Generalmente, la cantidad de dicha solución de metales traza agregada al medio de cultivo es mayor que aproximadamente 1 ml/l, preferiblemente mayor que aproximadamente 5 ml/l, y muy preferiblemente mayor que aproximadamente 10 ml/l. Sin embargo, más allá de ciertas concentraciones, la adición de metales traza al medio de cultivo no es ventajosa para el crecimiento de los microorganismos. Por consiguiente, la cantidad de dicha solución de metales traza añadida al medio de cultivo es generalmente menor que aproximadamente 100 ml/l, preferiblemente menor que aproximadamente 50 ml/l, y muy preferiblemente menor que aproximadamente 30 ml/l. Cabe señalar que, además de agregar metales traza en una solución madre, los componentes individuales se pueden agregar por separado, cada uno dentro de los intervalos correspondientes independientemente de las cantidades de los componentes determinados por los intervalos anteriores de la solución de metales traza.
El medio de cultivo puede incluir otras vitaminas, tales como pantotenato, biotina, calcio, pantotenato, inositol, piridoxina-HCl, y tiamina-HCl. Dichas vitaminas se pueden agregar al medio de cultivo como una solución madre que, por conveniencia, se puede preparar por separado del resto del medio de cultivo. Sin embargo, más allá de ciertas concentraciones, la adición de vitaminas al medio de cultivo no es ventajosa para el crecimiento de los microorganismos.
Los métodos de fermentación descritos en el presente documento se pueden realizar en los modos de cultivo convencionales, que incluyen, pero no se limitan a, lotes, lotes alimentados, reciclaje de células, continuo y semicontinuo. En algunas modalidades, la fermentación se lleva a cabo en modo de lotes alimentados. En tal caso, algunos de los componentes del medio se agotan durante el cultivo, incluido el pantotenato durante la etapa de producción de la fermentación. En algunas modalidades, el cultivo puede complementarse con concentraciones relativamente altas de dichos componentes al principio, por ejemplo, de la etapa de producción, de modo que el crecimiento y/o la producción de glucósidos de esteviol sea soportado por un período de tiempo antes de que se requieran adiciones. Los intervalos preferidos de estos componentes se mantienen en todo el cultivo al hacer adiciones a medida que los niveles son agotados por el cultivo. Los niveles de los componentes en el medio de cultivo pueden controlarse, por ejemplo, muestreando periódicamente el medio de cultivo y analizando las concentraciones. Alternativamente, una vez que se desarrolla un procedimiento de cultivo estándar, se pueden hacer adiciones en intervalos de tiempo correspondientes a niveles conocidos en momentos particulares a lo largo del cultivo. Como lo reconocerán los expertos en la técnica, la tasa de consumo de nutrientes aumenta durante el cultivo a medida que aumenta la densidad celular del medio. Además, para evitar la introducción de microorganismos extraños en el medio de cultivo, la adición se realiza usando métodos de adición asépticos, como se conoce en la técnica. Además, se puede agregar una pequeña cantidad de agente antiespumante durante el cultivo.
La temperatura del medio de cultivo puede ser cualquier temperatura adecuada para el crecimiento de las células genéticamente modificadas y/o la producción de glucósido de esteviol. Por ejemplo, antes de la inoculación del medio de cultivo con un inóculo, el medio de cultivo puede llevarse y mantenerse a una temperatura en el intervalo de aproximadamente 20 °C a aproximadamente 45 °C, preferiblemente a una temperatura en el intervalo de aproximadamente 25 °C a aproximadamente 40 °C, y muy preferiblemente en el intervalo de aproximadamente 28 °C a aproximadamente 32 °C.
El pH del medio de cultivo se puede controlar mediante la adición de ácido o base al medio de cultivo. En tales casos, cuando se usa amoníaco para controlar el pH, también sirve convenientemente como fuente de nitrógeno en el medio de cultivo. Preferiblemente, el pH se mantiene de aproximadamente 3,0 a aproximadamente 8,0, muy preferiblemente de aproximadamente 3,5 a aproximadamente 7,0, y muy preferiblemente aún de aproximadamente 4,0 a aproximadamente 6,5.
En algunas modalidades, la concentración de la fuente de carbono, tal como la concentración de glucosa, del medio de cultivo se controla durante el cultivo. La concentración de glucosa del medio de cultivo puede monitorearse usando técnicas conocidas, tales como, por ejemplo, el uso de la prueba enzimática de glucosa oxidasa o la cromatografía de líquidos de alta presión, que se puede usar para controlar la concentración de glucosa en el sobrenadante, por ejemplo, un componente libre de células del medio de cultivo. Como se indicó anteriormente, la concentración de la fuente de carbono debe mantenerse por debajo del nivel en el que se produce la inhibición del crecimiento celular. Aunque dicha concentración puede variar de un organismo a otro, para la glucosa como fuente de carbono, la inhibición del crecimiento celular se produce a concentraciones de glucosa superiores a aproximadamente 60 g/l, y puede determinarse fácilmente mediante un ensayo. Por consiguiente, cuando se usa glucosa como fuente de carbono, la glucosa se alimenta preferiblemente al fermentador y se mantiene por debajo de los límites de detección. Alternativamente, la concentración de glucosa en el medio de cultivo se mantiene en el intervalo de aproximadamente 1 g/l a aproximadamente 100 g/l, muy preferiblemente en el intervalo de aproximadamente 2 g/l a aproximadamente 50 g/l, y muy preferiblemente aún en el intervalo de aproximadamente 5 g/l a aproximadamente 20 g/l. Aunque la concentración de la fuente de carbono se puede mantener dentro de los niveles deseados mediante la adición de, por ejemplo, una solución de glucosa sustancialmente pura es aceptable y se puede preferir mantener la concentración de la fuente de carbono del medio de cultivo mediante la adición de alícuotas del medio de cultivo original. El uso de alícuotas del medio de cultivo original puede ser deseable porque las concentraciones de otros nutrientes en el medio (por ejemplo, las fuentes de nitrógeno y fosfato) se pueden mantener simultáneamente. Del mismo modo, las concentraciones de metales traza se pueden mantener en el medio de cultivo mediante la adición de alícuotas de la solución de metales traza.
Otros medios y métodos de fermentación adecuados se describen, por ejemplo, en el documento WO 2016/196321.
5.8 Composiciones de fermentación
En otro aspecto, en el presente documento se proveen composiciones de fermentación que comprenden una célula hospedadora genéticamente modificada de la invención y glucósidos de esteviol producidos por la célula hospedadora genéticamente modificada. Las composiciones de fermentación pueden comprender además un medio. Las composiciones de fermentación comprenden RebA, RebD y RebM. En ciertas modalidades, las composiciones de fermentación provistas en el presente documento comprenden RebM como un componente principal de los glucósidos de esteviol producidos a partir de la célula hospedadora genéticamente modificada. En ciertas modalidades, las composiciones de fermentación comprenden RebA, RebD y RebM en una relación de al menos 1:7:50. En ciertas modalidades, las composiciones de fermentación comprenden RebA, RebD y RebM en una relación de al menos 1:7:50 a 1:100:1000. En ciertas modalidades, las composiciones de fermentación comprenden una relación de al menos 1:7:50 a 1:200:2000. En ciertas modalidades, la relación de RebA, RebD y RebM se basa en el contenido total de estos tres glucósidos de esteviol que están asociados con la célula hospedadora genéticamente modificada y el medio. En ciertas modalidades, la relación de RebA, RebD y RebM se basa en el contenido total de estos tres glucósidos de esteviol en el medio. En ciertas modalidades, la relación de RebA, RebD y RebM se basa en el contenido total de estos tres glucósidos de esteviol que están asociados con la célula hospedadora genéticamente modificada.
En otras modalidades, las composiciones de fermentación comprenden una célula hospedadora genéticamente modificada, y además comprenden RebA y RebM. En ciertas modalidades, las composiciones de fermentación comprenden RebA y RebM en una relación de RebA:RebM de al menos 1:50. En ciertas modalidades, las composiciones de fermentación comprenden RebA y RebM en una relación de RebA:RebM de al menos 1:50 a 1:1000. En ciertas modalidades, las composiciones de fermentación comprenden RebA y RebM en una relación de RebA:RebM de al menos 1:50 a 1:2000. En ciertas modalidades, la relación de RebA y RebM se basa en el contenido total de estos dos glucósidos de esteviol que están asociados con la célula hospedadora genéticamente modificada y el medio. En ciertas modalidades, la relación de RebA y RebM se basa en el contenido total de estos dos glucósidos de esteviol en el medio. En ciertas modalidades, la relación de RebA y RebM se basa en el contenido total de estos dos glucósidos de esteviol que están asociados con la célula hospedadora genéticamente modificada.
En ciertas modalidades, las composiciones de fermentación comprenden RebD y RebM en una relación de RebD: RebM de al menos 7:50. En ciertas modalidades, las composiciones de fermentación comprenden RebD y RebM en una relación de RebD: RebM de al menos 7:50 a 7:100. En ciertas modalidades, las composiciones de fermentación comprenden RebD y RebM a una relación RebD: RebM de al menos 7:50 a 7:200. En ciertas modalidades, la relación de RebA, RebD y RebM se basa en el contenido total de estos dos glucósidos de esteviol que están asociados con la célula hospedadora genéticamente modificada y el medio. En ciertas modalidades, la relación de RebD y RebM se basa en el contenido total de estos dos glucósidos de esteviol en el medio. En ciertas modalidades, la relación de RebD y RebM se basa en el contenido total de estos dos glucósidos de esteviol que están asociados con la célula hospedadora genéticamente modificada.
En ciertas modalidades, las composiciones de fermentación provistas en el presente documento contienen RebM2 a un nivel indetectable. En ciertas modalidades, las composiciones de fermentación provistas en el presente documento contienen glucósidos de esteviol no naturales en un nivel indetectable. En ciertas modalidades, las composiciones de fermentación provistas en el presente documento, cuando se someten a cromatografía GC, no producen un pico de "esteviol 2 glucosa" entre un pico de RebA y un RebB a un nivel detectable
5.9 Recuperación de glucósidos de esteviol
Una vez que la célula hospedadora produce el glucósido de esteviol, puede recuperarse o aislarse para su uso posterior usando cualquier método de separación y purificación adecuado, incluyendo cualquier método adecuado de separación y purificación de glucósido de esteviol, conocido en la técnica. Los métodos adecuados se describen, por ejemplo, en las patentes de E.U.A. Números 7.838.044 y 8.981.081; Solicitudes de Patente de E.U.A. N.° 14/603.941, 14/033.563, 14/362.275, 14/613.615, 14/615.888; Solicitudes del PCT N.° PCT/US12/070562 y PCT/US14/031129. En algunas modalidades, una fase acuosa que comprende el glucósido de esteviol se separa de la fermentación por centrifugación. En otras modalidades, una fase acuosa que comprende el glucósido de esteviol se separa de la fermentación espontáneamente. En otras modalidades, una fase acuosa que comprende el glucósido de esteviol se separa de la fermentación añadiendo un desemulsionante y/o un agente de nucleación en la reacción de fermentación. Ejemplos ilustrativos de demulsificadores incluyen floculantes y coagulantes. Ejemplos ilustrativos de agentes de nucleación incluyen gotitas del propio glucósido de esteviol y disolventes orgánicos tales como dodecano, miristato de isopropilo y oleato de metilo.
El glucósido de esteviol producido en estas células puede estar presente en el sobrenadante del cultivo y/o asociado con las células hospedadoras. En modalidades en las que el glucósido de esteviol está asociado con la célula hospedadora, la recuperación del glucósido de esteviol puede comprender un método de permeabilización o lisado de las células. De forma alternativa o simultánea, el glucósido de esteviol en el medio de cultivo puede recuperarse usando un proceso de recuperación que incluye, pero sin limitarse a, cromatografía, cromatografía de adsorción, extracción, extracción con solvente, separación con membrana, electrodiálisis, ósmosis inversa, destilación, derivación química y cristalización.
En algunas modalidades, el glucósido de esteviol se separa de otros productos que pueden estar presentes en la fase acuosa. En algunas modalidades, la separación se logra mediante la adsorción, destilación, extracción de gas-líquido (extracción), extracción de líquido-líquido (extracción con solvente), extracción de vacío, evaporación, ultrafiltración y técnicas cromatográficas estándares. Otros medios y métodos de fermentación adecuados se describen, por ejemplo, en las publicaciones de solicitud de patente de E.U.A. N.° 2016/0185813, 2017/0190728, WO/2017/093895. Otros métodos adecuados se describen, por ejemplo, en las Patentes de E.U.A. N.° 7.838.044 y 8.981.081; Solicitudes de Patente de E.U.A. N.° 14/603.941, 14/033.563, 14/362.275, 14/613.615 y 14/615.888; Solicitudes del PCT N.° PCT/US12/070562, y PCT/US14/031129.
En ciertas modalidades, el (los) glucósido(s) de esteviol recuperado(s) puede(n) usarse en varios productos finales. Por ejemplo, un compuesto RebM purificado o una composición que comprende RebM se puede usar en cualquier producto consumible, tal como productos alimenticios, productos farmacéuticos, suplementos dietéticos o suplementos nutricionales. En modalidades particulares, un consumible que comprende RebM se fabrica mediante el proceso de cultivo de una población de células hospedadoras genéticamente modificadas de cualquiera de las reivindicaciones anteriores en un medio con una fuente de carbono bajo condiciones adecuadas para preparar RebM; y recuperando dicho compuesto RebM del medio.
5.10 Métodos para hacer células genéticamente modificadas
Los ácidos nucleicos que codifican las proteínas pueden introducirse en la célula hospedadora mediante cualquier método conocido para un experto en la técnica sin limitación (ver, por ejemplo, Hinnen et al. (1978) Proc. Natl. Acad. Sci. USA 75:1292-3; Cregg et al. (1985) Mol. Cell. Biol. 5:3376-3385; Goeddel et al. eds, 1990, Methods in Enzymology, vol. 185, Academic Press, Inc., CA; Krieger, 1990, Gene Transfer and Expression -- A Laboratory Manual, Stockton Press, NY; Sambrook et al., 1989, Molecular Cloning -- A Laboratory Manual, Cold Spring Harbor Laboratory, NY; and Ausubel et al., eds., Edición actual, Current Protocols in Molecular Biology, Greene Publishing Associates and Wiley Interscience, NY). Las técnicas ilustrativas incluyen, pero no se limitan a, esferoplastia, electroporación, transformación mediada por PEG 1000 y acetato de litio o transformación mediada por cloruro de litio.
La actividad de una enzima en una célula hospedadora puede alterarse modificando la transcripción del gen que codifica la enzima. Esto se puede lograr, por ejemplo, modificando el número de copias de la secuencia de nucleótidos que codifica la enzima (por ejemplo, usando un vector de expresión de número de copias más alto o más bajo que comprende la secuencia de nucleótidos, o introduciendo copias adicionales de la secuencia de nucleótidos en el genoma del célula hospedadora o eliminando o interrumpiendo la secuencia de nucleótidos en el genoma de la célula hospedadora), cambiando el orden de las secuencias de codificación en un ARNm policistrónico de un operón o dividiendo un operón en genes individuales, cada uno con sus propios elementos de control, o aumentando la fuerza del promotor u operador al que la secuencia de nucleótidos está unida operativamente. Alternativamente o, además, la actividad de una enzima en una célula hospedadora puede alterarse modificando el nivel de traducción de un ARNm que codifica la enzima. Esto se puede lograr, por ejemplo, modificando la estabilidad del ARNm, modificando la secuencia del sitio de unión al ribosoma, modificando la distancia o secuencia entre el sitio de unión del ribosoma y el codón de inicio de la secuencia codificante de la enzima, modificando toda la región intercistrónica ubicada "en dirección 5' del", o adyacente al, lado 5' del codón de inicio de la región codificante de la enzima, estabilizando el extremo 3' del transcrito de ARNm usando horquillas y secuencias especializadas, modificando el uso de la enzima por el codón, alterando la expresión de los ARNt de codón raros usados en la biosíntesis de la enzima, y/o aumentando la estabilidad de la enzima, como, por ejemplo, a través de la mutación de su secuencia codificante.
La actividad de una enzima en una célula hospedadora se puede alterar de varias maneras, incluyendo, pero sin limitarse a, la expresión de una forma modificada de la enzima que presenta mayor o menor solubilidad en la célula hospedadora, expresando una forma alterada de la enzima que carece de un dominio a través del cual se inhibe la actividad de la enzima, expresando una forma modificada de la enzima que tiene una Kcat mayor o menor o una Km mayor o menor para el sustrato, o expresando una forma alterada de la enzima que es más o menos afectada por la retroalimentación o la regulación por otra molécula en la vía.
Como lo entenderán los expertos en la técnica, puede ser ventajoso modificar una secuencia de codificación para mejorar su expresión en un hospedero particular. El código genético es redundante con 64 codones posibles, pero la mayoría de los organismos suelen usar un subconjunto de estos codones. Los codones que se usan con mayor frecuencia en una especie se denominan codones óptimos, y los que no se usan muy a menudo se clasifican como codones raros o de bajo uso. Los codones pueden sustituirse para reflejar el uso de codones preferido del hospedero, en un proceso a veces llamado "optimización de codones" o "control del sesgo de codones de las especies". La optimización de codones para otras células hospedadoras se puede determinar fácilmente usando tablas de uso de codones o se puede realizar usando software comercialmente disponible, tal como CodonOp (www.idtdna.com/CodonOptfrom) de Integrated DNA Technologies.
Las secuencias de codificación optimizadas que contienen codones preferidos por un hospedero procariótico o eucariótico particular (Murray et al., 1989, Nucl Acids Res. 17: 477-508) pueden prepararse, por ejemplo, para aumentar la velocidad de traducción o para producir transcritos de ARN recombinante que tienen propiedades deseables, tales como una vida media más larga, en comparación con las transcripciones producidas a partir de una secuencia no optimizada. Los codones de parada de la traducción también pueden modificarse para reflejar las preferencias del hospedero. Por ejemplo, los codones de parada típicos para S. cerevisiae y mamíferos son UAA y UGA, respectivamente. El codón de parada típico para plantas monocotiledóneas es UGA, mientras que los insectos y E. coli comúnmente usan UAA como el codón de parada (Dalphin et al., 1996, Nucí Acids Res. 24: 216-8).
Los expertos en la técnica reconocerán que, debido a la naturaleza degenerada del código genético, se puede usar varias moléculas de ADN que se diferencian en sus secuencias de nucleótidos para codificar una enzima dada de la descripción. La secuencia de ADN nativa que codifica las enzimas biosintéticas descritas anteriormente se hace referencia aquí simplemente para ilustrar una modalidad de la descripción, y la descripción incluye moléculas de ADN de cualquier secuencia que codifique las secuencias de aminoácidos de los polipéptidos y proteínas de las enzimas utilizadas en los métodos de la descripción. De manera similar, un polipéptido puede tolerar generalmente una o más sustituciones, deleciones e inserciones de aminoácidos en su secuencia de aminoácidos sin pérdida o pérdida significativa de una actividad deseada. La descripción incluye dichos polipéptidos con diferentes secuencias de aminoácidos que las proteínas específicas descritas en el presente documento, siempre que los polipéptidos modificados o variantes tengan la actividad enzimática anabólica o catabólica del polipéptido de referencia. Además, las secuencias de aminoácidos codificadas por las secuencias de ADN mostradas aquí simplemente ilustran las modalidades de la descripción.
[Para determinar el porcentaje de identidad de dos secuencias de aminoácidos, o de dos secuencias de ácido nucleico, las secuencias se alinean con fines de comparación óptimos (por ejemplo, se pueden introducir espacios en una o ambas de una primera y una segunda secuencia de aminoácidos o ácido nucleico para la alineación óptima y las secuencias no homólogas pueden ignorarse con fines de comparación). Luego se comparan los residuos de aminoácidos o los nucleótidos en las posiciones de aminoácidos correspondientes o las posiciones de nucleótidos. Cuando una posición en la primera secuencia está ocupada por la misma porción de aminoácido o nucleótido que la posición correspondiente en la segunda secuencia, entonces las moléculas son idénticas en esa posición (como se usa en el presente documento, la "identidad" del aminoácido o del ácido nucleico es equivalente a "homología" del aminoácido o del ácido nucleico). El porcentaje de identidad entre las dos secuencias es una función del número de posiciones idénticas compartidas por las secuencias, teniendo en cuenta el número de espacios y la longitud de cada espacio, que deben introducirse para una alineación óptima de las dos secuencias.
Cuando se usa "homólogo" en referencia a proteínas o péptidos, se reconoce que las posiciones de los residuos que no son idénticas a menudo difieren por las sustituciones conservativas de aminoácidos. Una "sustitución conservativa de aminoácidos" es aquella en la que un residuo de aminoácido es sustituido por otro residuo de aminoácido que tiene una cadena lateral (grupo R) con propiedades químicas similares (por ejemplo, carga o carácter hidrófobo). En general, una sustitución de aminoácidos conservativa no cambiará sustancialmente las propiedades funcionales de una proteína. En los casos en que dos o más secuencias de aminoácidos difieren entre sí por sustituciones conservativas, el porcentaje de identidad de secuencia o el grado de homología se puede ajustar ascendentemente para corregir la naturaleza conservativa de la sustitución. Los medios para realizar este ajuste son bien conocidos por los expertos en la técnica (véase, por ejemplo, Pearson WR, 1994, Methods in Mol Biol 25: 365-89).
Los siguientes seis grupos contienen cada uno aminoácidos que son sustituciones conservativas entre sí: 1) Serina (S), Treonina (T); 2) Ácido Aspártico (D), Ácido Glutámico (E); 3) Asparagina (N), Glutamina (Q); 4) Arginina (R), Lisina (K); 5) Isoleucina (I), Leucina (L), Alanina (A), Valina (V) y 6) Fenilalanina (F), Tirosina (Y), Triptófano (W).
La homología de secuencia para polipéptidos, que también se conoce como porcentaje de identidad de secuencia, se mide generalmente usando un software de análisis de secuencia. Un algoritmo típico usado para comparar una secuencia de molécula con una base de datos que contiene un gran número de secuencias de diferentes organismos es el programa informático BLAST. Cuando se busca una base de datos que contiene secuencias de un gran número de organismos diferentes, es típico comparar secuencias de aminoácidos.
Además, cualquiera de los genes que codifican las enzimas anteriores (o cualquiera de los mencionados aquí (o cualquiera de los elementos reguladores que controlan o modulan su expresión)) puede optimizarse mediante técnicas de ingeniería genética/proteica, tales como la evolución dirigida o la mutagénesis racional, que son conocidas por los expertos en la técnica. Dicha acción permite a los expertos en la técnica optimizar las enzimas para la expresión y la actividad en la levadura.
Además, los genes que codifican estas enzimas pueden identificarse a partir de otras especies de hongos y bacterias y pueden expresarse para la modulación de esta vía. Varios organismos podría servir como fuentes para estas enzimas, incluyendo, pero sin limitarse a, Saccharomyces spp., incluyendo S. cerevisiae y S. uvarum, Kluyveromyces spp., incluyendo K. thermotolerans, K. lactis, y K. marxianus, Pichia spp., Hansenula spp., incluyendo H. polymorpha, Candida spp., Trichosporon spp., Yamadazyma spp., incluyendo Y. spp. stipitis, Torulaspora pretoriensis, Issatchenkia orientalis, Schizosaccharomyces spp., incluyendo S. pombe, Cryptococcus spp., Aspergillus spp., Neurospora spp., o Ustilago spp. Las fuentes de genes de hongos anaeróbicos incluyen, pero no se limitan a, Piromyces spp., Orpinomyces spp. o Neocallimastix spp. Las fuentes de enzimas procarióticas que son útiles incluyen, pero no se limitan a, Escherichia. coli, Zymomonas mobilis, Staphylococcus aureus, Bacillus spp., Clostridium spp., Corynebacterium spp., Pseudomonas spp., Lactococcus spp., Enterobacter spp., y Salmonella spp.
Las técnicas conocidas por los expertos en la técnica pueden ser adecuadas para identificar genes homólogos adicionales y enzimas homólogas. En general, los genes análogos y/o enzimas análogas pueden identificarse por análisis funcional y tendrán similitudes funcionales. Las técnicas conocidas por los expertos en la técnica pueden ser adecuadas para identificar genes análogos y enzimas análogas. Por ejemplo, para identificar glicosiltransferasas UDP, PTA, o cualquier gen, proteína o enzima de la vía biosintética homóloga o análoga, las técnicas pueden incluir, entre otras, la clonación de un gen por PCR usando cebadores basados en una secuencia publicada de un gen/enzima de interés, o por PCR degenerada usando cebadores degenerados diseñados para amplificar una región conservada entre un gen de interés. Además, un experto en la técnica puede usar técnicas para identificar genes, proteínas o enzimas homólogas o análogas con homología o similitud funcional. Las técnicas incluyen examinar una célula o cultivo celular para determinar la actividad catalítica de una enzima a través de ensayos enzimáticos in vitro para dicha actividad (por ejemplo, como se describe en el presente documento o en Kiritani, K., Branched-Chain Amino Acids Methods Enzymology, 1970), luego aislar la enzima con dicha actividad a través de la purificación, determinando la secuencia proteica de la enzima mediante técnicas tales como la degradación de Edman, el diseño de cebadores de PCR para la probable secuencia de ácido nucleico, la amplificación de dicha secuencia de ADN mediante PCR y la clonación de dicha secuencia de ácido nucleico. Para identificar genes homólogos o similares y/o enzimas homólogas o similares, genes análogos y/o enzimas o proteínas análogas, las técnicas también incluyen la comparación de datos relativos a un gen o enzima candidato con bases de datos tales como BRENDA, KEGG o MetaCYC. El gen o enzima candidato puede identificarse dentro de las bases de datos mencionadas anteriormente de acuerdo con las enseñanzas de este documento.
6. Ejemplos
Ejemplo 1: Generación de una cepa de levadura de base capaz de alto flujo a farnesilpirofosfato (FPP) y el isoprenoide farneseno.
Una cepa de producción de farneseno se ha creado a partir de una cepa de tipo silvestre de Saccharomyces cerevisiae (CEN.PK2) mediante la expresión de los genes de la vía del mevalonato (Figura 1C) bajo el control de los promotores GAL1 o GAL10. Esta cepa comprendía los siguientes genes de la vía del mevalonato integrados cromosómicamente de S. cerevisiae: acetil-CoA tiolasa, HMG-CoA sintasa, HMG-CoA reductasa, mevalonato quinasa, fosfomevalonato quinasa, mevalonato pirofosfato descarboxilasa, e IPP: es una fuente de información. Todos los genes descritos en el presente documento fueron optimizados con codones usando algoritmos públicamente disponibles u otros adecuados. Además, la cepa contenía seis copias de farneseno sintasa de Artemisinin annua, también bajo el control de los promotores GAL1 o GAL10. La cepa también contenía una supresión del gen GAL80 y una copia adicional de GAL4 bajo el promotor GAL4oc, en donde la secuencia codificante del gen GAL4 de Saccharomyces cerevisiae está bajo control regulador de una versión "constitutiva operativa" de su promotor nativo (PGAL4oc; ver, por ejemplo, Griggs y Johnston (1991) PNAS 88 (19): 8597-8601). Finalmente, el gen ERG9, que codifica la escualeno sintasa, se regula a la baja al reemplazar el promotor nativo con el promotor del gen de levadura MET3 (Westfall et al. PNAS 2012).
Ejemplo 2. Generación de una cepa de levadura base capaz de alto flujo a RebA.
La Figura 2A muestra una vía biosintética ilustrativa del FPP al esteviol. La Figura 2B muestra un ejemplo de vía biosintética del esteviol al glucósido RebM. Para convertir la cepa de base de farneseno descrita anteriormente para tener un alto flujo al isoprenoide caureno C-20, se integraron en el genoma seis copias de una geranilgeranilpirofosfato sintasa (GGPPS), seguidas de cuatro copias, cada una de una copalildifosfato sintasa y caureno. En este punto, las seis copias de farneseno sintasa se eliminaron de la cepa. Una vez que se confirmó que la nueva cepa producía entcaureno, los genes restantes para convertir ent-caureno en RebA se insertaron en el genoma. La Tabla 4 enumera todos los genes y promotores usados para convertir FPP a RebA. Cada gen después de que la caureno sintasa se integró con una sola copia, excepto por la enzima Sr.KAH que tenía dos copias (Tabla 4). La cepa que contenía todos los genes descritos en la Tabla 1 produjo principalmente RebA. La enzima UGT91D_like3 tiene cierta actividad para convertir RebA en Rebaudiósido D (RebD). Los inventores midieron que una sola copia de UGT91D_like3 es capaz de convertir aproximadamente (3 %) de RebA en la cepa a RebD in vivo en la cepa de levadura descrita anteriormente (Figura 3 y Tabla 5). UGT76G1 luego puede convertir RebD al producto final RebM.
Ejemplo 3. Generación de una cepa para seleccionar nuevas enzimas UDP-glicosiltransferasa (UGT) para convertir RebA a RebD.
Para realizar una cepa de cribado para cribar rápidamente para conversión de RebA a RebD in vivo, una plataforma de aterrizaje se insertó en la cepa RebA descrita anteriormente. La plataforma de aterrizaje consistía en 500 pb de secuencias de ADN dirigidas al locus en cualquiera de los extremos del constructo a la región genómica en dirección 3' del marco de lectura abierto ALG1 (Figura 4). Internamente, la plataforma de aterrizaje contenía un promotor PGAL1 y un terminador de levadura que flanqueaba un sitio de reconocimiento de endonucleasa (F-CphI).
Ejemplo 4. Cribado de genes UGT que convierten RebA a RebD con alta eficiencia in vivo
Más de cien enzimas UGT obtenidas del GenBank, se optimizaron por codones para la expresión óptima en S. cerevisiae y sintetizado con 60 pb de la secuencia homóloga a la pGAL1 y terminador de levadura que flanquean las secuencias F-CPHI en la plataforma de aterrizaje descrita anteriormente. Cada gen UGT sintetizado se probó individualmente, con una sola copia, para determinar la capacidad de convertir RebA a RebD in vivo en la cepa de levadura descrita anteriormente. Las levaduras se transformaron con ADN donante de UGT y un plásmido que contenía la endonucleasa F-CphI para cortar el ADN en la plataforma de aterrizaje. Las integraciones correctas se verificaron mediante PCR de colonias usando un cebador inverso interno al gen UGT específico en cada transformación y un cebador directo universal al final del ORF de ALF1.
Ejemplo 5. Métodos de transformación de levadura
Cada constructo de ADN se integra en Saccharomyces cerevisiae (CEN.PK2) con técnicas de biología molecular estándar en una transformación de acetato de litio optimizada (LiAc). En resumen, las células se cultivaron durante la noche en un medio de extracto de levadura peptona dextrosa (YPD) a 30 °C con agitación (200 rpm), se diluyeron a una DO600 de 0,1 en 100 ml de YPD y se cultivaron a una DO600 de 0,6-0,8. Para cada transformación, se recogieron 5 ml de cultivo mediante centrifugación, se lavaron en 5 ml de agua estéril, se hicieron girar de nuevo, se resuspendieron en 1 ml de LiAc 100 mM y se transfirieron a un tubo de microcentrífuga. Las células se centrifugaron (13,000 xg) durante 30 segundos, el sobrenadante se eliminó y las células se resuspendieron en una mezcla de transformación que consistía en 240 pl de PEG al 50 %, 36 pl de LiAc 1 M, 10 pl de ADN de esperma de salmón hervido y 74 pl de ADN del donante. Para las transformaciones que requerían la expresión de la endonucleasa F-Cph1, el ADN del donante incluía un plásmido que llevaba el gen F-CphI expresado bajo el promotor de la levadura TDH3 para la expresión. Esto cortará el sitio de reconocimiento de endonucleasa de F-CphI en la plataforma de aterrizaje para facilitar la integración del gen UGT. Después de un choque térmico a 42 °C durante 40 minutos, las células se recuperaron durante la noche en medios YPD antes de colocar en placas en medios selectivos. La integración del ADN se confirmó mediante PCR de colonias con cebadores específicos para las integraciones.
Ejemplo 6. Condiciones de cultivo de levadura
Las colonias de levadura verificadas que contenían el gen UGT esperado se recogieron en placas de microtitulación de 96 pozos que contienen medio de siembra Bird (BSM, originalmente descrito por van Hoek et al., Biotechnology and Bioengineering 68(5), 2000, pp. 517-523) con 20 g/l de sacarosa y 37,5 g/l de sulfato de amonio. Las células se cultivaron a 30 °C en una incubadora de placa de microtitulación de alta capacidad con agitación a 1000 rpm y 80 % de humedad durante 3 días hasta que los cultivos alcanzaron el agotamiento de carbono. Los cultivos saturados de crecimiento se subcultivaron en placas nuevas que contenían BSM con 40 g/l de sacarosa y 150 g/l de sulfato de amonio tomando 14,4 pl de los cultivos saturados y diluyendo en 360 pl de medio fresco. Las células en los medios de producción se cultivaron a 30 °C en un agitador de placas de microtitulación de alta capacidad a 1000 rpm y 80 % de humedad durante 3 días adicionales antes de la extracción y el análisis. Una vez completado, todo el caldo de células se diluyó con 360 l de etanol al 100 %, se selló con un sello de aluminio y se agitó a 1250 rpm durante 30 minutos para extraer los glucósidos de esteviol. Se agregaron 490 ul de etanol: agua 50:50 a una nueva placa de ensayo de 1,1 ml y se agregaron 10 l de la mezcla de cultivo/etanol a la placa de ensayo. La mezcla se centrifugó para sedimentar los sólidos, y se transfirieron 400 l de la solución a una nueva placa de 1,1 ml y se analizaron mediante LC-MS.
Ejemplo 7. Métodos analíticos
Las muestras se analizaron por espectrometría de masas LC-MS (AB QTRAP 4000) usando un péptido Sigma Ascentis Express Peptide ES-C18 (5 cm, 2,1 mm, 2,7 um; parte n.° 53301-U) con el siguiente gradiente (fase móvil A: Ácido fórmico al 0,1 % en H2O; fase móvil B: ácido fórmico al 0,1 % en acetonitrilo):
Tabla 2
Figure imgf000030_0002
El espectrómetro de masas se hizo funcionar en el modo de monitoreo de la reacción múltiple de iones negativos. Cada isómero de rebaudiósido se identificó por el tiempo de retención, determinado a partir de un estándar auténtico, y la transición MRM:
Tabla 3
Figure imgf000030_0001
continuación
Figure imgf000031_0001
Las áreas de los picos de un cromatograma de un espectrómetro de masas se usaron para generar la curva de calibración. La relación molar de compuestos relevantes (es decir, RebA, RebD, RebM) se determinó cuantificando la cantidad en moles de cada compuesto a través de una calibración externa usando un estándar auténtico y luego tomando las relaciones apropiadas.
Se llevó a cabo análisis de NMR para confirmar que RebM se produce a partir de las cepas genéticamente modificadas. Después de la fermentación, las cepas se retiraron del caldo de fermentación. Los glucósidos de esteviol se purificaron a partir del medio líquido restante. Se puede usar cualquier método adecuado para el análisis de NMR, incluyendo los que se describen, por ejemplo, en los documentos WO/2017/093895 y WO/2016/028899.
Ejemplo 8. Se encontró que las enzimas UGT tienen una alta actividad para convertir RebA a RebD
Se encontró que seis enzimas UGT tienen alta actividad para convertir RebA a RebD (Figura 3). El rendimiento de estas enzimas se comparó con otras dos enzimas UGT descritas en la literatura, Os_UGT_91C1 (es decir, EUGT11 descrita en el documento WO 2013/022989 A2) y Sl_UGT_101249881 (es decir, UGTSL2 en WO2014/193888 A1) como participantes también en la conversión de RebA a RebD. La Tabla 5 enumera la mediana de la relación de [micromoles de Reb (D+M)/micromoles de (A+D+M)]; RebA, RebD y RebM se midieron in vivo como se describió anteriormente. Esta relación es una medida de la eficiencia de conversión de RebA a RebD. La suma de la uM de [Reb (A+D+M)] mide la RebA total que se hizo en la celda. La suma de la uM de [Reb (D+M)] mide la RebD total que se hizo en la celda. Las Figuras 5Aa-5I muestran los cromatogramas de RebE, RebA, RebD, RebM y RebM2 para todos los genes UGT en la Figura 3 y la Tabla 2. RebM2 es un isómero de RebM con un solo enlace de glucosa incorrecto. RebM2 tiene Glq8(1-2)[Glq8 (1-6)]Glq61- en la posición de 19 carbonos (COOH) en lugar de en lugar de la GlqS (1-2)[Glq3 (1-3))]Glq31- para RebM.
El uso de los métodos de NMR descritos en el Ejemplo 7, el producto de la muestra generada a partir de la cepa que comprende UGT40087 se comparó contra un RebM estándar mediante espectroscopia de NMR 1D y 2d . La superposición de los espectros de NMR 1D y 2D registrados en metanol y piridina confirmó que ambos compuestos son idénticos. La interpretación detallada de los datos de NMR 2D y la comparación con los datos publicados en la literatura confirmaron que ambas muestras fueron RebM.
En un recipiente de fermentación, ya sea 0,5 o 2,0 litros, UGT40087, cuando se expresa en un fondo de cepas diferentes, produjo RebA, RebD y RebM en una relación de aproximadamente RebA:RebD:RebM de aproximadamente 1:7:50.
Tabla 4. Genes, pro FPP a RebA
Figure imgf000031_0002
Tabla 5. Mediana de la relación de la conversión de RebA a RebD de diferentes enzimas UGT, con número de r ín ID n i
Figure imgf000032_0001
Ejemplo 9: Especificidad de las enzimas en la Tabla 5 que convierten RebA a RebD
Las enzimas enumeradas en la Tabla 5 son capaces de catalizar la conversión de RebA a RebD mediante la adición de un azúcar glucosa en la posición C-2' de la 19-O-glucosa de RebA a través de la formación de un enlace glicosídico beta-1,2-enlazado. En ciertas modalidades, es deseable que la producción biotecnológica de RebM en un hospedero heterólogo produzca RebM (1) con alta pureza y (2) sin que produzca ningún glucósido de esteviol "no natural". Es probable que cualquier producto vendido en el mercado requiera una pureza extremadamente alta para garantizar el mejor perfil de sabor y cumplir con múltiples normas reglamentarias de alimentos humanos. La presencia de glucósidos de esteviol distintos de RebM probablemente aumentará el costo del procesamiento posterior para obtener un RebM altamente puro. Si hay cantidades significativas de glucósidos de esteviol no-RebM, potencialmente podría comprometer la pureza final del producto RebM. En ciertas modalidades, podría ser ventajoso que las enzimas heterólogas no produzcan ningún glucósido de esteviol "no natural". Un glucósido de esteviol "no natural" se define aquí como cualquier glucósido de esteviol que no se sabe que se produce naturalmente en la planta Stevia rebaudiana.
Por las razones descritas anteriormente, todas las enzimas enumeradas en la Tabla 5 fueron examinadas en cuanto a su perfil de impurezas, para determinar si hicieron algunos glucósidos de esteviol inesperados o no naturales que no se muestran en la Figura 2B. Las trazas cromatográficas para el tiempo de retención más largo para todas las enzimas enumeradas en la Tabla 2 se analizaron más a fondo. De todas las enzimas con eficiencias de conversión superiores al 50 %, las únicas enzimas que no produjeron productos inesperados fueron UGT40087 y Os_UGT_91C1 (EUGT11). Como se esperaba, UGT91D_like3 no produjo picos inesperados en el cromatograma.
Entre las enzimas con eficiencias de conversión superiores al 50 %, las trazas cromatográficas de estas enzimas producen uno o más inesperados picos que están asociados con glucósido que no ocurre de manera natural. Por ejemplo, la traza cromatográfica de Ob_UGT91B1_like produjo un pico inesperado (esteviol 2 glucosa) entre el pico de RebA y el pico de RebB en el tiempo de retención de aproximadamente 6,61 minutos. La intensidad del pico inesperado de Ob_UGT91B1_like fue al menos 31 veces mayor que la del pico RebA. Véase Figura 9C. El pico inesperado (esteviol 2 glucosa) no está presente en la traza cromatográfica de una cepa de control principal (con UGT74G1, UGT85C2, UGT76G1 y UGT91D_like3) o de una cepa que comprende UGT40087. Véase Figuras 9b y 9C. En otro ejemplo, la traza cromatográfica de Hv_UGT_V1 produjo un pico inesperado (esteviol 2 glucosa) entre el pico de RebA y el pico de RebB en el tiempo de retención de aproximadamente 6,61 minutos. La intensidad del pico inesperado de Hv_UGT_V1 fue factor 0,6 menor que la del pico RebA. En otro ejemplo, la traza cromatográfica de Sl_UGT_101249881 produjo un pico inesperado (esteviol 2 glucosa) entre el pico RebA y el pico RebB en el tiempo de retención de aproximadamente 6,67 minutos. La intensidad del pico inesperado de Sl_UGT_101249881 fue aproximadamente 1,11 veces mayor que la del pico RebA. En otro ejemplo, la traza cromatográfica de Sr.UGT_g252778 produjo un pico inesperado (esteviol 2 glucosa) entre el pico de RebA y el pico de RebB en el tiempo de retención de aproximadamente 6,67 minutos. La intensidad del pico inesperado de Sr.UGT_g252778 fue un factor de aproximadamente 0,96 más bajo que el del pico RebA. Algunas de estas enzimas también produjeron picos inesperados adicionales. Las trazas cromatográficas para Hv_UGT_V1, Sl_UGT_101249881, y Sr.UGT_g252778 se omiten.
Estos resultados indican que en comparación con las dos enzimas UGT40087 y Os_UGT_91C1 (EUGT11), las otras tres enzimas con más de 50 % de eficiencia de conversión de A a D (es decir, Hv_UGTV1, SI_UGT_101249881, y Sr.UGT_g252778) pueden catalizar reacciones adicionales, potencialmente produciendo glucósidos de esteviol que normalmente no se producen en la vía hacia RebM en la planta Stevia rebaudiana.
Tabla 6. Es ecificidad de las enzimas UGT
Figure imgf000033_0001
Ejemplo 10: La actividad de la enzima UGT40087 es específica para la posición C-2' de un glucósido de 19-O-glucosa esteviol
UGT40087 cataliza la reacción de adición de una segunda porción de azúcar al C-2' de una 19-O-glucosa de esteviósido o RebA. Como se muestra en la Figura 5A y la Figura 5I, la cepa de control principal sin UGT40087 (como se describe en el Ejemplo 2) puede generar RebA, pero no genera cantidades detectables de RebE, RebD o RebM. La adición de UGT40087 en la célula progenitora ahora da como resultado una cantidad detectable de RebE, lo que indica que UGT40087 cataliza la adición de una segunda porción de glucosa a la posición C-2' de una 19-O-glucosa en un enlace beta-1,2 de esteviósido para hacer RebE. Además, aparecen dos picos nuevos para RebD y RebM en el cromatograma para la cepa que contiene UGT40087, mientras que el pico para RebA disminuye significativamente, en comparación con la cepa original sin UGT40087. Por lo tanto, UGT40087 es capaz de catalizar la adición de una segunda porción de glucosa a la posición C-2' de una 19-O-glucosa en un enlace beta-1,2 del rebaudiósido A a rebaudiósido D. La presencia de UGT76G1 en la cepa cataliza la adición final de glucosa para convertir RebD a RebM.
Con el fin de evaluar la capacidad de añadir un azúcar a la posición C-2' de una 13-O-glucosa en un enlace beta-1,2 de esteviolmonósido o rubusósido, se hizo una cepa base que lleva un alto flujo a rubusósido solamente. La cepa base de rubusósido es genéticamente idéntica a la cepa base de RebA descrita en el ejemplo 2, excepto que la cepa base de rubusósido no contiene la enzima UGT91D_like3. Como se muestra en la Tabla 7, la cepa base de rubusósido, que tiene UGT74G1, UGT85C2 y UGT76G1 solo es capaz de producir 19-glucósido, esteviolmonósido y rubusósido. La adición de UGT40087 a esta variedad no cambia este perfil en absoluto. Si UGT40087 fuera capaz de agregar un azúcar a la posición C-2 de una 13-O-glucosa en un enlace beta-1,2 de esteviolmonósido o rubusósido, entonces debe haber cantidades detectables de uno o ambos esteviolbiósido o esteviósido. El esteviolbiósido, esteviósido, y también RebA se ven cuando la cepa es transformada con UGT91D_like3, que es capaz de añadir un azúcar a la posición C-2' de una 13-O-glucosa en el enlace beta-1,2 tanto de esteviolmonósido como rubusósido.
EUGT 11 (Os_UGT_91C1) fue caracterizada previamente por otros para catalizar la adición de una segunda porción de azúcar a la posición C-2' de un glucósido de 19-O-esteviol o un glucósido de 13-O-esteviol. Véase Figura 5 del documento WO 2013/022989. Como se señaló anteriormente, UGT40087 no parece catalizar la adición de un azúcar a la posición C-2 de una 13-O-glucosa en un enlace beta-1,2 de esteviolmonósido o rubusósido a un nivel detectable. Estos resultados indican que UGT40087 es una UDP-glicosiltransferasa que es funcionalmente distinguible y produce resultados diferentes en comparación con EUGT11.
Figure imgf000034_0001
Ejemplo 11. Manipulación genética de quimeras UGT intercambiando los dominios N-terminales
Las UDP-glicosiltransferasas (UGTs) vegetales comparten estructuras de proteínas altamente conservadas a pesar de que tienen relativamente baja homología de secuencia de aminoácidos. Estas UGT, que adoptan el llamado pliegue estructural GT-B, consisten en dos dominios, que se rompen aproximadamente en el punto medio de sus secuencias de aminoácidos primarios. El dominio N-terminal es el dominio aceptor de azúcar que determina principalmente la especificidad del sustrato. Como era de esperar, este dominio es un dominio más variable en términos de su secuencia de aminoácidos, reflejando los diversos sustratos que pueden ser glicosilados por UGT. El dominio C-terminal más conservado es el dominio donante de azúcar, en donde se une la UDP-glucosa. Los dos dominios generalmente están vinculados por un enlazador flexible que crea una región ideal para dividir la proteína para los diseños de intercambio de dominios (Figura 6). Dada la naturaleza de la estructura de dominio altamente conservada de las UGT, los dominios de cualquiera de las dos UGT podrían recombinarse para alterar la especificidad del sustrato o mejorar una función deseada, tal como la actividad catalítica. En este ejemplo, los inventores investigaron el papel del dominio N-terminal de UGT40087 para conferir especificidad de sustrato, es decir, la actividad de convertir RebA a RebD mediante el diseño de varias quimeras UGT a través del intercambio de dominios.
El enfoque general se podría tomar para diseñar un experimento de intercambio de dominios implica los siguientes pasos: 1) seleccionar el intercambio de pares de candidatos, 2) seleccionar el sitio de intercambio de dominios para hacer una quimera entre el par de UGT (con una opción para mutar el dominio C-terminal para mejorar las interacciones con el sustrato objetivo y el dominio N-terminal), y 3) crear, probar y desarrollar proteínas quiméricas para la actividad deseada. Este enfoque se tomó en este ejemplo para realizar el intercambio de dominios como se describe a continuación.
Se seleccionaron cuatro UGT como progenitores para construir quimeras de: UGT40087 (SEQ ID NO: 11), UGT Si91Dlike (SEQ ID NO: 12), OS_UGT_91C1 (SEQ ID NO: 8), y (SEQ ID NO: 7) 91Dlike3. El dominio N-terminal de UGT40087 se usó para reemplazar los dominios N-terminal de Si91Dlike, OS_UGT_91C1 y 91Dlike3, creando tres quimeras con 97 %, 79 % y 71 % de identidades de secuencia generales a UGT40087, respectivamente.
Se usó SWISS-MODEL para generar modelos estructurales para las cuatro UGT. Las posiciones exactas de los aminoácidos ("sitios de intercambio") se seleccionaron según las alineaciones estructurales y las alineaciones de secuencias. Para minimizar la perturbación al plegamiento tridimensional de las proteínas quiméricas, la región flexible situada entre los dominios N- y C-terminales, que constituyen las dos mitades distintas de la enzima (Figura 6), se usaron para los sitios de intercambio. Gly215 y Leu216 (los números de aminoácidos se refieren a UGT40087) en esta región están altamente conservados en todas las UGT, incluidas las cuatro UGT en este Ejemplo. Por lo tanto, los dos dominios se dividieron entre estos dos residuos para el intercambio de dominios (Figura 6).
Con el fin de probar los efectos de intercambio de dominios, los experimentos se realizaron en las cepas de levadura que son genéticamente idénticas, excepto que las cepas de levadura incluyen diferentes UGT. Sin embargo, estas cepas de levadura son genéticamente diferentes de las usadas en el análisis de diversidad de UGT descrito en el Ejemplo 4. Los métodos generales descritos en los Ejemplos 4 a 7 se usaron para la transformación, cultivo y análisis de la cepa. Las relaciones de conversión de RebA a RebD de varios diseños de intercambio de dominios se muestran en la Tabla 8 a continuación.
Tabla 8. Resultados de intercambio de dominios de UGT40087
Figure imgf000035_0001
UGT40087 comparte el 90 %, 54 % y 36 % de identidades de secuencia globales con Si91Dlike, Os_UGT_91C1 y 91Dlike3, respectivamente. Excepto 91Dlike3, que tiene aproximadamente un 40 % de identidades de secuencia tanto en las secuencias del N-terminal como del C-terminal a UGT40087, las quimeras del dominio N-terminal UGT40087 y los dominios del C-terminal de Si91Dlike y Os_UGT_91C1 están activos en la conversión de RebA a RebD (Tabla 8). Aunque Si91Dlike no tiene actividad detectable, la sustitución de su dominio N-terminal por la de UGT40087 confirió toda la actividad UGT40087, lo que indica que el dominio N-terminal de UGT40087 es importante para la conversión de RebA a RebD.
Las alineaciones de las cuatro UGT progenitoras también revelan seis residuos de aminoácidos N-terminales (V11, I12, P55, E90, S203, E223 y V413 en UGT40087; Figura 8 - la Figura de alineación de secuencia) que son compartidos por dos enzimas activas (UGT40087 y Os_UGT_91C1) para la conversión de RebA a RebD, pero son diferentes de las de las dos enzimas inactivas (Si91Dlike y 91Dlike3).
Ejemplo 12. Manipulación genética de variantes de UGT mediante el intercambio de bucles N-terminales
La comparación de estructuras modeladas de UGT40087 y Os_UGT_91C1 reveló cuatro bucles que poseen diferencias conformacionales significativas en el dominio aceptor de azúcar N terminal. Las ubicaciones de los bucles se muestran en la Figura 6. Para identificar los bucles que pueden contribuir a la actividad superior de UGT40087 para la conversión de RebA a RebD, cada uno de estos bucles se intercambió en las dos proteínas para generar un total de 12 variantes de UGT. Se diseñaron dos versiones de bucle_3 y bucle_4 para tener en cuenta dos posibles longitudes de bucle. Los diseños detallados se enumeran en las Tablas 9 y 10.
Tabla 9. Diseño de intercambio de bucles basado en UGT40087 (las secuencias entre aminoácidos con número ín i n l r i n in r m i n T 1 1.
Figure imgf000036_0001
En la Tabla 9, la secuencia de aminoácidos con un número de ID de secuencia entre dos residuos de aminoácidos con subíndices es la región del bucle que es intercambiado desde Os_UGT_91C a la base UGT40087. Los dos residuos de aminoácidos con subíndices adyacentes a la región del bucle intercambiado de Os_UGT_91C y los números de los subíndices corresponden a los residuos de aminoácidos y las posiciones de aminoácidos de UGT40087, respectivamente, antes de la incorporación de la región del bucle intercambiado. En los nuevos UGT quiméricos enumerados en la Tabla 9, la región de bucle intercambiada de Os_UGT_91C reemplazó la región de bucle correspondiente de la base UGT40087.
Se observa que la secuencia de aminoácidos de SEQ ID NO: 27, la región del bucle intercambiado, integrado en UGT40087_bucle1 es una versión modificada del bucle1 original de Os_UGT_91C1. De manera más específica, el 12° residuo de aminoácido en la secuencia de SEQ ID NO: 27 es prolina (en lugar de arginina que está presente en la posición correspondiente en la bucle1 original de Os_UGT_91C tiene la SEQ ID NO: 8). Por lo tanto, en UGT40087_bucle1, hay una sola sustitución de aminoácido, prolina en la posición 51, en comparación con la secuencia original de UGT40087 con SEQ ID NO: 11. La posición de la prolina sustituida en la posición 51 en UGT40087_bucle1 se muestra en negritas en la Tabla 9.
Tabla 10. Diseño de intercambio de bucles basado en Os_UGT_91C1 (las secuencias entre aminoácidos con n m r ín i n l r i n in r m i n T4 7.
Figure imgf000036_0002
En la Tabla 10, la secuencia de aminoácidos con un número de ID de secuencia entre dos residuos de aminoácidos con subíndices es la región del bucle siendo intercambiado desde UGT40087 en la base Os_UGT_91C1. Los dos residuos de aminoácidos con subíndices adyacentes a la región de bucle intercambiado de UGT40087 y los números de subíndices corresponden a los residuos de aminoácidos y las posiciones de aminoácidos de Os_UGT_91C1, respectivamente, antes de la incorporación de la región de bucle intercambiada. En los nuevos UGT quiméricos enumerados en la Tabla 10, la región de bucle intercambiada de UGT40087 reemplazó la región de bucle correspondiente de la base OS_UGT_91C1.
Se observa que la secuencia de aminoácidos de SEQ ID NO: 28, la región del bucle intercambiado, integrado en Os_UGT_91C1_bucle1 es una versión modificada del bucle1 original de UGT40087. De manera más específica, el 12° residuo aminoácido en la secuencia de SEQ ID NO: 28 es arginina (en lugar de prolina que está presente en la posición correspondiente en el buclel original de UGT40087 que tiene la SEQ ID NO: 11). Por lo tanto, en Os_UGT_91C1_bucle1, hay una sola sustitución de aminoácido, arginina en la posición 58, en comparación con la secuencia original de Os_UGT_91C1 con SEQ ID NO: 8. La posición de la arginina sustituida en la posición 58 en Os_UGT_91C1_bucle1 se muestra en negritas en la Tabla 10.
Las proteínas variantes fueron sintetizadas por Twist Bioscience con 60 pb de la secuencia homóloga al promotor GAL1 y un terminador de levadura que flanquean las secuencias F-CPHI en la plataforma de aterrizaje descrita en el Ejemplo 4. Cada variante UGT sintetizada se prueba individualmente como una sola copia cromosómica por su actividad en la conversión de RebA a RebD en el mismo fondo de cepas que en el Ejemplo 11 para los experimentos de quimera de intercambio de dominios de UGT. Para crear las cepas, los ADN del donante de quimera de UGT y un plásmido que contenía la endonucleasa F-CphI se transformaron en el hospedero de levadura. Las integraciones correctas se verificaron mediante PCR de colonias usando un cebador inverso interno a los genes UGT específicos y un cebador directo universal al final del lugar de integración. Las cepas confirmadas se probaron para la conversión de RebA a RebD como se describió anteriormente.
Tabla 11. Resultados de intercambio de bucles basados en UGT40087
Figure imgf000037_0001
T l 12. R l in r m i l n T 1 1
Figure imgf000037_0002
Con UGT40087 como el progenitor, las variantes de bucle de intercambio fueron todos activos en la conversión de RebA a RebD excepto para UGT40087_bucle4_2 (Tabla 11). Bucle4_2 es una secuencia larga que se encuentra cerca

Claims (15)

REIVINDICACIONES
1. Una célula hospedadora genéticamente modificada que comprende un ácido nucleico heterólogo que codifica una UDP-glicosiltransferasa que comprende una secuencia de aminoácidos que tiene al menos el 80 %, 85 %, 90 % o 95% de identidad de secuencia con SEQ ID NO: 1 o SEQ ID NO: 11, en donde la célula hospedadora genéticamente modificada es capaz de convertir RebA a RebD con una eficiencia superior al 90 %, 95 %, 96 % o 97 %.
2. La célula hospedadora genéticamente modificada de la reivindicación 1, en donde la UDP-glicosiltransferasa comprende una secuencia de aminoácidos que tiene la secuencia de SEQ ID NO: 1 o SEQ ID NO: 11.
3. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, en donde la UDP-glicosiltransferasa es capaz de beta 1,2 glicosilación de la posición C2' de la glucosa 19-0 de un glucósido de esteviol.
4. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, en donde la UDP-glicosiltransferasa está codificada por un ácido nucleico heterólogo, en donde el ácido nucleico heterólogo comprende una secuencia de nucleótidos que tiene al menos el 80 %, 85 %, 90 % o 95 % de identidad de secuencia con SEQ ID NO: 13.
5. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, en donde la UDP-glicosiltransferasa está codificada por un ácido nucleico heterólogo que tiene la secuencia de SEQ ID NO: 13.
6. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, en donde la UDP-glicosiltransferasa comprende una secuencia de aminoácidos que tiene al menos el 95 % de identidad de secuencia con SEQ ID NO: 1 o SEQ ID NO: 11.
7. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, en donde la UDP-glicosiltransferasa comprende una secuencia de aminoácidos que tiene la SEQ ID NO: 24.
8. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, en donde la UDP-glicosiltransferasa comprende una secuencia de aminoácidos que tiene al menos el 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad de secuencia con SEQ ID n O: 1 o SEQ ID NO: 11.
9. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, que es capaz de producir RebM.
10. La célula hospedadora genéticamente modificada de cualquiera de las reivindicaciones anteriores, en donde la célula hospedadora genéticamente modificada comprende, además: uno o más ácidos nucleicos heterólogos que codifican una o más enzimas de una vía para producir esteviol, y/o uno o más ácidos nucleicos heterólogos que codifican una o más enzimas de una vía para producir un glucósido de esteviol.
11. La célula hospedadora genéticamente modificada de la reivindicación 10, en donde las una o más enzimas de la vía comprenden una geranilgeranil difosfato sintasa, una copalil difosfato sintasa, una ent-caureno sintasa, una caureno oxidasa, una ácido caurenoico hidroxilasa, una citocromo P450 reductasa, UGT74G1, UGT76G1, UGT85C2 y UGT91D.
12. La célula hospedadora genéticamente modificada de una cualquiera de cualquiera de las reivindicaciones anteriores, en donde la célula se selecciona del grupo que consiste en una célula bacteriana, una célula fúngica, una célula de alga, una célula de insecto y una célula vegetal.
13. La célula hospedadora genéticamente modificada de la reivindicación 12, en donde la célula fúngica es Saccharomyces cerevisiae.
14. Un método para producir RebM:
(a) cultivando una población de las células hospedadoras genéticamente modificadas de cualquiera de las reivindicaciones anteriores en un medio con una fuente de carbono bajo condiciones adecuadas para producir RebM;y
(b) recuperando dicho compuesto RebM del medio.
15. Una composición de fermentación que comprende las células hospedadoras genéticamente modificadas de cualquiera de las reivindicaciones anteriores y glucósidos de esteviol producidos por las células hospedadoras genéticamente modificadas, en donde los glucósidos de esteviol comprenden RebA, RebD y RebM en una relación de RebA:RebD:RebM de al menos 1:7:50.
ES17757641T 2016-08-12 2017-08-11 Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos Active ES2906310T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662374408P 2016-08-12 2016-08-12
PCT/US2017/046637 WO2018031955A2 (en) 2016-08-12 2017-08-11 Udp-dependent glycosyltransferase for high efficiency production of rebaudiosides

Publications (1)

Publication Number Publication Date
ES2906310T3 true ES2906310T3 (es) 2022-04-18

Family

ID=59700219

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17757641T Active ES2906310T3 (es) 2016-08-12 2017-08-11 Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos

Country Status (14)

Country Link
US (3) US11091743B2 (es)
EP (1) EP3497222B1 (es)
JP (2) JP7404068B2 (es)
KR (1) KR102331018B1 (es)
CN (1) CN109804073B (es)
AU (1) AU2017308143B2 (es)
BR (1) BR112018074999A2 (es)
CA (1) CA3031162A1 (es)
ES (1) ES2906310T3 (es)
MX (1) MX2019001631A (es)
MY (1) MY194280A (es)
PT (1) PT3497222T (es)
SG (1) SG11201900930UA (es)
WO (1) WO2018031955A2 (es)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2017003666A (es) 2014-09-19 2018-02-01 Purecircle Sdn Bhd Esteviol glicosidos de alta pureza.
BR112018074999A2 (pt) * 2016-08-12 2019-03-12 Amyris, Inc. glicosiltransferase dependente de udp para a produção de alta eficiência de rebaudiosídeo
IL268121B2 (en) 2017-02-03 2024-01-01 Codexis Inc Transgenic glycosyltransferases and steviol glycoside glucosylation methods
CN111093390A (zh) * 2017-05-15 2020-05-01 谱赛科美国股份有限公司 高纯度甜菊醇糖苷
EP3765627A4 (en) * 2018-03-12 2021-10-13 Conagen Inc. BIOSYNTHETIC PRODUCTION OF STEVIOL GLYCOSIDES REBAUDIOSIDE J AND REBAUDIOSIDE N
EP3788059A1 (en) 2018-04-30 2021-03-10 DSM IP Assets B.V. Steviol glycoside transport
CN113260699A (zh) 2018-10-15 2021-08-13 阿迈瑞斯公司 用于高效生成瑞鲍迪苷的甜叶菊异贝壳杉烯酸羟化酶变体
AU2020211408A1 (en) 2019-01-24 2021-08-12 Amyris, Inc. ABC transporters for the high efficiency production of rebaudiosides
MX2022011329A (es) * 2020-03-13 2022-10-07 Amyris Inc Composiciones edulcorantes de rebaudiosido m.
CN111424065B (zh) * 2020-03-24 2022-08-16 金禾益康(北京)生物科技有限公司 使用糖基转移酶对甜菊糖苷类化合物进行糖基化方法
CN111518782B (zh) * 2020-03-24 2022-09-02 广东广业清怡食品科技股份有限公司 一种糖基转移酶ugtzj1突变体及其应用
WO2022216922A1 (en) * 2021-04-08 2022-10-13 Conagen Inc. Biosynthetic production of steviol glycosides
CN115478060B (zh) * 2021-06-16 2023-11-28 弈柯莱生物科技(集团)股份有限公司 一种糖基转移酶及其应用
KR102628374B1 (ko) * 2021-10-19 2024-01-24 씨제이제일제당 주식회사 신규한 당전이효소 및 이의 용도
AR127393A1 (es) * 2021-10-19 2024-01-17 Cj Cheiljedang Corp Métodos para preparar rebaudiósido d y rebaudiósido m
CN114045273B (zh) * 2021-11-15 2022-07-22 四川大学 糖基转移酶OsUGT91C1突变体及其应用
KR20230098495A (ko) * 2021-12-24 2023-07-04 주식회사 삼양사 당전이 효소 변이체 및 이를 이용한 스테비올 배당체의 제조방법
WO2023225604A1 (en) * 2022-05-19 2023-11-23 Amyris, Inc. Compositions and methods for improved production of steviol glycosides
WO2024042486A1 (en) 2022-08-26 2024-02-29 Amyris Bio Products Portugal, Unipessoal, Ltda. Compositions and methods for the production of polyurethanes
WO2024042405A1 (en) 2022-08-26 2024-02-29 Amyris Bio Products Portugal, Unipessoal, Ltda. Compositions and methods for the synthesis of bio-based polymers
WO2024116153A1 (en) 2022-12-02 2024-06-06 Amyris Bio Products Portugal, Unipessoal, Ltda. Compositions and methods for using previously cultured cells

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7838044B2 (en) 2004-12-21 2010-11-23 Purecircle Sdn Bhd Extraction, separation and modification of sweet glycosides from the Stevia rebaudiana plant
KR102061165B1 (ko) 2008-10-03 2019-12-31 모리타 가가쿠 고교 가부시키가이샤 신규 스테비올 배당체
JP4760951B2 (ja) 2009-05-08 2011-08-31 トヨタ自動車株式会社 ブタノール生産能を有する組換え微生物及びブタノールの製造方法
WO2011059954A1 (en) 2009-11-12 2011-05-19 Purecircle Usa Granulation of a stevia sweetener
US10888099B2 (en) 2009-11-12 2021-01-12 Purecircle Sdn Bhd. Granulation of a Stevia sweetener
EP2544538B1 (en) 2010-03-12 2022-06-15 PureCircle USA Inc. High-purity steviol glycosides
JP5056897B2 (ja) 2010-05-14 2012-10-24 トヨタ自動車株式会社 2−ブタノールの製造方法及び2−ブタノール生産能を有する組換え微生物
BR122021005283B1 (pt) 2010-06-02 2022-02-22 Evolva, Inc Hospedeiro recombinante que compreende genes recombinantes para produção deesteviol ou glicosídeo de esteviol, método para produzir esteviol, glicosídeo de esteviol ou composição de glicosídeo de esteviol e método para sintetizar esteviol ou glicosídeo de esteviol
WO2012135591A2 (en) 2011-03-30 2012-10-04 Amyris, Inc. Microbial isoprenoid production using a heterologous dxp pathway
KR102114493B1 (ko) 2011-08-08 2020-05-26 에볼바 에스아 스테비올 글리코시드의 재조합 생산
DK2806754T3 (en) 2012-01-23 2019-02-18 Dsm Ip Assets Bv Diterpene PREPARATION
CA2867112C (en) * 2012-03-16 2021-04-20 Suntory Holdings Limited Steviol glucosyltransferases and genes encoding the same
US10113154B2 (en) 2012-03-27 2018-10-30 Suntory Holdings Limited Method for producing steviol glycoside
US9752174B2 (en) 2013-05-28 2017-09-05 Purecircle Sdn Bhd High-purity steviol glycosides
JP6346174B2 (ja) 2012-05-22 2018-06-20 ピュアサークル スンディリアン ブルハド 高純度ステビオールグリコシド
TW201402599A (zh) 2012-05-30 2014-01-16 Suntory Holdings Ltd 甜菊糖苷糖苷轉化酵素及編碼該酵素之基因
SG11201505597SA (en) 2013-02-06 2015-08-28 Evolva Sa Methods for improved production of rebaudioside d and rebaudioside m
KR20150128705A (ko) 2013-02-11 2015-11-18 에볼바 에스아 재조합 숙주에서 스테비올 글리코시드의 효율적인 생성
KR101404728B1 (ko) 2013-02-28 2014-06-09 씨제이제일제당 (주) 스테비오사이드로부터 리바우디오사이드 a를 제조하는 방법
PE20151544A1 (es) 2013-03-15 2015-11-04 Cargill Inc Plantas de stevia con un contenido de rebaudiosido d incrementado
US10689681B2 (en) 2013-05-31 2020-06-23 Dsm Ip Assets B.V. Microorganisms for diterpene production
WO2015007748A1 (en) 2013-07-15 2015-01-22 Dsm Ip Assets B.V. Diterpene production
AU2014298420B2 (en) 2013-07-31 2018-10-04 Dsm Ip Assets B.V. Recovery of steviol glycosides
AU2013397496B2 (en) 2013-08-07 2020-03-12 Amyris, Inc. Methods for stabilizing production of acetyl-coenzyme a derived compounds
JP2017528125A (ja) 2014-08-11 2017-09-28 エヴォルヴァ エスアー.Evolva Sa. 組み換え宿主におけるステビオールグリコシドの産生
CN114052237A (zh) 2014-08-19 2022-02-18 谱赛科有限责任公司 制备莱鲍迪苷i的方法以及用途
CA2960693A1 (en) * 2014-09-09 2016-03-17 Evolva Sa Production of steviol glycosides in recombinant hosts
MX2017004248A (es) 2014-10-03 2017-05-19 Conagen Inc Edulcorantes no caloricos y metodos para sintetizar.
MY182396A (en) 2014-11-05 2021-01-23 Manus Biosynthesis Inc Microbial production of steviol glycosides
CA2973674A1 (en) 2015-01-30 2016-08-04 Evolva Sa Production of steviol glycosides in recombinant hosts
CN104726523B (zh) 2015-03-28 2018-08-10 南京工业大学 一种酶法制备莱鲍迪苷m的方法
US10815513B2 (en) 2015-05-29 2020-10-27 Cargill, Incorporated Fermentation methods for producing steviol glycosides using high pH and compositions obtained therefrom
JP2018516081A (ja) 2015-05-29 2018-06-21 カーギル・インコーポレイテッド 配糖体を産生するための熱処理
CA2991662A1 (en) 2015-07-10 2017-01-19 Dsm Ip Assets B.V. Steviol glycoside composition
EP4043579A1 (en) 2015-07-10 2022-08-17 DSM IP Assets B.V. Method for preparing a steviol glycoside compostion
CN107922913B (zh) 2015-08-13 2022-04-05 帝斯曼知识产权资产管理有限公司 甜菊醇糖苷转运
WO2017093895A1 (en) 2015-11-30 2017-06-08 Purecircle Sdn Bhd Process for producing high purity steviol glycosides
AU2016367317A1 (en) 2015-12-10 2018-05-24 Evolva Sa Production of steviol glycosides in recombinant hosts
BR112018017259B1 (pt) * 2016-03-01 2022-11-16 Univation Technologies, Llc Método para formar uma composição precursora modificada de um catalisador de ziegler-natta (zn)
WO2017178632A1 (en) 2016-04-13 2017-10-19 Evolva Sa Production of steviol glycosides in recombinant hosts
US10815514B2 (en) 2016-05-16 2020-10-27 Evolva Sa Production of steviol glycosides in recombinant hosts
CN109477128A (zh) 2016-05-16 2019-03-15 埃沃尔瓦公司 在重组宿主中甜菊醇糖苷的生产
BR112019002417B1 (pt) 2016-08-09 2023-05-02 Dsm Ip Assets B.V. Cristalização de glicosídeos de esteviol
BR112018074999A2 (pt) * 2016-08-12 2019-03-12 Amyris, Inc. glicosiltransferase dependente de udp para a produção de alta eficiência de rebaudiosídeo
CN110100006A (zh) 2016-11-07 2019-08-06 埃沃尔瓦公司 重组宿主中甜菊糖苷的生产
CN111093390A (zh) 2017-05-15 2020-05-01 谱赛科美国股份有限公司 高纯度甜菊醇糖苷
AU2018314249A1 (en) * 2017-08-11 2020-03-05 Amyris, Inc. Pisum sativum kaurene oxidase for high efficiency production of rebaudiosides
WO2019099649A1 (en) 2017-11-20 2019-05-23 Manus Bio, Inc. Microbial host cells for production of steviol glycosides
US20190270971A1 (en) 2018-03-01 2019-09-05 Jason Donald Increasing productivity of microbial host cells that functionally express p450 enzymes
GB201805576D0 (en) 2018-04-04 2018-05-16 Optibiotix Ltd Sweeteners and methods of production thereof
EP3788059A1 (en) 2018-04-30 2021-03-10 DSM IP Assets B.V. Steviol glycoside transport
AU2019314181A1 (en) 2018-07-30 2021-02-04 Tate & Lyle Solutions Usa Llc Engineered glycosyltransferases and steviol glycoside glucosylation methods
CA3144658A1 (en) 2019-06-25 2020-12-30 Manus Bio, Inc. Uridine diphosphate-dependent glycosyltransferase enzyme

Also Published As

Publication number Publication date
US20190185826A1 (en) 2019-06-20
JP2022137061A (ja) 2022-09-21
CN109804073B (zh) 2023-05-16
KR20190038612A (ko) 2019-04-08
MY194280A (en) 2022-11-25
EP3497222A2 (en) 2019-06-19
JP2019524134A (ja) 2019-09-05
JP7404068B2 (ja) 2023-12-25
PT3497222T (pt) 2022-02-09
US11091743B2 (en) 2021-08-17
KR102331018B1 (ko) 2021-11-26
AU2017308143B2 (en) 2022-04-07
CN109804073A (zh) 2019-05-24
EP3497222B1 (en) 2021-12-22
MX2019001631A (es) 2019-08-05
WO2018031955A2 (en) 2018-02-15
SG11201900930UA (en) 2019-02-27
RU2019104496A (ru) 2020-09-14
WO2018031955A3 (en) 2018-03-15
AU2017308143A1 (en) 2019-02-07
US20240174987A1 (en) 2024-05-30
US20210355458A1 (en) 2021-11-18
BR112018074999A2 (pt) 2019-03-12
US11866738B2 (en) 2024-01-09
RU2019104496A3 (es) 2021-04-09
CA3031162A1 (en) 2018-02-15

Similar Documents

Publication Publication Date Title
ES2906310T3 (es) Glicosiltransferasa dependiente de UDP para la producción de alta eficiencia de rebaudiósidos
JP7487099B2 (ja) レバウジオシドの高効率生成のためのエンドウ(pisum sativum)カウレンオキシダーゼ
US20210371892A1 (en) Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides
RU2777901C2 (ru) Udp-зависимая гликозилтрансфераза для высокоэффективного продуцирования ребаудиозидов
RU2795855C2 (ru) Аbc-транспортеры для высокоэффективного производства ребаудиозидов
US20220106619A1 (en) Abc transporters for the high efficiency production of rebaudiosides
RU2795550C2 (ru) Применение кауреноксидазы pisum sativum для высокоэффективного производства ребаудиозидов
US20220282228A1 (en) Kaurenoic acid 13-hydroxylase (kah) variants and uses thereof