ES2933968T3 - Producción de manool - Google Patents

Producción de manool Download PDF

Info

Publication number
ES2933968T3
ES2933968T3 ES16736039T ES16736039T ES2933968T3 ES 2933968 T3 ES2933968 T3 ES 2933968T3 ES 16736039 T ES16736039 T ES 16736039T ES 16736039 T ES16736039 T ES 16736039T ES 2933968 T3 ES2933968 T3 ES 2933968T3
Authority
ES
Spain
Prior art keywords
synthase
seq
polypeptide
nucleic acid
sclareole
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16736039T
Other languages
English (en)
Inventor
Michel Schalk
Letizia ROCCI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Firmenich SA
Original Assignee
Firmenich SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich SA filed Critical Firmenich SA
Application granted granted Critical
Publication of ES2933968T3 publication Critical patent/ES2933968T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/002Preparation of hydrocarbons or halogenated hydrocarbons cyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01012Copalyl diphosphate synthase (5.5.1.12)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y505/00Intramolecular lyases (5.5)
    • C12Y505/01Intramolecular lyases (5.5.1)
    • C12Y505/01014Syn-copalyl-diphosphate synthase (5.5.1.14)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

En el presente documento se proporcionan métodos para producir (+)-manool que comprenden: poner en contacto geranilgeranil difosfato con una copalil difosfato (CPP) sintasa para formar un (9S, 10S)-copalil difosfato en el que la CPP sintasa comprende una secuencia de aminoácidos que tiene al menos 90%, 95 %, 98 %), 99 % y 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste en SEQ ID NO: 1 y SEQ ID NO: 2; y poner en contacto el CPP con una enzima esclareol sintasa para formar (+)-manool. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Producción de manool
Campo técnico
Se proporcionan aquí métodos bioquímicos para producir (+)-manool utilizando una difosfato de copalilo sintasa y una esclareol sintasa.
Antecedentes
Los terpenos se encuentran en la mayoría de los organismos (microorganismos, animales y plantas). Estos compuestos son fabricados con cinco unidades de carbono llamadas unidades de isopreno y se clasifican por el número de estas unidades presentes en su estructura. Por consiguiente los monoterpenos, sesquiterpenos y diterpenos son terpenos que contienen 10, 15 y 20 átomos de carbono respectivamente. Los sesquiterpenos, por ejemplo, se encuentran ampliamente en el reino vegetal. Muchas moléculas de terpeno (por ejemplo sesquiterpeno) son conocidas por sus propiedades de sabor y fragancia y sus efectos cosméticos, medicinales y antimicrobianos. Se han identificado numerosos hidrocarburos de terpeno (por ejemplo, sesquiterpeno) y terpenoides (por ejemplo, sesquiterpenoides).
La producción biosintética de terpenos involucra enzimas llamadas terpeno sintasas. Estas enzimas convierten un precursor de terpeno acíclico en uno o más productos de terpeno. En particular, las diterpeno sintasas producen diterpenos por medio de la ciclación del precursor de pirofosfato de geranilgeranilo (GGPP). La ciclación del GGPP requiere frecuentemente dos polipéptidos de enzimas, una diterpeno sintasa del tipo I y una del tipo II que trabajan en combinación en dos reacciones enzimáticas sucesivas. Las diterpeno sintasas del tipo II catalizan una ciclación/redisposición del GGPP iniciada por medio de la protonación del doble enlace terminal del GGPP que conduce a un compuesto intermedio de difosfato de diterpeno cíclico. Este compuesto intermedio luego se convierte adicionalmente por medio de una diterpeno sintasa del tipo I que cataliza una ciclación iniciada por ionización.
Las diterpeno sintasas están presentes en las plantas y otros organismos y utilizan sustratos tales como el difosfato de geranilgeranilo pero las mismas tienen diferentes perfiles de productos. Los genes y los ADNc que codifican las diterpeno sintasas han sido clonados y se caracterizaron las enzimas recombinantes correspondientes.
Las difosfato de copalilo sintasas y las esclareol sintasas son enzimas que están presentes en las plantas. Por lo tanto, es deseable descubrir y utilizar estas enzimas y variantes en los procesos bioquímicos para generar el (+)-manool.
Y. Ma et al. 2012 (en Journal of Experimental Botany, 63 (7), 2809-2823) y Guanghong Cui et al. 2015 (en Plant Physiology, 169, 1607-1618) desvelan varias enzimas difosfato de copalilo sintasa aisladas de Salvia miltiorrhyza.
La solicitud de patente WO 2014/022434 se refiere a la producción de esclareol a partir de GGPP utilizando las enzimas difosfato de labdenilo sintasa (LPPS) y una esclareol sintasa derivada de Salvia sclarea.
A. Caniard et al., 2012 (en BMC Plant Biology, 12: 119, 1-13) desvela la producción de esclareol usando una Saccharomyces cerevisiae modificada por ingeniería genética metabólica transformada con GGPP sintasa de S. cerevisiae, labda-13-en-8-ol difosfato sintasa (ScLPPS) de Salvia sclarea y esclareol sintasa (SsSS) de S. sclarea. La SsLPPS produce labda-13-en-8-ol difosfato como producto principal a partir de GGPP con algunas cantidades menores de su análogo no hidroxilado difosfato de (9 S, 10 S)-copalilo. La SsSS transforma estos intermedios en esclareol y se obtienen pequeñas cantidades de manool como un subproducto. Se especula que el manool podría producirse a partir de pequeñas cantidades de difosfato de copalilo mediante la misma SsSS que produce esclareol.
Sumario
Se proporciona aquí un método para producir (+)-manool que comprende:
a) poner en contacto el difosfato de geranilgeranilo con una difosfato de copalilo (CPP) sintasa para formar un difosfato de (9S, 10S)-copalilo en donde la CPP sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2; y
b) poner en contacto el difosfato de (9S, 10S)-copalilo CPP con una esclareol sintasa para formar el (+)-manool; y c) aislar opcionalmente el (+)-manool.
También se proporciona aquí un polipéptido en donde el polipéptido comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2.
También se proporciona aquí un ácido nucleico que codifica un polipéptido descrito anteriormente.
También se proporciona aquí un ácido nucleico en donde el ácido nucleico comprende una secuencia de nucleótidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:3.
También se proporciona aquí un método para transformar un organismo no humano o una célula hospedadora con un ácido nucleico que codifica un polipéptido que tiene una actividad de la difosfato de copalilo sintasa y un polipéptido que tiene una actividad de la esclareol sintasa en donde el polipéptido que tiene una actividad de la difosfato de copalilo sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2 y en donde el polipéptido que tiene una actividad de la esclareol sintasa comprende una secuencia de aminoácidos que tiene al menos 90%, 95%, 98%, 99% o 100% de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO: 4 y el SEQ ID NO: 5. También se proporciona aquí un organismo no humano o una célula hospedadora producida por el método.También se proporciona aquí un vector de expresión que comprende un ácido nucleico que codifica una CPP sintasa donde la CPP sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO: 2, y un ácido nucleico que codifica una esclareol sintasa.
También se proporciona aquí una célula u organismo hospedador no humano que comprende al menos un ácido nucleico que codifica un polipéptido que tiene una actividad de la CPP sintasa, y al menos un ácido nucleico que codifica un polipéptido que tiene una actividad de la esclareol sintasa, en donde el polipéptido que tiene una actividad de la CPP sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2.
También se proporciona aquí un método para producir (+)-manool que comprende cultivar una célula u organismo hospedador de acuerdo con la invención.
Descripción de las figuras
Figura 1. Ruta enzimática desde el difosfato de geranilgeranilo (GGPP) hasta el (+)-manool.
Figura 2. Análisis con GCMS de la conversión enzimática in vitro del GGPP. Figura 2A. Utilizando la enzima de SmCPS recombinante. Figura 2B. Utilizando la enzima de SsScS recombinante. Figura 2C. Combinando las enzimas de SmCPS con las enzimas de SsScS en un solo ensayo.
Figura 3. Análisis con GCMS del (+)-manool producido utilizando las células de E. coli que expresan las enzimas de la ruta del SmCPS, SsScS y mevalonato. Figura 3A. Cromatograma de iones totales de un extracto del medio de cultivo de E. coli. Figura 3B. Cromatograma de iones totales de un estándar del (+)-manool. Figura 3C. Espectro de masa del pico principal (tiempo de retención de 14,55 min) en el cromatograma A. Figura 3D. Espectro de masa del estándar auténtico del (+)-manool.
Figura 4. Rutas enzimáticas desde el difosfato de geranilgeranilo (GGPP) hasta el (+)-manool y el esclareol.
Descripción detallada
Abreviaturas utilizadas
bp par de base
kb kilo base
ADN ácido desoxirribonucleico
ADNc ADN complementario
CPP difosfato de copalilo
DTT ditiotreitol
FPP difosfato de farnesilo
GGPP difosfato de geranilgeranilo
GC cromatógrafo de gases
LB caldo de lisogenia
MS espectrómetro de masa
MVA ácido mevalónico
PCR reacción en cadena de la polimerasa
ARN ácido ribonucleico
ARNm ácido ribonucleico mensajero
miARN micro ARN
ARNsi ARN de interferencia pequeño
ARNr ARN ribosomal
ARNt ARN de transferencia
DEFINICIONES
El término "polipéptido" significa una secuencia de aminoácidos de residuos de aminoácidos polimerizados consecutivamente, por ejemplo, al menos 15 residuos, al menos 30 residuos, al menos 50 residuos. En algunas modalidades provistas aquí, un polipéptido comprende una secuencia de aminoácidos que es una enzima, o un fragmento, o una variante de los mismos.
El término polipéptido "aislado" se refiere a una secuencia de aminoácidos que se remueve de su medio ambiente natural por medio de cualquier método o combinación de los métodos conocidos en la técnica e incluye métodos recombinantes, bioquímicos y de síntesis.
El término "proteína" se refiere a una secuencia de aminoácidos de cualquier longitud en donde los aminoácidos están unidos por medio de enlaces de péptidos covalentes, e incluye el oligopéptido, péptido, polipéptido y proteínas de longitud completa ya sea que están presentes de manera natural o sintéticos.
Los términos "función biológica", "función", "actividad biológica" o "actividad" se refieren a la capacidad de la CPP sintasa y a la actividad de la esclareol sintasa para catalizar la formación del (+)-manool. La "función biológica", "función", "actividad biológica" o "actividad" de la CPP sintasa pueden, por ejemplo, referirse a la capacidad de la CPP sintasa para catalizar la formación del difosfato de (9S, 10S)-copalilo a partir del GGPP. La "función biológica", "función", "actividad biológica" o "actividad" de la esclareol sintasa pueden, por ejemplo, referirse a la capacidad de la esclareol sintasa para catalizar la formación del (+)-manool a partir del difosfato de (9S, 10S)-copalilo.
Una esclareol sintasa se puede referir a una enzima, por ejemplo una enzima que está presente de manera natural, que tiene la capacidad de catalizar la formación del esclareol a partir del difosfato de labdendiol (LPP) como se muestra en la figura 4. El LPP se puede producir a partir del GGPP por medio de la acción de una difosfato de labdendiol sintasa (LPS) (véase la figura 4). Para su uso en la presente invención, tal esclareol sintasa, como anteriormente, también tiene la capacidad de catalizar la formación del (+)-manool a partir del difosfato de (9S, 10S)-copalilo. Se entenderá que, por ejemplo las variantes, fragmentos y formas truncadas de las esclareol sintasas se pueden utilizar en la invención, siempre que estas tengan la capacidad de catalizar la formación del (+)-manool a partir del difosfato de (9S, 10S)-copalilo. Se entenderá además por ejemplo que tales variantes, fragmentos o formas truncadas de las enzimas de esclareol sintasas pueden haber perdido algo o la totalidad de la capacidad de catalizar la formación del esclareol a partir del LPP sin perjudicar su adecuación para su uso en la invención.
Los términos "secuencia de ácidos nucleicos", "ácido nucleico" y "polinucleótido" se utilizan intercambiablemente, significando una secuencia de nucleótidos. Una secuencia de ácidos nucleicos puede ser un desoxirribonucleótido de una sola hebra o de doble hebra, o un ribonucleótido de cualquier longitud, e incluye secuencias codificantes y no codificantes de un gen, exones, intrones, secuencias complementarias de sentido y anti-sentido, ADN genómico, ADNc, miARN, ARNsi, ARNm, ARNr, ARNt, secuencias de ácidos nucleicos recombinantes, secuencias de ADN y/o ARN que están presentes de manera natural aisladas y purificadas, secuencias de ADN y ARN sintéticas, fragmentos, cebadores y sondas de ácidos nucleicos. La persona con experiencia en la técnica es consciente de que las secuencias de ácidos nucleicos de ARN son idénticas a las secuencias de ADN con la diferencia de que la timina (T) está reemplazada por el uracilo (U).
Un "ácido nucleico aislado" o una "secuencia de ácidos nucleicos aislada" se define como un ácido nucleico o una secuencia de ácidos nucleicos que está en un medio ambiente diferente de aquel en el cual el ácido nucleico o la secuencia de ácidos nucleicos están presentes de manera natural. El término "que está presente de manera natural" como se utiliza aquí tal como se aplica a un ácido nucleico se refiere a un ácido nucleico que se encuentra en una célula en la naturaleza. Por ejemplo, una secuencia de ácidos nucleicos que está presente en un organismo, por ejemplo en las células de un organismo, que se puede aislar de una fuente en la naturaleza y que no ha sido modificado intencionalmente por un ser humano en el laboratorio está presente de manera natural.
Las "secuencias de ácidos nucleicos recombinantes" son las secuencias de ácidos nucleicos que resultan del uso de los métodos de laboratorio (clonación molecular) para reunir conjuntamente el material genético de más de una fuente, creando una secuencia de ácidos nucleicos que no está presente de manera natural y que no se podría encontrar de otra manera en organismos biológicos.
La "tecnología de ADN recombinante" se refiere a los procedimientos de biología molecular para preparar una secuencia de ácidos nucleicos recombinante como se describe, por ejemplo, en Laboratory Manuals editado por Weigel y Glazebrook, 2002 Cold Spring Harbor Lab Press; y Sambrook et al., 1989 Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press.
El término "gen" significa una secuencia de ADN que comprende una región, que se transcribe en una molécula de ARN, por ejemplo, un ARNm en una célula, unido operativamente a las regiones reguladoras adecuadas, por ejemplo, un promotor. Por consiguiente un gen puede comprender varias secuencias unidas operativamente, tales como un promotor, una secuencia delantera 5' que comprende, por ejemplo, las secuencias involucradas en el inicio de la traducción, una región codificante de ADNc o ADN genómico, intrones, exones, y/o una secuencia no traducida 3' que comprende, por ejemplo, sitios de terminación de la transcripción.
Un "gen quimérico" se refiere a cualquier gen, que no se encuentra normalmente en la naturaleza en una especie, en particular, un gen en el cual están presentes una o más partes de la secuencia de ácidos nucleicos que no están asociadas entre sí en la naturaleza. Por ejemplo, el promotor no está asociado en la naturaleza con parte o la totalidad de la región transcrita o con otra región reguladora. El término "gen quimérico" se entiende que incluye construcciones de expresión en las que un promotor o una secuencia reguladora de la transcripción está unida operativamente a una o más secuencias codificantes o a un complemento de anti-sentido, es decir, inverso, de la hebra de sentido, o de la secuencia de repetición invertida (en el sentido y anti-sentido, por lo cual la transcripción de ARN forma un ARN de doble hebra durante la transcripción). El término "gen quimérico" también incluye genes obtenidos a través de la combinación de las partes de una o más secuencias codificantes para producir un nuevo gen.
Una "3' UTR" o una "secuencia no traducida 3"' (también referida como "región no traducida 3'" o "extremo 3'") se refiere a la secuencia de ácidos nucleicos encontrada corriente abajo de la secuencia codificante de un gen, que comprende por ejemplo un sitio de terminación de la transcripción y (en la mayoría, pero no en todos los ARNm eucariotas) una señal de poliadenilación tal como AAUAAA o variantes de la misma. Después de la terminación de la transcripción, la transcripción del ARNm se puede escindir corriente abajo de la señal de poliadenilación y se puede agregar una extremidad de poli(A) que está involucrada en el transporte del ARNm hasta el sitio de la traducción, por ejemplo, el citoplasma.
"Expresión de un gen" involucra la transcripción del gen y la traducción del ARNm en una proteína. La sobreexpresión se refiere a la producción del producto génico como se midió por niveles de ARNm, polipéptido y/o actividad de la enzima en los organismos o células transgénicas que exceden los niveles de producción en los organismos o células no transformadas de un antecedente genético semejante.
"Vector de expresión" como se utiliza aquí significa una molécula de ácido nucleico modificada genéticamente utilizando los métodos de biología molecular y la tecnología de ADN recombinante para el suministro de ADN exógeno o extraño en una célula hospedadora. El vector de expresión normalmente incluye las secuencias requeridas para la transcripción apropiada de la secuencia de nucleótidos. La región codificante usualmente codifica una proteína de interés pero también puede codificar un ARN, por ejemplo, un ARN de anti-sentido, un ARNsi y semejantes.
Un "vector de expresión" como se utiliza aquí incluye cualquier vector recombinante lineal o circular que incluye, pero no está limitado a, vectores virales, bacteriófagos y plásmidos. La persona con experiencia en la técnica es capaz de seleccionar un vector adecuado de acuerdo con el sistema de expresión. En una modalidad, el vector de expresión incluye el ácido nucleico de una modalidad de aquí unido operativamente a al menos una secuencia reguladora, que controla la transcripción, traducción, iniciación y terminación, tal como un promotor, operador o mejorador transcripcional, o un sitio de unión ribosómico del ARNm y, opcionalmente, que incluye al menos un marcador de selección. Las secuencias de nucleótidos están "unidas operativamente" cuando la secuencia reguladora se relaciona funcionalmente con el ácido nucleico de una modalidad de aquí. "Secuencia reguladora" se refiere a una secuencia de ácidos nucleicos que determina el nivel de expresión de las secuencias de ácidos nucleicos de una modalidad de aquí y es capaz de regular la velocidad de transcripción de la secuencia de ácidos nucleicos unida operativamente a la secuencia reguladora. Las secuencias reguladoras comprenden promotores, mejoradores, factores de transcripción, elementos promotores y semejantes.
"Promotor" se refiere a una secuencia de ácidos nucleicos que controla la expresión de una secuencia codificante proporcionando un sitio de unión para la ARN polimerasa y otros factores necesarios para una transcripción adecuada que incluye sin limitación los sitios de unión al factor de transcripción, los sitios de unión a la proteína activadora o represora. El significado del término promotor también incluye el término "secuencia reguladora del promotor". Las secuencias reguladoras del promotor pueden incluir elementos corriente arriba y corriente abajo que pueden influir en la transcripción, el procesamiento del ARN o la estabilidad de la secuencia de ácidos nucleicos codificante asociada. Los promotores incluyen secuencias derivadas de manera natural y sintéticas. Las secuencias de ácidos nucleicos codificantes se localizan usualmente corriente abajo del promotor con respecto a la dirección de la transcripción que comienza en el sitio de iniciación de la transcripción.
El término "promotor constitutivo" se refiere a un promotor no regulado que permite la transcripción continua de la secuencia de ácidos nucleicos a la que está unido operativamente.
Como se utiliza aquí, el término "unido operativamente" se refiere a un enlace de elementos de polinucleótidos en una relación funcional. Un ácido nucleico está "unido operativamente" cuando se coloca en una relación funcional con otra secuencia de ácidos nucleicos. Por ejemplo, un promotor, o más bien una secuencia reguladora de la transcripción, está unida operativamente a una secuencia codificante si afecta la transcripción de la secuencia codificante. Unido operativamente significa que las secuencias de ADN que se unen son normalmente contiguas. La secuencia de nucleótidos asociada con la secuencia del promotor puede ser de origen homólogo o heterólogo con respecto a la planta que va a ser transformada. La secuencia también puede ser parcial o totalmente sintética. Independientemente del origen, la secuencia de ácidos nucleicos asociada con la secuencia del promotor será expresada o suprimida de acuerdo con las propiedades del promotor al cual se une después de la unión al polipéptido de una modalidad de aquí.
El ácido nucleico asociado puede codificar una proteína que se desea que sea expresada o suprimida en todo el organismo en todo momento o, alternativamente, en un tiempo específico o en tejidos, células o compartimentos celulares específicos. Tales secuencias de nucleótidos codifican particularmente las proteínas que confieren rasgos fenotípicos deseables a los organismos o células hospedadoras alteradas o transformadas con las mismas. Más particularmente, la secuencia de nucleótidos asociada conduce a la producción de una (+)-manool sintasa en el organismo.
"Péptido objetivo" se refiere a una secuencia de aminoácidos que tiene como objetivo una proteína, o un polipéptido para los orgánulos intracelulares, es decir, las mitocondrias, o los plástidos, para el espacio extracelular (péptido de señal de secreción). Una secuencia de ácidos nucleicos que codifica un péptido objetivo se puede fusionar con la secuencia de ácidos nucleicos que codifica el extremo terminal amino, por ejemplo, el extremo N-terminal, de la proteína o polipéptido, o se puede utilizar para reemplazar un polipéptido objetivo natural.
El término "cebador" se refiere a una secuencia de ácidos nucleicos corta que se hibrida hasta una secuencia de ácidos nucleicos del molde y se utiliza para la polimerización de una secuencia de ácidos nucleicos complementaria al molde.
Como se utiliza aquí, el término "célula hospedadora" o "célula transformada" se refiere a una célula (u organismo) alterada para albergar al menos una molécula de ácido nucleico, por ejemplo, un gen recombinante que codifica una proteína o secuencia de ácidos nucleicos deseada que durante la transcripción produce una proteína de CPP sintasa y una proteína de esclareol sintasa o que juntas producen (+)- manool.
La célula hospedadora es particularmente una célula bacteriana, una célula fúngica o una célula vegetal. La célula hospedadora puede contener un gen recombinante que ha sido integrado en los genomas de los orgánulos o nucleares de la célula hospedadora. Alternativamente, el hospedador puede contener el gen recombinante extracromosómicamente. Las secuencias homologas incluyen secuencias parálogas u ortólogas. Los métodos para identificar los parálogos o los ortólogos que incluyen métodos filogenéticos, semejanza de secuencia y métodos de hibridación son conocidos en la técnica y se describen aquí.
Los parálogos resultan de la duplicación de genes que da lugar a dos o más genes con secuencias semejantes y funciones semejantes. Los parálogos normalmente se agrupan conjuntamente y se forman por duplicaciones de genes dentro de las especies de plantas relacionadas. Los parálogos se encuentran en grupos de genes semejantes utilizando el análisis de Blast por pares o durante el análisis filogenético de las familias de genes utilizando programas tales como CLUSTAL. En los parálogos, las secuencias de consenso pueden ser características identificadas para las secuencias dentro de los genes relacionados y que tienen funciones semejantes de los genes.
Los ortólogos, o secuencias ortólogas, son secuencias semejantes entre sí a causa de que se encuentran en especies que descienden de un ancestro común. Por ejemplo, se sabe que las especies de plantas que tienen ancestros comunes contienen muchas enzimas que tienen secuencias y funciones semejantes. La persona con experiencia en la técnica puede identificar secuencias ortólogas y predecir las funciones de los ortólogos, por ejemplo, construyendo un árbol poligénico para una familia de genes de una especie utilizando los programas CLUSTAL o BLAST.
El término "marcador seleccionable" se refiere a cualquier gen que durante la expresión se puede utilizar para seleccionar una célula o células que incluyen el marcador seleccionable. Los ejemplos de los marcadores seleccionables se describirán posteriormente. La persona con experiencia en la técnica sabrá que diferentes marcadores seleccionables de antibióticos, de fungicidas, auxotróficos o de herbicidas son aplicables a diferentes especies objetivo.
El término "organismo" se refiere a cualesquiera organismos unicelulares o multicelulares no humanos tales como una planta, o un microorganismo. Particularmente, un microorganismo es una bacteria, una levadura, un alga o un hongo.
El término "planta" se utiliza intercambiablemente para incluir células de plantas que incluyen protoplastos de plantas, tejidos de plantas, cultivos de tejidos de células de plantas que dan lugar a plantas regeneradas, o partes de plantas, u órganos de plantas tales como raíces, tallos, hojas, flores, polen, óvulos, embriones, frutos y semejantes. Se puede utilizar cualquier planta para llevar a cabo los métodos de una modalidad de aquí.
Para las descripciones de aquí y las reivindicaciones adjuntas, el uso de "o" significa "y/o" a menos que se establezca de otra manera. De manera semejante, "comprende", "está comprendido de", "que comprende" "incluye", "que incluye" e "incluyendo" son intercambiables y no están propuestos para ser limitantes.
Se entenderá además que en donde las descripciones de varias modalidades utilicen el término "que comprende", aquellas personas con experiencia en la técnica podrían entender que en algunos casos específicos, una modalidad se puede describir alternativamente utilizando el lenguaje "que consiste esencialmente de" o "que consiste de".
Una modalidad provista aquí es un método para transformar un organismo no humano o una célula hospedadora con un ácido nucleico que codifica un polipéptido que tiene una actividad de la difosfato de copalilo sintasa y con ácido nucleico que codifica un polipéptido que tiene una actividad de la esclareol sintasa en donde el polipéptido que tiene la actividad de la difosfato de copalilo sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2. Particularmente, el polipéptido que tiene la actividad de la esclareol sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:4 y el SEQ ID NO:5.
Una modalidad provista aquí es un método que comprende cultivar una célula u organismo hospedador no humano capaz de producir un difosfato de geranilgeranilo (GGPP) y es transformado para expresar un polipéptido que tiene una actividad de la difosfato de copalilo sintasa en donde el polipéptido que tiene la actividad de la difosfato de copalilo sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2 y es transformado adicionalmente para expresar un polipéptido que tiene una actividad de la esclareol sintasa. Particularmente, el polipéptido que tiene la actividad de la esclareol sintasa comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:4 y el SEQ ID NO:5.
Se proporciona aquí adicionalmente un vector de expresión que comprende un ácido nucleico que codifica una CPP sintasa en donde la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2 y además el vector de expresión comprende un ácido nucleico que codifica una enzima de esclareol sintasa. Particularmente, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 90 %, 95 %, 98 %, 99 % o 100 % semejante o idéntica a un polipéptido seleccionado del grupo que consiste del SEQ ID NO:4 y el SEQ ID NO:5. En una modalidad particular, las dos enzimas podrían estar sobre dos vectores diferentes transformados en la misma célula. En una modalidad adicional las dos enzimas podrían estar sobre dos vectores diferentes transformados en dos células diferentes.
Se proporciona aquí adicionalmente una célula transformada o un organismo hospedador no humano para albergar al menos un ácido nucleico que codifica una CPP sintasa en donde la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO: 2 y al menos un ácido nucleico que codifica una enzima de esclareol. Particularmente, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 90 %, 95 %, 98 %, 99 % o 100 % semejante o idéntica a un polipéptido seleccionado del grupo que consiste del SEQ ID NO:4 y el SEQ ID NO: 5.
En una modalidad, el ácido nucleico que codifica para una CPP sintasa provista aquí comprende una secuencia de nucleótidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:3.
En una modalidad, el ácido nucleico que codifica para una CPP sintasa provista aquí comprende una secuencia de nucleótidos que tiene al menos 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:3.
En una modalidad, el ácido nucleico que codifica para una CPP sintasa provista aquí comprende una secuencia de nucleótidos que tiene al menos 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:3.
En una modalidad, el ácido nucleico que codifica para una CPP sintasa provista aquí comprende una secuencia de nucleótidos que tiene al menos 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:3.
En una modalidad, el ácido nucleico que codifica para una CPP sintasa provista aquí comprende una secuencia de nucleótidos que tiene 99 % o 100 % de identidad de secuencia con el SEQ ID NO:3. En una modalidad, el ácido nucleico que codifica para una CPP sintasa provista aquí comprende una secuencia de nucleótidos que es idéntica a el SEQ ID NO:3.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con un polipéptido seleccionado del grupo que consiste del SEQ ID NO:1 y el SEQ ID NO:2.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:1.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 95 %, 98 %, 99 % o 100 % de identidad de secuencia con una SEQ ID NO:1.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:1.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 99 % o 100 % de identidad de secuencia con el SEQ ID NO:1. En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que es idéntico a el SEQ ID NO:1.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:2.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 95 %, 98 %, 99 % o 100 % de identidad de secuencia con una SEQ ID NO:2.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:2.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que tiene al menos 99 % o 100 % de identidad de secuencia con el Se Q ID NO:2.
En una modalidad, la CPP sintasa comprende un polipéptido que comprende una secuencia de aminoácidos que es idéntica a el SEQ ID NO:2.
En una modalidad, el ácido nucleico que codifica la enzima de esclareol sintasa tiene una secuencia de nucleótidos al menos 90 %, 95 %, 98 %, 99 % o 100 % semejante o idéntica a el SEQ ID NO:6.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 90 %, 95 %, 98 %, 99 % o 100 % semejante o idéntica a el SEQ ID NO:4.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 95 %, 98 %, 99 % o 100 % semejante o idéntica a el SEQ ID NO:4.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 98 %, 99 % o 100 % semejante o idéntica a el SEQ ID NO:4.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 99 % o 100 % semejante o idéntica a el SEQ ID NO:4.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es idéntica a el SEQ ID NO:4. En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 90 %, 95 %, 98 %, 99 % o 100 % semejante o idéntica a el SEQ ID NO:5.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 95 %, 98 %, 99 % o 100 % semejante o idéntica a el SEQ ID NO:5.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 98 %, 99 % o 100 % semejante o idéntica a el SEQ ID NO:5.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es al menos 99 % o 100 % semejante o idéntica a el SEQ ID NO:5.
En una modalidad, la esclareol sintasa tiene una secuencia de aminoácidos que es idéntica a el SEQ ID NO:5. En otra modalidad, se proporciona aquí un vector de expresión que comprende un ácido nucleico descrito aquí. Un vector de expresión puede comprender uno o más ácidos nucleicos descritos aquí.
En otra modalidad, se proporciona aquí una célula u organismo hospedador no humano transformado para albergar al menos un ácido nucleico descrito aquí de modo que el mismo exprese o sobre-exprese heterólogamente al menos un polipéptido descrito aquí.
En una modalidad, el organismo hospedador no humano provisto aquí es una planta, un procariota o un hongo. En una modalidad, el hospedador no humano provisto aquí es un microorganismo, particularmente una bacteria o una levadura.
En una modalidad, el organismo no humano provisto aquí es E. coli y la levadura es Saccharomyces cerevisiae. En una modalidad, el organismo no humano provisto aquí es Saccharomyces cerevisiae.
En una modalidad, la célula es una célula procariota.
En otra modalidad, la célula es una célula bacteriana.
En una modalidad, la célula es una célula eucariota.
En una modalidad, la célula eucariótica es una célula de levadura o una célula de planta.
En una modalidad, el proceso para producir (+)-manool produce el (+)-manool a una pureza de al menos 98 % o 98,5 %.
En otra modalidad, un método provisto aquí comprende además procesar el (+)-manool hasta un derivado utilizando una síntesis química o bioquímica o una combinación de ambas utilizando los métodos comúnmente conocidos en la técnica.
En una modalidad, el derivado de (+)-manool se selecciona del grupo que consiste de un hidrocarburo, alcohol, acetal, aldehído, ácido, éter, cetona, lactona, acetato y un éster.
De acuerdo con cualquier modalidad de la invención, el derivado de (+)-manool es un compuesto de C10 a C25 que comprende opcionalmente uno, dos o tres átomos de oxígeno.
En una modalidad adicional, el derivado se selecciona del grupo que consiste de acetato de manool (acetato de (3R)-3-metil-5-[(1S,4aS,8aS)-5,5,8a-trimetil-2-metilendecahidro-1-naftalenil]-1-penten-3-ilo), copalol ((2E)-3-metil-5-[(1S,4aS,8aS)-5,5,8a-trimetil-2-metilendecahidro-1-naftalenil]-2-penten-1-ol), acetato de copalol (acetato de (2E)-3-metil-5-[(1S,4aS,8aS)-5,5,8a-trimetil-2-metilendecahidro-1-naftalenil]-2-penten-1-ilo), copalal ((2E)-3-metil-5-[(1S,4aS,8aS)-5,5,8a-trimetil-2-metilendecahidro-1-naftalenil]-2-pentenal), (+)-manooloxi (4-[(1S,4aS,8aS)-5,5,8atrimetil-2-metilendecahidro-1-naftalenil]-2-butanona), Z-11 ((3S,5aR,7aS,11aS,11bR)-3,8,8,11atetrametildodecahidro-3,5a-epoxinafto[2,1-c]oxepina), gamma-ambrol (2-[(1S,4aS,8aS)-5,5,8a-trimetil-2-metilendecahidro-1-naftalenil]etanol) y Ambrox® (3aR,5aS,9aS,9bR)-3a,6,6,9a-tetrametildodecahidronafto[2,1-b]furano).
En otra modalidad, un método provisto aquí comprende además poner en contacto el (+)-manool con un sistema de reacción adecuado para convertir el (+)-manool en un derivado de (+)-manool adecuado. El sistema de reacción adecuado puede ser de naturaleza enzimática (por ejemplo que requiere una o más enzimas) o de naturaleza química (por ejemplo que requiere uno o más productos químicos sintéticos).
Por ejemplo, el (+)-manool se puede convertir enzimáticamente en manooloxi o gamma-ambrol utilizando un proceso descrito en la literatura por ejemplo como se describe en la patente de Estados Unidos No. 7.294.492.
Todavía en otra modalidad, el derivado de (+)- manool es el copalol y sus ésteres con ácidos carboxílicos de C1-C5. Todavía en otra modalidad, el derivado de (+)-manool son los ésteres de (+)-manool con ácidos carboxílicos de C1-C5.
En una modalidad, el derivado de (+)-manool es el copalal.
En una modalidad, el derivado de (+)-manool es el manooloxi.
Todavía en otra modalidad, el derivado de (+)-manool es el Z-11.
En una modalidad, el derivado de (+)-manool es el gamma-ambrol o es una mezcla de los mismos y sus ésteres con ácidos carboxílicos de C1-C5, y en particular el gamma-ambrol y sus ésteres.
En una modalidad adicional, el (+)-manool derivado es Ambrox®, esclareólido (también conocido como 3a,6,6,9atetrametildecahidronafto[2,1-b]furan-2(1H)-ona y todos sus diastereoisómeros y estereoisómeros), 3,4a,7,7,10apentametildodecahidro-1H-benzo[f] cromen-3-ol o 3,4a,7,7,10a-pentametil-4a,5,6,6a,7,8,9,10,10a,10b-decahidro-1H-benzo[f]cromeno y todas sus cetonas cíclicas de diastereoisómeros y estereoisómeros y la forma abierta, (1R,2R,4aS,8aS)-1-(2-hidroxietil)-2,5,5,8a-tetrametildecahidronaftalen-2-ol Do L, gamma-ambrol.
Los ejemplos específicos de cómo se pueden obtener los derivados (por ejemplo, un hidrocarburo de trieno, un acetato o un copalol) se detallan en los ejemplos.
Por ejemplo, el manool obtenido de acuerdo con la invención se puede procesar en manooloxi (una cetona, como ya se conoce por los métodos) y luego en ambrol (un alcohol) y ambrox (un éter), de acuerdo con EP 212254.
La capacidad de un polipéptido de catalizar la síntesis de un sesquiterpeno particular se puede confirmar llevando a cabo el ensayo enzimático como se detalla en los ejemplos provistos aquí.
Los polipéptidos también están propuestos para incluir polipéptidos truncados siempre que los mismos mantengan su actividad de la (+)-manool sintasa y su actividad de la esclareol sintasa. Un polipéptido de CPP sintasa truncado tiene por ejemplo la actividad de una c Pp sintasa como se definió aquí anteriormente. Un polipéptido de esclareol sintasa truncado tiene por ejemplo la actividad de una esclareol sintasa como se definió aquí anteriormente.
Como está propuesto aquí posteriormente, una secuencia de nucleótidos obtenida por medio de la modificación de las secuencias descritas aquí se puede llevar a cabo utilizando cualquier método conocido en la técnica, por ejemplo por medio de la introducción de cualquier tipo de mutaciones tales como las mutaciones de supresión, inserción o sustitución. Los ejemplos de tales métodos son citados en la parte de la descripción con relación a los polipéptidos variantes y los métodos para preparar los mismos.
El porcentaje de identidad entre dos secuencias de nucleótidos o péptidos es una función del número de residuos de nucleótidos o aminoácidos que son idénticos en las dos secuencias cuando se ha generado una alineación de estas dos secuencias. Los residuos idénticos se definen como los residuos que son iguales en las dos secuencias en una posición dada de la alineación. El porcentaje de identidad de secuencia, como se utiliza aquí, se calcula a partir de la alineación óptima tomando el número de residuos idénticos entre las dos secuencias dividiéndolo entre el número total de residuos en la secuencia más corta y multiplicándolo por 100. La alineación óptima es la alineación en la cual el porcentaje de identidad es el más elevado posible. Se pueden introducir huecos en una o ambas secuencias en una o más posiciones de la alineación para obtener la alineación óptima. Estos espacios se toman en cuenta entonces como residuos no idénticos para el cálculo del porcentaje de la identidad de secuencia. La alineación para el propósito de determinar el porcentaje de identidad de secuencia de ácidos nucleicos o aminoácidos se puede lograr de varias maneras utilizando programas de computadora y por ejemplo los programas de computadora disponibles públicamente disponibles en la red mundial. Preferentemente, el programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) que se ajusta a los parámetros predeterminados, disponibles del National Center for Biotechnology Information (NCBI) en http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, se puede utilizar para obtener una alineación óptima de las secuencias de ácidos nucleicos o proteínas y para calcular el porcentaje de identidad de secuencia.
El polipéptido que se va a poner en contacto con el GGPP in vitro se puede obtener por medio de la extracción de cualquier organismo que expresa el mismo, utilizando las tecnologías estándar de extracción de enzimas o proteínas. Si el organismo hospedador es un organismo unicelular o una célula que libera el polipéptido de una modalidad de aquí en el medio de cultivo, el polipéptido simplemente se puede recolectar del medio de cultivo, por ejemplo por medio de la centrifugación, seguido opcionalmente por las etapas de lavado y re-suspensión en las soluciones de amortiguación adecuadas. Si la célula u organismo acumula el polipéptido dentro de sus células, el polipéptido puede ser obtenido por medio de la ruptura o lisis de las células y la extracción adicional del polipéptido del lisado celular.
De acuerdo con otra modalidad particular, el método de cualquiera de las modalidades descritas anteriormente se lleva a cabo in vivo. Estas modalidades provistas aquí son particularmente ventajosas puesto que es posible llevar a cabo el método in vivo sin aislar previamente el polipéptido. La reacción ocurre directamente dentro de la célula u organismo transformado para expresar el polipéptido.
Por consiguiente, por ejemplo, el (+)-manool puede ser producido partir del GGPP cultivando un organismo o célula hospedadora descrita aquí.
La célula u organismo está propuesto para "expresar" un polipéptido, siempre que la célula u organismo sea transformado para albergar un ácido nucleico que codifica el polipéptido, este ácido nucleico se transcribe a ARNm y el polipéptido se encuentra en la célula u organismo hospedador. El término "expresar" abarca "expresar heterólogamente" y "sobre-expresar", este último se refiere a los niveles de actividad del ARNm, polipéptido y/o enzima sobre y por encima de lo que se mide en una célula u organismo no transformado. Una descripción más detallada de los métodos adecuados para transformar una célula u organismo hospedador no humano será descrita más adelante en la parte de la especificación que está dedicada a tales células u organismos hospedadors no humanos transformados.
Una célula u organismo está propuesto para ser "capaz de producir FPP" cuando el mismo produce FPP de manera natural o cuando el mismo no produce FPP de manera natural pero es transformado para producir FPP, ya sea antes de la transformación con un ácido nucleico como se describe aquí o junto con el ácido nucleico. Las células u organismos transformados para producir una mayor cantidad de FPP que la célula u organismo que está presente de manera natural también están abarcados por las "células u organismos capaces de producir FPP". Los métodos para transformar organismos, por ejemplo los microorganismos, de modo que los mismos produzcan FPP ya son conocidos en la técnica. Por ejemplo, un microorganismo se puede transformar con
Una célula u organismo está propuesto para ser "capaz de producir GGPP" cuando el mismo produce GGPP de manera natural o cuando el mismo no produce GGPP de manera natural pero es transformado para producir GGPP, ya sea antes de la transformación con un ácido nucleico como se describe aquí o junto con el ácido nucleico. Las células u organismos transformados para producir una mayor cantidad de GGPP que la célula u organismo que está presente de manera natural también están abarcados por las "células u organismos capaces de producir GGPP". Los métodos para transformar organismos, por ejemplo los microorganismos, de modo que los mismos produzcan GGPP ya son conocidos en la técnica.
Los organismos hospedadors no humanos adecuados para llevar a cabo el método de una modalidad de aquí in vivo pueden ser cualesquiera organismos unicelulares o multicelulares no humanos. En una modalidad particular, el organismo hospedador no humano utilizado para llevar a cabo una modalidad de aquí in vivo es una planta, un procariota o un hongo. Se puede utilizar cualquier planta, procariota u hongo. Las plantas particularmente útiles son aquellas que producen de manera natural cantidades elevadas de terpenos. En una modalidad más particular, el organismo hospedador no humano utilizado para llevar a cabo el método de una modalidad de aquí in vivo es un microorganismo. Se puede utilizar cualquier microorganismo, pero de acuerdo con una modalidad aún más particular el microorganismo es una bacteria o una levadura. Más particularmente, la bacteria es E. coli y la levadura es Saccharomyces cerevisiae.
Algunos de estos organismos no producen GGPP de manera natural o solamente en pequeñas cantidades. Para ser adecuados para llevar a cabo el método de una modalidad de aquí, estos organismos tienen que ser transformados para producir el precursor o para producir el precursor en grandes cantidades. Los mismos se pueden transformar ya sea antes de la modificación con el ácido nucleico descrito de acuerdo con cualquiera de las modalidades anteriores o simultáneamente, como se explicó anteriormente.
Un organismo se puede transformar, por ejemplo, con un ácido nucleico que codifica una GGPP sintasa. El ácido nucleico se puede incluir en el mismo o diferente vector de expresión para un ácido nucleico que codifica una CPP sintasa o para un ácido nucleico que codifica una esclareol sintasa como se describe aquí. Una GGPP sintasa puede, por ejemplo, comprender la secuencia de aminoácidos en el SEQ ID NO:7. Un ácido nucleico que codifica una GGPP sintasa puede, por ejemplo, comprender la secuencia de ácidos nucleicos en el SEQ ID NO:8. Se puede utilizar un método de transformación tal como aquel descrito aquí y en los presentes ejemplos.
Un organismo se puede transformar con uno o más ácidos nucleicos que codifican una parte o la totalidad de la ruta de mevalonato que conduce al FPP. Se puede utilizar un método tal como aquel descrito en los presentes ejemplos.
Las células eucariotas superiores aisladas también se pueden utilizar, en lugar de los organismos completos, como hospedadoras para llevar a cabo el método de una modalidad de aquí in vivo. Las células eucariotas adecuadas pueden ser cualesquiera células no humanas, pero son particularmente células fúngicas o de plantas.
De acuerdo con otra modalidad particular, los polipéptidos que tienen una actividad de la CPP sintasa y una actividad de la esclareol sintasa utilizados en cualquiera de las modalidades descritas aquí o codificados por los ácidos nucleicos descritos aquí pueden ser variantes obtenidas por ingeniería genética, siempre que las variantes mantengan su actividad de la CPP sintasa y su actividad de la esclareol sintasa. Un polipéptido de CPP sintasa variante por ejemplo, tiene la actividad de una CPP sintasa como se definió aquí anteriormente. Un polipéptido de esclareol sintasa variante por ejemplo tiene la actividad de una esclareol sintasa como se definió aquí anteriormente.
Como se utiliza aquí, el polipéptido está propuesto como un polipéptido o fragmento de péptido que abarca las secuencias de aminoácidos identificadas aquí, así como a polipéptidos variantes o truncados, siempre que los mismos mantengan su actividad de la CPP sintasa y su actividad de la esclareol sintasa como se define aquí.
"Mantener la actividad" puede significar, por ejemplo, que el polipéptido mantiene al menos algo de la actividad original del polipéptido no truncado o, no mutado, por ejemplo, al menos 70, 80, 90, 95, 97, 99 o 100 % de la actividad. Un polipéptido truncado o variante puede tener, en algunos casos, una actividad aumentada comparado con el polipéptido no truncado o no mutado.
Los ejemplos de los polipéptidos variantes son las proteínas que están presentes de manera natural que resultan de los eventos de empalme del ARNm alterno o de escisión proteolítica de los polipéptidos descritos aquí. Las variaciones atribuibles a la proteólisis incluyen, por ejemplo, diferencias en los N- o C- terminales durante la expresión en diferentes tipos de células hospedadoras, debido a la remoción proteolítica de uno o más aminoácidos terminales de los polipéptidos de una modalidad de aquí. Los polipéptidos codificados por un ácido nucleico obtenido por mutación natural o artificial de un ácido nucleico de una modalidad de aquí, como se describirá de aquí en adelante, también están abarcados por una modalidad de aquí.
Las variantes de los polipéptidos resultantes de una fusión de las secuencias de péptidos adicionales en los extremos terminales carboxilo y amino también se pueden utilizar en los métodos de una modalidad de aquí. En particular, tal fusión puede mejorar la expresión- de los polipéptidos, ser útil en la purificación de la proteína o mejorar la actividad enzimática del polipéptido en un sistema de expresión o medio ambiente deseado. Tales secuencias de péptidos adicionales por ejemplo pueden ser los péptidos de señalización. De acuerdo con esto, se abarcan los métodos que utilizan polipéptidos variantes, tales como aquellos obtenidos por medio de la fusión con otros oligo o polipéptidos y/o aquellos que están unidos a los péptidos de señalización. Los polipéptidos resultantes de una fusión con otra proteína funcional, tal como otra proteína de la ruta de biosíntesis del terpeno, también se pueden utilizar ventajosamente en los métodos de una modalidad de aquí.
Como se mencionó anteriormente, el ácido nucleico que codifica el polipéptido de una modalidad de aquí es una herramienta útil para modificar las células u organismos hospedadors no humanos propuestos para ser utilizados cuando el método se lleva a cabo in vivo.
Por lo tanto también se proporciona aquí un ácido nucleico que codifica un polipéptido de acuerdo con cualquiera de las modalidades descritas anteriormente.
El ácido nucleico de una modalidad de aquí se puede definir como que incluye polímeros de ribonucleótidos o desoxirribonucleótidos ya sea en la forma de una sola hebra o de dos hebras (ADN y/o ARN). Los términos "secuencia de nucleótidos" también se deben entender que comprenden una molécula de polinucleótido o una molécula de oligonucleótido en la forma de un fragmento separado o como un componente de un ácido nucleico más grande. Los ácidos nucleicos de una modalidad de aquí también abarcan ciertas secuencias de nucleótidos aisladas que incluyen aquellas que están sustancialmente libres de material endógeno contaminante. El ácido nucleico de una modalidad de aquí puede estar truncado, siempre que el mismo codifique un polipéptido abarcado aquí, como se describió anteriormente.
En una modalidad, el ácido nucleico de una modalidad de aquí que codifica para una CPP sintasa puede estar presente ya sea de manera natural en una planta tal como Salvia miltiorrhiza, u otras especies, o se puede obtener modificando el SEQ ID NO:3.
En una modalidad adicional, el ácido nucleico de una modalidad de aquí que codifica para una esclareol sintasa puede estar presente ya sea de manera natural en una planta tal como Salvia sclarea, u otras especies, o se puede obtener modificando el SEQ ID NO:6.
Las mutaciones pueden ser cualquier tipo de mutaciones de estos ácidos nucleicos, tales como mutaciones puntuales, mutaciones de supresión, mutaciones de inserción y/o mutaciones de desplazamiento de marco. Se puede preparar un ácido nucleico variante para adaptar su secuencia de nucleótidos a un sistema de expresión específico. Por ejemplo, se sabe que los sistemas de expresión bacterianos expresan polipéptidos de manera más eficiente si los aminoácidos son codificados por codones particulares.
Debido a la degeneración del código genético, más de un codón puede codificar la misma secuencia de aminoácidos, múltiples secuencias de ácidos nucleicos pueden codificar el mismo polipéptido o proteína, todas estas secuencias de ADN están abarcadas por una modalidad de aquí. En donde sea apropiado, las secuencias de ácidos nucleicos que codifican la CPP sintasa y la esclareol sintasa se pueden optimizar para una expresión aumentada en la célula hospedadora. Por ejemplo, los nucleótidos de una modalidad de aquí se pueden sintetizar utilizando codones particulares para un hospedador para una expresión mejorada.
Otra herramienta importante para transformar las células u organismos hospedadors -adecuados para llevar a cabo el método de una modalidad de aquí in vivo es un vector de expresión que comprende un ácido nucleico de acuerdo con cualquier modalidad de una modalidad de aquí. Por lo tanto tal vector también es provisto aquí. Un vector de expresión puede comprender, por ejemplo, uno o más de un ácido nucleico que codifica una CPP sintasa, un ácido nucleico que codifica una esclareol sintasa o un ácido nucleico que codifica una GGPP sintasa, como se describe aquí.
Las células y organismos hospedadors no humanos recombinantes transformados para albergar al menos un ácido nucleico de una modalidad de aquí de modo que el mismo exprese o sobre-exprese heterólogamente al menos un polipéptido de una modalidad de aquí también son herramientas muy útiles para llevar a cabo el método de una modalidad de aquí. Por lo tanto también se proporcionan aquí tales células y organismos hospedadors no humanos.
Un ácido nucleico de acuerdo con cualquiera de las modalidades descritas anteriormente se puede utilizar para transformar las células y organismos hospedadors no humanos y el polipéptido expresado puede ser cualquiera de los polipéptidos descritos anteriormente.
Los organismos hospedadors no humanos de una modalidad de aquí pueden ser cualesquiera organismos unicelulares o multicelulares no humanos. En una modalidad particular, el organismo hospedador no humano es una planta, un procariota o un hongo. Cualquier planta, procariota u hongo es adecuado para ser transformado de acuerdo con los métodos provistos aquí. Las plantas particularmente útiles son aquellas que producen de manera natural cantidades elevadas de terpenos.
En una modalidad más particular, el organismo hospedador no humano es un microorganismo. Cualquier microorganismo es adecuado para ser utilizado aquí, pero de acuerdo con una modalidad aún más particular, el microorganismo es una bacteria o una levadura. Más particularmente, la bacteria es E. coli y la levadura es Saccharomyces cerevisiae.
Las células eucariotas superiores aisladas también se pueden transformar, en lugar de los organismos completos. Por células eucariotas superiores, se entiende aquí cualquier célula eucariota no humana excepto a las células de levadura. Las células eucariotas superiores particulares son las células fúngicas o las células de plantas.
Una variante también puede diferir del polipéptido de una modalidad de aquí por la unión de los grupos modificadores que están unidos covalente o no covalentemente a la cadena principal del polipéptido.
La variante también incluye un polipéptido que difiere del polipéptido descrito aquí por los sitios de glicosilación unidos en N o unidos en O, y/o por una adición de residuos de cisteína. La persona con experiencia en la técnica reconocerá como modificar una secuencia de aminoácidos y como preservar la actividad biológica.
Las modalidades provistas aquí incluyen, pero no están limitadas a las secuencias de ADNc, ADN genómico y ARN. Los genes, que incluyen los polinucleótidos de una modalidad de aquí, se pueden clonar sobre la base de la información de la secuencia de nucleótidos disponible, tal como se encuentra en el listado de secuencias adjunto y por los métodos conocidos en la técnica. Estos incluyen, por ejemplo el diseño de los cebadores de ADN que representan las secuencias de flanqueo de tal gen del cual uno es generado en las orientaciones de sentido y que inicia la síntesis de la hebra de sentido y el otro es credo de manera complementaria inversa y genera la hebra de anti-sentido. Las ADN polimerasas termoestables, tales como aquellas utilizadas en la reacción en cadena de la polimerasa se utilizan comúnmente para llevar a cabo tales experimentos. Alternativamente, los genes que representan las secuencias de ADN se pueden sintetizar químicamente e introducir subsiguientemente en las moléculas del vector de ADN que se pueden multiplicar por ejemplo por las bacterias compatibles tales como por ejemplo E. coli.
Se proporcionan aquí las secuencias de ácidos nucleicos obtenidas por medio de las mutaciones del SEQ ID NO: 3 y el SEQ ID NO: 6; tales mutaciones se pueden hacer rutinariamente. Es claro para la persona con experiencia en la técnica que se pueden introducir mutaciones, supresiones, inserciones y/o sustituciones de uno o más nucleótidos en esta secuencia de ADN.
Las secuencias de ácidos nucleicos de una modalidad de aquí que codifican la CPP sintasa y las proteínas de escalereol sintasa se pueden insertar en los vectores de expresión y/o pueden estar contenidas en los genes quiméricos insertados en los vectores de expresión, para producir la CPP sintasa y la escaleol sintasa en un organismo hospedador o en una célula hospedadora. Los vectores para insertar transgenes en el genoma de las células hospedadoras son bien conocidos en la técnica e incluyen plásmidos, virus, cósmidos y cromosomas artificiales. Los vectores de co-integración o binarios en los que se inserta un gen quimérico también se utilizan para transformar las células hospedadoras.
Una modalidad provista aquí proporciona los vectores de expresión recombinantes que comprenden un ácido nucleico que codifica para una CPP sintasa y una escalereol sintasa cada una, por separado, están unidas operativamente a las secuencias de ácidos nucleicos asociadas tales como, por ejemplo, las secuencias del promotor.
Alternativamente, la secuencia del promotor puede estar ya presente en un vector de modo que la secuencia de ácidos nucleicos que se va a transcribir sea insertada en el vector corriente abajo de la secuencia del promotor. Los vectores se diseñan normalmente para tener un origen de replicación, un sitio de clonación múltiple y un marcador seleccionable.
EJEMPLOS
Ejemplo 1.
Genes de diterpeno sintasa.
Dos diterpeno sintasas son necesarias para la conversión del difosfato de geranilgeranilo (GGPP) a manool: una diterpeno sintasa del tipo I y una del tipo II. En estos ejemplos, para la diterpeno sintasa del tipo II, se utilizó la difosfato de copalilo sintasa (CPP) de Salvia miltiorrhiza (NCBI No. de acceso ABV57835.1). Para la expresión óptima en las células de E. coli, se optimizó el uso del codón del ADNc, se retiraron los primeros 58 codones y se agregó un codón de inicio de ATP. Para la diterpeno sintasa del tipo I, se utilizó la esclareol sintasa de Salvia sclarea (SsScS) (NCBI No. de acceso AET21246.1, W02009095366). El uso del codón del ADNc se optimizó para la expresión de E. coli (DNA 2.0, Menlo Park, CA 94025), se retiraron los 50 primeros codones N-terminales. Cada uno de estos dos ADNc se sintetizó in vitro y se clonaron en el plásmido pJ208 flanqueado con los sitios (DNA 2.0, Menlo Park, CA 94025, E.U.A).
Ejemplo 2.
Plásmidos de expresión.
El ADNc que codifica la CPP sintasa (SmCPS2) y la esclareol sintasa (SsScS) modificadas se digirió con Ndel y Kpnl y se ligó en el plásmido pETDuet-1 proporcionando los plásmidos de expresión pETDuet-SmCPS2 y pETDuet-1132opt, respectivamente.
Se construyó otro plásmido para la co-expresión de las enzimas SmCPS2 y SsScS junto con una difosfato de geranilgeranilo (GGPP) sintasa. Para la GGPP sintasa, se utilizó el gen CrtE de Pantoea agglomerans (NCBI acceso M38424.1) que codifica para una GGPP sintasa (NCBI No. de acceso AAA24819.1). El gen CrtE se sintetizó con la optimización del codón y la adición de los sitios de reconocimiento de las enzimas de restricción Ncol y BamHI en los extremos 3' y5' (DNA 2.0, Menlo Park, CA 94025, E.U.A) y se ligó entre los sitios Ncol y BamHI del plásmido pETDuet-1 para obtener el plásmido pETDuet-CrtE. El ADNc que codifica la SmCPS2 modificada se digirió con Ndel y Kpnl y se ligó en el plásmido pETDuet-1-CrtE proporcionando así la construcción pETDuet-CrtE-SmCPS2. El ADNc optimizado (Sa1132opt) que codifica para la SsScS truncada se introdujo entonces en el plásmido pETDuet-CrtE-SmCPS2 utilizando la técnica In-Fusion® (Clontech, Takara Bio Europa). Para esta clonación, se utilizó el pETDuet-1132opt como molde en una amplificación por PCR utilizando el cebador delantero SmCPS2-1132Inf_Fl 5'-CTGTTTGAGCCGGTCGCCTAAGGTACCAGAAGGAGATAAATAATGGCGAAAATGAAGGAGAACTTTAAACG-3' y el cebador inverso 1132-pET_Inf_Rl 5'-GCAGCGGTTTCTTTACCAGACTCGAGGTCAGAACACGAAGCTCTTCATGTCCTCT-3'. El producto por PCR se ligó en el plásmido pETDuet-CrtE-SmCPS2 digerido con las enzimas de restricción Kpnl y Xhol y utilizando el kit de clonación por PCR In-Fusion® Dry-Down (Clontech, Takara Bio Europa), proporcionando el nuevo plásmido pETDuet-CrtE-SmCPS2-SsScS. En este plásmido, el gen CrtE está bajo el control del primer promotor T7 del plásmido pETDuet y los ADNc que codifican la c Pp sintasa y la esclareol sintasa están organizados en una construcción bi-cistrónica bajo el control del segundo promotor T7.
Ejemplo 3.
Expresión heteróloga en E. coli y actividades enzimáticas.
Se utilizaron los plásmidos de expresión (pETDuet-SmCPS2 o pETDuet-1132opt) para las células de E. coli B121(DE3) transformadas (Novagene, Madison, WI). Se utilizaron colonias individuales de células transformadas para inocular 25 ml del medio LB. Después de 5 a 6 horas de incubación a 37 °C, los cultivos se transfirieron a una incubadora a 20 °C y se dejaron 1 hora para el equilibrio. La expresión de la proteína se indujo entonces por la adición de IPTG 0,1 mM y el cultivo se incubó durante la noche a 20 °C. Al día siguiente, las células se recolectaron por centrifugación, se re-suspendieron en 0,1 volúmenes de MOPSO 50 mM, de pH 7, glicerol al 10 %, DTT 1 mM y se liso por sonicación. Los extractos se aclararon por centrifugación (30 minutos a 20.000 g) y los sobrenadantes que contuvieron las proteínas solubles se utilizaron para experimentos adicionales.
Ejemplo 4.
Ensayos de la actividad de la diterpeno sintasa in vitro.
Los ensayos enzimáticos se llevaron a cabo en tubos de vidrio sellados de Teflon utilizando de 50 a 100 pl de extracto de proteína en un volumen final de 1 ml de MOPSO 50 mM de pH 7, glicerol al 10 % suplementado con MgCh 20 mM de y difosfato de geranilgeranilo purificado (GGPP) de 50 a 200 pM (preparado como se describe por Keller y Thompson, J. Chromatogr 645(1), 161-167, 1993). Los tubos se incubaron de 5 a 48 horas a 30 °C y los productos de enzimas se extrajeron dos veces con un volumen de pentano. Después de la concentración bajo un flujo de nitrógeno, los extractos se analizaron por GC-MS y se compararon con los extractos de las proteínas de control (obtenidas a partir de las células transformadas con el plásmido vacío). El análisis por GC-MS se llevó a cabo en un sistema de GC de la serie 6890 de Agilent equipado con una columna DB1 (30 m x 0,25 mm x 0,25 mm de espesor de la película; de Agilent) y se acopló con un espectrómetro de masa de la serie 5975. El gas portador fue helio a un flujo constante de 1 ml/min. La inyección se hizo en un modo sin separación con la temperatura del inyector ajustada a 260 °C y la temperatura del horno se programó de 100 °C a 225 °C a 10 °C/min y a 280 °C a 30 °C/min. Las identidades de los productos se confirmaron con base en la concordancia de los índices de retención y los espectros de masa de los estándares auténticos.
En estas condiciones y con la proteína recombinante de las células de E. coli transformadas con los plásmidos pETDuet-SmCPS2 o pETDuet-1132opt (que expresan heterólogamente las enzimas SmCPS o SsScS, respectivamente), no se detectó ninguna producción de moléculas de diterpeno en los extractos de disolvente (los diterpenos que contienen difosfato no se detectan en estas condiciones). Luego se llevaron a cabo ensayos semejantes pero combinando los 2 extractos de proteínas que contuvieron la SmCPS y la SsScS recombinantes en un solo ensayo. En estos ensayos, se formó un producto principal y se identificó como que es (+)-manool por la coincidencia del espectro de masa y del índice de retención con los estándares auténticos (figuras 2A-2C).
Ejemplo 5.
Producción de manool in vivo utilizando células de E. coli.
La producción in vivo de manool utilizando cultivos de células completas se evaluó utilizando células de E. coli. Para aumentar el nivel del difosfato de farnesilo endógeno (FPP), se acumuló la productividad del diterpeno de las células, se co-expresó una ruta de mevalonato completa heteróloga que conduce al FPP en las mismas células. Las enzimas de esta ruta se expresaron utilizando un solo plásmido que contuvo todos los genes organizados en dos operones bajo el control de dos promotores. La construcción de este plásmido de expresión se describe en la patente W02013064411 o en Schalk et al (2013) J. Am. Chem. Soc. 134, 18900-18903. De manera breve, un primer operón sintético que consiste de los genes de una acetoacetil-CoA de E. coli tiolasa (atoB), de una HMG-CoA de Staphylococcus aureus sintasa (mvaS), de una HMG-CoA de Staphylococcus aureus reductasa (mvaA) y de una FPP de Saccharomyces cerevisiae sintasa (ERG20) se sintetizó in vitro (DNA2.0, Menlo Park, CA, E.U.A) y se ligó en el vector pACYCDuet-1 digerido con NcoI-BamHI (de Invitrogen) produciendo el pACYC-29258. Un segundo operón que contuvo una mevalonato quinasa (MvaKl), una fosfomevalonato quinasa (MvaK2), una mevalonato difosfato descarboxilasa (MvaD) y una isopentenil difosfato isomerasa (idi) se amplificó a partir del ADN genómico de Streptococcus pneumoniae (ATCC BAA-334) y se ligó en el segundo sitio de multiclonación de pACYC-29258 que proporciona el plásmido pACYC-29258-4506. Este plásmido contuvo así los genes que codifican todas las enzimas de la ruta biosintética que resultan de la acetil-coenzima A a FPP.
Se co-transformaron las células de E. coli KRX (de Promega) con el plásmido pACYC-29258-4506 y con el plásmido pETDuet-CrtE-SmCPS2-SsScS. Las células transformadas se seleccionaron sobre placas de carbenicilina (50 pg/ml) y cloranfenicol (34 pg/ml) LB-agarosa. Se utilizaron colonias individuales para inocular 5 ml del medio LB líquido suplementado con los mismos antibióticos. El cultivo se incubó durante la noche a 37 °C. Al día siguiente, se inocularon 2 ml de medio TB suplementado con los mismos antibióticos con 0,2 ml del cultivo durante la noche. Después de 6 horas de incubación a 37 °C, el cultivo se enfrió a 28 °C y se agregaron a cada tubo IPTG 1 mM, ramnosa al 0,2 % y 1:10 de volúmenes de decano. Los cultivos se incubaron durante 48 horas a 28 °C. Los cultivos se extrajeron entonces dos veces con 2 volúmenes de MTBE (éter metil terc-butílico), la fase orgánica se concentró a 500 pl y se analizó por GC-MS como se describió anteriormente en el ejemplo 4 excepto por la temperatura del horno que fue de 1 minuto mantenida a 100 °C, seguido por un gradiente de temperatura de 10 °C/min a 220 °C y 20 °C/min y a 3000 °C. En estas condiciones de cultivo, se produjo manool como el único producto de diterpeno y con un rendimiento de 300 a 500 mg/l (figuras 3A-3D).
Ejemplo 6.
Producción de (+)-manool utilizando células recombinantes, purificación y análisis de RMN.
Se preparó una camada de cultivo de E. coli en las condiciones descritas en el ejemplo 5, excepto que la fase orgánica de decano se reemplazó por 50 g/l de Amberlite XAD-4 para la determinación de la fase sólida. El medio de cultivo se filtró para recuperar la resina. La resina se lavó entonces con 3 volúmenes de columna de agua, y se eluyó utilizando 3 volúmenes de columna de MTBE. El producto se purificó entonces adicionalmente por cromatografía ultrarrápida sobre gel de sílice utilizando una fase móvil compuesta de heptano:MTBE 8:2 (v/v). La estructura del manool se confirmó por 1H y RMN-13C. La rotación óptica se midió utilizando un espectrómetro de Bruker Avance de 500 MHz. El valor de [a]D20= 26,9° (0,3 %, CHCh) confirmó la producción de (+)-manool.
Ejemplo 7.
El manool obtenido en los ejemplos anteriores se convirtió en sus esteres de acuerdo con la siguiente parte experimental (aquí posteriormente como un ejemplo en su acetato):
Figure imgf000015_0001
Siguiendo la literatura (G. Ohloff, Helv. Chim. Acta 41, 845 (1958)), se trataron 32,0 g (0,11 mol) de (+)-manool cristalino puro con 20,0 g (0,25 mol) de cloruro de acetilo en 100 ml de dimetil anilina durante 5 días a temperatura ambiente. La mezcla se calentó adicionalmente durante 7 horas a 50° para alcanzar el 100 % de conversión. Después del enfriamiento, la mezcla de la reacción se diluyó con éter, se lavó sucesivamente con H2SO4 al 10 %, NaHCO3 acuoso y agua hasta la neutralidad. Después del secado (Na2SO4) y la concentración, el producto se destiló (bulbo a bulbo, p.f.= 160°, 0,1 mbar) para dar 20,01 g (79,4 %) de acetato de manool que se utilizó sin purificación adicional.
MS: M+ 332 (0); m/e: 272 (27), 257 (83), 137 (62), 95 (90), 81 (100).
RMN-1H (CDCI3): 0,67, 0,80, 0,87, 1,54 y 2,01 (5s, 3H cada uno), 4,49 (s, 1H), 4,80 (s, 1H), 5,11 (m, 1H), 5,13 (m, 1H), 5,95 (m, 1H).
RMN-13C (CDCI3): 14,5 (c), 17,4 (t), 19,4 (t), 21,7 (c), 22,2 (c), 23,5 (c), 24,2 (t), 33,5 (s), 33,6 (t), 38,3 (t), 39,0 (t), 39,3 (t), 39,8 (s), 42,2 (t), 55,6 (d), 57,2 (t), 83,4 (s), 106,4 (t), 113,0 (t), 142,0 (d), 148,6 (s), 169,9 (s).
Ejemplo 8.
El acetato de manool obtenido en los ejemplos anteriores se convirtió en sus tríenos de acuerdo con la siguiente parte experimental (aquí posteriormente como un ejemplo en su esclareno y (Z+E)-biformeno):
Figure imgf000016_0001
A una solución de 0,4 g de acetato de manool en 4 ml de ciclohexano a temperatura ambiente se agregaron 0,029 g (0,05 eq.) de complejo de BF3.AcOH. Después de 15 minutos a temperatura ambiente, la reacción se inactivó con NaHCO3 acuoso y se lavó con agua hasta la neutralidad. El análisis por GC-MS mostró solamente los hidrocarburos que fueron identificados como esclareno, (Z) y (E)-biformeno. No se detectó ningún acetato de copalol.
Otro ensayo con más catalizador (0,15 eq.) dio el mismo resultado.
• Esclareno: MS: M+ 272 (18); m/e: 257 (100), 149 (15), 105 (15).
• (Z) y (E)-biformeno (espectros idénticos): MS: M+ 272 (29); m/e: 257 (100), 187 (27), 161 (33), 105 (37).
Ejemplo 9.
El manool obtenido en los ejemplos anteriores se convirtió en ésteres de copalilo de acuerdo con la siguiente parte experimental (aquí posteriormente como un ejemplo en el acetato):
Figure imgf000016_0002
A una solución de 0,474 g (0.826 mmol, 0,27 eq.) de BF3.AcOH en 100 ml de ciclohexano a temperatura ambiente se agregaron 4,4 g de anhídrido acético y 12 g de ácido acético. A temperatura ambiente, se agregaron 10,0 g (33 mmol) de manool cristalino puro en 15 ml de ciclohexano (si es exotérmica) y la temperatura se mantuvo a temperatura ambiente utilizando un baño de agua. Después de 30 min de agitación a temperatura ambiente, un control de GC no mostró ningún material de partida. La mezcla de la reacción se inactivó con 300 ml de NaHCO3 acuoso saturado y se trató como de costumbre. La mezcla sin refinar (9,9 g) se purificó por cromatografía ultrarrápida (SiO2, pentano/éter 95:5) y por destilación bulbo a bulbo (Eb.= 130°, 0,1 mbar) para dar 4,34 g (37,1 %) de una mezcla 27/73 de (Z) y (E)-acetato de copalilo.
• Acetato de (Z)-copalilo:
MS: M+ 332 (0); m/e: 317 (2), 272 (35)=, 257 (100), 137 (48), 95 (68), 81 (70).
RMN-1H (CDCh): 0,67, 0,80, 0,87, 1,76 y 2,04 (5s, 3H cada uno), 4,86 (s, 1H), 5,35 (t: J=6 Hz, 1H).
• Acetato de (E)-copalilo:
MS: M+ 332 (0); m/e: 317 (2), 272 (33)=, 257 (100), 137 (54), 95 (67), 81 (74).
RMN-1H (CDCh): 0,68, 0,80, 0,87, 1,70 y 2,06 (5s, 3H cada uno), 4,82 (s, 1H), 5,31 (t: J = 6 Hz, 1H).
RMN-13C (CDCI3): (Espectro registrado en la mezcla (Z/E), solamente se dan las señales significativas): 61,4 (t), 106,2 (t), 117,9 (d), 143,1 (s), 148,6 (s), 171,1 (s).
Ejemplo 10.
El acetato de copalilo obtenido en los ejemplos anteriores se convirtió en copalol de acuerdo con la siguiente parte experimental:
Figure imgf000017_0001
Se mezclaron conjuntamente el acetato de copalilo (4,17 g, 12,5 mmol), gránulos de KOH (3,35 g, 59,7 mmol), agua (1,5 g) y EtOH (9,5 ml) y se agitaron durante 3 horas a 50°. Después del tratamiento habitual, se obtuvieron y se purificaron 3,7 g de (Z+E)-copalol sin refinar por cromatografía ultrarrápida (SiO2, pentano/éter 7:2). Después de la evaporación del disolvente, una destilación bulbo a bulbo (Eb = 170°, 0,1 mbar) proporcionó 3,25 g (92 %) de una mezcla 27/73 de (Z) y (E)-copalol.
• (Z)-copalol
MS: M+ 290 (3); m/e: 275 (18), 272 (27), 257 (82), 137 (71), 95 (93), 81 (100), 69 (70).
RMN-1H (CDCI3): 0,67, 0,80, 0,87 y 1,74 (4s, 3H cada uno); 4,06 (m, 2H), 4,55 (s, 1H), 4,86 (s, 1H), 5,42 (t: J=6 Hz, 1H).
• (E)-copalol
MS: M+ 290 (3); m/e: 275 (27), 272 (22), 257 (75), 137 (75), 95 (91), 81 (100), 69 (68).
RMN-1H (CDCI3): 0.68, 0,80, 0,87 y 1,67 (4s, 3H cada uno); 4,15 (m, 2H), 4,51 (s, 1H), 4,83 (s, 1H), 5,39 (t, J=6 Hz, 1H).
RMN-13C (CDCI3): (Espectro registrado en la mezcla (Z/E), solo se dan las señales significativas): 59,4 (t), 106,2 (t), 123,0 (d), 140,6 (s), 148,6 (s).
El análisis de RMN concuerda bien con los espectros publicados para los compuestos semejantes. Por ejemplo, véase S. Hasecawa, Y. Hirose, Phytochemistry 19 (11), 2479 (1980).
Listado de secuencias
SEQ ID NO:1
SmCPS, difosfato de copalilo sintasa de longitud completa de S. miltiorrhiza
MASLSSTILSRSPAARRRITPASAKLHRPECFATSAWMGSSSKNLSLSYQLNHKKISVAT
VDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSPYDTAWVAMIKDV
EGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIACWALRSWNVHAHKV
KRGVTY1KENVDKLMEGNEEHMTCGFEWFPALLQKAKSLGIEDLPYDSPAVQEVYHV
REQKLKRIPLE1MHK1PTSLLFSLEGLENLDWDKLLKLQSADGSFLTSPSSTAFAFMQTKD
EKCYQFKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQRLGISRFFEPEIADCLSH
1HKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVDPNVLRNFKQKDGKFSCYG
GQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLKEKLANNQILDKWVISKHLPDEI
KLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTLYRMPEISNDTYHDLAKTDFKRC
QAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSYFLATASIFELERTNERIAWAKSQIIA
KMITSFFNKETTSEEDKRALLNELGN1NGLNDTNGAGREGGAGSIALATLTQFLEGFDRY
TRHQLKNAWSVWLTQLQHGEADDAELLTNTLNICAGHIAFREEILAHNEYKALSNLTSK
ICRQLSFIQSEKEMGVEGE1AAKSSIKMKELEEDMQMLVKLVLEKYGGIDRNIKKAFLAV
AKTYYYRAYHAADTIDTHMFKVLFEPVA
SEQ ID NO:2
SmCPS2, difosfato de copalilo sintasa truncada de S. miltiorrhiza
MATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGR1SVSPYDTAWVAMI KDVEGRDGPQFPSSLEWTVQNQLEDGSWGDQKLFCVYDRLVNTIACWALRSWNVHA HKVKRGVTYIKENVDKLMEGNEEHMTCGFEWFPALLQKAKSLGIEDLPYDSPAVQEV YHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSADGSFLTSPSSTAFAFM QTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWA1DRLQRLG1SRFFEPEIADCLSH1H KEWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVDPNVLRNFKQKDGKFSCYGG QMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLKEKLANNQILDKWVISKHLPDEIK LGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTLYRMPEISNDTYHDLAKTDFKRCQ AKHQFEWLYMQEWYESCGIEEFGISRKDLLLSYFLATASIFELERTNERIAWAKSQIIAK MITSFFNKETTSEEDKRALLNELGNINGLNDTNGAGREGGAGSIALATLTQFLEGFDRYT RHQLKNAWSVWLTQLQHGEADDAELLTNTLNICAGHIAFREEILAHNEYKALSNLTSKI
CRQLSFIQSEKEMGVEGEIAAKSSIKNKELEEDMQMLVKLVLEKYGGIDRNIKKAFLAV
AKTYYYRAYHAADTIDTHMFKVLFEPVA SEQ ID NO:3
SmCPS2opt, ADNc optimizado que codifica para SmCPS2
AT GGC AACT GTTG ACGCACCT C AAGT CCAT G ATC ACGAT GGCACCACCGTT CACCAG GGTCACGACGCGGTGAAGAACATCGAGGACCCGATCGAATACATTCGTACCCTGCT GCGTACCACTGGTGATGGTCGCATCAGCGTCAGCCCGTATGACACGGCGTGGGTGG CGATGATTAAAGACGTCGAGGGTCGCGATGGCCCGCAATTTCCTTCTAGCCTGGAGT GGATTGTCC AAAAT C AGCTGG AAGATGGCT CGT GGGGT GACCAGAAGCT GTTTT GTG TTTACGATCGCCTGGTTAATACCATCGCATGTGTGGTTGCGCTGCGTAGCTGGAATG TTCACGCTCATAAAGTCAAACGTGGCGTGACGTATATCAAGGAAAACGTGGATAAG CT GAT GGAAGGC AACGAAG AACACATGACGT GT GGCTTCGAGGTT GTTTTTCCAGCC TTGCTGCAGAAAGCAAAGTCCCTGGGTATTGAGGATCTGCCGTACGACTCGCCGGCA GTGCAAGAAGTCTATCACGTCCGCGAGCAGAAGCTGAAACGCATCCCGCTGGAGAT TATGCATAAGATTCCGACCTCTCTGCTGTTCTCTCTGGAAGGTCTGGAGAACCTGGA TTGGGACAAACTGCTGAAGCTGCAGTCCGCTGACGGTAGCTTTCTGACCAGCCCGAG CAGCACGGCCTTTGCGTTTATGCAGACCAAAGATGAGAAGTGCTATCAATTCATCAA GAATACTATTGATACCTTCAACGGTGGCGCACCGCACACGTACCCAGTAGACGTTTT TGGTCGCCTGTGGGCGATTGACCGTTTGCAGCGTCTGGGTATCAGCCGTTTCTTCGA GCCGGAGATTGCGGACTGCTTGAGCCATATTCACAAATTCTGGACGGACAAAGGCG TGTTCAGCGGTCGTGAGAGCGAGTTCTGCGACATCGACGATACGAGCATGGGTATG CGT CT GATGCGTAT GCACGGTT ACGACGTGGACCCGAAT GTGTTGCGCAACTT CAAG CAAAAAGATGGCAAGTTTAGCTGCTACGGTGGCCAAATGATTGAGAGCCCGAGCCC GAT CT AT AACTTAT ATCGTGCGAGCCAACTGCGTTTCCCGGGTGAAGAAATT CTGGA AGATGCGAAGCGTTTTGCGTATGACTTCCTGAAGGAAAAGCTCGCAAACAATCAAA TCTTGGATAAATGGGTGATCAGCAAGCACTTGCCGGATGAGATTAAACTGGGTCTGG AGATGCCGTGGTTGGCCACCCTGCCGAGAGTTGAGGCGAAATACTATATTCAGTATT ACGCGGGTAGCGGTGATGTTTGGATTGGCAAGACCCTGTACCGCATGCCGGAGATC AGCAATGATACCTATCATGACCTGGCCAAGACCGACTTCAAACGCTGTCAAGCGAA ACATCAATTTGAATGGTTATACATGCAAGAGTGGTACGAAAGCTGCGGCATCGAAG AGTTCGGTATCTCCCGTAAAGATCTGCTGCTGTCTTACTTTCTGGCAACGGCCAGCAT TTTCGAGCTGGAGCGTACCAATGAGCGTATTGCCTGGGCGAAATCACAAATCATTGC T AAGATGATTACGAGCTTTTTCAAT AA AGAAACCACGTCCGAGGAAGATAAACGTG CTCT GCT GAAT GAACT GGGCAACATCAACGGTCTGAATGACACCAACGGTGCCGGT CGTGAGGGTGGCGCAGGCAGCATTGCACTGGCCACGCTGACCCAGTTCCTGGAAGG TTT C G ACCGCT ACACCCGT CACC AGCTGAAGAACGCGT GGTCCGT CT GGCTG ACOCA GCTGCAGCATGGTGAGGCAGACGACGCGGAGCTGCTGACCAACACGTTGAATATCT GCGCTGGCCATATCGCGTTTCGCGAAGAGATTCTGGCGCACAACGAGTACAAAGCC CTGAGCAAT CTGACCTCTAAAAT CT GT CGTC AGCTT AGCTTTATT CAG AGCGAG A AA GAAATGGGCGTGGAAGGTGAGATCGCGGCAAAATCCAGCATCAAGAACAAAGAAC TGGAAGAAGATATGCAGATGTTGGTCAAGCTCGTCCTGGAGAAGTATGGTGGCATC GACCGT AAT AT CAAGAAAGCGTTTCTGGCCGTGGCG AAAACGT ATTACT ACCGCGC GTACCACGCGGCAGATACCATTGACACCCACATGTTTAAGGTTTTGmGAGCCGGT TGCTTAA
SEQ ID NO:4
Esclareol sintasa de longitud completa MSLAFNVGVTPFSGQRVGSRKEKFPVQGFPVTTPNRSRLrVNCSLTTE)FMAKMKENFK REDDKFPTTTTLRSEDIPSNLCIIDTLQRLGVDQFFQYEINTILDNTFRLWQEKHKV1YGN VTTHAMAFRLLRVKGYEVSSEELAPYGNQEAVSQQTNDLPMIIELYRAANERIYEEERS LEKILAWTTIFLNKQVQDNSIPDKKLHKLVEFYLRNYKGITIRLGARRNLELYDMTYYQ ALKSTNRFSNLCNEDFLVFAKQDFD1HEAQNQKGLQQLQRWYADCRLDTLNFGRDWII ANYLASLIIGDHAFDYVRLAFAKTSVLVTIMDDFFDCHGSSQECDKIIELVKEWKENPDA EYGSEELEILFMALYNTVNELAERARVEQGRSVKEFLVKLWVEILSAFKIELDTWSNGT QQSFDEYISSSWLSNGSRLTGLLTMQFVGVKLSDEMLMSEECTDLARHVCMVGRLLND VCSSEREREENIAGKSYSILLATEKDGRKVSEDEAIAEINEMVEYHWRKVLQIVYKKES1 LPRRCKDWLEMAKGTFYAYGINDELTSPQQSKEDMKSFVF
SEQ ID NO:5
Esclareol sintasa truncada (SsScS).
MAKMKENFKREDDKFPTTTTLRSEDffSNLCiroTLQRLGVDQFFQYEINTILDNTFRLWQ EKHKVIYGNVTTHAMAFRLLRVKGYEVSSEELAPYGNQEAVSQQTNDLPMIIELYRAA NERIYEEERSLEKJLAWTTIFLNKQVQDNSIPDKKLHKLVEFYLRNYKGrnRLGARRNLE LYDMTYYQALKSTNRFSNLCNEDFLWAKQDFD1HEAQNQKGLQQLQRWYADCRLDT LNFGRDVYIIANYLASLIIGDHAFDYVRLAFAKTSVLVT1MDDFFDCHGSSQECDKIIELV KEWKENPDAEYGSEELEILFMALYNTVNELAERARVEQGRSVKEFLVKLWVEILSAFKI ELDTWSNGTQQSFDEYISSSWLSNGSRLTGLLTMQFVGVKLSDEMLMSEECTDLARHV CMVGRLLNDVCSSEREREEN1AGKSYSILLATEKDGRKVSEDEAIAEINEMVEYHWRKV LQIVYKKESILPRRCKDVFLEMAKGTFYAYGINDELTSPQQSKEDMKSFVF
SEQ ID NO:6
1132-2-5_opt, ADNc optimizado que codifica para la esclareol sintasa truncada.
ATGGCGAAAATGAAGGAGAACTTTAAACGCGAGGACGATAAATTCCCGACGACCAC GACCCT GCGCAGCGAGG ATATCCCGAGCAACCTGT GCATC ATTGAT ACCCT GCAGC GCCTGGGTGTCGATCAGTTCTTCCAATACGAAATCAATACCATTCTGGACAATACTT TTCGTCTGTGGCAAGAGAAACACAAAGTGATCTACGGCAACGTTACCACCCACGCG ATGGCGTTCCGTTTGTTGCGTGTCAAGGGCTACGAGGTTTCCAGCGAGGAACTGGCG CCGTACGGTAATCAGGAAGCAGTTAGCCAACAGACGAATGATCTGCCTATGATCATT GAGCTGTATCGCGCAGCAAATGAGCGTATCTACGAAGAGGAACGCAGCCTGGAAAA GATCCTGGCGTGGACCACGATCTTCCTGAACAAACAAGTTCAAGACAATTCTATTCC TGATAAGAAGCTGCATAAACTGGTCGAATTCTATCTGCGTAATTACAAGGGCATCAC GATCCGTCTGGGCGCACGCCGTAACCTGGAGTTGTATGATATGACGTATTACCAGGC TCTGAAAAGCACCAATCGTTTCTCCAATCTGTGTAATGAGGATTTTCTGGTGTTCGCC AAGCAGGATTTTGACATCCACGAGGCGCAAAATCAAAAAGGTCTGCAACAACTGCA ACGTTGGTACGCTGACTGTCGCCTGGACACCCTGAATTTCGGTCGCGACGTTGTCAT TATTGCAAACTATCTGGCCAGCCTGATCATCGGTGATCACGCATTCGACTACGTCCG CCTGGCCTTCGCTAAGACCAGCGTTCTGGTGACCATTATGGATGATTTCTTCGATTGC CACGGTTCTAGCCAGGAATGCGACAAAATCATTGAGCTGGTGAAAGAGTGGAAAGA AAACCCTGATGCGGAATACGGTTCCGAAGAGTTGGAGATCCTGTTTATGGCCTTGTA CAACACCGTGAATGAACTGGCCGAGCGTGCTCGTGTGGAGCAGGGCCGTTCTGTGA AGGAGTTTTTGGTCAAGTTGTGGGTGGAAATCCTGTCCGCGTTCAAGATCGAACTGG ATACGTGGTCGAATGGTACGCAACAGAGCTTCGACGAATACATCAGCAGCAGCTGG CTGAGCAATGGCAGCCGTCTGACCGGTTTGCTGACCATGCAATTTGTGGGTGTTAAA CTGTCCGATGAAATGCTGATGAGCGAAGAATGCACCGACCTGGCACGCCATGTGTG TATGGTGGGTCGCCTGCTGAACGACGTCTGCAGCAGCGAACGTGAGCGCGAGGAAA ACATTGCAGGCAAGAGCTACAGCATCTTGTTGGCCACCGAGAAAGATGGTCGCAAA GTGTCTGAGGACGAAGCAATTGCAGAGATTAATGAAATGGTCGAGTACCACTGGCG T AAG G TTTT GC AG A TT GT GT AT AAG A A AG AG AG C AT CTTGCCGCGT CGCTGT AAGG A TGTTTTCTTGGAGATGGCGAAGGGCACGTTCTATGCGTACGGCATTAACGACGAGCT GACGAGCCCGCAACAATCGAAAGAGGACATGAAGAGCTTCGTGTTCTGAGGTAC
SEQ ID NO:7
GGPP sintasa de Pantoea agglomerans.
MVSGSKAGVSPHREIEVMRQSIDDHLAGLLPETDSQDIVSLAMREGVMAPGKRIRPLLM LLAARDLRYQGSMPTLLDLACAVELTHTASLMLDDMPCMDNAELRRGQPTTHKKFGE SVAILASVGLLSKAFGLIAATGDLPGERRAQAVNELSTAVGVQGLVLGQFRDLNDAALD RTPDAILSTNHLKTGILFSAMLQIVAIASASSPSTRETLHAFALDFGQAFQLLDDLRDDHP ETGKDRNKDAGKSTLVNRLGADAARQKLREHTOSADKHLTFACPQGGAIRQFMHLWF GHHLADWSPVMKIA
SEQ ID NO:8
CrtEopt, ADNc optimizado que codifica para la GGPP sintasa de Pantoea agglomerans.
ATGGTTTCTGGTTCGAAAGCAGGAGTATCACCTCATAGGGAAATCGAAGTCATGAG ACAGTCCATTGATGACCACTTAGCAGGATTGTTGCCAGAAACAGATTCCCAGGATAT CGTTAGCCTTGCTATGAGAGAAGGTGTTATCGCACCTGGTAAACGTATCAGACCTTT GCT GAT GTT ACTT GCT GCAAGAGACCT GAGATATC AGGGTT CTAT GCCTAC ACTACT GGATCTAGCTTGTGCTGTTGAACTGACACATACTGCTTCCTTGATGCTGGATGACAT GCCTTGTATGGACAATGCGGAACTTAGAAGAGGTCAACCAACAACCCACAAGAAAT TCGGAGAATCTGTTGCCATTTTGGCTTCTGTAGGTCTGTTGTCGAAAGCTTTTGGCTT
GATTGCTGCAACTGGTGATCTTCCAGGTGAAAGGAGAGCACAAGCTGTAAACGAGC TATCTACTGCAGTTGGTGTTCAAGGTCTAGTCTTAGGACAGTTCAGAGATTTGAATG ACGCAGCTTTGGACAGAACTCCTGATGCTATCCTGTCTACGAACCATCTGAAGACTG GCATCTTGTTCTCAGCTATGTTGCAAATCGTAGCCATTGCTTCTGCTTCTTCACCATC TACTAGGGAAACGTTACACGCATTCGCATTGGACTTTGGTCAAGCCTTTCAACTGCT AGACGATTTGAGGGATGATCATCCAGAGACAGGTAAAGACCGTAACAAAGACGCTG GTAAAAGCACTCTAGTCAACAGATTGGGTGCTGATGCAGCTAGACAGAAACTGAGA GAGCACATTGACTCTGCTGACAAACACCTGACATTTGCATGTCCACAAGGAGGTGCT ATAAGGCAGTTTATGCACCTATGGTTTGGACACCATCTTGCTGATTGGTCTCCAGTG ATGAAGATCGCCTAA

Claims (14)

REIVINDICACIONES
1. Un método para producir (+)-manool, que comprende:
a. poner en contacto difosfato de geranilgeranilo con una difosfato de copalilo (CPP) sintasa para formar un difosfato de (9S, 10S)-copalilo en donde la CPP sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO: 1 o el SEQ ID NO: 2; y b. poner en contacto el CPP con una enzima de esclareol sintasa para formar (+)-manool; y
c. aislar opcionalmente el (+)-manool.
2. El método de conformidad con la reivindicación 1, en donde la esclareol sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO: 4 o el SEQ ID NO: 5.
3. Un método para transformar una célula hospedadora o un organismo no humano con un ácido nucleico que codifica un polipéptido que tiene una actividad de la difosfato de copalilo sintasa y un polipéptido que tiene una actividad de la esclareol sintasa en donde el polipéptido que tiene la actividad de la difosfato de copalilo sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:1 o el SEQ ID NO:2 y en donde el polipéptido que tiene una actividad de la esclareol sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad con el SEQ ID NO: 4 o el SEQ ID NO: 5.
4. El método de conformidad con la reivindicación 3, en donde la célula es una célula bacteriana, una célula de levadura o una célula vegetal.
5. Un vector de expresión que comprende un ácido nucleico que codifica una CPP sintasa, en donde la CPP sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:1 o el SEQ ID NO:2 y un ácido nucleico que codifica una esclareol sintasa.
6. El vector de expresión de la reivindicación 5, en donde el ácido nucleico que codifica la CPP sintasa comprende una secuencia de nucleótidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:3 y en donde el ácido nucleico que codifica la enzima esclareol sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad del SEQ ID NO: 6.
7. Una célula hospedadora o un organismo no humano producidos mediante un método de acuerdo con las reivindicaciones 3 o 4.
8. Un organismo hospedador no humano o una célula que comprenden:
a. al menos un ácido nucleico que codifica un polipéptido que tiene actividad CPP sintasa y al menos un ácido nucleico que codifica un polipéptido que tiene actividad esclareol sintasa, en donde el polipéptido que tiene actividad CPP sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:1 o el SEQ iD NO:2; o
b. el vector de expresión de las reivindicaciones 5 o 6.
9. El organismo hospedador no humano o la célula de acuerdo con la reivindicación 8, en donde el polipéptido que tiene actividad esclareol sintasa comprende una secuencia de aminoácidos que tiene al menos el 90 %, 95 %, 98 %, 99 % o 100 % de identidad de secuencia con el SEQ ID NO:4 o el SEQ ID n O:5.
10. El organismo hospedador no humano o la célula de acuerdo con una cualquiera de las reivindicaciones 7 a 9, que es capaz de producir GGPP.
11. Un método para producir (+)-manool que comprende cultivar el organismo hospedador o la célula de acuerdo con una cualquiera de las reivindicaciones 7 a 10; y opcionalmente aislar el (+)-manool.
12. El método de conformidad con la reivindicación 11, en donde el organismo hospedador o la célula son una bacteria, una levadura o una planta.
13. El método de conformidad con una cualquiera de las reivindicaciones 1, 2, 11 o 12, que comprende además procesar el (+)-manool hasta un derivado de (+)-manool utilizando una síntesis química o bioquímica o una combinación de ambas, en donde el derivado es un alcohol, un acetal, un aldehido, un ácido, éteres, una cetona, una lactona, un acetato o un éster.
14. El método de conformidad con la reivindicación 13, en donde el derivado se selecciona del grupo que consiste en capalol, capalal, (+)-manooloxi, Z-11, gamma-ambrol y ambrox.
ES16736039T 2015-06-30 2016-06-30 Producción de manool Active ES2933968T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562187236P 2015-06-30 2015-06-30
GBGB1601249.4A GB201601249D0 (en) 2016-01-22 2016-01-22 Production of manool
PCT/EP2016/065448 WO2017001641A1 (en) 2015-06-30 2016-06-30 Production of manool

Publications (1)

Publication Number Publication Date
ES2933968T3 true ES2933968T3 (es) 2023-02-15

Family

ID=55534814

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16736039T Active ES2933968T3 (es) 2015-06-30 2016-06-30 Producción de manool

Country Status (9)

Country Link
US (1) US10385361B2 (es)
EP (1) EP3317418B1 (es)
JP (1) JP6856553B2 (es)
CN (1) CN107889506B (es)
CA (1) CA2987487A1 (es)
ES (1) ES2933968T3 (es)
GB (1) GB201601249D0 (es)
MX (1) MX2017015827A (es)
WO (1) WO2017001641A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020011883A1 (en) * 2018-07-10 2020-01-16 Firmenich Sa Method for biocatalytic production of terpene compounds
BR112021025663A2 (pt) * 2019-07-10 2022-04-12 Firmenich & Cie Método biocatalítico para a degradação controlada de compostos terpenos

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0212254B1 (fr) 1985-08-12 1991-10-09 Firmenich Sa Procédé pour la préparation de composés oxygénés décaliniques
CN101319220B (zh) * 2007-06-05 2010-08-25 中国中医科学院中药研究所 一种丹参二萜合酶基因及其编码产物与应用
EP2238256B1 (en) * 2008-01-29 2015-10-14 Firmenich S.A. Method for producing sclareol
EP2366782A1 (en) * 2010-03-09 2011-09-21 Sandoz AG Polypeptide having diterpene synthase activity
ES2625861T3 (es) 2011-11-01 2017-07-20 Firmenich Sa Citocromo p450 y su uso para la oxidación enzimática de terpenos
US9353385B2 (en) * 2012-07-30 2016-05-31 Evolva, Inc. Sclareol and labdenediol diphosphate synthase polypeptides, encoding nucleic acid molecules and uses thereof

Also Published As

Publication number Publication date
CN107889506A (zh) 2018-04-06
MX2017015827A (es) 2018-04-10
EP3317418A1 (en) 2018-05-09
BR112017028183A2 (pt) 2018-08-28
CA2987487A1 (en) 2017-01-05
JP6856553B2 (ja) 2021-04-07
US20190002925A1 (en) 2019-01-03
GB201601249D0 (en) 2016-03-09
JP2018527892A (ja) 2018-09-27
US10385361B2 (en) 2019-08-20
EP3317418B1 (en) 2022-11-30
CN107889506B (zh) 2021-09-14
WO2017001641A1 (en) 2017-01-05

Similar Documents

Publication Publication Date Title
CN104846020B (zh) 生产香紫苏醇的方法
US20210010035A1 (en) Production of manool
US20180208948A1 (en) Drimenol synthases i
US10385363B2 (en) Drimenol synthases II
ES2933968T3 (es) Producción de manool
US20200056210A1 (en) Sesquiterpene synthases for production of drimenol and mixtures thereof
US11293040B2 (en) Methods of producing sesquiterpene compounds
CN107849586B (zh) 芳香化合物的生产
BR112017028183B1 (pt) Produção de manool