ES2843632T3 - Vía de asimilación de la L-arabinosa y sus usos - Google Patents

Vía de asimilación de la L-arabinosa y sus usos Download PDF

Info

Publication number
ES2843632T3
ES2843632T3 ES16704629T ES16704629T ES2843632T3 ES 2843632 T3 ES2843632 T3 ES 2843632T3 ES 16704629 T ES16704629 T ES 16704629T ES 16704629 T ES16704629 T ES 16704629T ES 2843632 T3 ES2843632 T3 ES 2843632T3
Authority
ES
Spain
Prior art keywords
polypeptide
acid sequence
seq
arabinose
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16704629T
Other languages
English (en)
Inventor
Rémi Bernard
Assia Zigha
Pascale Joseph
Jean-Paul Leonetti
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deinove SA
Original Assignee
Deinove SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deinove SA filed Critical Deinove SA
Application granted granted Critical
Publication of ES2843632T3 publication Critical patent/ES2843632T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/065Ethanol, i.e. non-beverage with microorganisms other than yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01016Ribulokinase (2.7.1.16)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • C12Y501/03004L-Ribulose-5-phosphate 4-epimerase (5.1.3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/01Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
    • C12Y503/01004L-Arabinose isomerase (5.3.1.4)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Una célula hospedante recombinante que comprende: una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de Lribulosa- -fosfato-5 4-epimerasa, y una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de Larabinosa- isomerasa, y una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de Lribuloquinasa.

Description

DESCRIPCIÓN
Vía de asimilación de la L-arabinosa y sus usos
Campo de la invención
La presente invención se refiere a una nueva vía metabólica de la L-arabinosa y sus usos, en particular en tecnologías de conversión de biomasa para producir biocombustibles u otros compuestos de interés.
Antecedentes de la invención
La biorrefinería ofrece el potencial de utilizar una amplia variedad de recursos de biomasas no alimentarios, tales como residuos agrícolas, desechos forestales y municipales o cultivos específicos, tales como pasto varilla (Panicum virgatum) o miscanto, para producir compuestos bioquímicos, biomateriales y biocombustibles valiosos.
Estos compuestos se pueden producir a partir de estos materiales de biomasas vegetales a través de una serie de etapas de proceso, que incluyen la degradación y fermentación de la biomasa, utilizando, por ejemplo, tratamientos y catalizadores químicos, físicos y/o biológicos. Normalmente, la biorrefinería requiere un tratamiento previo de la biomasa para hidrolizar al menos parcialmente la hemicelulosa, retirar la lignina y descristalizar la celulosa, de modo que las enzimas celulasas puedan acceder a su sustrato.
Las bacterias Deinococcus son bacterias gram-positivas que fueron aisladas por primera vez en 1956 por Anderson et al. Estos organismos extremófilos son resistentes al daño del DNA por radiaciones ultravioleta e ionizantes o por agentes reticulantes (mitomicina C) y son tolerantes a la desecación. El documento WO 01/023526 muestra la inusual resistencia de Deinococcus a la radiación y además propone su manipulación genética y uso en biorremedios. El documento WO 2009/063079 muestra que las bacterias Deinococcus pueden resistir a los disolventes y transformar la biomasa para generar etanol. El documento WO 2010/130806 describe además cepas recombinantes de Deinococcus en las que se han insertado genes de biosíntesis de etanol. Estas cepas recombinantes presentan un rendimiento mejorado en la producción de etanol. El documento WO 2013/092965 describe también una nueva generación de bacterias Deinococcus mejoradas, con mayores y notables propiedades de degradación de biomasas y producción de biocombustibles.
Debido a que la materia prima representa una parte importante de todos los costos, y con el fina obtener altos rendimientos de producción, un proceso eficaz requiere el uso de cepas de microorganismos que tengan la capacidad de metabolizar todos los azúcares principales que se encuentran en las biomasas vegetales, tales como glucosa, xilosa, arabinosa, galactosa. y/o manosa. En particular, la biomasa celulósica puede comprender de 3 al 15% del componente L-arabinosa y la mejora en la asimilación de esta pentosa puede disminuir significativamente los costos de todo el proceso y aumentar los rendimientos de producción.
]La solicitud de patente internacional WO 2009/011591 describe células eucariotas que han adquirido la capacidad de convertir L-arabinosa en D-xilulosa-5-fosfato por transformación con secuencias de nucleótidos que codifican una arabinosa-isomerasa, una ribuloquinasa y una ribulosa-5-P-4-epimerasa de una bacteria que pertenece a los géneros Clavibacter, Arthrobactero Gramella.
Como se sabe actualmente las bacterias Deinococcus no pueden producir etanol a partir de L-arabinosa, por lo que existe la necesidad de una nueva vía metabólica de la L-arabinosa que se pueda usar para producir bacterias Deinococcus recombinantes que presenten una conversión eficaz de L-arabinosa en etanol o en cualquier otro producto de fermentación o compuesto de interés industrial.
Sumario de la invención
Los autores la presente invención identificaron un nuevo operón funcional de asimilación de L-arabinosa de Deinococcus roseus que confiere la capacidad de utilizar L-arabinosa como única fuente de carbono.
Por consiguiente, en un primer aspecto, la presente invención se refiere a una célula hospedante recombinante que comprende:
(i) una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa- isomerasa, y
(ii) una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa; y
(iii) una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa.
La célula hospedante recombinante puede comprender una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 75, 80, 90, 95, 98, 99% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa. Preferiblemente, la secuencia de ácidos nucleicos codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1.
La célula hospedante recombinante puede comprender una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 75, 80, 90, 95, 98, 99% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa. Preferiblemente, la secuencia de ácidos nucleicos codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3. La célula hospedante recombinante puede comprender una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 75, 80, 90, 95, 98, 99% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa. Preferiblemente, la secuencia de ácidos nucleicos codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
La célula hospedante recombinante puede comprender una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1, una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3 y una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
Preferiblemente, la célula hospedante es una bacteria Deinococcus, más preferiblemente una bacteria Deinococcus productora de etanol o productora de un compuesto isoprenoide. Preferiblemente, la bacteria se selecciona del grupo que consiste en D. geothermalis, D. aquatilis, D. gobiensis, D. cellulolysiticus, D. deserti, D. murrayi, D. maricopensis y D. radiodurans, más preferiblemente del grupo que consiste en D. geothermalis, D. cellulolysiticus, D. deserti, D. murrayi, D. maricopensis y D. radiodurans, e incluso más preferiblemente es D. geothermalis.
El presente documento describe también un extracto celular de la célula recombinante de la invención.
En un segundo aspecto, la presente invención se refiere a un polipéptido aislado o purificado que comprende, o consiste en, una secuencia de aminoácidos que tiene una identidad de al menos 90% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa. La presente invención se refiere también a una construcción, casete de expresión o vector de ácidos nucleicos recombinantes, que comprende una secuencia de ácidos nucleicos que codifica dicho polipéptido.
El presente documento describe también una bacteria Deinococcus recombinante o una bacteria relacionada que comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que presenta actividad de L-arabinosa-isomerasa, un polipéptido que presenta actividad de L-ribuloquinasa y/o un polipéptido que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa. Preferiblemente, dicha bacteria comprende una o varias construcciones de casetes de expresión y/o vectores de expresión de ácidos nucleicos, que codifican uno o varios polipéptidos, tal como se describen en la presente memoria. Preferiblemente, la bacteria es una bacteria Deinococcus seleccionada del grupo que consiste en D. geothermalis, D. cellulolysiticus, D. deserti, D. aquatilis, D. gobiensis, D. murrayi, D. maricopensis y D. radiodurans, más preferiblemente del grupo que consiste en D. geothermalis, D. cellulolysiticus, D. deserti, D. murrayi, D. maricopensis y D. radiodurans, e incluso más preferiblemente es D. geothermalis.
En un aspecto adicional, la presente invención se refiere a un método para producir un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 90% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, que comprende; (a) cultivar una célula hospedante de la invención que expresa dicho polipéptido; y (b) recuperar dicho polipéptido del cultivo celular; y (c) opcionalmente, purificar dicho polipéptido. La presente invención se refiere también a un método para producir un producto de fermentación, que comprende poner en contacto un sustrato que contiene arabinosa, preferiblemente una biomasa celulósica que contiene arabinosa, con una célula hospedante recombinante de la invención, y opcionalmente recuperar el producto de fermentación.
El producto de fermentación puede ser biocombustible, tal como etanol, butanol, propanol, glicerol-metanol, isopropanol, propanodiol, glicerol o 2,3-butanodiol, un ácido orgánico, tal como formiato, acetato, lactato, butirato, gluconato, xilonato, citrato, succinato, propionato, fumarato, malato, piruvato, ácido itacónico y ácido kójico, y sus sales o ésteres, un compuesto isoprenoide o un compuesto farmacéutico, tal como antibióticos, compuestos bacteriostáticos, antimetabolitos, compuestos quimioterapéuticos, agentes antiparasitarios, agentes antifúngicos, compuestos antivirales, compuestos con actividad de citoquinas o factores de crecimiento celular. Preferiblemente, el producto de fermentación es etanol o un compuesto isoprenoide.
Breve descripción de los dibujos
Figura 1: Casete de expresión que comprende el operón de arabinosa de D. roseus para ser insertado en el locus ldh de D. geothermalis.
Figura 2: Crecimiento de la cepa de D. geothermalis que contiene los genes pdc y adh, pero no el operón de arabinosa (-ara) y la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus (+ara) en medio mínimo definido que contiene L-arabinosa como única fuente de carbono.
Figura 3: Concentración de arabinosa en el medio durante el crecimiento de la cepa de D. geothermalis que contiene los genes pdc y adh, pero no el operón de arabinosa (-ara) y la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus (+ara) en medio mínimo definido que contiene L-arabinosa como única fuente de carbono.
Figura 4: Producción de etanol durante el crecimiento de la cepa de D. geothermalis que contiene los genes pdc y adh, pero no el operón de arabinosa (-ara) y la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus (+ara) en medio mínimo definido que contiene L-arabinosa como única fuente de carbono.
Figura 5: Concentraciones de glucosa y arabinosa en el medio de cultivo durante el crecimiento de la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus en medio mínimo definido que contiene L-arabinosa y glucosa como únicas fuentes de carbono.
Figura 6: Producción de etanol durante el crecimiento de la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus en medio mínimo definido que contiene L-arabinosa y glucosa como únicas fuentes de carbono.
Figura 7: Crecimiento de la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de adh y arabinosa de D. roseus en un medio técnico que comprende 10%, 20% o 30% de un hidrolizado de sustrato de rastrojo de maíz.
Figura 8: Concentración de glucosa durante el crecimiento de la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus en un medio técnico que comprende 10%, 20% o 30% de un hidrolizado de sustrato de rastrojo de maíz.
Figura 9: Concentración de xilosa durante el crecimiento de la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus en un medio técnico que comprende 10%, 20% o 30% de un hidrolizado de sustrato de rastrojo de maíz.
Figura 10: Concentración de arabinosa durante el crecimiento de la cepa de D. geothermalis recombinante que contiene los genes pdc y adh y el operón de arabinosa de D. roseus en un medio técnico que comprende 10%, 20% o 30% de un hidrolizado de sustrato de rastrojo de maíz.
Descripción detallada de la invención
La vía metabólica bacteriana de la L-arabinosa es independiente de cofactores y consiste en L-arabinosa-isomerasa (AraA) que convierte L-arabinosa en L-ribulosa, L-ribuloquinasa (AraB) que convierte L-ribulosa en L-ribulosa-5-fosfato, y L-ribulosa-5-fosfato-4-epimerasa (AraD) que convierte L-ribulosa-5-fosfato en D-xilulosa-5-fosfato que posteriormente entra en la vía de la pentosa-fosfato (PPP).
Los autores de la presente invención identificaron un nuevo operón funcional de la vía de la L-arabinosa de Deinococcus roseus y mostraron que la introducción y expresión de este operón en una cepa de Deinococcus geothermalis etanologénica confiere la capacidad de usar L-arabinosa como única fuente de carbono produciendo mientras etanol. También demostraron que la expresión de este operón en una bacteria Deinococcus que tiene una geraniol-sintasa confiere la capacidad de producir el geraniol monoterpénico utilizando L-arabinosa como única fuente de carbono. Además, demostraron que, sorprendentemente, gracias a este operón, la cepa de Deinococcus recombinante puede coasimilar eficazmente L-arabinosa y glucosa y/o xilosa sin diauxia y, por tanto, es un biocatalizador prometedor para aumentar el rendimiento de producción de los procesos de fermentación en los que se co-fermentan mezcla de los azúcares pentosa y hexosa.
El operón identificado de la vía de la L-arabinosa codifica tres nuevas enzimas: la L-arabinosa-isomerasa (AraA, EC 5.3.1.4) de la SEQ ID NO: 1 que comprende 500 residuos de aminoácidos, la L-ribuloquinasa (AraB, EC 2.7.1.16) de la SEQ ID NO: 3 que comprende 563 residuos de aminoácidos, y la L-ribulosa-5-fosfato-4-epimerasa (AraD, EC 5.1.3.4) de la SEQ ID NO: 5 que comprende 217 residuos de aminoácidos.
Definiciones
Como se usa en la presente memoria, los términos "péptido", "oligopéptido", "polipéptido" y "proteína" se emplean indistintamente y se refieren a una cadena de aminoácidos unidos por enlaces peptídicos, independientemente del número de aminoácidos que forman dicha cadena.
Como se usa en la presente memoria, el término "identidad de secuencias" o "identidad" se refiere al número (%) de coincidencias (residuos de aminoácidos idénticos) en posiciones de un alineamiento de dos secuencias polipeptídicas. La identidad de secuencias se determina comparando las secuencias cuando se alinean de modo que se maximice el solapamiento y la identidad minimizando mientras los huecos de secuencia. En particular, la identidad de secuencias se puede determinar usando cualquiera de varios algoritmos matemáticos de alineación global o local, dependiendo de la longitud de las dos secuencias. Las secuencias de longitudes similares se alinean preferiblemente usando un algoritmo de alineación global (por ejemplo, de algoritmo de Needleman y Wunsch; Needleman and Wunsch, 1970) que alinea las secuencias de manera óptima en toda la longitud, mientras que las secuencias de longitudes sustancialmente diferentes se alinean preferiblemente usando un algoritmo de alineación local (por ejemplo, el algoritmo de Smith y Waterman (Smith and Waterman, 1981) o el algoritmo de Altschul (Altschul et al., 1997; Altschul et al., 2005)). La alineación con el fin de determinar el porcentaje de identidad de las secuencias de aminoácidos se puede lograr de varias formas que están dentro de la experiencia en la técnica, por ejemplo, usando programas informáticos disponibles públicamente en sitios web de Internet, tales como http://blast.ncbi.nlm.nih.gov/ o http://www.ebi.ac.uk/Tools/emboss/. Los expertos en la técnica pueden determinar los parámetros apropiados para medir la alineación, incluidos los algoritmos necesarios para lograr la máxima alineación en toda la longitud de las secuencias que se comparan. Preferiblemente, para los fines de la presente invención, los valores de % de identidad de secuencias de aminoácidos se refieren a valores generados utilizando el programa de alineación de secuencias por pares EMBOSS Needle que crea una alineación global óptima de dos secuencias utilizando el algoritmo de Needleman-Wunsch, en el que todos los parámetros de búsqueda se establecen en valores por defecto, es decir, matriz de puntuación = BLOSUM62, abertura de huecos = 10, Extensión de huecos = 0,5, Penalización del hueco final = falso, Abertura del hueco final = 10 y Extensión del hueco final = 0,5.
Como se usa en la presente memoria, el término "fragmento funcional" se refiere a un fragmento de un polipéptido de la invención, que comprende al menos 100, 150, 200, 250, 300, 350, 400, 450 o 500 aminoácidos contiguos de dicho polipéptido, y que retiene la actividad enzimática de todo el polipéptido. Preferiblemente, el fragmento funcional retiene la especificidad del sustrato y/o la afinidad del sustrato y/o el pH óptimo y/o la temperatura óptima de todo el polipéptido. El experto en la materia puede evaluar fácilmente estas propiedades utilizando métodos bien conocidos. Como se usa en la presente memoria, el término "purificado" o "aislado", en relación con un polipéptido o ácido nucleico, se refiere a un polipéptido o ácido nucleico que no está en su medio o forma natural. Por tanto, el término "aislado" incluye un polipéptido o ácido nucleico separado de su entorno original, por ejemplo, el entorno natural si existe de forma natural. Por ejemplo, un polipéptido aislado carece típicamente de al menos algunas proteínas u otros constituyentes de las células a las que está normalmente asociado o con las que normalmente está mezclado o en solución. Un polipéptido aislado incluye dicho polipéptido producido naturalmente contenido en un lisado celular; el polipéptido en una forma purificada o parcialmente purificada, el polipéptido recombinante, el polipéptido que es expresado o secretado por una célula, así como el polipéptido en una célula hospedante o cultivo heterólogo. En relación con un ácido nucleico, el término aislado o purificado indica, por ejemplo, que el ácido nucleico no está en su contexto genómico natural (por ejemplo, en un vector, como un casete de expresión, unido a un promotor o introducido artificialmente en una célula hospedante heteróloga).
Como se usa en la presente memoria, el término "heterólogo" con referencia a un polinucleótido o polipéptido se refiere a un polinucleótido o polipéptido que no se encuentra naturalmente en una célula hospedante. En algunas realizaciones preferidas, este término se refiere a un polinucleótido o polipéptido que no se encuentra naturalmente en la célula de Deinococcus hospedante, sino que se obtiene de otra cepa de Deinococcus' .
Como se usa en la presente memoria, el término "endógeno" con referencia a un polinucleótido o polipéptido se refiere a un polinucleótido o polipéptido que se encuentra naturalmente en una célula hospedante.
Como se usa en la presente memoria, el término "arabinosa" puede referirse a D-arabinosa o L-arabinosa, preferiblemente L-arabinosa.
El presente documento describe un polipéptido que comprende:
— una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, o uno de sus fragmentos funcionales,
— una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, o uno de sus fragmentos funcionales, o
— una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, o uno de sus fragmentos funcionales.
En un primer aspecto, el polipéptido comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, o uno de sus fragmentos funcionales. Los términos "L-arabinosa-isomerasa" y "AraA" se usan en la presente memoria indistintamente y se refieren a una enzima que convierte L-arabinosa en L-ribulosa. En particular, estos términos se refieren a una enzima que tiene una actividad descrita como EC 5.3.1.4 de acuerdo con la nomenclatura de enzimas de la Unión Internacional de Bioquímica y Biología Molecular. La actividad de la L-arabinosa-isomerasa se puede evaluar usando cualquier método conocido por los expertos en la técnica. Por ejemplo, la actividad de la L-arabinosa-isomerasa puede ser analizada usando L-arabinosa como sustrato y detectando la producción de L-ribulosa con el ensayo de cisteínacarbazol como se describe en el artículo de Dische and Borenfreund (J. Biol. Chem. 1951 Oct; 192 (2): 583-7) o de Englesberg (J. Bacteriol. 1961 Jun; 81: 996-1006).
Preferiblemente, el polipéptido comprende, o consiste en, una secuencia de aminoácidos que tiene una identidad de al menos 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89 , 90, 91, 92, 93, 94, 95, 96, 97, 98 o 99% con la SEQ ID NO: 1. Preferiblemente, el porcentaje de identidad se determina sobre más del 10% de la longitud de la SEQ ID NO: 1, más preferiblemente sobre más del 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de la longitud de la SEQ ID NO: 1. En una realización particular, el polipéptido comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1.
Alternativamente, el polipéptido puede comprender, o consistir en, una secuencia que difiere de la secuencia expuesta en la SEQ ID NO: 1 en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 sustituciones, inserciones y/o deleciones de residuos de aminoácidos, preferiblemente en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 o 15 sustituciones, inserciones y/o deleciones de residuos de aminoácidos.
El polipéptido también puede ser un fragmento funcional de una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa. Preferiblemente, el fragmento funcional comprende, o consiste en, al menos 100, 150, 200, 250, 300, 350, 400, 450 o 500 aminoácidos contiguos de una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1, preferiblemente de la secuencia de aminoácidos de la SEQ ID NO: 1.
En un segundo aspecto, el polipéptido comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, o uno de sus fragmentos funcionales. Los términos "ribuloquinasa", "L-ribuloquinasa" y "AraB" se usan indistintamente en la presente memoria y se refieren a una enzima que convierte L-ribulosa en L-ribulosa-5-fosfasa. En particular, estos términos se refieren a una enzima que tiene una actividad descrita como EC 2.7.1.16 según la nomenclatura enzimática de la Unión Internacional de Bioquímica y Biología Molecular. La actividad de ribuloquinasa puede evaluarse utilizando cualquier método conocido por el experto. Por ejemplo, la actividad de ribuloquinasa puede ser determinada mediante la reacción modificada de cisteína-carbazol como se describe en el artículo de Tokgoz et al., (Turk J. Biol. 2014, 38: 633-639) o midiendo la producción de ribulosa-fosfato marcada con 14C como se describe en el artículo de Schleif et al., (J. Bacteriol, 1973 Jul; 115 (1): 9-14).
Preferiblemente, el polipéptido comprende, o consiste en, una secuencia de aminoácidos que tiene una identidad de al menos 74, 75, 76, 77, 78, 79, 80, 81,82, 83, 84, 85, 86, 87, 88, 89, 90,91,92, 93, 94, 95, 96, 97, 98 o 99% con la SEQ ID NO: 3. Preferiblemente, el porcentaje de identidad se determina sobre más del 10% de la longitud de la SEQ ID NO: 3, más preferiblemente sobre más de 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de la longitud de la SEQ ID NO: 3. En un aspecto particular, el polipéptido comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3.
Alternativamente, el polipéptido puede comprender, o consistir en, una secuencia que difiere de la secuencia expuesta en la SEQ ID NO: 3 en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 sustituciones, inserciones y/o deleciones de residuos de aminoácidos, preferiblemente en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 o 15 sustituciones, inserciones y/o deleciones de residuos de aminoácidos.
El polipéptido puede ser también un fragmento funcional de una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa. Preferiblemente, el fragmento funcional comprende, o consiste en, al menos 100, 150, 200, 250, 300, 350, 400, 450 o 500 aminoácidos contiguos de una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3, preferiblemente de la secuencia de aminoácidos de la SEQ ID NO: 3.
En un tercer aspecto, el polipéptido comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, o uno de sus fragmentos funcionales.
Los términos "L-ribulosa-5-fosfato-4-epimerasa", "L-ru5P", "fosforribulosa-isomerasa", "ribulosa-fosfato-4-epimerasa" y "AraD" se usan indistintamente en la presente memoria y se refieren a una enzima que convierte L-ribulosa-5-fosfasa en D-xilosa-5-fosfato. En particular, estos términos se refieren a una enzima que tiene una actividad descrita como EC 5.1.3.4 de acuerdo con la nomenclatura enzimática de la Unión Internacional de Bioquímica y Biología Molecular. La actividad de L-ribulosa-5-fosfato-4-epimerasa se puede evaluar usando cualquier método conocido por los expertos en la técnica. Por ejemplo, esta actividad puede ser determinada usando L-ribulosa-5-fosfato como sustrato y midiendo la producción de D-xilulosa-5-fosfato como se describe en el artículo de Davis et al., (J. Biol. Chem. 1972, 247: 5862-5866).
Preferiblemente, el polipéptido comprende, o consiste en, una secuencia de aminoácidos que tiene una identidad de al menos 74, 75, 76, 77, 78, 79, 80, 81,82, 83, 84, 85, 86, 87, 88, 89, 90,91,92, 93, 94, 95, 96, 97, 98 o 99% con la SEQ ID NO: 5. Preferiblemente, el porcentaje de identidad se determina sobre más del 10% de la longitud de la SEQ ID NO: 5, más preferiblemente sobre más del 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de la longitud de la SEQ ID NO: 5. En un aspecto particular, el polipéptido comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
Alternativamente, el polipéptido puede comprender, o consistir en, una secuencia que difiere de la secuencia expuesta en la SEQ ID NO: 5 en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 o 20 sustituciones, inserciones y/o deleciones de residuos de aminoácidos, preferiblemente en 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 o 15 sustituciones, inserciones y/o deleciones de residuos de aminoácidos.
El polipéptido puede ser también un fragmento funcional de una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa. Preferiblemente, el fragmento funcional comprende, o consiste en, al menos 100, 150, 200, 250, 300, 350, 400, 450 o 500 aminoácidos contiguos de una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5, preferiblemente de la secuencia de aminoácidos de la SEQ ID NO: 5.
Los polipéptidos como se ha descrito anteriormente pueden ser también polipéptidos híbridos o polipéptidos de fusión en los que un polipéptido como se ha descrito anteriormente está fusionado en su N-terminal y/o C-terminal con otro polipéptido. Los métodos para producir polipéptidos de fusión son bien conocidos en la técnica e incluyen el ligamiento de las secuencias codificantes que codifican el polipéptido y la región de adición de otro polipéptido de modo que estén en marco y que la expresión del polipéptido de fusión esté bajo el control del (de los) mismo(s) promotor(es) y terminador. La región de adición del polipéptido de fusión se puede seleccionar para aumentar la estabilidad de la enzima, para promover la secreción (tal como un péptido señal hidrófobo N-terminal) de la proteína de fusión de una célula (tal como una célula bacteriana o una célula de levadura), o para ayudar a la purificación de la proteína de fusión. Más particularmente, la región adicional puede ser una etiqueta útil para la purificación o inmovilización de la enzima. Dicha etiqueta es bien conocida por los expertos en la técnica, por ejemplo, una etiqueta His (His6), una etiqueta FLAG, una etiqueta HA (epítopo derivado de la proteína hemaglutinina de la gripe), una proteína de unión a maltosa (MPB), una etiqueta MYC (epítopo derivado de la proto-oncoproteína humana MYC) o una etiqueta GST (glutatión-S-transferasa pequeña). Un polipéptido de fusión puede comprender además un sitio de escisión para proteasas o agentes químicos, entre la enzima y la región de adición. Tras la secreción de la proteína de fusión, el sitio se escinde liberando los dos polipéptidos separados.
Los polipéptidos descritos anteriormente pueden estar también fusionados en su N-terminal y/o C-terminal con uno o varios polipéptidos que presentan una actividad enzimática distinta.
Los polipéptidos descritos anteriormente se pueden producir mediante técnicas recombinantes o, cuando son de origen natural, se pueden aislar o purificar a partir de fuentes naturales. Pueden ser expresados, derivados, secretados, aislados o purificados a partir de una célula hospedante, por ejemplo, una bacteria Deinococcus. Los polipéptidos se encuentran preferiblemente en forma aislada o purificada. Se pueden purificar mediante métodos conocidos per se en la técnica y ser conservados por técnicas convencionales.
Los polipéptidos como los descritos anteriormente pueden ser de origen natural, recombinante y/o sintético y, opcionalmente, pueden ser modificados (por ejemplo, químicamente, enzimáticamente, físicamente, etc.). En particular, pueden ser modificados para mejorar, por ejemplo, su estabilidad o actividad.
Los polipéptidos pueden estar en forma soluble o en fase sólida. En particular, pueden estar unidos a membranas celulares o vesículas lipídicas, o a soportes sintéticos, tales como vidrio, plástico, polímeros, filtros, membranas, por ejemplo, en forma de perlas, columnas, placas y similares.
El presente documento describe además un ácido nucleico que codifica un polipéptido como se describió anteriormente.
Preferiblemente, el ácido nucleico es un ácido nucleico recombinante, aislado o purificado. Como se usa en esta memoria, el término "ácido nucleico recombinante" designa un ácido nucleico que ha sido diseñado por ingeniería genética y no se encuentra como tal en bacterias de tipo natural.
El ácido nucleico puede ser DNA (cDNA o gDNA), RNA o una mezcla de los dos. Puede estar en forma monocatenaria o en forma dúplex o una mezcla de las dos. Puede comprender nucleótidos modificados, que comprenden, por ejemplo, un enlace modificado, una base púrica o pirimidínica modificada, o un azúcar modificado. Se puede preparar por cualquier método conocido por un experto en la técnica, incluyendo síntesis química, recombinación y mutagénesis. El ácido nucleico descrito en la presente memoria puede ser deducido de la secuencia del polipéptido descrito en la presente memoria y el uso de codones puede adaptarse de acuerdo con la célula hospedante en la que se transcribirá el ácido nucleico. Estas etapas se pueden llevar a cabo de acuerdo con métodos bien conocidos por un experto en la técnica y algunos de los cuales están descritos en el manual de referencia de Sambrook. et al., (Sambrook J, Russell D (2001) Molecular Cloning: A laboratory manual Third Edition Cold Spring Harbor).
En un primer aspecto, el ácido nucleico descrito en la presente memoria comprende, o consiste en, una secuencia de nucleótidos que tiene una identidad de al menos 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 o 99% con la SeQ ID NO: 2. Preferiblemente, el porcentaje de identidad se determina sobre más del 10% de la longitud de SEQ ID NO: 2, más preferiblemente más de 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de la longitud de la SEQ ID NO: 2. En una realización particular, el ácido nucleico comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 2.
En un segundo aspecto, el ácido nucleico descrito en la presente memoria comprende, o consiste en, una secuencia de nucleótidos que tiene una identidad de al menos 70, 71,72, 73, 74, 75, 76, 77, 78, 79, 80, 81,82, 83, 84, 85, 86, 87, 88, 89, 90, 91,92, 93, 94, 95, 96, 97, 98 o 99% con la SEQ ID No : 4. Preferiblemente, el porcentaje de identidad se determina sobre más del 10% de la longitud de la SEQ ID NO: 4, más preferiblemente más de 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de la longitud de la SEQ ID NO: 4. En un aspecto particular, el ácido nucleico comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 4.
En un tercer aspecto, el ácido nucleico descrito en la presente memoria comprende, o consiste en, una secuencia de nucleótidos que tiene una identidad de al menos 70, 71,72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 o 99% con la SeQ ID NO: 6. Preferiblemente, el porcentaje de identidad se determina sobre más del 10% de la longitud de la SEQ ID NO: 6, más preferiblemente más del 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de la longitud de la SEQ ID NO: 6. En un aspecto particular, el ácido nucleico comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 6.
El presente documento describe también un casete de expresión que comprende una región codificante que comprende un ácido nucleico que codifica al menos un polipéptido descrito en la presente memoria, unido operativamente a una o más secuencias de control que dirigen la expresión de dicha región codificante en una célula hospedante adecuada en condiciones compatibles con las secuencias de control.
El término "casete de expresión" designa una construcción de ácidos nucleicos que comprende una región codificante, es decir, uno o varios genes, y una región reguladora, es decir, que comprende una o más secuencias de control, unidas operativamente. Opcionalmente, el casete de expresión puede comprender varias regiones codificantes unidas operativamente a varias regiones reguladoras. En particular, el casete de expresión puede comprender varias secuencias codificantes, estando cada una de estas secuencias unida operativamente al mismo promotor o a un promotor distinto. Alternativamente, el casete de expresión puede comprender una o varias secuencias codificantes, estando cada una de estas secuencias unida operativamente a un promotor distinto y varias otras secuencias codificantes unidas operativamente a un promotor común.
El término "secuencias de control" significa secuencias de ácidos nucleicos necesarias para la expresión de una región codificante. Las secuencias de control pueden ser endógenas o heterólogas. Se preferirán las secuencias de control bien conocidas y utilizadas actualmente por los expertos en la técnica. Dichas secuencias de control incluyen, aunque sin limitación, una secuencia delantera, secuencia de poliadenilación, secuencia de propéptido, promotor, secuencia de péptido señal y terminador de la transcripción. Preferiblemente, las secuencias de control incluyen un promotor y un terminador de la transcripción.
El término " unido operativamente " significa una configuración en la que una secuencia de control está colocada en una posición apropiada con respecto a una secuencia codificante, de tal manera que la secuencia de control dirige la expresión de la región codificante.
La secuencia de control puede incluir un promotor que sea reconocido por una célula hospedante o un sistema de expresión in vitro para la expresión de un ácido nucleico que codifica un polipéptido como se describe en la presente memoria. El promotor contiene secuencias de control de la transcripción que median la expresión del polipéptido. El promotor puede ser cualquier polinucleótido que muestre actividad transcripcional en la célula hospedante incluyendo promotores mutantes, truncados e híbridos, y se pueden obtener de genes que codifican polipéptidos extracelulares o intracelulares ya sea endógenos o heterólogos a la célula hospedante. El promotor puede ser un promotor endógeno o heterólogo. El promotor puede ser un promotor fuerte, débil, constitutivo o inducible. En un aspecto particular, el promotor es heterólogo del ácido nucleico que codifica un polipéptido como se describe en la presente memoria, es decir, no está unido operativamente en la naturaleza a dicho ácido nucleico o está unido operativamente en una localización diferente en la naturaleza.
Preferiblemente, el promotor es un polinucleótido que muestra actividad transcripcional en bacterias Deinococcus. En este sentido, se han estudiado y utilizado diversos promotores para la expresión génica en bacterias Deinococcus. Los ejemplos de promotores adecuados incluyen los promotores PtufA y PtufB de los factores de prolongación de la traducción de los genes Tu tufA (DR0309) y tufB (DR2050), el promotor del gen resU localizado en pI3, la región promotora PgroESL del operón groESL (Lecointe et al., 2004. Mol Microbio! 53: 1721-1730; Meima et al., 2001. J. Bacteriol 183: 3169-3175.) o sus derivados.
La secuencia de control puede ser también un terminador de la transcripción, que es reconocido por una célula hospedante para terminar la transcripción. El terminador está unido operativamente al extremo 3' del ácido nucleico que codifica el polipéptido. En la presente invención se puede usar cualquier terminador que sea funcional en la célula hospedante. Preferiblemente, el terminador es funcional en bacterias Deinococcus. Ejemplos de tal terminador están descritos en Lecointe. et al, 2004, supra. Normalmente, el terminador se elige en correlación con el promotor. La secuencia de control puede ser también una secuencia codificante del péptido señal que codifica un péptido señal unido al N-terminal de un polipéptido codificado y dirige el polipéptido hacia la vía secretora de la célula, es decir, para su secreción al espacio extracelular (o periplásmico).
La región codificante del casete de expresión puede comprender:
(i) un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-arabinosa-isomerasa, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1,
(ii) un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribuloquinasa-isomerasa, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3, y/o
(iii) un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
En un aspecto particular, la región codificante comprende un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-arabinosa-isomerasa, y un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribuloquinasaisomerasa.
En otro aspecto, la región codificante comprende un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-arabinosa-isomerasa, y un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa. En un aspecto adicional, la región codificante comprende un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribuloquinasa-isomerasa, y un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa.
En un aspecto preferido, la región codificante comprende un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-arabinosa-isomerasa, un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribuloquinasa-isomerasa, y un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa.
Los ácidos nucleicos que codifican los polipéptidos descritos en la presente memoria pueden estar colocados en cualquier orden en la región codificante.
Preferiblemente, las secuencias codificantes comprendidas en la región codificante están colocadas bajo el control de un mismo promotor, es decir, están colocadas en un operón. Los ácidos nucleicos que codifican los polipéptidos como se describen en la presente memoria pueden estar colocados en cualquier orden en el operón.
En un aspecto particular, los ácidos nucleicos que codifican los polipéptidos como se describen en la presente memoria pueden estar colocados en la región codificante o el operón en el mismo orden que en la Figura 1, es decir, un ácido nucleico que codifica una L-ribuloquinasa-isomerasa, un ácido nucleico que codifica una L-ribulosa-5-fosfato-4-epimerasa y un ácido nucleico que codifica una L-arabinosa-isomerasa.
Opcionalmente, el casete de expresión puede comprender también un marcador seleccionable que permite una fácil selección de células hospedantes recombinantes. Normalmente, el marcador seleccionable es un gen que codifica resistencia a antibióticos o que confiere autotrofia.
El casete de expresión como se describe en la presente memoria se puede usar directamente para transformar una célula hospedante, preferiblemente una célula Deinococcus hospedante y permitir la expresión del ácido nucleico como se describe en la presente memoria en dicha célula. Preferiblemente, el casete de expresión, o una de sus partes que comprende un ácido nucleico como se describe en la presente memoria está insertado en el genoma de la célula hospedante. En un aspecto particular, el casete de expresión está integrado en el genoma de la célula hospedante, preferiblemente una célula Deinococcus hospedante. El casete de expresión puede estar integrado, por ejemplo, en el gen que codifica la fosfoacetiltransferasa (pta) o lactato-deshidrogenasa (Idh) o en una secuencia IS presente en el genoma de la célula hospedante (véase por ejemplo el documento WO 2015/092013).
El presente documento describe también un vector de expresión que comprende un ácido nucleico o un casete de expresión como se describe en la presente memoria.
Como se usa en la presente memoria, el término "vector de expresión" significa una molécula de DNA o RNA que comprende un casete de expresión. Preferiblemente, el vector de expresión es una molécula de DNA bicatenario lineal o circular.
El vector de expresión como se describe en la presente memoria se puede usar para transformar una célula hospedante, preferiblemente una célula hospedante de Deinococcus y permitir la expresión del ácido nucleico como se describe en la presente memoria en dicha célula. La elección del vector dependerá típicamente de la compatibilidad del vector con la célula hospedante en la que se introducirá el vector. El vector puede ser un vector autónomamente replicante, es decir, un vector que existe como una entidad extracromosómica, cuya replicación es independiente de la replicación cromosómica, por ejemplo, un plásmido, un elemento extracromosómico, un minicromosoma o un cromosoma artificial. El vector puede contener cualquier medio para asegurar la autorreplicación. Alternativamente, el vector puede ser uno que, cuando se introduce en la célula hospedante, se integra en el genoma y se replica junto con el (los) cromosoma(s) en los que se ha integrado. Preferiblemente, el vector, o una de sus partes, que comprende un ácido nucleico como se describe en la presente memoria, por ejemplo, el casete de expresión como se describe en la presente memoria, se inserta en el genoma de la célula hospedante. En un aspecto particular, el vector o casete de expresión se integra en el genoma de la célula hospedante, preferiblemente una célula hospedante de Deinococcus, en el gen que codifica la fosfoacetiltransferasa (pta) o lactato-deshidrogenasa (Idh). Alternativamente, el vector o casete de expresión puede ser integrado en una secuencia IS presente en el genoma de la célula hospedante (véase por ejemplo el documento WO 2015/092013). El vector comprende preferiblemente uno o más marcadores seleccionables que permiten una fácil selección de las células hospedantes que comprenden el vector. Un marcador seleccionable es un gen cuyo producto proporciona resistencia a antibióticos, resistencia a metales pesados, prototrofia a la auxotrofia y similares.
El vector comprende preferiblemente un elemento que permite la integración del vector en el genoma de la célula hospedante o la replicación autónoma del vector en la célula independientemente del genoma. Cuando se produce la integración en el genoma de la célula hospedante, la integración de las secuencias en el genoma puede depender de la recombinación homóloga o no homóloga. Por un lado, el vector puede contener polinucleótidos adicionales para dirigir la integración mediante recombinación homóloga en una localización precisa en el genoma de la célula hospedante. Estos polinucleótidos adicionales pueden ser cualquier secuencia que sea homóloga con la secuencia diana en el genoma de la célula hospedante. Por otro lado, el vector puede ser integrado en el genoma de la célula hospedante por recombinación no homóloga.
Para la replicación autónoma, el vector puede comprender además un origen de replicación que permita al vector replicarse autónomamente en la célula hospedante en cuestión. El origen de la replicación puede ser cualquier replicador de plásmido que medie la replicación autónoma que funcione en una célula.
Los métodos para seleccionar estos elementos de acuerdo con la célula hospedante en la que se desea la expresión son bien conocidos por los expertos en la técnica. Los vectores se pueden construir mediante las técnicas clásicas de biología molecular, bien conocidas por un experto en la técnica.
El presente documento describe además el uso de un ácido nucleico, un casete de expresión o un vector de expresión como se describe en la presente memoria para transformar, transfectar o transducir una célula.
También describe el uso de un ácido nucleico, un casete de expresión o un vector de expresión como se describe en la presente memoria para conferir una capacidad de fermentar arabinosa en una célula hospedante recombinante. El presente documento describe también una célula hospedante, preferiblemente una célula hospedante recombinante, que comprende un ácido nucleico, un casete de expresión o un vector de expresión como se describe en la presente memoria.
Como se usa en la presente memoria, el término "célula hospedante recombinante" designa una célula que no se encuentra en la naturaleza y que contiene un genoma modificado como resultado de una deleción, inserción o modificación de elementos genéticos. En una realización particular, este término se refiere a una célula que comprende un "ácido nucleico recombinante", es decir, un ácido nucleico que ha sido modificado por ingeniería genética y no se encuentra como tal en la célula de tipo natural.
La célula hospedante recombinante comprende un ácido nucleico heterólogo, es decir, un ácido nucleico que no se encuentra naturalmente en dicha célula, en particular un ácido nucleico heterólogo que codifica un polipéptido como se describe en la presente memoria, o un casete o vector de expresión que comprende dicho ácido nucleico.
La célula hospedante se puede transformar, transfectar o transducir de forma transitoria o estable. Se introduce un casete o vector de expresión de la invención en una célula hospedante de modo que el casete o vector se mantenga como un integrante cromosómico o como un vector extracromosómico autorreplicante como se ha descrito anteriormente. El término "célula hospedante" también abarca cualquier progenie de una célula hospedante parental que no sea idéntica a la célula hospedante parental debido a mutaciones que se producen durante la replicación.
El ácido nucleico, casete de expresión o vector de expresión como se describe en la presente memoria se puede introducir en la célula hospedante por cualquier método conocido por el experto, tal como electroporación, conjugación, transducción, transformación de células competentes, transformación de protoplastos, fusión de protoplastos, transformación biolística por “pistola de genes”, transformación mediada por PEG, transformación o transfección asistida por lípidos, transfección mediada químicamente, transformación mediada por acetato de litio o transformación mediada por liposomas.
Opcionalmente, se puede insertar en la célula hospedante más de una copia de un ácido nucleico, casete o vector como se describe en la presente memoria para aumentar la producción del polipéptido.
La célula hospedante puede ser una célula procariota o eucariota.
La célula hospedante procariota puede ser cualquier bacteria gram-positiva o gram-negativa. Los ejemplos de hospedantes de expresión bacteriana adecuados incluyen, aunque sin limitación, Deinococcus y bacterias relacionadas, Escherichia (por ejemplo, Escherichia coli), Pseudomonas (por ejemplo. P. fluorescens o P. stutzerei), Proteus (por ejemplo Proteus mirabilis), Ralstonia (por ejemplo Ralstonia eutropha), Streptomyces, Staphylococcus (por ejemplo S. carnosus), Lactococcus (por ejemplo L. lactis) o Bacilo (subtilis, megaterium, licheniformis, etc.). La célula hospedante puede ser también una célula eucariota, tal como una célula de levadura, fúngica, de mamífero, de insecto o vegetal. Los ejemplos de hospedantes de expresión de levadura adecuados incluyen, aunque sin limitación, células de Saccharomyces (por ejemplo Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis), Schizosaccharomyces (por ejemplo Schizosaccharomyces pombe), Yarrowia (por ejemplo Yarrowia lipolytica), Hansenula (por ejemplo Hansenula polymorpha), Kluyveromyces (por ejemplo Kluyveromyces lactis), Pichia (por ejemplo Pichia pastoris) o Candida. Los ejemplos de hospedantes de expresión fúngicos adecuados incluyen, aunque sin limitación, Trichoderma, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium o Trametes. Preferiblemente, la célula hospedante es una bacteria, más preferiblemente una bacteria Deinococcus o bacteria relacionada.
En el contexto de la invención, el término "Deinococcus" incluye cepas variantes naturales o de tipo natural de Deinococcus, Por ejemplo, cepas obtenidas mediante evolución acelerada, por tecnologías de barajamiento de DNA, mutagénesis o cepas recombinantes obtenidas por inserción de ácido(s) nucleico(s) eucariota(s), procariota(s) y/o sintético(s), cepas modificadas genéticamente y/o químicamente por cualquier proceso conocido per se en la técnica o cualquier tecnología de ingeniería genética. Las bacterias Deinococcus pueden designar cualquier bacteria del género. Deinococcus, tales como sin limitación, bacterias D. geothermalis, D. cellulolysiticus, D. radiodurans, D. proteolyticus, D. radiopugnans, D. radiophilus, D. grandis, D. indicus, D. frigens, D. saxícola, D. maricopensis, D. marmoris, D. deserti, D. murrayi, D. aerius, D. aerolatus, D. aerophilus, D. aetherius, D. alpinitundrae, D. altitudinis, D. apachensis, D. aquaticus, D. aquatilis, D. aquiradiocola, D. aquivivus, D. caeni, D. claudionis, D. daejeonensis, D. depolymerans, D. ficus, D. gobiensis, D. hohokamensis, D. hopiensis, D. misasensis, D. navajonensis, D. papagonensis, D. peraridilitoris, D. pimensis, D. piscis, D. radiomollis, D. reticulitermitis, D. roseus, D. sonorensis, D. wulumuqiensis, D. xibeiensis, D. xinjiangensis, D. yavapaiensis, D. citri, D. guilhemensis, D. phoenicis, D. soli, D. humi, D. sahariens, D. mumbaiensis, o D. yunweiensis, o cualquiera de sus combinaciones. Preferiblemente, el término "Deinococcus” se refiere a D. geothermalis, D. cellulolysiticus, D. deserti, D. murrayi, D. maricopensis, D. aquatilis, D. gobiensis o D. radiodurans. Más preferiblemente, el término "Deinococcus" se refiere a D. geothermalis, D. cellulolysiticus, D. deserti, D. murrayi, D. maricopensis o D. radiodurans.
En realizaciones preferidas, la célula hospedante es una bacteria Deinococcus que no es capaz de asimilar o utilizar de forma natural la L-arabinosa, es decir, que no es capaz de asimilar o utilizar L-arabinosa antes de la introducción de un ácido nucleico, casete o vector de expresión como se describe en la presente memoria.
Como se usa en la presente memoria, el término "usar" o "asimilar" se refiere a la capacidad de un organismo para usar L-arabinosa como fuente de carbono o fuente de energía, en particular para producir un compuesto de interés. Como se usa en la presente memoria, el término "bacteria relacionada" se refiere a una bacteria "relacionada" con Deinococcus, es decir, una bacteria que: (i) contiene un rDNA de 16S que, tras la amplificación utilizando los cebadores GTTACCCGGAATCACTGGGCGTA (SEQ ID NO: 7) y GGTATCTACGCATTCCACCGCTA (SEQ ID NO: 8), genera un fragmento de aproximadamente 158 pares de bases y/o (ii) resiste un tratamiento con UV de 4 mJ/cm2. En una realización particular las bacterias relacionadas con Deinococcus son bacterias que tienen una molécula de rDNA de 16S que tiene una identidad de secuencia de al menos 70%, preferiblemente al menos 80% con una secuencia de rDNA de 16S de Deinococcus. En particular, el término "bacteria relacionada" se puede referir a una bacteria Deinobacterium, Truepera, Thermus, Meiothermus, Marinithermus, Oceanithermus, Vulcanithermus, Bacillus, Microbacterium, Cellulosimicrobium, Methylobacterium, Sphingobacterium, Pseudomonas, Caldimonas, Paenibacillus, Gordonia, Rhodococcus, Stenotrophomomas, Novosphingobium, Sphingomonas, Flavobacterium, Sphingobium, Sphingopysis, Tepidinomas, Exiguobacteríum, Nocardia, Arthrobacter, Kineococcus, Williamsia, Porphyrobacter, Geodermatophylus, Hymenobacter, Kineococcus, Kocuria, Methylobacterium, Halobacterium salinarum, Chroococcidiopsis, Pyrococcus abissis o Lactobacillus plantarum. Preferiblemente, este término se refiere a una bacteria que pertenece al filo de Deinococcus-Thermus, tal como las bacterias Deinobacterium, Truepera, Thermus, Meiothermus, Marinithermus, Oceanithermus o Vulcanithermus.
La célula hospedante como se describe en la presente memoria puede expresar:
(i) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1, (ii) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3, o
(iii) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
En un aspecto particular, la célula hospedante expresa un polipéptido de acuerdo con (i) y presenta además actividad de L-ribuloquinasa y/o actividad de L-ribulosa-5-fosfato-4-epimerasa, preferiblemente actividad de L-ribuloquinasa y actividad de L-ribulosa-5-fosfato-4-epimerasa.
En otro aspecto particular, la célula hospedante expresa un polipéptido de acuerdo con (ii) y presenta además actividad de L-arabinosa-isomerasa y/o actividad de L-ribulosa-5-fosfato-4-epimerasa, preferiblemente actividad de L-arabinosa-isomerasa y actividad de L-ribulosa-5-fosfato-4-epimerasa.
En un aspecto particular adicional, la célula hospedante expresa un polipéptido de acuerdo con (iii) y presenta además actividad de L-arabinosa-isomerasa y/o actividad de L-ribuloquinasa, preferiblemente actividad de L-arabinosa-isomerasa y actividad de L-ribuloquinasa.
En un aspecto, la célula hospedante expresa un polipéptido de acuerdo con (i) y un polipéptido de acuerdo con (ii). Preferiblemente, la célula hospedante presenta además actividad de L-ribulosa-5-fosfato-4-epimerasa.
En otro aspecto, la célula hospedante expresa un polipéptido de acuerdo con (i) y un polipéptido de acuerdo con (iii). Preferiblemente, la célula hospedante presenta además actividad de L-ribuloquinasa.
En otro aspecto, la célula hospedante expresa un polipéptido de acuerdo con (ii) y un polipéptido de acuerdo con (iii). Preferiblemente, la célula hospedante presenta además actividad de L-arabinosa-isomerasa.
En un aspecto preferido, la célula hospedante expresa un polipéptido de acuerdo con (i), un polipéptido de acuerdo con (ii) y un polipéptido de acuerdo con (iii).
En particular, la célula hospedante recombinante de la invención comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, o uno de sus fragmentos funcionales, una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, o uno de sus fragmentos funcionales; y/o una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, o uno de sus fragmentos funcionales.
Dichos ácidos nucleicos heterólogos pueden estar comprendidos en uno o varios casetes o vectores de expresión. En particular, la célula hospedante recombinante puede comprender:
un casete o vector de expresión que comprende un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-arabinosa-isomerasa, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1, y/o
un casete o vector de expresión que comprende un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribuloquinasa-isomerasa, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3, y/o
un casete o vector de expresión que comprende un ácido nucleico que codifica un polipéptido como se describe en la presente memoria y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
La célula hospedante puede expresar también una o varias enzimas adicionales útiles en la conversión de biomasa, tales como enzimas amilolíticas, celulolíticas o hemicelulolíticas. Estas enzimas adicionales pueden ser enzimas endógenas o heterólogas. Estas enzimas pueden ser, por ejemplo, amilasas, lacasas, glucosidasas, celulasas, xilanasas, pectinasas, esterasas, acetil-xilan-esterasas, ácido ferúlico-esterasa, p-cumaroil-esterasas, alfaarabinofuranosidasa, beta-galactosidasas, mananasas, manosidasas y/o glucuronidasa.
La célula hospedante puede expresar también enzimas endógenas o heterólogas implicadas en la producción de compuestos de interés por fermentación de azúcares monoméricos.
En una realización particular, la célula hospedante expresa una enzima endógena o heteróloga seleccionada de acetaldehído-deshidrogenasas, alcohol-deshidrogenasas (ADH) y/o piruvato-descarboxilasa (PDC). Preferiblemente, la célula hospedante es una bacteria Deinococcus capaz de producir etanol, es decir, que expresa alcoholdeshidrogenasas (ADH) endógenas o heterólogas y piruvato descarboxilasa (PDC). Por tanto, esta célula hospedante es particularmente útil para la producción de etanol a partir de un sustrato que contiene arabinosa. En otra realización particular, la célula hospedante es capaz de producir un compuesto isoprenoide, por ejemplo, expresa terpeno-sintasa endógena o heteróloga. Preferiblemente, dicha célula hospedante es una bacteria Deinococcus. Por tanto, esta célula hospedante es particularmente útil para la producción de un compuesto isoprenoide a partir de un sustrato que contiene arabinosa.
En un aspecto adicional, el presente documento describe también una bacteria Deinococcus recombinante o bacteria relacionada que comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que presenta actividad de L-arabinosa-isomerasa, un polipéptido que presenta actividad de L-ribuloquinasa y/o un polipéptido que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa.
La(s) secuencia(s) de ácidos nucleicos heteróloga(s) puede(n) estar presentes en las bacterias, o insertadas en el genoma de las bacterias, en una o varias copias.
En un aspecto particular, la bacteria recombinante es una bacteria Deinococcus seleccionada del grupo que consiste en D. geothermalis, D. cellulolysiticus, D. deserti, D. murrayi, D. aquatilis, D. gobiensis, D. maricopensis y D. radiodurans. En otro aspecto particular, la bacteria recombinante es una bacteria Deinococcus seleccionada del grupo que consiste en D. geothermalis, D. cellulolysiticus, D. deserti, D. murrayi, D. maricopensis y D. radiodurans. La(s) secuencia(s) de ácidos nucleicos se puede(n) seleccionar de cualquier secuencia de nucleótidos conocida por el experto y que codifica un polipéptido que presenta actividad de L-arabinosa-isomerasa, un polipéptido que presenta actividad de L-ribuloquinasa y/o un polipéptido que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa. Dichas secuencias se pueden obtener fácilmente de bases de datos comunes tales como GenBank o Uniprot.
En un aspecto, la bacteria recombinante comprende una secuencia de ácidos nucleicos heteróloga obtenida de una cepa de Deinococcus y que codifica un polipéptido que presenta actividad de L-arabinosa-isomerasa, un polipéptido que presenta actividad de L-ribuloquinasa y/o un polipéptido que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa.
En otro aspecto, la bacteria recombinante comprende una secuencia de ácidos nucleicos heteróloga, preferiblemente obtenida de una cepa de Deinococcus, y que codifica un polipéptido que presenta actividad de L-arabinosa-isomerasa, una secuencia de ácidos nucleicos heteróloga, preferiblemente obtenida de una cepa de Deinococcus, y que codifica un polipéptido que presenta actividad de L-ribuloquinasa, y/o una secuencia de ácidos nucleicos heteróloga, obtenida preferiblemente de una cepa de Deinococcus, y que codifica un polipéptido que presenta actividad de L-ribulosa-5-fosfato-4- epimerasa.
Más preferiblemente, la bacteria recombinante comprende una o varias construcciones de ácidos nucleicos, una o varios casetes de expresión y/o uno o varios vectores de expresión como se describe en la presente memoria, que codifican uno o varios polipéptidos como se describe en la presente memoria.
En particular, la bacteria recombinante de la invención comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, y una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato 4-epimerasa.
El presente documento describe además un extracto celular de una célula hospedante como se describe en la presente memoria.
Como se usa en la presente memoria, el término "extracto celular" se refiere a cualquier fracción obtenida de una célula hospedante, tal como un líquido sobrenadante celular, un residuo celular, paredes celulares, extracto de DNA, enzimas o preparación enzimática o cualquier preparación derivada de células hospedantes por tratamiento químico, físico y/o enzimático, que está esencialmente libre de células vivas.
El extracto celular puede comprender uno o varios polipéptidos como se describe en la presente memoria.
En particular, el extracto celular puede comprender:
(i) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1, (ii) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ. ID NO: 3, y/o
(iii) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos de 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
En un aspecto, el extracto celular comprende un polipéptido de acuerdo con (i) y un polipéptido de acuerdo con (ii). En otro aspecto, el extracto celular comprende un polipéptido de acuerdo con (i) y un polipéptido de acuerdo con (iii). En otro aspecto, el extracto celular comprende un polipéptido de acuerdo con (ii) y un polipéptido de acuerdo con (iii).
En un aspecto preferido, el extracto celular comprende un polipéptido de acuerdo con (i), un polipéptido de acuerdo con (ii) y un polipéptido de acuerdo con (iii).
En otro aspecto, el presente documento describe también un método para producir un polipéptido como se describe en la presente memoria, en el que el método comprende: (a) cultivar una célula hospedante que expresa dicho polipéptido, preferiblemente una célula hospedante recombinante de la invención, en condiciones propicias para la producción de dicho polipéptido; y (b) recuperar dicho polipéptido del cultivo celular; y (c) opcionalmente, purificar dicho polipéptido.
La célula hospedante que expresa un polipéptido como se describe en la presente memoria, preferiblemente una célula hospedante recombinante de la invención, se puede cultivar en un medio nutriente adecuado para la producción de polipéptidos usando métodos conocidos en la técnica. Por ejemplo, se pueden cultivar por cultivo en matraz agitado, o fermentación a pequeña o gran escala (incluidas fermentaciones continuas, por lotes, por lotes alimentados o en estado sólido) en fermentadores de laboratorio o industriales, realizadas en un medio adecuado y en condiciones que permiten que el polipéptido se exprese y/o se aísle. El cultivo tiene lugar en un medio nutriente adecuado que comprende fuentes de carbono y nitrógeno y sales inorgánicas, usando procedimientos conocidos en la técnica. Los medios adecuados están disponibles en proveedores comerciales o se pueden preparar de acuerdo con composiciones publicadas (por ejemplo, en catálogos de la American Type Culture Collection).
El polipéptido se puede detectar usando cualquier método conocido en la técnica. En particular, el polipéptido se puede detectar mediante cualquier ensayo descrito anteriormente para evaluar la actividad de L-arabinosaisomerasa, L-ribuloquinasa o L-ribulosa-fosfato-4-epimerasa, o, si la proteína es una proteína recombinante etiquetada, usando anticuerpos dirigidos contra esta etiqueta por métodos bien conocidos en la técnica.
El polipéptido se puede recuperar usando cualquier método conocido en la técnica. Si el polipéptido se secrega en el medio nutriente, se puede recuperar directamente del líquido sobrenadante del cultivo. Si el polipéptido no se secrega, se puede recuperar de los lisados celulares o después de la permeabilización. Por ejemplo, el polipéptido se puede recuperar del medio nutriente por procedimientos convencionales que incluyen, aunque sin limitación, recogida, centrifugación, filtración, extracción, secado por pulverización, evaporación o precipitación.
Opcionalmente, el polipéptido se puede purificar parcial o totalmente por una variedad de procedimientos conocidos en la técnica que incluyen, aunque sin limitación, cromatografía (por ejemplo, de intercambio iónico, de afinidad, hidrófoba, de cromatoenfoque y de exclusión por tamaños), procedimientos electroforéticos (por ejemplo, enfoque isoeléctrico preparatorio), solubilidad diferencial (por ejemplo, precipitación con sulfato de amonio), SDS-PAGE o extracción para obtener polipéptidos sustancialmente puros.
Alternativamente, el método puede comprender: (a) poner en contacto un ácido nucleico, casete de expresión o vector de expresión como se describe en la presente memoria con un sistema de expresión in vitro; y (b) recuperar el polipéptido; y (c) opcionalmente, purificar dicho polipéptido. Los sistemas de expresión in vitro son bien conocidos por los expertos en la técnica y están disponibles comercialmente.
En otro aspecto, el presente documento describe también un método para preparar un polipéptido como se describe en la presente memoria inmovilizado sobre un soporte sólido, que comprende producir el polipéptido como se detalla anteriormente e inmovilizar el polipéptido sobre un soporte sólido. El presente documento describe también un soporte sólido, estando inmovilizado un polipéptido, como se describe en la presente memoria sobre el soporte sólido. Los medios de inmovilización son bien conocidos por los expertos en la técnica (véase por ejemplo, ’Enzyme Technology' por Martin Chaplin and Christopher Bucke, Cambridge University Press, 1990). El polipéptido de acuerdo con la presente descripción se puede inmovilizar sobre el soporte sólido por cualquier medio conveniente, en particular adsorción, unión covalente, atrapamiento o confinamiento por membrana. Se puede usar una amplia variedad de materiales insolubles para inmovilizar el polipéptido. Estos son generalmente matrices inorgánicas o poliméricas inertes. El soporte sólido puede ser, por ejemplo, membranoso, en partículas o fibroso. Más particularmente, el soporte sólido es preferiblemente una perla, por ejemplo, micro- o nano-perlas. El polipéptido se puede inmovilizar sobre una matriz de poliuretano, sobre Sepharose activada, alginato, resina Amberlite, resina Sephadex o resina Duolite. Otros soportes sólidos útiles para la invención incluyen resinas con estructura de tipo acrílico, resinas de poliestireno, resinas macrorreticulares y resinas con grupos funcionales básicos. El polipéptido inmovilizado se puede usar luego en un reactor. Los ejemplos de reactor incluyen, aunque sin limitación, un reactor enzimático, un reactor de membrana, un reactor de flujo continuo, tal como un reactor de depósito agitado, un reactor de lecho empaquetado de operación continua, un reactor de lecho fluidizado de operación continua y un reactor de lecho empaquetado.
Por tanto, en un aspecto adicional, el presente documento describe una composición que comprende al menos un polipéptido como se describe en la presente memoria y como se ha definido anteriormente y al menos una enzima adicional.
La composición puede comprender:
(i) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1, (ii) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ. ID NO: 3, y/o
(iii) un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, o uno de sus fragmentos funcionales, preferiblemente un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
En un aspecto, la composición comprende un polipéptido de acuerdo con (i) y un polipéptido de acuerdo con (ii). En otro aspecto, la composición comprende un polipéptido de acuerdo con (i) y un polipéptido de acuerdo con (iii). En otro aspecto, la composición comprende un polipéptido de acuerdo con (ii) y un polipéptido de acuerdo con (iii). En un aspecto preferido, la composición comprende un polipéptido de acuerdo con (i), un polipéptido de acuerdo con (ii) y un polipéptido de acuerdo con (iii).
Preferiblemente, dicha al menos una enzima adicional es una enzima implicada en la conversión de biomasa y se puede seleccionar, por ejemplo, de enzimas amilolíticas, celulolíticas o hemicelulolíticas, tales como amilasas, lacasas, glucosidasas, celulasas, xilanasas, pectinasas, esterasas, acetil-xilan-esterasas, feruloil-esterasa, pcumaroil-esterasas, alfa-arabinofuranosidasa, beta-galactosidasas, manasas, manosidasas y/o glucuronidasas. La composición puede comprender además componentes adecuados para la conservación de enzimas, tales como estabilizadores como glicerol, sorbitol o monopropilenglicol, conservantes o agentes tamponantes. El polipéptido o polipéptidos de la invención puede(n) estar libres o inmovilizados en un soporte sólido. La composición puede ser líquida o seca. En una realización particular, la composición es líquida y comprende al menos 10, 20, 30, 40 o 50% (p/ v), preferiblemente entre 20 y 50% (p/v), de glicerol, sorbitol o monopropilenglicol, preferiblemente glicerol.
El presente documento describe también una composición que comprende una célula hospedante recombinante de la invención. La composición puede ser líquida (por ejemplo, suspensión) o seca (por ejemplo, composición liofilizada). Preferiblemente, la composición que comprende la célula hospedante se mantiene congelada (por ejemplo, a aproximadamente -20°C) hasta su uso. Preferiblemente, la composición comprende además componentes adecuados para la conservación celular, en particular si las células están congeladas. La composición como se describe en la presente memoria puede comprender una o varias células hospedantes de la invención y, opcionalmente, una o varias células adicionales.
El presente documento describe también una composición cosmética que comprende una célula hospedante recombinante de la invención y/o uno de sus extractos celulares. Describe además el uso de una célula hospedante recombinante de la invención y/o uno de sus extractos celulares, para preparar una composición cosmética. En el contexto de la presente descripción, las composiciones cosméticas o productos de belleza se refieren a composiciones adecuadas para su aplicación en al menos una parte del cuerpo, para efectos cosméticos. Las composiciones cosméticas de la presente descripción pueden incluir, aunque sin limitación, lociones, tales como loción para el cabello y loción para después del afeitado, cremas para la piel, como crema de día, cremas antiarrugas y cremas hidratantes, o maquillaje, como lápiz labial, etc. La composición cosmética de la presente descripción puede contener además uno o más vehículos o diluyentes cosméticamente aceptables y/o uno o más ingredientes activos adicionales.
El presente documento describe también un pienso o composición alimentaria, un aditivo alimentario o un suplemento dietético, que comprende, o consiste en, una célula hospedante recombinante de la invención y/o uno de sus extractos celulares. También describe el uso de una célula hospedante recombinante de la invención y/o uno de sus extractos celulares, para preparar un pienso o composición alimentaria, un aditivo alimentario o un suplemento dietético. Los métodos para producir dicha composición, aditivo o suplemento son bien conocidos por los expertos en la técnica, véase por ejemplo el documento WO 2013/092645. El aditivo alimentario (es decir, un aditivo que modifica las propiedades (por ejemplo, nutricionales, digestibilidad, palatabilidad) de un alimento) se puede añadir a un alimento antes, durante o después de la preparación de dicho alimento. En un aspecto particular, la composición, aditivo o suplemento comprende una célula hospedante recombinante de la invención y/o uno de sus extractos celulares, y una biomasa celulósica, preferiblemente una biomasa celulósica que contiene arabinosa. Dicha biomasa puede estar cruda o pretratada.
El presente documento también describe una composición que comprende al menos un polipéptido como se describe en la presente memoria o una célula hospedante recombinante de la invención y un sustrato que contiene arabinosa como se describe a continuación.
En un aspecto adicional, la presente invención se refiere a un método para producir un producto de fermentación que comprende poner en contacto un sustrato, preferiblemente biomasa celulósica, con una célula hospedante recombinante de la invención y, opcionalmente, recuperar la producción de fermentación.
El sustrato es un sustrato que contiene arabinosa, más preferiblemente una biomasa celulósica que contiene arabinosa.
Como se usa en la presente memoria, el término "biomasa celulósica" se refiere a cualquier material de biomasa, preferiblemente biomasa vegetal, que comprende celulosa, hemicelulosa y/o lignocelulosa, preferiblemente que comprende celulosa y hemicelulosa. La biomasa celulósica incluye, aunque sin limitación, pectinas y productos hemicelulósicos (tal como xilano) que contienen mezclas de hexosas y pentosas (por ejemplo, xilosa, arabinosa), material vegetal, tales como productos forestales, materias primas leñosas (maderas blandas y duras), desechos agrícolas o subproductos agrícolas y residuos vegetales o sus hidrolizados (tales como rastrojo de maíz, mazorca de maíz, cáscara de maíz, fibra de maíz, avena, sorgo, bagazo de caña de azúcar, pastos, paja de arroz, paja de trigo, racimo vacío de frutas de palma aceitera y palmera datilera, bagazo de agave, de la industria del tequila), gramíneas perennes (pasto varilla, miscanto, alpiste, erianto, pasto napier, carrizo gigante y alfalfa); residuos sólidos urbanos (RSU), productos acuáticos, tales como algas y algas marinas, papel de desecho, cuero, algodón, cáñamo, productos de caucho natural, subproductos de la industria papelera y de pasta papelera, tales como lejía residual e hidrolizados de madera, remolacha azucarera y subproductos del procesamiento de alimentos.
Preferiblemente, si la biomasa celulósica comprende lignocelulosa, esta biomasa se pretrata antes de su uso en el método de la invención. Este pretratamiento está destinado a abrir los haces de lignocelulosas para acceder a las cadenas poliméricas de celulosa y hemicelulosa. Los métodos de pretratamiento son muy conocidos por los expertos y pueden incluir pretratamientos físicos (por ejemplo, tratamiento con vapor de agua a alta presión, extrusión, pirólisis o irradiación), pretratamientos fisicoquímicos y químicos (por ejemplo, explosión de fibra de amoniaco, tratamientos con agentes alcalinos, ácidos, disolventes u oxidantes) y/o pretratamientos biológicos
La arabinosa puede estar contenida en el sustrato como arabinosa monomérica o polimérica, o como un constituyente de heteropolisacáridos que contienen típicamente galactosa, ramnosa, manosa, glucosa, ácido galacturónico, ácido glucurónico, ácido 4-o-metilglucurónico, xilosa y/o ácido ferúlico.
En una realización preferida, el sustrato es un sustrato rico en arabinosa, preferiblemente una biomasa rica en arabinosa y más preferiblemente una biomasa celulósica rica en arabinosa. El sustrato rico en arabinosa puede ser también un polímero rico en arabinosa.
Como se usa en la presente memoria, el término "polímero rico en arabinosa" se refiere a un polímero que comprende al menos 10% de arabinosa, preferiblemente 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de arabinosa.
Los ejemplos de dichos polímeros incluyen, aunque sin limitación, arabinanos, pectina-arabinanos, arabinogalactanos y arabinoxilanos.
Como se usa en la presente memoria, el término "sustrato rico en arabinosa" se refiere a un sustrato que comprende al menos 10% de arabinosa, preferiblemente 20, 30, 40, 50, 60, 70, 80, 90, 95, 99 o 100% de arabinosa. El sustrato puede ser un sustrato sólido o líquido, un sustrato parcial o totalmente purificado o un sustrato crudo. Como se usa en la presente memoria, el término "biomasa rica en arabinosa" se refiere a una biomasa, preferiblemente una biomasa celulósica, que comprende al menos 10% de arabinosa, preferiblemente 20, 30, 40, 50 o 60% de arabinosa. Preferiblemente, el porcentaje de arabinosa se refiere al porcentaje de materia seca, es decir, el término "10%'' se refiere a 10 g de arabinosa por 100 g de materia seca.
Ejemplos de biomasas celulósicas ricas en arabinosa incluyen, aunque sin limitación, gomas exudadas de algunos árboles y arbustos tropicales como goma arábiga, goma tragacanto y goma ghatti, compuestos de pectina como remolacha azucarera, raíz de achicoria, pectina cítrica y pectina de manzana, algas, el arabano de frutos cítricos, arabinogalactano del alerce, así como corteza de maderas dura, tal como corteza de haya o abedul, paja o vainas de cereales, cáscara de maíz, mazorcas de maíz, fibras de maíz y bagazo.
Esta biomasa puede estar cruda o pretratada antes de ser utilizada en el método de la invención.
La fermentación es un proceso metabólico realizado por un microorganismo en el que los azúcares monoméricos se convierten en un producto de interés, preferiblemente un producto de interés industrial. Esta vía metabólica puede estar codificada naturalmente por el microorganismo, o dicho microorganismo puede haber sido modificado genéticamente para llevar a cabo dicha vía.
Los ejemplos de productos de fermentación de interés incluyen, aunque sin limitación, biocombustible. tal como etanol, butanol, propanol, glicerol-metanol, isopropanol, propanodiol, glicerol o 2-3-butanodiol, ácidos orgánicos, tales como formiato, acetato, lactato, butirato, gluconato, xilonato, citrato, succinato, propionato, fumarato, malato, piruvato, ácido itacónico, ácido mucónico y ácido kójico, y sus sales o ésteres, compuestos isoprenoides, tales como geraniol, carotenoides, fármacos o compuestos farmacéuticos, tales como antibióticos, compuestos bacteriostáticos, antimetabolitos, compuestos quimioterapéuticos, agentes antiparasitarios, agentes antifúngicos, compuestos antivirales, compuestos con actividad de citoquinas, antioxidantes o factores de crecimiento celular. El producto de fermentación puede ser también un compuesto cosmético o nutriente. Los ejemplos de compuestos cosméticos incluyen, aunque sin limitación, antioxidantes y carotenoides. Los ejemplos de compuestos nutrientes incluyen, aunque sin limitación, vitaminas, aminoácidos y ácidos grasos. Preferiblemente, el producto de fermentación es un biocombustible, más preferiblemente etanol o un compuesto isoprenoide, más preferiblemente un compuesto carotenoide. En una realización particular, el producto de fermentación es geraniol.
Dependiendo de las condiciones, la biomasa o el sustrato se puede poner en contacto con una célula hospedante recombinante de la invención, sola o en combinación con otras enzimas o células. Debe entenderse que las cantidades precisas de polipéptido o célula hospedante utilizada inicialmente para transformar eficazmente la biomasa o el sustrato pueden ser ajustadas por el experto en la técnica dependiendo del tipo de células, el tipo de biomasa o sustrato y las condiciones de cultivo.
En una realización particular, el método de la invención se realiza en un reactor de conversión de biomasa. Por "reactor" se entiende un depósito de fermentación convencional o cualquier aparato o sistema para la conversión de biomasa, típicamente seleccionado entre biorreactores, biofiltros, contactores biológicos rotatorios y otros biorreactores de fase gaseosa y/o líquida. El aparato que se puede usar de acuerdo con la invención se puede usar de forma continua o por cargas de lotes. Dependiendo de las células usadas, el método se puede realizar bajo aerobiosis, anaerobiosis o microaerobiosis.
En los siguientes ejemplos se describen aspectos y ventajas adicionales de la presente invención, que deben considerarse ilustrativos y no limitativos.
Ejemplos
Los inventores identificaron un nuevo operón de la vía de la L-arabinosa de Deinococcus roseus que codifica L-ribuloquinasa (AraB), L-ribulosa-5-fosfato-4-epimerasa (AraD) y L-arabinosa-isomerasa (AraA). Mostraron que la introducción y expresión de este operón en la cepa de Deinococcus confiere la capacidad de utilizar L-arabinosa como única fuente de carbono. Además, mostraron que la introducción y expresión de este operón en una cepa etanologénica de Deinococcus confiere la capacidad de producir etanol a partir de L-arabinosa como única fuente de carbono. Además, mostraron que la introducción de este operón de la vía de la L-arabinosa en una cepa de Deinococcus que expresa la geraniol-sintasa de Ocimum basilicum, permite a dicha bacteria producir geraniol a partir de L-arabinosa como fuente de carbono. Además, mostraron que la cepa de Deinococcus recombinante que contiene el operón de arabinosa es capaz de coasimilar eficazmente arabinosa, glucosa y/o xilosa sin diauxia.
Materiales y métodos
Cepas de Deinococcus
Deinococcus roseus se obtuvo de la colección de DSMZ con la siguiente referencia DSM-22367.
La cepa de Deinococcus geothermalis usada en los ejemplos 1 a 3 es una cepa recombinante productora de etanol que comprende un ácido nucleico que codifica una piruvato-descarboxilasa (PDC) y una alcohol-deshidrogenasa (ADH) de Zymomonas mobilis. Esta cepa se obtuvo como se describe en la solicitud de patente internacional WO 2010/130806.
La cepa de Deinococcus geothermalis utilizada en el ejemplo 4 es una cepa recombinante que comprende un ácido nucleico que codifica una geraniol-sintasa (GES) de Ocimum basilicum. El cDNA de GES se insertó en el cromosoma en sustitución del gen de fosfotransacetilasa (pta). La expresión del gen está bajo el control de un promotor constitutivo. Para aumentar la producción de isoprenoides, esta cepa se modificó por ingeniería genética para que expresara también una farnesil-pirofosfato-sintasa mutante (K170G) y para que sobreexpresara los genes DXS e IDI de la vía de MEP. Esta cepa se obtuvo como se describe en la solicitud de patente internacional WO 2015/189428.
El DNA genómico se preparó utilizando el kit Dneasy & Blood de QIAGEN según lo indicado por el fabricante.
El operón de arabinosa de D. roseus que codifica L-ribuloquinasa (AraB), L-ribulosa-5-fosfato-4-epimerasa (AraD) y L-arabinosa-isomerasa (AraA) se amplificó y ensambló con un promotor constitutivo por PCR solapante.
La inserción de fragmentos de DNA en el cromosoma de Deinococcus geothermalis se realizó utilizando un mecanismo de recombinación homóloga. Los casetes de inserción comprendían una secuencia de ácidos nucleicos para ser insertada en el cromosoma, flanqueada por una región de 500 pb homóloga a la secuencia en dirección 5’ o en dirección 3’ de la diana cromosómica.
Para la expresión de genes heterólogos se utilizaron promotores constitutivos fuertes tales como los promotores PtufA y PtufB de los genes Tu de los factores de alargamiento de la traducción tufA (DR0309) y tufB (DR2050), o la región promotora PgroESL del operón groESL (Lecointe et al., 2004; Meima et al., 2001).
El casete de expresión que contiene el operón de arabinosa de D. roseus DSM-22367 con el gen que codifica la L-ribuloquinasa (araB, SEQ ID NO: 4), el gen que codifica la L-ribulosa-5-fosfato-4-epimerasa (araD, SEQ ID NO: 6) y el gen que codifica la L-arabinosa-isomerasa (araA, SEQ ID NO: 2) y un casete de resistencia a la eritromicina, se insertaron en el cromosoma de las cepas de Deinococcus geothermalis productoras de etanol y productoras de geraniol descritas anteriormente interrumpiendo el gen ldh que codifica la lactato-deshidrogenasa.
Resultados
Ejemplo 1: Asimilación de L-arabinosa y producción de etanol
El operón de arabinosa de Deinococcus roseus que codifica L-ribuloquinasa (AraB), L-ribulosa-5-fosfato-4-epimerasa (AraD) y L-arabinosa-isomerasa (AraA) se insertó en el cromosoma de Deinococcus geothermalis productor de etanol, interrumpiendo el gen de lactato-deshidrogenasa (ldh) como se ha descrito anteriormente.
Los cultivos de cepas productoras de etanol que comprenden o no el operón de L-arabinosa de D. roseus se realizaron a 48°C y 250 rpm durante 48 horas. Estos cultivos se utilizaron para inocular, a una densidad óptica inicial a 600 nm (DO600) de 0,4, 25 mL de un medio definido que contenía L-arabinosa como única fuente de carbono. La composición de este medio definido fue: (NH4)2SO4 100 mM; NaH2PO4.H2O 10 mM; KCl 10 mM; Na2SO4 10 mM; citrato 30 mM; MgCl2.6H2O 10 mM; CaCl2.2H2O 10 mM; ZnCl250 mg/L; FeSO4.7H2O 50 mg/L; MnCl2.4H2O 50 mg/L; CuSO450 mg/L; CoCl2.6H2O 50 mg/L; H3BO35 mg/L; MES 200 mM; (NH4)6Mo7O24.4H2O 0,5 mM; arabinosa 30 g/L (200 mM).
Después de 48 horas de cultivo, se observó crecimiento solo para la cepa recombinante que contenía el operón de asimilación de L-arabinosa (ara+) insertado en su cromosoma (Figura 2). El consumo de L-arabinosa se siguió durante el crecimiento y mostró que el 66% de la L-arabinosa total se consumió después de 70 horas de crecimiento (Figura 3).
La producción de etanol también se midió durante el crecimiento. La producción de etanol se observó solo para la cepa recombinante que contenía el operón de asimilación de la L-arabinosa insertado en su cromosoma (Figura 4). Estos datos demostraron claramente que el operón de asimilación de la L-arabinosa de D. roseus identificado por los inventores codifica enzimas activas y es suficiente para permitir que una cepa de Deinococcus productora de etanol crezca y produzca etanol a partir de L-arabinosa.
Ejemplo 2: Coasimilación de glucosa y arabinosa
Los cultivos de la cepa de D. geothermalis productora de etanol que comprende la vía de asimilación de la L-arabinosa de D. roseus se realizaron a 48°C y 250 rpm a una densidad óptica inicial a 600 nm (DO600) de 0,4 y en un medio definido mineral que contenía L-arabinosa y glucosa como fuentes de carbono. La composición del medio fue: (NH4)2SO4 100 mM; NaH2PO4.H2O 10 mM; KCl 10 mM; Na2SO410 mM; ácido cítrico 30 mM; MgCl2.6H2O 10 mM; CaCl2.2H2O 10 mM; ZnCÍ250 mg/L; FeSO4.7 H2O 50 mg/L; MnCMhbO 50 mg/L; CuSO450 mg/L; C0CI2.6H2O 50 mg/L; H3BO35 mg/L; MES 200 mM; (NH4)6Mo7O24.4H2O 0,5 mM; arabinosa 15 g/L (100 mM), glucosa 15 g/L (83 mM).
Siguiendo el crecimiento y la concentración de glucosa y arabinosa en el medio, los inventores mostraron que la cepa de D. geothermalis recombinante es capaz de coasimilar glucosa y arabinosa (Figura 5) y producir etanol al mismo tiempo (Figura 6).
Ejemplo 3: Coasimilación de glucosa, xilosa y arabinosa
Los cultivos de la cepa de D. geothermalis productora de etanol que comprende la vía de asimilación de la L-arabinosa de D. roseus se realizaron a 48°C y 250 rpm durante 48 horas desde la fase logarítmica de crecimiento y se inocularon en 25 mL de un medio técnico obtenido después de un pretratamiento con ácido diluido seguido de una hidrólisis enzimática del sustrato de rastrojo de maíz. Este medio comprendía glucosa (50%), xilosa (25%) y arabinosa (25%). Se usaron tres concentraciones diferentes de este medio técnico: 10% (glucosa 18 mM, xilosa 11 mM, arabinosa 12 mM), 20% (glucosa 35 mM, xilosa 21 mM, arabinosa 25 mM) y 30% (glucosa 42 mM, xilosa 33 mM, arabinosa 35 mM).
Siguiendo el crecimiento y la concentración de glucosa, xilosa y arabinosa en el medio, los inventores mostraron que la cepa de D. geothermalis recombinante es capaz de coasimilar glucosa, xilosa y arabinosa (Figuras 7 a 9).
Ejemplo 4: Asimilación de L-arabinosa y producción de geraniol
El operón de arabinosa de Deinococcus roseus que codifica la L-ribuloquinasa (AraB), L-ribulosa-5-fosfato-4-epimerasa (AraD) y L-arabinosa-isomerasa (AraA) se insertó en el cromosoma de Deinococcus geothermalis productor de geraniol, interrumpiendo el gen de lactato-deshidrogenasa (Idh) como se ha descrito anteriormente. Para realizar cultivos de semillas, se seleccionaron colonias individuales para inocular 25 mL de medio CMA2% (peptona 2 g/L; extracto de levadura 5 g/L; glucosa 55 mM (20 g/L); ácido MOPS 40 mM; NH4Cl 20 mM; NaOH 10 mM; KOH 10 mM; CaCl2.2H2O 0,5 gM; Na2SO4.10H2O 0,276 mM; MgCl2.6H2O 0,528 mM; (NH4)6(Mo7)O24.4H2O 3 nM; H3BO30,4 gM; CoCÍ2.6H2O 30 nM; CuSO4.5H2O 10 nM; MnCl20,25 gM; ZnSO4.7H2O 10 nM; D-biotina 1 gg/L; niacina (ácido nicotínico) 1 gg/L; vitamina B61 gg/L; vitamina B1; FeCh 20 gM; citrato sódico.2H2O 20 gM; K2HPO4 5.7 mM) que contenía 2% de arabinosa como fuente principal de carbono, y se cultivaron a 37°C y 250 rpm durante una noche. A continuación, se inoculó la semilla de la fase logarítmica de crecimiento en 25 mL del mismo medio recién preparado a una densidad óptica inicial a 600 nm (DO600) de 0,4. Este segundo cultivo de siembra se cultivó a 37°C y 250 rpm durante una noche. Los cultivos para la producción de geraniol se realizaron a 37°C y 250 rpm durante 48 horas desde la fase logarítmica de crecimiento inoculados en 25 mL de medio definido mineral (NH4)2SO4 < 100 mM; NaH2PO4.H2O < 10 mM; KCl < 10 mM; Na2SO4 < 10 mM; ácido cítrico < 30 mM; MgCl2.6H2O < 10 mM; CaCl2.2H2O < 10 mM; ZnCl2 < 50 mg/L; FeSO4.7 H2O < 50 mg/L; MnCl2.4 H2O < 50 mg/L; CuSO4 < 50 mg/L; CoCÍ2.6H2O < 50 mg/L; H3BO3 < 5 mg/L; MES < 200 mM; (NH4)6Mo7O24.4H2O < 0,5 mM; arabinosa 20 g/L a una densidad óptica inicial a 600 nm (DO600) de 0,4.
Después de 48 horas de cultivo, se observó crecimiento solo para la cepa recombinante que contenía el operón de asimilación de la L-arabinosa (ara+) insertado en su cromosoma. La cepa recombinante produjo aproximadamente 2.8 mg de geraniol/g de arabinosa o aproximadamente 15 mg/L de geraniol después de 48 horas de cultivo.
Estos resultados mostraron que el operón de asimilación de la L-arabinosa de D. roseus identificado por los inventores permite que una cepa productora de geraniol crezca y produzca geraniol a partir de L-arabinosa.

Claims (10)

REIVINDICACIONES
1. Una célula hospedante recombinante que comprende:
una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, y
una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 72% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, y
una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 73% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa.
2. La célula hospedante recombinante de acuerdo con la reivindicación 1, en donde dicha célula hospedante recombinante comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 75, 80, 90, 95, 98, 99% con la SEQ ID NO: 5 y que presenta actividad de L-ribulosa-5-fosfato-4-epimerasa, preferiblemente comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
3. La célula hospedante recombinante de acuerdo con la reivindicación 1 o 2, en donde dicha célula hospedante recombinante comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 75, 80, 90, 95, 98, 99% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa, preferiblemente comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1.
4. La célula hospedante recombinante de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en donde dicha célula hospedante recombinante comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende una secuencia de aminoácidos que tiene una identidad de al menos 75, 80, 90, 95, 98, 99% con la SEQ ID NO: 3 y que presenta actividad de L-ribuloquinasa, preferiblemente comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3.
5. La célula hospedante recombinante de acuerdo con una cualquiera de las reivindicaciones 1 a 4, en donde dicha célula hospedante recombinante comprende una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 1, una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 3 y una secuencia de ácidos nucleicos heteróloga que codifica un polipéptido que comprende, o consiste en, la secuencia de aminoácidos de la SEQ ID NO: 5.
6. La célula hospedante recombinante de acuerdo con una cualquiera de las reivindicaciones 1 a 5, en donde la célula hospedante es una bacteria Deinococcus, preferiblemente una bacteria Deinococcus seleccionada del grupo que consiste en D. geothermalis, D. aquatilis, D. gobiensis, D. cellulolysiticus, D. deserti, D. murrayi, D. maricopensis y D. radiodurans, más preferiblemente una bacteria Deinococcus productora de etanol o un compuesto isoprenoide.
7. Un polipéptido aislado que comprende una secuencia de aminoácidos que tiene una identidad de al menos un 90% con la SEQ ID NO: 1 y que presenta actividad de L-arabinosa-isomerasa.
8. Una construcción, casete o vector de expresión de ácidos nucleicos recombinantes, que comprende una secuencia de ácidos nucleicos que codifica un polipéptido de acuerdo con la reivindicación 7.
9. Un método para producir un polipéptido de acuerdo con la reivindicación 7, que comprende:
(a) cultivar una célula hospedante de acuerdo con una cualquiera de las reivindicaciones 1 a 6 que expresa dicho polipéptido; y
(b) recuperar dicho polipéptido del cultivo celular; y
(c) opcionalmente, purificar dicho polipéptido.
10. Un método para producir un producto de fermentación que comprende poner en contacto un sustrato que contiene arabinosa, preferiblemente una biomasa celulósica que contiene arabinosa, con una célula hospedante recombinante de una cualquiera de las reivindicaciones 1 a 6 y 9, y opcionalmente recuperar el producto de fermentación, siendo preferiblemente dicho producto de fermentación biocombustible, tal como etanol, butanol, propanol, glicerol-metanol, isopropanol, propanodiol, glicerol o 2-3-butanodiol, un ácido orgánico, tal como formiato, acetato, lactato, butirato, gluconato, xilonato, citrato, succinato, propionato, fumarato, malato, piruvato, ácido itacónico, ácido mucónico y ácido kójico, y sus sales o ésteres, un compuesto isoprenoide, tal como geraniol, carotenoides, fármaco o un compuesto farmacéutico, tal como antibióticos, compuestos bacteriostáticos, antimetabolitos, compuestos quimioterapéuticos, agentes antiparasitarios, antioxidantes, agentes antifúngicos, compuestos antivirales, compuestos con actividad de citoquinas o factores de crecimiento celular.
ES16704629T 2015-02-16 2016-02-15 Vía de asimilación de la L-arabinosa y sus usos Active ES2843632T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP15305232 2015-02-16
PCT/EP2016/053201 WO2016131788A1 (en) 2015-02-16 2016-02-15 L-arabinose assimilation pathway and uses thereof

Publications (1)

Publication Number Publication Date
ES2843632T3 true ES2843632T3 (es) 2021-07-19

Family

ID=52596439

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16704629T Active ES2843632T3 (es) 2015-02-16 2016-02-15 Vía de asimilación de la L-arabinosa y sus usos

Country Status (5)

Country Link
US (1) US10392623B2 (es)
EP (1) EP3259359B1 (es)
DK (1) DK3259359T3 (es)
ES (1) ES2843632T3 (es)
WO (1) WO2016131788A1 (es)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001023526A1 (en) 1999-09-27 2001-04-05 The Henry M. Jackson Foundation Engineered radiation resistant bioremediating bacteria
SE0202090D0 (sv) 2002-05-08 2002-07-04 Forskarpatent I Syd Ab A modifierd yeast consuming L-arabinose
EP2171038A2 (en) * 2007-07-19 2010-04-07 Royal Nedalco B.V. Novel arabinose-fermenting eukaryotic cells
FR2923491B1 (fr) 2007-11-14 2012-12-14 Deinove Sa Utilisation de bacteries pour la production de sources de bioenergie
EP2251415A1 (en) 2009-05-14 2010-11-17 Deinove Recombinant bacteria and the uses thereof for producing ethanol
CA2858765C (en) 2011-12-19 2020-01-14 Deinove Ingredients for animal feed compositions
CA2858771A1 (en) 2011-12-23 2013-06-27 Deinove Bacteria with reconstructed transcriptional units and the uses thereof
ES2728317T3 (es) 2013-12-20 2019-10-23 Deinove Sa Sistema dirigido a IS para la inserción génica e ingeniería genética en bacterias Deinococcus
US10900060B2 (en) 2014-06-13 2021-01-26 Deinove Method of producing terpenes or terpenoids

Also Published As

Publication number Publication date
EP3259359A1 (en) 2017-12-27
EP3259359B1 (en) 2020-11-18
WO2016131788A1 (en) 2016-08-25
US20180016586A1 (en) 2018-01-18
US10392623B2 (en) 2019-08-27
DK3259359T3 (da) 2021-01-18

Similar Documents

Publication Publication Date Title
Kirsch et al. Salt-regulated accumulation of the compatible solutes sucrose and glucosylglycerol in cyanobacteria and its biotechnological potential
Zhang et al. One-step production of lactate from cellulose as the sole carbon source without any other organic nutrient by recombinant cellulolytic Bacillus subtilis
Wang et al. Evolution of D-lactate dehydrogenase activity from glycerol dehydrogenase and its utility for D-lactate production from lignocellulose
JP5961886B2 (ja) ペントースおよびグルコース発酵酵母細胞
US20110183382A1 (en) Methods and compositions for producing chemical products from c. phytofermentans
WO2009013159A2 (en) Acetyl-coa producing enzymes in yeast
WO2011044279A2 (en) Microbial systems for producing commodity chemicals
Anusree et al. Co-expression of endoglucanase and β-glucosidase in Corynebacterium glutamicum DM1729 towards direct lysine fermentation from cellulose
Lee et al. Fermentation of rice bran and defatted rice bran for butanol production using Clostridium beijerinckii NCIMB 8052
CN101918539A (zh) 包含发酵基因卡盒的自养生物进行光驱动的co2还原生成有机化合物以用作燃料或用作工业半成品
CN102300988A (zh) 表达木糖异构酶的微生物
WO2012068310A2 (en) Compositions and methods for improved saccharification of genetically modified plant-derived biomass
CA2780974C (en) Mutli-cellulase enzyme compositions for hydrolysis of cellulosic biomass
WO2014109360A1 (ja) 高効率な異種タンパク質の製造方法
CN108603179A (zh) 发酵产物生产增加的真核细胞
KR101832431B1 (ko) 산으로 전처리한 바이오매스를 이용한 부탄올 발효
ES2843632T3 (es) Vía de asimilación de la L-arabinosa y sus usos
WO2011133984A2 (en) New bacterium for production of chemicals and recombinants thereof
JP2015502168A (ja) 再構成された転写ユニットを有する細菌及びその使用
EP3262164B1 (en) Hemicellulose-degrading compositions and uses thereof
BR112020004921A2 (pt) cepa consumidora de ácido acético
US20170268023A1 (en) Method of producing alcohol
JP7163659B2 (ja) グルカル酸生産能を有する高耐酸性微生物、及びそれを用いたグルカル酸の製造方法
ES2607894T3 (es) Enzimas productoras de acetil-CoA en levadura
El-Bakary et al. Identification of Endoglucanase Gene Responsible for Cellulose Degradation Using Aspergillus flavus