MX2013007288A - Microorganismos deseñados geneticamente que comprenden 4-hidroxibenzoil-coa tioesterasas y metodos de uso de los mismos para producir acidos grasos libes y derivados de acidos grasos. - Google Patents

Microorganismos deseñados geneticamente que comprenden 4-hidroxibenzoil-coa tioesterasas y metodos de uso de los mismos para producir acidos grasos libes y derivados de acidos grasos.

Info

Publication number
MX2013007288A
MX2013007288A MX2013007288A MX2013007288A MX2013007288A MX 2013007288 A MX2013007288 A MX 2013007288A MX 2013007288 A MX2013007288 A MX 2013007288A MX 2013007288 A MX2013007288 A MX 2013007288A MX 2013007288 A MX2013007288 A MX 2013007288A
Authority
MX
Mexico
Prior art keywords
microorganism
further characterized
hydroxybenzoyl
nucleic acid
fatty acid
Prior art date
Application number
MX2013007288A
Other languages
English (en)
Other versions
MX336787B (es
Inventor
Toby Richardson
Robert Christopher Brown
Rekha Seshadri
Carlos Chavez-Torres
Weidong Xu
Original Assignee
Exxonmobil Res & Eng Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Exxonmobil Res & Eng Co filed Critical Exxonmobil Res & Eng Co
Publication of MX2013007288A publication Critical patent/MX2013007288A/es
Publication of MX336787B publication Critical patent/MX336787B/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • C12Y301/020234-Hydroxybenzoyl-CoA thioesterase (3.1.2.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6418Fatty acids by hydrolysis of fatty acid esters
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/582Recycling of unreacted starting or intermediate materials

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

La invención descrita proporciona microorganismos genéticamente diseñados, incluyendo microorganismos fotosintéticos, que expresan 4-hidroxibenzoil-CoA tioesterasas y métodos de uso de los microorganismos genéticamente diseñados para producir ácidos grasos libres y/o derivados de ácido graso.

Description

MICROORGANISMOS DISEÑADOS GENÉTICAMENTE QUE COMPRENDEN 4-HIDROXIBENZOIL-COA TIOESTERASAS Y MÉTODOS DE USO DE LOS MISMOS PARA PRODUCIR ÁCIDOS GRASOS LIBRES Y DERIVADOS DE ÁCIDOS GRASOS REFERENCIA CRUZADA Esta solicitud reclama el beneficio de prioridad de la solicitud norteamericana 61/426,568 del mismo título presentada el 23 de diciembre de 2010, la cual se incorpora por la presente como referencia en su totalidad.
REFERENCIA A UN LISTADO DE SECUENCIA Esta solicitud contiene referencias a secuencias de aminoácido y/o secuencias de ácidos nucleicos que han sido sometidas al mismo tiempo con la presente como el archivo de texto del listado de secuencias titulado "2010EM383 (PM0010) secuencias.TXT", tamaño de archivo 71.1 Kilobitios (KB), creado el 12 de diciembre de 201 1. El listado de secuencias antes mencionado se incorpora por la presente como referencia en su totalidad con base a 37 C. F. R. §1.52(e)(5).
CAMPO TÉCNICO La invención se relaciona a composiciones y métodos para producir ácidos grasos libres y derivados de ácidos grasos en microorganismos, incluyendo microorganismos fotosintéticos tales como cianobacterias y microalgas.
ANTECEDENTES DE LA INVENCIÓN Combustibles biológicos Los combustibles biológicos representan fuentes renovables de energía de organismos vivos, tales como plantas superiores, hongos, o bacterias. Las formas fotosintéticas de vida captan energía de luz y subsiguientemente la convierten en energía libre de compuestos orgánicos basados en CO2 fijo, utilizando agua como el último donador de electrones. Actualmente, se emplean dos tecnologías principales para generar combustibles biológicos utilizando organismos fototróficos: primero, la producción de combustible biológico a base de plantas a través de la fermentación del contenido del azúcar de la planta a etanol y, segundo, en un grado mucho menor, la producción de biodiesel derivado de algas a través de la extracción de lípidos de la biomasa de cultivos a gran escala (Angermáyr et al., 2009, Curr Opin Biotechnol, 20(3): 257-263).
Lípidos Los lípidos biológicos son un grupo químicamente diverso de compuestos, cuya característica común y que los define es su insolubilidad en agua. Las funciones biológicas de los lípidos son igualmente diversas. Las grasas y los aceites son las principales formas de almacenamiento de energía en muchos organismos, y los fosfolípidos y esteróles suman aproximadamente la mitad de la masa de las membranas biológicas. Otros lípidos, aunque presentes en cantidades relativamente pequeñas, juegan papeles cruciales como cofactores de enzima, portadores de electrón, pigmentos absorbedores de luz, anclas hidrófobas, agentes emulsificantes, hormonas, y mensajeros ¡ntracelulares (Lodish, H., Molecular Cell Biology, 6thed., St. Martin's Press (2008)). Ácidos grasos Los ácidos grasos son ácidos carboxílicos con cadenas de hidrocarburo de 4 a 36 carbonos. En algunos ácidos grasos, esta cadena está saturada completamente (significando que no contiene enlaces dobles) y no ramificada; otros contienen uno (monoinsaturado) o más enlaces dobles (poliinsaturado). Unos pocos contienen anillos de tres carbonos o grupos hidroxilo. Una nomenclatura simplificada para estos compuestos especifica la longitud de cadena y el número de enlaces dobles, separados por dos puntos; el ácido palmítico saturado de 16 carbonos se abrevia 16:0, y el ácido oléico de 18 carbonos, con un enlace doble, es 18:1. Las posiciones de cualquier enlace doble se especifican por números supraíndice seguidos por ? (delta); un ácido graso de 20 carbonos con un enlace doble entre el C-9 y C-10 (C-1 es el carbono del carboxilo), y otro entre C-12 y C-13, se designa 20:2 (?^12), por ejemplo. Los ácidos grasos que existen más comúnmente tienen números pares de átomos de carbono en una cadena no ramificada de 12 a 24 carbonos. El número par de carbonos resulta del modo de síntesis de estos compuestos, que implica la condensación de las unidades acetato (dos carbonos). (Lehninger et al., Principies of Biochemistry, Vol. 1 , Macmillan, 2005).
La posición de los enlaces dobles en los ácidos grasos ¡nsaturados también es irregular; en la mayoría de los ácidos grasos monoinsaturados, el enlace doble está entre C-9 y C-10 (?9), y los otros enlaces dobles de los ácidos grasos poliinsaturados son generalmente ?12 y ?15. Los enlaces dobles de los ácidos grasos poliinsaturados casi nunca están conjugados (alternando enlaces sencillo y doble), pero normalmente están separados por un grupo metileno (-CH=CH-CH2-CH=CH-). Las propiedades físicas de los ácidos grasos, y de los compuestos que los contienen, se determinan en gran parte por la longitud y el grado de insaturación de la cadena de hidrocarburo, es decir, a más larga la cadena de acilo graso y menos los enlaces dobles, más baja la solubilidad en agua. (Lehninger et al., Principies of Biochemistry, Vol. 1 , Macmillan, 2005).
Biosíntesis del ácido graso La formación irreversible de malonil-CoA de acetil-CoA se cataliza por acetil-CoA carboxilasa en lo que se considera es el primer paso comprometido en la biosíntesis del ácido graso (figura 1). La acetil-CoA carboxilasa contiene biotina como su grupo prostésico, unido covalentemente por un enlace amida al grupo e-amino de un residuo lisina en una de tres subunidades de la molécula de la enzima. El grupo carboxilo, derivado del bicarbonato (HCO3"), primero se transfiere a una biotina en una reacción dependiente del ATP. El grupo biotinilo sirve como un portador temporal de CO2, transfiriéndolo al acetil-CoA en el segundo paso para producir malonil-CoA. (Lehninger et al., Principies ofBiochemistry, Volume 1 , Macmillan, 2005).
En contraste a otras bacterias heterotróficas, tal como E. coli, que tienen que metabolizar glucosa del medio en la acetil-CoA para iniciar la síntesis del ácido graso, en la cianobacteria, el precursor para la síntesis de ácido graso, es decir, la acetil-CoA, proviene directamente del ciclo de Calvin-Benson que fija el bióxido de carbono utilizando energía y reduciendo la potencia proporcionada por las reacciones de luz de la fotosíntesis.
La secuencia de la reacción mediante la cual se ensamblan las cadenas largas de los átomos de carbono en los ácidos grasos consisten en cuatro pasos: (1) condensación; (2) reducción; (3) deshidratación; y (4) reducción. El grupo acilo saturado producido durante este conjunto de reacciones es reciclado para volverse el sustrato en otra condensación con un grupo malonilo activado. Con cada pasaje a través del ciclo, la cadena de acilo graso se extiende por dos carbonos. En muchas células, el alargamiento de la cadena termina cuando la cadena alcanza 16 carbonos, y el producto (palmitato, 16:0) deja el ciclo. El metilo y los átomos de carbono de carboxilo del grupo acetilo se vuelven C-16 y C-15, respectivamente, del palmitato; el resto de los átomos de carbono se deriva del malonil-CoA. Todas las reacciones en el procedimiento de síntesis son catalizadas por un complejo multi-enzimático, la ácido graso sintasa (Lehninger et al., Principies ofBiochemistry, Volume 1 , Macmillan, 2005).
Ciclo de Alargamiento en la Síntesis de ácido graso La síntesis del ácido graso representa un proceso central y conservado por el cual se producen las cadenas de acilo para la utilización en varios productos finales tales como membranas biológicas. El sistema de la enzima, que cataliza la síntesis de ácidos grasos saturados de cadena larga del acetil CoA, del malonil-CoA, y del NADPH, se denomina la ácido graso sintasa (FAS, por sus siglas en inglés) (figura 1). Las ácido graso sintasas (FASs) pueden dividirse en dos clases, el tipo I y II, que están principalmente presentes en los eucariotas y en bacterias y plantas respectivamente. Se caracterizan por estar compuestos de ya sea polipéptidos polivalentes grandes en el caso del tipo I o consisten en proteínas mono-funcionales expresadas discretamente en el sistema del tipo II. (Chan D. and Vogel H, Biochem J., 2010, 430(1): 1-19). La ácido graso sintasa contiene seis actividades catalíticas y contiene la beta-cetoacil sintasa (KS), acetil/malonil transacilasa (AT/MT), beta-hidroxiacil deshidratasa (DH), enoil reductasa (ER), beta-cetoacil reductasa (KR), proteína portadora de acilo (ACP), y tioesterasa (TE) (Chirala and Wakil, Lipids, 2004, 39(1 1 ): 1045-53). Ha sido mostrado que las reacciones que conducen a la síntesis de ácido graso en organismos superiores son muy similares a ésos de las bacterias (Berg et al, Biochemistry, 6th ed., Macillan, 2008).
La biosíntesis del ácido graso se inicia por el componente de la ácido graso sintasa la enzima acetiltransferasa que carga el cebador de acilo, generalmente el acetato, de la coenzima A (CoA) a un sitio de unión específico en la ácido graso sintasa (FAS). Al final del proceso, la terminación del alargamiento de la cadena ocurre eliminando el producto de la ácido graso sintasa (FAS) o por transesterificación a un aceptor apropiado o por hidrólisis. Las respectivas enzimas son generalmente palmitoil transferasa y tioesterasa. La secuencia de la reacción entre la iniciación y la terminación implica el alargamiento de los intermediarios unidos por la enzima por varios ciclos iterativos de un conjunto distinto de pasos de reacción. Cada ciclo incluye (i) transacilación de malonilo del CoA a la enzima por malonil transferasa; (ii) condensación de la enzima de acilo con malonato que se une a enzima a la enzima de 3-cetoacilo por 3-cetoacil sintasa, (iii) reducción de la 3-cetó- al intermediario 3-hidroxiacilo por cetoacil reductasa, (iv) deshidratación de la enzima de 3-hidroxiacilo a 2,3-trans-enoato por deshidratasa, y, (v) por último, la reducción del enoato a la enzima de acilo saturada por la enoil reductasa. El grupo prostético, 4'-fosfopanteteína, juega un papel central en la unión del sustrato, procesamiento de intermediarios, y comunicación de los intermediarios entre los varios centros catalíticos de la ácido graso sintasa (FAS). Este cofactor se une covalentemente a un grupo específico del hidroxilo de la serina del dominio de ACP o, dependiendo del sistema FAS, al componente de ACP del FAS. En algunas bacterias, la secuencia iterativa de los ciclos de alargamiento puede ser interrumpida en una longitud de cadena de 10 carbonos por un ciclo que implica una isomerasa intrínseca que convierte el 2-trans- en el intermediario 3-c s-decenoilo, que subsiguientemente no se reduce pero se alarga más hasta ácidos grasos monoinsaturados de cadena larga (Schweizer and Hofmann, Microbiol Mol BioI Rev., 2004, 68(3): 501-17).
Proteína portadora de acilo (ACP) La proteína portadora de acilo (ACP), la proteína de cofactor que une covalentemente los intermediarios del acilo graso vía un enlazador de fosfopanteteína durante el proceso de síntesis, es central para la síntesis idel ácido graso. Es una proteína sumamente conservada que porta los intermediarios de acilo durante la síntesis del ácido graso. El ACP suministra cadenas de acilo para la síntesis de lípidos y del ácido lipóico, así como para la detección de quorum, bioluminiscencia y activación de toxinas. Además, ilos ACPs o PCPs (proteínas portadoras de peptidilo) también son utilizados en la síntesis de polipéptidos y peptídica no ribosomal, lo que produce metabolitos secundarios importantes, tal como, el antibiótico lipopéptido daptomicina y el sideróforo portador de hierro enterobactina (Chan and Vogel, Biochem, J., 2010, 430:1-19).
En levaduras y mamíferos, el ACP existe como un dominio separado dentro de una poliproteína multifuncional grande de la ácido graso sintasa (FAS tipo I), mientras que es una pequeña proteína monomérica en las bacterias y las plantas (FAS tipo II) (Byers and Gong, Biochem Cell Biol., 2007, 85(6): 649-62).
En E. coli, el ACP es sumamente abundante, comprendiendo aproximadamente 0.25% de todas las proteínas solubles y representa uno de los cuatro centros de interacción principales de proteína-proteína, los otros siendo ADN y ARN polimerasas así como proteínas asociadas a ribosomas.
En los sistemas de FAS tipo I , el ACP forma parte de polipéptidos grandes de multi-dominio que también portan los otros dominios de proteína para la síntesis de FA en un modo lineal. Aunque la arquitectura y la identidad de secuencia de los sistemas de FAS tipo I sean diferentes de las enzimas disociadas de tipo II, muchas de las unidades funcionales en estos complejos son similares. Por otro lado, otros dominios, tales como la enoil reductasa y las enzimas deshidratasa, varían apreciablemente entre los sistemas de tipo la, Ib y II (Chan y Vogel, Biochem. J., 2010, 430: 1-19).
Acil-ACP tioesterasas La reacción de terminación principal de la biosíntesis de ácido graso es catalizada por la proteína portadora de acilo-acilo (acil-ACP) tioesterasas en eucariotas. Estudios anteriores han mostrado que la enzima acil-ACP tioesterasa termina el alargamiento del acilo de un grupo acilo graso hidrolizando un grupo acilo en un ácido graso. En plantas, una acil-ACP tioesterasa termina el proceso de alargamiento del acilo por hidrólisis del acil-ACP tioéster; entonces se libera el ácido graso libre de la ácido graso sintasa. En E. coli, el grupo acilo de cadena larga se transfiere directamente del ACP al glicerol-3-fosfato por una glicerol-3-fosfato aciltransferasa, y los ácidos grasos libres normalmente no se encuentran como intermediarios eñ la biosíntesis de lípidos. Como en la la mayoría de otros organismos, los productos finales principales de la planta y de la ácido graso sintasa de E.coli son generalmente ácidos grasos de 16- o 18- carbonos. La longitud de la cadena se determina por las 3-cetoacil-ACP sintasas I y II y la gliceról-3-fosfato aciltransferasa glicerol-3-fosfato en E. coli. (Voelker and Davies, J. Bacterio!, 1994, 17: 7320-7327). 4-Hidroxibenzoil-CoA Tioesterasas (4-HBTs) Durante el último siglo, se han liberado grandes cantidades de 4-clorobenzoato industrialmente producido (4-CBA) o progenitores de 4-CBA (herbicidas y pesticidas de bifenilo polyclorados) en el ambiente (Corck, D. and Krueger, J. (1991 ) Adv. Appl. Microbio!., 36:1-66; Furukawa, K. (1994) Biodegradation, 5:289-300; Haggblom, M. (1992) FEMS Microbio!. Rev., 9:29-71 ; Higson, F.(1992) Adv. Appl. Microbio!., 37:135-164; and Zhuang, Z. et al., (2003) Applied and Environmental Microbiology, 69: 2707-2711). Dentro de los años recientes, se ha identificado una variedad de microorganismos que degradan el 4-CBA que habitan en el suelo, que catabolizan los hidrocarburos halogenados que aparecen en el ambiente y los utilizan como la fuente principal de carbono (Hileman, B. (1993) Chem. Eng. News, 71 :11-20).
El primer paso en el esquema bioquímico, por el cual e!l 4-clprobenzoato se tioesterifica con CoA, requiere una molécula de Mg2 +-ATP y se cataliza por la 4- clorobenzoil-CoA ligasa. El segundo paso se cataliza por la 4- clorobenzoil-CoA deshalogenasa e implica la sustitución hidrolítica dé un hidroxilo para un grupo cloro en la posición para del anillo aromático. En el tercero y último paso, el enlace del tioéster entre la porción CoA y el grupo 4-hidroxibenzoilo es disociada por la 4-hidroxibenzoil-CoA tioesterasa (4-HBT). Los genes que codifican estas tres enzimas se organizan en un operón bajo el control positivo de 4-clorobenzoil-CoA (Dunaway-Mariano, D. and Babbitt, P. (1994) Biodegradation, 5:259-276).
La Patente de E.U.A. No. 5,455,167 revela genes y constructos para expresar genes que codifican acil-ACP tioesterasas de plantas superiores, así como un constructo para expresar un gen que codifica el Vibrio han/eyi LuxD acil transferasa (YP_001448362.1 Gl: 156977456), que pertenece a Pfam PF02273, en plantas superiores. La Publicación de PCT No. WO2007/136762 revela microorganismos recombinantes diseñados para la producción fermentativa de los derivados de ácido graso, tales como, entre otros, alcoholes grasos y ésteres cerosos, en los que la cepa hospedera puede expresar una tioesterasa de planta superior o la TesA acil-CoA tioesterasa de E.coH. La Publicación de PCT No. WO2008/100251 describe los métodos para diseñar microorganismos que incluyen genes que codifican a celulosomas sintéticas para producir productos de hidrocarburo (que pueden ser, entre otros, aléanos, alquenos, alquinos, dienos, ácidos grasos, isoprenoides, alcoholes grasos, ésteres de ácido graso, polihidroxialcanoatos, ácidos orgánicos, o similares). El microorganismo que contiene una o más secuencias exógenas de ácido nucleico que codifican una celulosoma sintética también pueden incluir un gen exógeno de tioesterasa, tal como el TesA acil-CoA de E.coH o un gen de tioesterasa de planta, que puede ser expresado en las células hospederas.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Un aspecto de la invención es un microorganismo que comprende por lo menos una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa (4-HBT). El microorganismo puede expresar el gen que codifica la 4-hidroxibenzoil-CoA tioesterasa para facilitar la producción de uno o más ácidos grasos o derivados de ácidos grasos, o una combinación de los mismos En una modalidad de la invención, la 4-hidroxibenzoil-CoA tioesterasa hidroliza el acil-ACP. Preferiblemente, pero no necesariamente, el microorganismo es un microorganismo fotosíntético.
En la mayoría de las modalidades de la invención, el microorganismo incluye una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoíl-CoA tioesterasa y también produce por lo menos un ácido graso libre y/o derivado de ácido graso en una cantidad mayor que la cantidad que sería producida por el mismo microorganismo sin la molécula recombinante de ácido nucleico. Por ejemplo, en algunas modalidades, el microorganismo produce por lo menos 5 mg por litro (por ejemplo por lo menos 10 mg por litro, por lo menos 20 mg por litro, por lo menos 30 mg por litro, por lo menos 40 mg por litro, o por lo menos 50 mg por litro) de ácidos grasos libres y/o derivados por un período de seis horas a diez días.
Adicionalmente o alternativamente, el microorganismo incluye una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa y puede producir por lo menos un ácido graso libre y/o derivado que tiene una longitud de cadena de acilo que varía de 8 a 24 carbonos (por ejemplo, una longitud de cadena de acilo de 8 a 18 carbonos o una longitud de cadena de acilo de 12 a 16 carbonos). Por ejemplo, por lo menos un ácido graso libre y/o derivado producido por tal microorganismo puede tener una longitud de cadena de acilo de 8, 10, 12, 14, 16, 18, 20, 22, y/o 24 carbonos. En casos donde el derivado de ácido graso comprende un éster ceroso, el éster ceroso debe comprender carbonos de éster (carbonos A), así como carbonos de cadena de acilo (carbonos B). En casos donde el derivado de ácido graso comprende uno o más compuestos que no exhiben un grupo carbonilo {por ejemplo, alcoholes grasos, aléanos, y alquenos), la longitud de la cadena del "acilo" de tales compuestos debe ser comprendida como correspondiendo en la presente al número total de carbono en esas moléculas.
Además, adicionalmente o alternativamente, el microorganismo incluye por lo menos un gen recombinante que codifica una 4-hidroxibenzoil-CoA tioesterasa y puede producir por lo menos un derivado de ácido graso tal como, pero no limitado a, uno o más aldehidos grasos, alcoholes grasos, ésteres cerosos, alcanos, alquenos, y/o una combinación de los mismos. Por ejemplo, el microorganismo puede producir por lo menos un derivado de ácido graso que tiene un número total de carbonos de 7 a 36 (por ejemplo, de 7 a 34 o de 1 1 a 32 carbonos). Adicionalmente o alternativamente, por lo menos un derivado de ácido graso producido por el microorganismo puede tener un número total de carbonos de 7, 8, 9, 10, 1 1 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 26, 28, 30, 32, 34, y/o 36.
Inclusive, adicionalmente o alternativamente, el microorganismo incluye por lo menos un gen recombinante que codifica una 4-hidroxibenzoil-CoA tioesterasa y por lo menos 30 por ciento en peso (por ejemplo por lo menos 40 % en peso, por lo menos 50 % en peso, o por lo menos 60 % en peso) de los ácidos grasos libres y/o derivados producidos por el microorganismo son ácidos grasos libres que tienen una longitud de cadena de acilo de 8, 10, 12, 14, 16, y/o 18 carbonos y/o derivados de ácido graso que tienen un número total de carbonos de 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 26, 28, 30, 32, 34, y/o 36.
Inclusive, adicionalmente o alternativamente, el microorganismo incluye la molécula recombinante de ácido nucleico que codifica una 4- hidroxibenzoil-CoA tioesterasa que es un miembro de la familia Pfam PF03061. Inclusive, adicionalmente o alternativamente, el microorganismo codifica una 4-hidroxibenzoil-CoA tioesterasa que incluye el dominio de Pfam PF03061 , y el microorganismo puede producir un ácido graso que tiene luna longitud de cadena de acilo de 8, 10, 12, 14, 16, y/o 18 carbonos y/o un derivado de ácido graso que tienen un número total de carbonos de 7 a 36.
Alternativamente o además, el microorganismo incluye por lo menos un gen recombinante que codifica una 4-hidroxibenzoil-CoA tioesterasa que tiene por lo menos 50% de identidad de aminoácido (por ejemplo, por lo menos 55%, por lo menos 60%, por lo menos 65%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100%, de identidad de secuencia) a SEQ ID NO: 1 o SEQ ID NO: 2. Además adicionalmente o alternativamente, el microorganismo puede producir un ácido graso que tiene una longitud de cadena de acilo de 8, 10, 12, 14, 16, y/o 18 carbonos y/o un derivado de ácido graso que tiene un número total de carbonos de 7 a 36. En algunas modalidades, el microorganismo contiene una molécula de ácido nucleico que incluye una secuencia de nucleótidos SEQ ID NO: 3 o SEQ ID NO: 4.
Además en la presente se proporciona una molécula aislada o recombinante de ácido nucleico que comprende una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos que tiene por lo menos 97% de identidad a SEQ ID NO: 1. Por ejemplo, una molécula aislada o recombinante de ácido nucleico de la invención puede comprender una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos que tiene por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100%, de identidad de secuencia a SEQ ID NO: 1. También en la presente se proporciona una molécula aislada o recombinante de ácido nucleico que comprende una secuencia que codifica un polipéptido que incluye una secuencia de aminoácidos que tiene por lo menos 70 %, por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100%, de identidad de secuencia a la identidad a SEQ ID NO: 1 , en la que el polipéptido puede hidrolizar un sustrato de acil-ACP. Alternativamente o además, la molécula aislada o recombinante de ácido nucleico comprende una secuencia que codifica un polipéptido que incluye una secuencia de aminoácidos que tiene por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100%, de identidad de secuencia a la identidad a SEQ ID NO: 1 y, cuando se expresa en un microorganismo hospedero, tiene como resultado la producción de un ácido graso libre o derivado de ácido graso por el microorganismo hospedero. Por ejemplo, la expresión de un polipéptido que tiene una secuencia con por lo menos 70% de identidad a SEQ ID NO: 1 puede tener como resultado la producción de por lo menos dos veces la cantidad de un ácido graso libre o derivado de ácido graso producido por un microorganismo idéntico al microorganismo hospedero en todos los aspectos excepto que no expresa el polipéptido que tiene una secuencia de aminoácidos por lo menos 70% idéntica a SEQ ID NO: 1.
Además en la presente se proporciona una molécula aislada o recombinante de ácido nucleico que comprende una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos que tiene por lo menos 70% de identidad a SEQ ID NO: 2. Por ejemplo, una molécula aislada o recombinante de ácido nucleico de la invención puede comprender una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos que tiene por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100%, de identidad de secuencia a la identidad a SEQ ID NO: 2. También en la presente se proporciona una molécula aislada o recombinante de ácido nucleico que comprende una secuencia que codifica un polipéptido que incluye una secuencia de aminoácidos que tiene por lo menos 50% de identidad a SEQ ID NO: 2, en la que el polipéptido puede hidrolizar un sustrato de acil-ACP. Por ejemplo, la molécula aislada o recombinante de ácido nucleico comprende una secuencia que codifica un polipéptido que incluye una secuencia de aminoácidos que tiene por lo menos 50% de identidad (por ejemplo, por lo menos 55%, por lo menos 60%, por lo menos 65%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100% de identidad) a SEQ ID NO: 2, en la que el polipéptido puede hidrolizar un sustrato de acil-ACP. Alternativamente o además, una molécula aislada o recombinante de ácido nucleico de la invención puede comprender una secuencia que tiene por lo menos 50% de identidad de aminoácido (por ejemplo, por lo menos 55%, por lo menos 60%, por lo menos 65%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100%, de identidad de secuencia) ASEQ ID NO: 2 en la que la expresión de la secuencia de ácido nucleico en un microorganismo hospedero tiene como resultado la producción de por lo menos un ácido graso libre o derivado de ácido graso. La expresión del polipéptido que tiene una secuencia con por lo menos 50% de identidad a SEQ ID NO: 2 puede tener como resultado la producción de por lo menos dos veces la cantidad de un ácido graso libre o derivado de ácido graso producido por un microorganismo idéntico en todos los aspectos excepto que no expresa el polipéptido que incluye una secuencia de aminoácidos por lo menos 50% idéntica a SEQ ID NO: 2.
En algunas modalidades, una molécula de ácido nucleico que codifica un 4-hidroxibenzoil-CoA tioesterasa establemente puede ser integrada en un cromosoma de un microorganismo. Adicionalmente o alternativamente, un ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa puede estar en un episoma autónomamente replicante. Por ejemplo, un ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa presente en un episoma y/o integrado en el genoma del microorganismo puede ser una molécula de ácido nucleico exógena introducida en el microorganismo hospedero (o un progenitor del microorganismo hospedero), y también puede ser una molécula recombinante de ácido nucleico producida por la ingeniería genética.
Además, adicionalmente o alternativamente, el microorganismo genéticamente diseñado puede incluir un constructo de expresión que incluye la molécula recombinante de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa y una o más secuencias adicionales que regulan la expresión del gen de 4-hidroxibenzoil-CoA tioesterasa. Por ejemplo, el constructo de expresión puede incluir a un promotor operativo en las células hospederas, donde el promotor puede ser, por ejemplo, un promotor bacteriano, vírico, fago, o eucariótico. Alternativamente, el promotor puede ser un promotor sintético. Además, un promotor en un constructo de expresión que incluye un gen que codifica una 4.-hidroxibenzoil-CoA tioesterasa puede ser un promotor constitutivo, o, en modalidades alterntivas, puede ser un promotor inducible. Por ejemplo, el promotor inducible puede ser controlado por un metal o compuesto tal como lactosa o un análogo de lactosa, y/o puede ser controlado por luz y puede ser, por ejemplo, un promotor lac, tac, o trc, un promotor secA, un promotor rbc, un promotor psaAB, o un promotor psbA.
Además inclusive, adicionalmente o alternativamente, el microorganismo de la invención descrita incluye una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa y comprende además una molécula recombinante de ácido nucleico que codifica una enzima de acetil-CoA carboxilasa y/o una molécula recombinante de ácido nucleico que codifica una ß-cetoacil sintasa (KAS). Además inclusive adicionalmente o alternativamente, el microorganismo de la invención descritatiene una expresión atenuada/interrumpida de uno o más genes que codifican la acil-ACP sintasa, acil-CoA sintasa, acil-CoA deshidrogenasa, glicerol-3-fosfato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa, o acetato cinasa. Por ejemplo, cualquiera de estos genes puede ser suprimido por mutagénesis insersional y/o subregulado a través de interferencia de ARN o a través de silenciamiento de gen mediado por ARN antisentido.
El microorganismo genéticamente diseñado en cualquiera de las modalidades proporcionadas en la presente puede ser, por ejemplo, una eubacteria, arqueobacteria, hongo, levadura, heteroconto, cianobacteria o alga. Según algunas modalidades de la invención presente, el microorganismo hospedero es un microorganismo fotosintético, tal como una bacteria o alga fotosintética, incluyendo una especie microalgal eucariótica. Por ejemplo, el microorganismo genéticamente modificado puede ser una especie del género microalgal que incluye, pero no limitado a, Achnanthes, Amphiprora, Amphora, Ankistrodesmus, Asteromonas, Boekelovia, Borodinella, Botryococcus, Bracteococcus, Chaetoceros, Cartería, Chlamydomonas, Chlorococcum, Chlorogonium, Chlorella, Chroomonas, Chrysosphaera, Cricosphaera, Crypthecodinium, Cryptomonas, Cyclotella, Dunaliella, Ellipsoidon, Emiliania, Eremosphaera, Ernodesmius, Euglena, Franceia, Fragilaria, Gloeothamnion, Haematococcus, Halocafeteria, Hymenomonas, Isochrysis, Lepocinclis, Micractinium, Monoraphidium, Nannochlorís, Nannochloropsis, Navícula, Neochloris, Nephrochloris, Nephroselmis, Nitzschia, Ochromonas, Oedogonium, Oocystis, Ostreococcus, Pavlova, Parachlorella, Pascheria, Phaeodactylum, Phagus, Picochlorum, Platymonas, Pleurochrysis, Pleurococcus, Prototheca, Pseudochlorella, Pseudoneochloris, Pyramimonas, Pyrobotrys, Scenedesmus, Skeletonema, Spyrogyra, Stichococcus, Tetraselmis, Thalassiosira, Viridiella, y Volvox.
Más especialmente, el microorganismo puede ser un microorganismo fotosintético procariótico. Por ejemplo, el microorganismo fotosintético puede ser una especie del género cianobacterial, que incluye, pero no se limita a, Agmenellum, Anabaena, Anabaenopsis, Anacystis, Aphanizomenon, Arthrospira, Asterocapsa, Borzia, Calothrix, Chamaésiphon, Chlorogloeopsis, Chroococcidiopsis, Chroococcus, Crinalium, Cyanobacterium, Cyanobium, Cyanocystis, Cyanospira, Cyanothece, Cylindrospermopsis, Cylindrospermum, Dactylococcopsis, Dermocarpella, Fischerella, Fremyella, Geitleria, Geitlerinema, Gloeobacter, Gloeocapsa, Gloeothece, Halospirulina, lyengariella, Leptolyngbya, Limnothrix, Lyhgbya, Microcoleus, Microcystis, Myxosarcina, Nodularia, Nostoc, Nostochopsis, Oscillatoria, Phormidium, Planktothrix, Pleurocapsa, Prochlorococcus, Prochloron, Prochlorothrix, Pseudanabaena, Rivularia, Schizothrix, Scytonema, Spirulina, Stanieria, Starria, Stigonema, Symploca, Synechococcus, Synechocystis, Thermosynechococcus, Tolypothrix, Trichodesmium, Tychonema, y Xenococcus.
Según otro aspecto, la invención presente proporciona un cultivo para producir un ácido graso libre y/o derivado que comprende una población de microorganismos que puede comprender una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa. En ciertas modalidades preferidas, el microorganismo es un microorganismo fotosintético y los medios de crecimiento del cultivo no incluyen una fuente de carbono reducido, o por lo menos una cantidad substancial de una fuente de carbono reducido, donde una cantidad substancial es una cantidad que puede apoyar el crecimiento del cultivo en ausencia de otra fuente de energía.
En una modalidad preferida, los microorganismos en el cultivo de la invención presente pueden producir (y opcionalmente, pero preferiblemente, liberar y/o secretar) por lo menos un ácido graso libre y/o derivado de ácido graso. Adicionalmente o alternativamente, los microorganismos en el cultivo producen una cantidad mayor de un ácido graso y/o derivado de ácido graso que un cultivo de los mismos microorganismos que no incluye una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa, en el que el cultivo es idéntico en otros aspectos. Además adicionalmente o alternativamente, los microorganismos en el cultivo incluyen una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa, en el que el cultivo puede incluir además por lo menos 5 mg por litro (por ejemplo por lo menos 10 mg por litro, por lo menos 20 mg por litro, por lo menos 30 mg por litro, por lo menos 40 mg por litro, o por lo menos 50 mg por litro) de ácidos grasos libres y/o derivados de ácido graso por un período que varía de seis horas a diez días. Los ácidos grasos y/o derivados de ácido graso pueden estar presentes en el medio - por ejemplo, como precipitados en o cerca de la superficie del medio, asociado con el recipiente del medio como gotículas incluyendo gotículas suspendidas {por ejemplo, una emulsión), como una capa relativamente inmiscible que flota en la parte superior del medio de cultivo acuoso, como un "nata", película, gel, semisólido, coloide, particulado fino, particulado, sólido, o agregado que puede estar disperso, suspendido, o atrapado dentro del medio de cultivo, asociado con las células del microorganismo hospedero, la fase separada en alguna otra manera, o una combinación de los mismos.
Adicionalmente o alternativamente, el microorganismo hospedero puede ser un microorganismo fotosintético y el medio de crecimiento del cultivo puede no incluir una cantidad substancial de una fuente de carbono reducido, donde una cantidad substancial es una cantidad que puede apoyar el crecimiento del cultivo en ausencia de otra fuente de energía. Además adicionalmente o alternativamente, un cultivo puede ser proporcionado con por lo menos una fuente de carbono inorgánico, tal como, por ejemplo, bicarbonato o bióxido de carbono (CO2), y/o los microorganismos fotosintéticos en el cultivo pueden estar expuestos a la luz por lo menos una porción del período de cultivo.
Adicionalmente, un ácido graso libre y/o derivado puede ser aislado del cultivo, por ejemplo, de las células, del medio de crecimiento, o del cultivo entero. Por ejemplo, el aislamiento puede ser por extracción orgánica de células enteras y/o lisadas, a través de eliminación de ácidos grasos libres y/o derivados como precipitados {por ejemplo, de la capa superior del medio de cultivo, también llamado "despumación"), a través del uso de adsorbentes particulados, burbujas, y/o matrices que pueden unirse a los ácidos grasos o derivados de ácido graso, o combinaciones de los mismos.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La figura 1 muestra un diagrama esquemático de la trayectoria biosintética para producir ácidos grasos libres y derivados de ácidos grasos.
La figura 2 muestra el mapa físico del vector de expresión (RB-RS1) utilizado para construir una biblioteca metagenómica.
La figura 3 muestra el perfil de los ácidos grasos libres (FFA) aislados del cultivo de células de E.coli que expresan el gen 340-64 (SÉQ ID NO: 3) comparado a una acil-ACP tioesterasa de planta superior (control 25).
La figura 4 es un gráfico de los ácidos grasos libres (FFA) aislados del cultivo de células de E. coli que expresan el gen 3-1 (SEQ ID NO: 4) comparado a un control (control 25).
La figura 5 es un gráfico de los ácidos grasos libres (FFA) aislados del cultivo de E. coli (cepa K19 que carece de una acil-CoA sintetasa funcional) que expresa el gen 340-64 (SEQ ID NO: 3) comparado a un control (control de vector vacío (EV) de RBRS1). La concentración de ácidos grasos libres (FFA) fue normalizada a OD de los cultivos de E. coli.
La figura 6 muestra los patrones de migración de los sustratos de acil-ACP en un gel de acrilamida nativo al 20% que contiene urea 2.5M. Los sustratos de acil-ACP (C16-ACP) fueron incubados con extractos de células obtenidos de E. coli que expresan clones diferentes (PE0045 (extracto de control), 3-1 de 4-HBT (SEQ ID NO: 4), o 340-64 de 4-HBT (SEQ ID NO: 3)).
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La invención descrita proporciona una composición y un método para producir uno o más ácidos grasos libres y/o derivados del mismo que comprende expresar 4-hidroxibenzoil-CoA tioesterasa en un microorganismo (por ejemplo,, expresando una molécula recombinante de ácido nucleico que codifica a 4-hidroxibenzoil-CoA tioesterasa).
Glosario Las abreviaturas utilizadas en la presente para los aminoácidos son esas abreviaturas que son utilizadas convencionalmente: A=Ala=Alán¡na; R=Arg=Arginina; N=Asn=Asparagina; D=Asp=Acido Aspártico; C=Cys=Cisteína; Q=Gln=Glutamina; E=Glu=Acido Glutámico; G=Gly=G:licina; H=His=Histidina; l=lle=lsoleucina; L=Leu=Leucina; K=Lys=Lisina; M=Met=Metionina; F=Phe=Fenilalanina; P=Pro=Prolina; S=Ser=Serina; T=Thr=Treonina; W=Trp=Triptófano; Y=Tyr=Tirosina; V=Val=Valina. Los aminoácidos pueden ser aminoácidos L- o D-. Un aminoácido puede ser reemplazado por un aminoácido sintético que es alterado para aumentar la vida media del péptido o para aumentar la potencia del péptido, o para aumentar la biodisponibilidad del péptido.
La frase "sustitución conservadora de aminoácido" o "mutación conservadora" como se utiliza en la presente se refiere al reemplazo de un aminoácido por otro aminoácido con una propiedad común. Una manera funcional de definir propiedades comunes entre aminoácidos individuales es analizar las frecuencias normalizadas de los cambios del aminoácido entre correspondientes proteínas de organismos homólogos (Schuiz, G. E. ahd R. H. Schirmer, Principies of Protein Structure, Springer-Verlag). Según tales análisis, los grupos de aminoácidos pueden ser definidos donde los aminoácidos dentro de un grupo se intercambian de manera preferencial entre sí, y por lo tanto se parecen entre sí principalmente en su impacto en la estructura general de la proteína (Schuiz, G. E. and R. H. Schirmer, Principies of Protein Structure, Springer-Verlag). Ejemplos de grupos de aminoácido definidos en esta manera pueden incluir: un "grupo cargado/polar", que incluye Glu, Asp, Asn, Gln, Lys, Arg, e His; un "grupo aromático o cíclico", que incluye Pro, Phe, Tyr, y Trp; y un "grupo alifático" que incluye Gly, Ala, Val, Leu, lie, Met, Ser, Thr, y Cys. Dentro de cada grupo, los subgrupos también pueden ser identificados. Por ejemplo, el grupo de aminoácidos cargados/polares puede ser subdividido en subgrupos incluyendo: el "subgrupo cargado positivamente", que comprende Lys, Arg y His; el "subgrupo cargado negativamente", que comprende Glu y Asp; y el "subgrupo polar" que comprende Asn y Gln. En otro ejemplo, el grupo aromático o cíclico puede ser subdividido en los subgrupos que incluyen: el "subgrupo de anillo de nitrógeno", que comprende Pro, His, y Trp; y el "subgrupo fenilo" que comprende Phe y Tyr. En otro ejemplo adicional, el grupo alifático puede ser subdividido en los subgrupos que incluyen: el "subgrupo no polar alifático grande", que comprende Val, Leu, y He; el "el subgrupo ligeramente polar alifático", que comprende Met, Ser, Thr, y Cys; y el subgrupo de residuo pequeño", que comprende Gly y Ala. Ejemplos de mutaciones conservadoras incluyen sustituciones de aminoácidos de aminoácidos dentro dé los subgrupos anteriores, tal como, pero no limitados a: Alanina (A), Serina (S), Treonina (T); Acido Aspártico (D), Acido Glutámico (E)¡ Asparagina (N), Acido Glutámico (Q); Arginina (R), Usina (K); Isoleucina (I), Leucina (L), Metionina (M), Valina (V); y Fenilalanina (F), Tirosina (Y), Triptófano (W).
El término "proteína tioesterasa portadora de acilo-acilo" o "acil- ACP tioesterasa," como se utiliza en la presente, se refiere a una enzima tioesterasa que hidroliza un enlace acil-ACP éster con preferencia a otros sustratos, tales como un sustrato acil-CoA y/o un sustrato de hidroxibenzoil-CoA (por ejemplo, 4-hidroxibenzoil-CoA, 2,5-dihidroxibenzoil-CoA, o similares), y puede incluir una acil-ACP tioesterasa que pertenece a la familia de Proteína (Pfam) PF01643 (en pfam.cgb.ki.se/; en pfam.janelia.org/; en pfam.sanger.ac.uk).
Los términos "acil-coenzima A tioesterasa", "acil-CoA tioesterasa", y "acil-CoA hidrolasa," como se utiliza en la presente, se refiere a una enzima tioesterasa que cataliza la hidrólisis del enlace tioéster presente dentro de las moléculas de acil-CoA éster para producir la coenzima A (CoASH) y el correspondiente ácido graso no esterificado.
El término "atenuar," como se utiliza en la presente, significa debilitar o reducir en fuerza, intensidad, actividad, efecto, o cantidad.
El término "autótrofo", como se utiliza en la presente, se refiere a un organismo que produce compuestos orgánicos complejos (carbohidratos, grasas, y proteínas) de moléculas inorgánicas sencillas que utilizan energía de la luz (por la fotosíntesis) o reacciones químicas inorgánicas. Pueden típicamente formar su propio alimento. Algunos autótrofos pueden fijar bióxido de carbono.
El término "autotrófico," como se utiliza en la presente, se refiere a un organismo que es capaz de producir compuestos orgánicos complejos (carbohidratos, grasas, y proteínas) de moléculas inorgánicas sencillas utilizando energía de la luz (por fotosíntesis) y/o reacciones químicas inorgánicas. El término "fotoautrófico", como se utiliza en la presente, se refiere a un organismo capaz de producir compuestos orgánicos complejos (carbohidratos, grasas, y proteínas) de moléculas inorgánicas sencillas utilizando energía de la luz (por la fotosíntesis). El "crecimiento fototrófico" es crecer utilizando la luz como una fuente de energía.
El término "combustible biológico," como se utiliza en la presente, se refiere a cualquier combustible que se obtiene de un recurso biológico renovable.
El término "fuente de carbono," como se utiliza en la presente, se refiere a un compuesto que proporciona estructuras principales de carbono necesarias para la síntesis de nuevas moléculas orgánicas.
El término "taxón monofilético", como se utiliza en la presente, se refiere a un grupo de taxón o especie biológica que comparte características heredadas de un antepasado común. Un taxón monofilético incluye un linaje ancestral y a todos los descendientes de ese antepasado. El término taxón monofilético es utilizado para también referirse a un agrupamiento de genes o proteínas por la relación (homología) de sus secuencias.
Un gen que es'Optimizado en codones" para la expresión en un organismo es un gen cuya secuencia de nucleótidos ha sido alterada con respecto a la secuencia original de nucleótidos, de manera que uno ó más codones de la secuencia de nucleótidos han sido cambiados a un codón diferente que codifica el mismo aminoácido, en el que el nuevo codón es utilizado más frecuentemente en genes del organismo de interés que el codón original. La degeneración del código genético proporciona que todos los aminoácidos excepto la metionina y el triptofano sean codificados por más de un codón. Por ejemplo, la arginina, leucina, y serina son codificadas por seis codones diferentes; y la glicina, alanina, valina, treonina, y prolina son codificados por cuatro codones diferentes. Muchos organismos utilizan ciertos codones para codificar un aminoácido particular má frecuentemente que otros. Sin limitar ningún aspecto de la invención a algún mecanismo particular, se cree que algún tARNs para un aminoácido dado es más predominante que otros dentro de un organismo particular, y los genes que requieren un tARN raro para la traducción de la proteína codificada pueden ser expresados en un nivel bajo debido en parte a una cantidad limitante del tARN raro. Así, para niveles adecuados u óptimos de expresión de una proteína codificada, un gen puede ser "optimizado en codones" para cambiar uno o más codones a nuevos codones ("codones preferidos") que están entre esos utilizados más frecuentemente en los genes del organismo hospedero (referido como la "preferencia del codón" del organismo). Como es utilizado en el contexto de la invención, un gen "optimizado en codones" o molécula de ácido nucleico de la invención no requieren tener cada codón alterado para conformarse a la preferencia del codón del organismo hospedero destinado, ni se requiere que los codones alterados de un gen "optimizado en codones" o molécula de ácido nucleico sea cambiada al codón más predominante utilizado por el organismo de interés. Por ejemplo, un gen optimizado en codones puede tener uno o más codones cambiados a codones que son utilizados más frecuentemente que el codón(es) original, sin tener en cuenta si son utilizados más frecuentemente en el organismo para codificar un aminoácido particular.
El término "elemento regulador controlable" o "elemento regulador," como se utiliza en la presente, se refiere a secuencias de ácidos nucleicos capaces de realizar la expresión de los ácidos nucleicos, o del producto de péptido o de proteína del mismo. Los elementos reguladores controlables pueden ser ligados operablemente a los ácidos nucleicos, a los péptidos, o a las proteínas de la invención presente. Los elementos reguladores controlables, tales como, pero no limitados a, secuencias de control, no requieren ser contiguos con los ácidos nucleicos, con los péptidos, ni con las proteínas cuya expresión ellos controlan siempre que funcionen para dirigir la expresión de los mismos. Así, por ejemplo, las secuencias que intervienen transcritas aún sin traducción pueden estar presentes entre una secuencia de promotor y un ácido nucleico de la invención presente y la secuencia del promotor todavía puede ser considerada "operablemente ligada" a la secuencia de la codificación. Otras de tales secuencias de control incluyen, pero no son limitadas a, secuencias mejoradoras, secuencias que regulan la traducción, secuencias que regulan la estabilidad del ARNm, señales de poliadenilación, señales de terminación, y sitios de unión de ribosoma.
El término, "endógeno," como se utiliza en la presente, se refiere a sustancias que se originan o se producen dentro de un organismo. Un gen o proteína "endógena" es un gen o proteína que reside en una especie que también se deriva de esa especie.
Un "episoma" es una molécula de ácido nucleico que no está integrada en el cromosoma o cromosomas de la célula y se replica autónomamente en una célula. Una molécula de ácido nucleico o secuencia "episomal" es un gen, molécula de ácido nucleico, o secuencia ácido nucleico que está integrada en un episoma. Un ejemplo de un episoma es un plásmido, que es una molécula circular de ADN fuera de los cromosomas que incluye un origen de réplica y se replica autónomamente dentro de la célula.
"Constructo de expresión" se refiere a un ácido nucleico que ha sido generado a través de intervención humana, incluyendo por medios recombinantes o síntesis química directa, con una serie de elementos de ácido nucleico especificados que permiten la transcripción y/o traducción de un ácido nucleico particular en una célula hospedera. El constructo de la expresión puede formar parte de un plásmido, virus, o fragmento de ácido nucleico.
El término "exógeno," como se utiliza en la presente, se refiere a una sustancia o molécula que se origina o se produce fuera de un organismo. El término "gen exógeno" o "molécula de ácido nucleico exógena," como se utiliza en la presente, se refiere a un ácido nucleico que codifica para la expresión de un ARN y/o proteína que ha sido introducida ("transformada") en una célula o un progenitor de la célula. Un gen exógeno puede ser de una especie diferente (y así un gen "heterólogo") o de la misma especie (y así un gen "homólogo"), con respecto a la célula que es transformada. Una célula transformada puede ser referida como una célula recombinante. Una molécula de ácido nucleico, gen, o proteína "endógena" puede representar el gen o proteína propia del organismo tal cual es producida naturalmente por el organismo.
El término que "expresa" o "expresión," como se utiliza en la presente, significa la transcripción y la traducción de una molécula de ácido nucleico por una célula. La expresión puede ser, por ejemplo, constitutiva o regulada, tal como, por un promotor inducible (por ejemplo, operón lac, que puede ser activado por el Isopropil ß-D-l-tiogalactopiranósido (IPTG)).
El término "ácido graso," como se utiliza en la presente, pretende referirse a un ácido carboxílico no esterificado que tiene una cadena de alquilo de por lo menos 3 carbonos (es decir, una cadena de acilo de por lo menos 4 carbonos) o su correspondiente anión de carboxilato, denotado como RCOOH o RCOO- respectivamente, donde R es una cadena de alquilo de entre 3 y 23 carbonos. Un "ácido graso libre" está substancialmente no asociado, por ejemplo, con una proteína, dentro o fuera de un organismo (por ejemplo, almacenamiento globular y/o micelular dentro de un organismo, sin esterificación, todavía puede calificar como un ácido graso libre). Así, un ácido graso libre según la invención presente no requiere ser necesariamente un ácido estricto ni ser estructuralmente "libre", pero un ácido graso libre específicamente no incluye una porción de acilo cuyo oxígeno de carboxilato esté ligado covalentemente a cualquier otra porción aparte de un átomo de hidrógeno, significando que los ásteres de ácido graso específicamente no están incluidos en los ácidos grasos libres. Sin embargo, un ácido graso libre puede incluir ventajosamente una porción de acilo que contiene por lo menos cuatro carbonos (por ejemplo, por lo menos 6 carbonos, por ejemplo por lo menos 8 carbonos), en la que la porción acilo (i) está ligada covalentemente a un átomo de hidrógeno, (i¡) tiene una carga iónica, a la que un contraión puede ser asociado (incluso si está suelto y/o separado por solvente) y/o (iii) se asocia de otro modo (no covalentemente) con una porción diferente de hidrógeno, por ejemplo, por un enlace de éster, de manera que un ácido graso libre es relativamente fácilmente transformable en la correspondiente forma ácida o la correspondiente forma iónica (por ejemplo, por unión de hidrógeno o similares. Ejemplos no limitativos de contraiones pueden incluir sales metálicas (tales como calcio, sodio, potasio, aluminio, hierro, y similares, y combinaciones de los mismos), otros iones inorgánicos (tales como amonio, mono-, di-, tri-, y tetra- alquilamonio, sulfonio, fosfonio, y similares, y combinaciones de los mismos), iones orgánicos (tales como carbocationes), y similares, y combinaciones de los mismos. El término "ácidos grasos libres" como se utiliza en la presente también se refiere a ácidos grasos, que no están covalentemente unidos a cualquier otra porción a excepción del hidrógeno (unido por el grupo ácido carboxílico). Por ejemplo, un ácido graso libre no está undio a otras moléculas tales como ACP, coenzima A (CoA), o al glicerol (por ejemplo, como parte de un triglicérido, diglicérido, monoglicérido, o molécula de fosfolípido). Los ácidos grasos libres contienen un grupo carboxilo (-COOH), que puede ser ionizado en una forma de carboxilato aniónico de (R-COO"; R: hidrocarburos).
Los ácidos grasos pueden tener un número par o impar de átomos de carbono (por ejemplo, heptadecanóico=C17) y también puede tener cadenas ramificadas {por ejemplo, ácido isopalmítico, ácido anteisononadecanóico) o unidades carbocíclicas (por ejemplo, ácido stercúlico, ácido chaulmoógrico).
En algunos ácidos grasos, la cadena de hidrocarburo está saturada completamente (significando que no contiene enlaces dobles) y no ramificada; otras contienen uno (monoinsaturado) o más enlaces dobles (insaturado). Una nomenclatura simplificada para estos compuestos especifica la longitud de cadena y el número de enlaces dobles, separados por dos puntos; el ácido palmítico saturado de 16 carbonos se abrevia 16:0, y el ácido oléico de 18 carbonos, con un enlace doble, es 18:1. Las posiciones de cualquier enlace doble se especifican por números de supraíndice después de ? (delta); un ácido graso de 20 carbonos con un doble enlace entre C-9 y C-10 (C-1 siendo el carbono del carboxilo), y otro entre C-12 y C-13, se designa 20:2 (?9.12), por ejemplo. Los ácidos grasos que existen más comúnmente tienen números pares de átomos de carbono en una cadena no ramificada de 12 a 24 carbonos. El número par de carbonos resulta del modo de síntesis de estos compuestos, que implica la condensación de las unidades acetato (dos carbonos). La posición de los enlaces dobles también es regular; en la mayoría de los ácidos grasos insaturados, el enlace doble está entre C-9 y C-10 (?9), y otros dobles enlaces de ácidos grasos polünsaturados son generalmente ?12 y ?15. Los enlaces dobles de casi todos los ácidos grasos insaturados naturales están en la configuración cis. (Lehhinger ét al., Principies of Biochemistry, Vol. 1 , Macmillan, 2005) Ejemplos de ácidos grasos saturados incluyen, pero no se limitan a, ácido butanóico (butírico) (C4), ácido hexanóico (capróico) (C6), ácido octanóico (caprílico) (C8), ácido decanóico (cáprico) (C10), ácido dodecahoico (láurico) (C12), ácido tetradecanóico (mirístico) (C14), ácido hexadecanóico (palmítico) (C16), ácido octadecanóico (esteárico) (C18), y ácido eicosanóico (araquídico) (C20), docosanóico (behénico) (C22), óico tetracosanóico (lignocérico) (C24). Ejemplos de ácidos grasos insaturados incluyen, pero no se limitan a, ácido miristoléico (C14:1 , c/sA9), ácido palmitoléico (C16:1 , c/sA9), ácido sapiénico (C16:1 , c/sA6), ácido oléico (C18:1 , c/sA9), ácido linóléico (C18:2, c/sA9 ,cisM2), ácido a-linoléico (C18:3, c/sA9, c/sA12, c sA15), ácido araquidónico (C20:4, cis 5, c/sA8, c/'sA11, c/'sA14), ácido eicosapentaenóico (C20:5, cis 5, cisáa, c/sA11, c/sA14, c/sA17), ácido erúcico (C22:1 , c/s-A13), y ácido docosahexaenóico (C22:6, c/'sM, c/'sA7 ,c¡sM0,cisM 3 ,c/sA16, c/'sA19 ). Los ácidos grasos de cadena larga también pueden ser formados de ácidos grasos de cadena más corta fácilmente disponibles (C12-C18) por procedimientos apropiados de extensión de cadena.
Ejemplos no limitativos de ácidos grasos de cadena ramificada naturales incluyen los iso ácidos grasos (principalmente con un número par de átomos de carbono) y los anteiso ácidos grasos (principalmente cón un número impar de átomos de carbono), ácidos ramificados de polimetilo en lípidos bacterianos, y ácidos a base de fitol.
Los ácidos cíclicos más comunes contienen un cicloprópano, ciclopropeno, o unidad de ciclopenteno. Los ácidos de cicloprópano existen en los fosfolípidos de la membrana bacteriana y son principalmente ácidos de C17 o C19 (lactobacílicos). La unidad de ciclopropano, como enlace doble cis, introduce una discontinuidad en la molécula y aumenta la fluidez en la membrana.
Las propiedades físicas de los ácidos grasos, y de los compuestos que los contienen, se determinan en gran parte por la longitud y grado de insaturación de la cadena de hidrocarburo. La cadena de hidrocarburo no polar justifica la solubilidad deficiente de los ácidos grasos en agua. Cuanto más larga la cadena de acilo graso y menos los enlaces dobles, más baja la solubilidad en agua. El grupo ácido carboxílico es polar (e ionizado a pH neutral) y cuenta para la ligera solubilidad de los ácidos grasos de cadena corta en agua. Los puntos de fusión de los ácidos grasos y de los compuestos que los contienen también están totalmente influenciados ¡por la longitud y el grado de insaturación de la cadena de hidrocarburo. En los compuestos completamente saturados, la libre rotación alrededor de cada uno de los enlaces carbono-carbono da a la cadena de hidrocarburo gran flexibilidad; la conformación más estable es esta forma completamente extendida, en la que el impedimento esférico de los átomos vecinos se minimiza. Estas molécula puede empacarse junta apretadamente en arreglos caso cristalinos, con átomos a lo largo de sus longitudes en contacto de van der Waals con los átomos de las moléculas vecinas. Un enlace doble cis fuerza una retorcedura en la cadena de hidrocarburo. Los ácidos grasos con una o varias de tales retorceduras no se pueden empacar juntas tan apretadamente como los ácidos grasos completamente saturados y sus interacciones entre sí son por lo tanto más débiles. Ya que toma menos energía térmica desordenar estos arreglos deficientemente ordenados de ácidos grasos insaturados, tienen menores puntos de fusión que los ácidos grasos saturados de la misma longitud de cadena (Lehninger et al., Principies of Biochemistry, Vol. 1 , Macmillan, 2005).
El término "derivado de ácido graso," como se utiliza en la presente, se refiere a una molécula orgánica derivada de un ácido graso.
Ejemplos de derivados de ácidos grasos incluyen, pero no se limitan a, ésteres de ácidos grasos de C1-C5 tales como metil ésteres de ácido graso y etil ésteres de ácido graso, tales como ésteres cerosos, tales como alcoholes grasos, aldehidos grasos, alcanos, y alquenos.
El término "alcohol graso," como se utiliza en la presente, se refiere a un alcohol formado de un ácido graso o derivado de ácido graso y que tiene la fórmula ROH. La cadena de hidrocarburo del alcohol graso puede ser recta o ramificada. La cadena de hidrocarburo puede ser saturada o insaturada.
El término "aldehido graso," como se utiliza en la presente, se refiere a un aldehido formado de un ácido graso o derivado de ácido graso y que tiene la fórmula RCHO. El hidrocarburo del aldehido graso puede ser saturado o ¡nsaturado.
El término "gen", como se utiliza en la presente, se refiere a una molécula de ácido nucleico que codifica una proteína o ARN funcional (por ejemplo, un tARN). Un gen puede incluir las regiones que no codifican la proteína final o el producto de ARN, tal como regiones sin traducir 5' o 3', intrones, sitios de unión de ribosoma, regiones de promotor o de mejorador, u otras regiones de secuencia asociadas y/o reguladoras.
Los términos "expresión de gen" y "expresión" se utilizan intercambiablemente en la presente para referirse al proceso por el cual la información transmisible de un gen, tal como una secuencia de ADN, es formada en un producto funcional de gen, tal como proteína o ARN.
El término "ingeniería genética," como se utiliza en la presente, se refiere al uso de métodos de biología molecular para manipular secuencias de ácidos nucleicos e introducir moléculas de ácidos nucleicos en organismos hospederos. El término "genéticamente diseñado", como se utiliza en la presente, significa una célula que ha sido sometida a manipulaciones de ADN recombinante, tal como la introducción de la molécula de ácido nucleico exógena, lo que tiene como resultado una célula que está en una forma no encontrada originalmente en la naturaleza.
El término "crecimiento", como se utiliza en la presente, se refiere a un proceso de volverse ser más grande, más largo o más numeroso, o puede indicar un aumento en el tamaño, en el número, o en el volumen de células en una población de células.
El término "heterotrófico," como se utiliza en la presente, se refiere a requerir sustratos de carbono reducido para el crecimiento.
El término "heterótrofo", como se utiliza en la presente, se refiere a un organismo que no produce su propio alimento y debe adquirir algunos de sus nutrientes del ambiente, por ejemplo, en forma de carbono reducido.
Un "homólogo" de un gen o proteína se refiere a su equivalente funcional en otra especie.
El término "hidrocarburo," como se utiliza en la presente, se refiere a cualquiera de los compuestos orgánicos formados exclusivamente de hidrógeno y carbono en varias proporciones.
El término "hibridación" se refiere a la unión de dos moléculas de ácido nucleico de una cadena entre sí a través de apareamiento de bases. Los nucleótidos se unirán a su complemento bajo condiciones normales, así que dos cadenas perfectamente complementarias se unirán (o "anillarán") una a la otra fácilmente. Sin embargo, debido a las geometrías moleculares diferentes de los nucleótidos, una inconsistencia única entre las dos cadenas hará una unión entre ellas más energéticamente desfavorable. Medir los efectos de la incompatibilidad de la base cuantificando la tasa en la que dos cadenas se anillan puede proporcionar información en cuanto a la similitud en la secuencia de la base entre dos cadenas a ser anilladas.
Los términos "4-hidroxibenzoil-CoA tioesterasa", "hidroxibenzoil-CoA tioesterasa", "4-hidroxibenzoato tioesterasa", y "4-HBT," como se utilizan en la presente, se refieren a una enzima de tioesterasa (EC 3.1.2.23) que puede catalizar la disociación del enlace tioéster del 4-hidroxibenzoil-CoA para formar hidroxibenzoato, el útiimo de los tres pasos en la trayectoria de convertir 4-clorobenzoato a hidroxibenzoato.
El término "inductor," como se utiliza en la presente, se refiere a una molécula que puede iniciar la transcripción de un gen, que es controlado por un promotor inducible.
El término "promotor inducible," como se utiliza en la presente, se refiere a un promotor, cuya actividad para promover la transcripción de un gen al que está ligado operablemente es controlado por una condición ambiental (por ejemplo, la temperatura, la luz, o similares) o la presencia de un factor tal como un compuesto o biomolécula específica. El término "promotor constitutivo" se refiere a un promotor cuya actividad es mantenida en un nivel relativamente constante en todas las células de un organismo con poca o ninguna consideración a las condiciones ambientales de la célula (como la concentración de un sustrato).
Los términos "inhibiendo", "inhibir", e "inhibición", como se utilizan en la presente, se refieren a reducir la cantidad o la velocidad de un proceso, a detener por completo, o a disminuir, a limitar, o a bloquear la acción o la función del mismo. La inhibición puede incluir una reducción o la disminución de la cantidad, de la velocidad, de la función de acción, o del proceso por lo menos 5%, por ejemplo por lo menos 10%, por lo menos 15%, por lo menos 20%, por lo menos 25%, por lo menos 30%, por lo menos 40%, por lo menos 45%, por lo menos 50%, por lo menos 55%, por lo menos 60%, por lo menos 65%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 98%, o por lo menos 99%, cuando es comparado a una sustancia de referencia, en donde la sustancia de referencia es una sustancia que no es inhibida.
El "carbono inorgánico" es un compuesto o molécula que contiene carbono que no puede ser utilizado como una fuente de energía por un organismo. Típicamente el "carbono inorgánico" está en forma de CO2 (bióxido de carbono), ácido carbónico, bicarbonato, o carbonato, que no puede ser más oxidado para energía o utilizado como una fuente para reducir la potencia por los organismos.
El término "mutagénesis insercional", como se utiliza en la presente, se refiere a una mutagénesis de ADN por la inserción de ADN exógeno en un gen.
El término "asilado", como se utiliza en la presente, se refiere a un proceso para obtener una sustancia, molécula, proteína, péptido, ácido nucleico, o anticuerpo que es substancialmente libre de otras sustancias con la que es encontrado comúnmente en la naturaleza o en sistemas in vivo hasta cierto grado práctico y apropiado para su uso destinado.
El término "asilado" se refiere a un material, tal como un ácido nucleico, como un péptido, o como una proteína, que es: (1 ) en esencia o substancialmente libre de componentes que acompañan normalmente o interactúan consigo como es encontrado en su ambiente natural, o (2) si el material está en su medio natural, el material ha sido sintéticamente (no naturalmente) alterado por la intervención humana deliberada a una composición y/o colocado en una ubicación en la célula (por ejemplo, genoma u organelo subcelular) no nativo a un material encontrado en ese ambiente. El término " substancialmente o en esencia libre" es utilizado para referirse a un material, que es por lo menos 80% libre, por ejemplo por lo menos 90% libre, por lo menos 95% libre, o por lo menos 99% libre (con porcentajes que son porcentajes en peso sólo cuando aplica) de componentes que acompañan normalmente o interactúan consigo como es encontrado en su ambiente natural. El material aislado comprende opcionalmente material no encontrado con el material en su medio natural.
El término "heterólogo", como se utiliza en la presente, se refiere a ácidos nucleicos derivados de una especie diferente que esa en la que son introducidos o en que residen por ingeniería genética del organismo o su antepasado. Una proteína heteróloga se deriva de una especie diferente de esa producida en o introducida en. Una secuencia de ácido nucleico heterolóloga, gen, o proteína, es una secuencia, gen, o proteína derivada de un organismo diferente de ese en que es introducido o que reside en.
Al referirse a elementos reguladores de gen, "heterólogo" se refiere a un elemento regulador de gen que está ligado operablemente a un gen con el que no está asociado en la naturaleza. El término "expresión heteróloga", como se utiliza en la presente, significa que un ácido nucleico heterólogo que codifica una proteína (por ejemplo, una enzima) es puesto en una célula que no hace normalmente {es decir, expresa) esa proteína.
El término "análogo de lactosa," como se utiliza en la presente, se refiere a un compuesto utilizado como un substituto para la lactosa, en donde la porción de glucosa de la lactosa es reemplazada por otro grupo químico. Ejemplos de un análogo de la lactosa incluyen, pero no se limitan a, isopropil- -D-tio-galactósido (IPTG), fenil- -D-galactosa (fenil-Gal), y alolactosa.
El término "lípido," como se utiliza en la presente, se refiere a un grupo químicamente diverso de compuestos, la característica común y que los define es su insolubilidad en agua.
El término "ingeniería metabólica," como se utiliza en la presente, se refiere generalmente a la alteración dirigida y premeditada de las trayectorias metabólicas encontradas en un organismo para comprender y para utilizar mejor las trayectorias celulares para la transformación química, para la transducción de energía, y para el ensamble supramolecular.
El término "intermediario metabólico", como se utiliza en la presente, se refiere a una molécula de precursor producida por una serie de reacciones enzimáticas, que es alterada por las reacciones enzimáticas subsiguientes.
El término "microorganismo" se refiere a un organismo vivo tan pequeño en tamaño que es sólo visible con ayuda de un microscopio.
El término "mixotrófico," como se utiliza en la presente, se refiere a células u organismos capaces de utilizar una combinación de fuentes diferentes de energía y carbono, por ejemplo, utilizando fototrofia (significando crecimiento utilizando energía de la luz) y quimiotrofia (significando crecimiento utilizando energía por la oxidación de donadores de electrón), o entre autotrofia y heterotrofía química.
El término " ácido nucleico, " como se utiliza en la presenté, se refiere a un polímero de deoxiribonucleotido o ribonucleotido en cualquiera de la forma de una o dos cadenas, y a menos que de otro modo sea limitado, abarca análogos conocidos que tienen la naturaleza esencial de los nucleótidos naturales en que hibridizan a ácidos nucleicos de una cadena en una manera semejante a los nucleótidos naturales (por ejemplo, ácidos nucleicos peptídicos).
El término "nucleótido," como se utiliza en la presente, se refiere a un compuesto químico que consiste en una base heterocíclica, un azúcar, y uno o más grupos fosfato. En los nucleótidos más comunes la base es un derivado de purina o pirimidina, y el azúcar es la desoxiribosa o ribosa pentosa. Los nucleótidos son los monómeros de los ácidos nucleicos, con tres o más unidos juntos para formar un ácido nucleico. Los nucleótidos son las unidades estructurales de ARN, ADN, y muchos cofactores, incluyendo, pero no limitado a, CoA, FAD, DMN, NAD, a NADP. Las purinas incluyen adenina (A), y guanina (G)¡ las pirimidinas incluyen citocina (C), timina (T), y uracilo (U).
El término " ligado operablemente", como se utiliza en la presente, se refiere a una unión funcional entre un elemento o región reguladora genética y una segunda secuencia de ácido nucleico, en donde el elemento o región reguladora genética promueve, inhibe, termina, inicia, o media la transcripción, la traducción, el movimiento, el procesamiento, o el transporte, de la secuencia de ácido nucleico que corresponde a la segunda secuencia.
El término "origen de réplica", como se utiliza en la presente, se refiere a una secuencia particular en un genoma, en el cromosoma, o en el episoma en el que se inicia la réplica de ADN.
El término "marco de lectura abierto", como se utiliza én la presente, se refiere a una secuencia de nucleótidos en una molécula de ADN que codifica una secuencia de aminoácidos ininterrumpida por un codón de parada que tiene el potencial para codificar por lo menos una porción de un péptido o proteína. Un marco de lectura abierto completo inicia con un codón de inicio (típicamente ATG), seguido por una cadena de codones cada uno de los cuales codifica un aminoácido, y termina con un codón de parada (TAA, TAG o TGA). Los marcos de lectura abiertos a menudo pueden confirmarse igualando sus secuencias con una base de datos de genes secuenciados o etiquetas de secuencias expresadas (ESTs).
El término "sobreexpresado", como se utiliza en la presente, se refiere al aumento en la cantidad de un gen o producto de gen con respecto a una cantidad del gen o producto del gen bajo condiciones normales.
El término "péptido", como se utiliza en la presente, se refiere a un biopolímero formado de la unión, en un orden definido, de aminoácidos. El enlace entre un residuo de aminoácido y el siguiente se conoce como una amida o enlace peptídico. El término "polipéptido", como se utiliza en la presente, se refiere a una cadena única de aminoácidos, y una "proteína" se refiere a uno o más polipéptidos. Los términos polipéptido, péptido, y proteína son también inclusivos de modificaciones incluyendo, pero no limitadas a, glicosilación, fijación de lípidos, sulfación, gama-carboxilación de residuos de ácido glutámico, hidroxilación y ribosilación de ADP. Los polipéptidos no pueden ser enteramente lineales. Por ejemplo, los polipéptidos pueden estar ramificados a consecuencia de la ubiquitinación, y ellos pueden ser circulares, con o sin ramificación, generalmente a consecuencia de eventos post-traduccionales, incluyendo el evento del procesamiento natural y los eventos producidos por la manipulación humana que no ocurren naturalmente.
El término "Pfam" se refiere a una colección grande de dominios de proteína y familias de proteína mantenidos por el Consorcio de Pfám y disponible en varios sitios patrocinados de la red mundial, incluyendo: pfam.sanger.ac.uk/ (Welcome Trust, Sanger Institute); pfam.sbc.su.se/ (Stockholm Bioinformatics Center); pfam.janelia.org/ (Janelia Farm, Howard Hughes Medical Institute); pfam.jouy.inra.fr/ (Instituí national de la Rechérche Agronomique); y pfam.ccbb.re.kr/. La última liberación de Pfam es Pfam 24.0 (Octubre de 2009, 11912 familias) con base en la liberación dé la base de datos de proteínas UniProt 15.6, un compuesto de la liberación de Swiss-Prot 57.6 y liberación de TrEMBLe 40.6. Los dominios y las familias de Pfam son identificados utilizando múltiples alineaciones de secuencia y modelos ocultos de Markov (HMMs). Las familias de Pfam-A, que están basadas en tareas de alta calidad, son generadas por una alineación semilla curada utilizando a miembros representativos de una familia de proteína y modelos de Markov de perfil oculto con base en la alineación de la semilla. Todas las secuencias identificadas que pertenecen a la familia entonces son utilizadas para generar automáticamente una alineación completa para la familia (Sonnhammer et al. (1998) Nucleic Acids Research 26: 320-322; Bateman et al. (2000) Nucleic Acids Research 26: 263-266; Bateman et al. (2004) Nucleic Acids Research 32, Datábase Issue: D138-D141 ; Finn et al. (2006) Nucleic Acids Research Datábase Issue 34: D247-251 ; Finn et al. (2010) Nucleic Acids Research Datábase Issue 38: D21 1-222). Consiguiendo acceso a la base de datos de pfam, por ejemplo, utilizando cualquiera de los sitios web de referencia anteriores, las secuencias de proteína pueden ser consultadas contra los modelos ocultos de Markov (HMMs) utilizando software de búsqueda de homología de HMMER (por ejemplo, HMMER3, hmmer.janelia.Org/). Coincidencias significativas que identifican una proteína consultada como estando en una familia de pfam (o como teniendo un dominio particular de pfam) son ésos en que la puntuación en bits es mayor que o igual al umbral de acumulación para el dominio de Pfam. El término "umbral de acumulación (GA)" o "límite de acumulación", como se utiliza en la presente, se refiere a un valor del umbral de búsqueda que es utilizado para construir unía alineación completa. El umbral de acumulación es la puntuación mínima que una secuencia debe alcanzar para pertenecer a la alineación completa de una entrada de Pfam. El umbral de acumulación para la familia de 4-hidroxibenzoil-CoA tioesterasa (PF03061) es 20.6. Los valores esperados (valores e) también pueden ser utilizados como un criterio para la inclusión de una proteína consultada en un pfam o para determinar si una proteína consultada tiene un dominio particular de pfam, donde valores bajos de e (mucho menores que 1.0, por ejemplo menor que 0.1 , o menor o igual que 0.01) representan probabilidades bajas de que una coincidencia se deba a la casualidad.
El término "fototrófico," como se utiliza en la presente, se refiere a un organismo que utiliza la luz del sol como su fuente primaria de energía. El crecimiento o cultivo "fototrófico" significa el crecimiento o el cultivo en el que los organismos utilizan luz, y moléculas no orgánicas, para la energía.
El término "microorganismo fotosintético," como se utiliza en la presente, incluye, pero no se limita a, todas las algas, microalgas, y bacterias fotosintéticas, que pueden crecer fototróficamente.
El término "plásmido," como se utiliza en la presente, se refiere a una molécula de ADN que se separa de, y puede replicarse independientemente del ADN cromosomático de una célula. Es de dos cadenas, en muchos casos, circular.
El término "polipéptido" es utilizado en la presente para referirse a un péptido que contiene de aproximadamente 10 a más que aproximadamente 1000 aminoácidos.
El término "polinucleótido" o "molécula de ácido nucleico" se refiere a un desoxiribopolinucleótido, ribopolinucleótido, o un analógico de los mismos que tiene la naturaleza esencial de un desoxiribopolinucleótido o ribonucleótido natural en que se híbridiza, bajo condiciones rigurosas de hibridación, a substancialmente la misma secuencia de nucleótidos como los nucleótidos que existen naturalmente y/o permite la traducción en los mismos aminoácidos como los nucleótidos que existen naturalmente. Un polinucleótido puede ser de longitud completa o una sub-secuencia de un gen nativo o heterólogo estructural o regulador. A menos que de otro modo sea indicado, el término incluye referencia a la secuencia especificada así como a la secuencia complementaria del mismo. Así, los ADN o los ARN con estructuras principales modificadas para la estabilidad o por otras razones son "polinucleótidos" como ese término es pensado en la presente. Además, los ADN o los ARN que comprenden bases inusuales, tales como inosina, o bases modificadas, tales como bases de tritiladas, para denominar sólo dos ejemplos, son polinucleótidos como el término es utilizado en la presente. Será apreciado que una gran variedad de modificaciones que han sido realizadas al ADN y al ARN que sirven muchos propósitos útiles son conocidas por los expertos en la técnica. El término polinucleótido, como es empleado en la presente, abarca tales formas químicamente, enzimáticamente o metabólicamente modificadas de los polinucleótidos, así como las formas químicas de ADN y ARN características de los virus y células, incluyendo entre otras cosas, células sencillas y complejas.
El término "cebador" se refiere a una molécula de ácido nucleico que, cuando es hibridizado a una cadena de ADN o ARN, es capaz de servir como el sustrato al que los nucleótidos son agregados en la síntesis de un producto de extensión en la presencia de un agente conveniente de polimerización (por ejemplo,, una ADN polimerasa). A veces, el cebador es lo suficientemente largo para hibridizar únicamente a una región específica de una cadena de ADN o de ARN.
El término "promotor," como se utiliza en la presente, se refiere a una región de ADN próxima al sitio de comienzo de la transcripción, que participa en el reconocimiento y unión de la polimerasa de ARN y otras proteínas para iniciar la transcripción. Un promotor dado puede trabajar armónicamente con otras regiones reguladoras (mejoradores, silenciadores, elementos/aislantes de frontera) para dirigir el nivel de transcripción de un gen dado.
El término "promotor lac," como se utiliza en la presente, se refiere a un promotor del operón lac, cuya actividad de transcripción es reprimida por una proteína represora (es decir, la proteína Lacl codificada por el gen lacl) pero liberado por un inductor, tal como, lactosa o análogos de la misma (por ejemplo, isopropil- -D-tiogalactósido (IPTG)). El inductor une a la proteína del represora y la previene de reprimir la transcripción del gen.
El término "promotor tac," como se utiliza en la presenté, se refiere a un promotor híbrido fuerte compuesto de la posición -35 de región del promotor trp y la posición -10 de región del promotor/operario lacUVS. La expresión del promotor tac es reprimida por la proteína Lacl. El alelo de laclq es una mutación de promotor que aumenta la concentración intracelular del represor de Lacl, que tiene como resultado una represión fuerte del promotor tac. La actividad transcripcional del promotor tac es controlada por una lactosa o análogos de la misma.
El término "promotor trc," como se utiliza en la presenté, se refiere a una secuencia híbrida del promotor de los promotores lac y trp. La actividad de transcripcional del promotor trc también es controlada por la lactosa o análogos de la misma. Un ejemplo de un promotor trc es el promotor trcY (5'-CTGAAATGAGCTGTTGACAATTAATCATCCGGCTCGTATAATGTGTGGAAT TGTGAGCGGATAACAATTTCACACTAAGGAGGAAAAAAA-3'; SEQ ID NO:52).
El término "recombinación," como se utiliza en la presente, se refiere al proceso por el cual piezas de ADN son separadas y recombinadas. El término "recombinación homologa," como se utiliza en la presente, se refiere a un tipo de recombinación genética en la que secuencias de nucleótidos son intercambiadas entre dos moléculas similares o idénticas de ADN.
Una molécula de ácido nucleico "recombinante" o "diseñada" es una molécula de ácido nucleico que ha sido alterada por manipulación humana. Como ejemplos no limitativos, una molécula recombinante de ácido nucleico incluye alguna molécula de ácido nucleico que: 1) ha sido sintetizada completamente o parcialmente o modificada in vitro, por ejemplo, utilizando técnicas químicas o enzimáticas {por ejemplo, por el uso de la síntesis química de ácido nucleico, o por el uso de enzimas para la replicación, la polimerización, la digestión (exonucleolítica o endonucleolítica), lá ligación, transcripción inversa, la transcripción, modificación de base (incluyendo, por ejemplo,, metilación, la integración o la recombinación (incluyendo recombinación homologa y específica de sitio) de moléculas de ácido nucleico); 2) incluye secuencias unidas de nucleótidos que no están unidas en la naturaleza, 3) ha sido diseñado utilizando técnicas de clonación molecular de manera que carece de uno o más nucleótidos con respecto a la secuencia de la molécula de ácido nucleico que existe naturalmente, y/o 4) ha sido manipulado utilizando técnicas de clonación molecular de manera que tiene uno o más cambios de secuencia o nuevos arreglos con respecto a la secuencia de ácido nucleico que existe naturalmente. Como ejemplos no limitativos, un ADNc es una molécula recombinante de ADN, como lo es cualquier molécula de ácido nucleico que ha sido generada por reacciones de polimerasa in vitro, o a la cual se han unido enlazadores, o que ha sido integrada en un vector, tal como un vector de clonación o vector de expresión.
Cuando se aplica a organismos, el término recombinante, diseñado, o genéticamente diseñado se refiere a organismos que han sido manipulados por introducción de una secuencia de ácido nucleico exógena o recombinante en el organismo, e incluyen organismos que tienen supresión de gen, mutaciones dirigidas, deleciones, o inserciones, así como organismos que tienen genes exógenos que han sido introducidos en el organismo. Una molécula de ácido nucleico exógena o recombinante puede ser integrada en el genoma del organismo recombinante/genéticamente diseñado o en otros casos puede no ser integrado en el genoma del organismo recombinante/genéticamente diseñado.
El término "proteína recombinante," como se utiliza en la presente, se refiere a una proteína producida por la ingeniería genética.
El término "recombinasa," como se utiliza en la presenté, se refiere a una enzima que cataliza la recombinación genética.
"Carbono reducido" o un "compuesto de carbono reducido" o "fuente de carbono reducido" se refiere a una molécula a base de carbono que incluye carbono e hidrógeno y puede ser utilizada como una fuente de energía por un organismo, ya sea por oxidación o glucólisis. Ejemplos no limitativos de carbono reducido son azúcares (incluyendo polisacáridos y almidón), alcoholes (incluyendo glicerol y alcoholes de azúcar), las formas de ácidos orgánicos (por ejemplo, el acetato, el citrato, succinato, etc.), los aminoácidos, las proteínas, los lípidos, y los ácidos grasos. El carbono reducido es referido a veces como el "carbono orgánico".
El término "secuencia reguladora" (también referida como una "región reguladora" o "elemento regulador" ) se refiere a un promotor, mejorador, región sin traducción hacia 5', región sin traducción hacia 3', sitio de unión de ribosoma, u otro segmento de ADN o ARN que regula la expresión de un gen próximo.
Los términos "residuo de aminoácido" y "aminoácido" son utilizados intercambiablemente para referirse a un aminoácido que es incorporado en una proteína, en un polipéptido, o en un péptido, incluyendo, pero no limitado a, un aminoácido que existe naturalmente y análogos conocidos de aminoácidos naturales que pueden funcionar en una manera similar a los aminoácidos que existen naturalmente.
Los términos siguientes son utilizados en la presente para describir las relaciones de secuencia entre dos o más ácidos nucleicos o polinucleótidos: (a) "secuencia de referencia", (b) "ventana de comparación", (c) "identidad de secuencia", (d) "porcentaje de identidad de secuencia", y (e) "identidad sustancial".
El término "secuencia de referencia" se refiere a una secuencia utilizada como una base para la comparación de secuencia. Una secuencia de referencia puede ser un subconjunto o la totalidad de una secuencia especificada; por ejemplo, como un segmento de una secuencia de ADNc de longitud completa o de gen, o la secuencia completa de ADNc o de gen.
El término "ventana de comparación" se refiere a un segmento contiguo y especificado de una secuencia de polinucleótido, en donde la secuencia de polinucleótido puede ser comparada a una secuencia de referencia y en donde la porción de la secuencia de polinucleótido en la ventana de comparación puede comprender adiciones o deleciones (es decir, vacíos) en comparación a la secuencia de referencia (que no comprende adiciones o deleciones) para la alineación óptima de las dos secuencias. Generalmente, la ventana de comparación es por lo menos 20 nucleótidos contiguos de largo, y puede ser opcionalmente por lo menos 30 nucleótidos contiguos de largo, por ejemplo por lo menos 40 nucleótidos contiguos de largo, por lo menos 50 nucleótidos contiguos de largo, por lo menos 100 nucleótidos contiguos de largo, o más largo. Los expertos en la técnica comprenden que para evitar una similitud alta a una secuencia de referencia debido a la inclusión de vacíos en la secuencia de polinucleótido, una pena de vacío es introducida típicamente y es restada del número de coincidencias.
Los métodos de alineación de las secuencias para la comparación son bien conocidos en la técnica. La alineación óptima de las secuencias para la comparación puede ser realizada por el algoritmo local de homología de Smith y Waterman, Adv. Appl. Math. 2:482 (1981); by the homology alignment algorithm of Needleman and Wunsch, J. Mol. Biol. 48:443 (1970); by the search for similarity method of Pearson and Lipman, Proc. Nati. Acad. Sci. 85:2444 (1988); por implementaciones computarizadas de estos algoritmos, incluyendo, pero no limitado a: CLUSTAL en el programa PC/Gene por Intelligenetics, Mountain View, Calif.; GAP, BESTFIT, BLAST, FASTA, y TFASTA en el paquete de software Wisconsin Genetics, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis., USA; el programa CLUSTAL es bien descrito por Higgins y Sharp, Gene 73:237-244 (1988); Higgíns y Sharp, CABIOS 5:151-153 (1989); Corpet, et al., Nucleic Acids Research 16:10881-90 (1988); Huang, et al., Computer Applications in the Biosciences 8:155-65 (1992), y Pearson, et al., Methods in Molecular Biology 24:307-331 (1994). La familia de programas BLAST, que puede utilizarse para búsquedas de similitud en bases de datos, incluye: BLASTN para secuencias de consulta de nucleótido contra secuencias de base de datos de nucleótido; BLÁSTX para secuencias de consulta de nucleótido contra secuencias de base de datos de proteína; BLASTP para secuencias de consulta de proteína contra secuencias de base de datos de proteína; TBLASTN para secuencias de consulta de proteína contra secuencias de base de datos de nucleótido; y TBLASTX para secuencias de consulta de nucleótido contra secuencias de base de datos de nucleótido. Vea, Current Protocols in Molecular Biology, Chapter 19, Ausubel, et al., Eds., Greene Publishing and Wiley-lntersciénce, New York (1995).
A menos que de otro modo sea indicado, los valores de identidad/similitud de secuencia proporcionadas en la presente se refieren al valor obtenido utilizando la serie de programas BLAST 2.0 utilizando parámetros predefinidos. AltschuI et al., Nucleic Acids Res. 25:3389-3402 (1997). El software para realizar los naálisis BLAST está disponible al público, por ejemplo, a través del NationalCenter for Biotechnology-lnformation en ncbi.nlm.nih.gov. Este algoritmo implica primero identificar pares de secuencias. de puntuación alta (HSPs) al identificar palabras cortas de longitud W en la secuencia de cola, ya sea que concuerden o satisfagan alguna puntuación de umbral T de valor positivo cuando se alinea con una palabra de la misma longitud en una secuencia de base de datos. T se refiere al umbral de puntuación de palabra del vecindario (AltschuI et al., supra). Estos aciertos de palabra del vecindario iniciales actúan como semillas para iniciar búsquedas para encontrar HSPs más largos que los contengan. Los aciertos de la palabra entonces son extendidos en ambas direcciones a lo largo de cada secuencia por tanto tiempo como se aumente la puntuación de alineación acumulativa. Las calificaciones acumulativas son calculadas utilizando, para secuencias de nucleótido, los parámetros M (puntuación de recompensa para un par de residuos coincidente; siempre> 0) y N (puntuación de penalización para residuos no coincidentes; siempre<0). Para secuencias de aminoácido, una matriz de puntuación es utilizada para calcular la puntuación acumulativa. La ampliación de los aciertos de palabras en cada dirección se detiene cuando: la puntuación de alineación acumulativa cae del valor máximo alcanzado en la cantidad X; la puntuación acumulativa desciende a cero o por debajo de éste debido a la acumulación de una o más alineaciones de residuos de puntuación negativa; o se llega al final de cualquier secuencia. Los parámetros de algoritmo BLAST, W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para la secuencia de nucleótido) utiliza como valores predefinidos una longitud de palabra (W) de 1 1 , un valor esperado (E) de 10, un corte de 100, M=5, N=-4, y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa BLASTP utiliza como valores predefinidos una longitud de palabra (W) de 3, un valor esperado (E) de 10, y la matriz de puntuación BLOSUM62 (vea Henikoff & Henikoff, Proc. Nati. Acad. Sci. USA, 1989, 89:10915).
Además para calcular el porcentaje de la identidad de secuencia, el algoritmo BLAST también realiza un análisis estadístico de la similitud ¡entre las dos secuencias (vea, por ejemplo, Karlin & Altschul, Proc. Nati. Acad. Sci. USA, 1993, 90: 5873-5787). Una medida de similitud proporcionada por el algoritmo de BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de la probabilidad de que ocurra por causalidad una coincidencia entre las dos secuencias de nucleótido o aminoácido. Las búsquedas de BLAST asumen que las proteínas pueden ser modeladas como secuencias aleatorias. Sin embargo, muchas proteínas verdaderas comprenden regiones de secuencias no aleatorias, que pueden ser tractos homopoliméricos, repeticiones de periodo corto, o regiones enriquecidas en uno o más aminoácidos. Tales regiones de baja complejidad pueden ser alineadas entre proteínas no relacionadas aunque otras regiones de la proteína sean enteramente diferentes. Varios programas de filtro de baja complejidad pueden ser empleados para reducir tales alineaciones de baja complejidad. Por ejemplo, el SEG (Wooten and Federhen, Comput. Chem., 1993, 17:149-163) y XNU (Claverie and States, Comput. Chem., 1993, 17:191-201) los filtros de baja complejidad pueden ser utilizados solos o en combinación.
Como se utiliza en la presente, "identidad de secuencia" o "identidad" en el contexto de dos secuencias de ácido nucleico o polipéptido se refiere a los residuos en las dos secuencias que son iguales cuando se alinean para la correspondencia máxima sobre una ventana de comparación especificada. Cuando se utiliza el porcentaje de identidad de secuencia con respecto a proteínas, es reconocido que las posiciones de residuo que rio son idénticas a menudo varían por sustituciones conservadoras de aminoácidos, es decir, donde los residuos de aminoácido son sustituidos por otros residuos de aminoácidos con propiedades químicas semejantes (por ejemplo, la carga y/o hidrofobicidad) y por lo tanto no cambian las propiedades funcionales de la molécula. Dónde las secuencias varían en las sustituciones conservadoras, el porcentaje de la identidad de secuencia puede ser ajustada hacia arriba para corregir la naturaleza conservadora de la sustitución. Las secuencias que varían por tales sustituciones conservadoras se dice que tienen "similitud de secuencia" o "similitud". Los medios para hacer este ajuste son bien conocidos por los expertos en la técnica. Típicamente esto implica calificar una sustitución conservadora como una no coincidencia parcial más que completa, aumentando así el porcentaje de la identidad de secuencia. Así, por ejemplo, donde se da a un aminoácido idéntico una puntuación de 1 y e da a una sustitución no conservadora una puntuación de cero, se da a una sustitución conservadora una puntuación entre cero y 1. La puntuación de las sustituciones conservadoras se calcula, por ejemplo, según el algoritmo de Meyers y Miller, Computer Applic. Biol. Sci., 1988, 4:1 1-17, por ejemplo, como se implementa en el programa PC/GENE (Intelligenetics, Mountain View, Calif., USA).
Como se utiliza en la presente, "porcentaje de identidad de secuencia" significa el valor determinado comparando dos secuencias óptimamente alineadas sobre una ventana de comparación, en donde la porción de la secuencia de polinucleótido en la ventana de comparación puede comprender adiciones o deleciones (es decir, vacíos) con respecto a la secuencia de referencia (que no comprende adiciones o deleciones) para la alineación óptima de las dos secuencias. El porcentaje es calculado determinando el número de posiciones en las que la base de ácido nucleico o residuo de aminoácido idéntico ocurre en mabas secuen cias para producir el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes entre el número total de posiciones en la ventana de comparación, y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia. A menos que de otro modo sea indicado, el % de homología de una secuencia es a través de la longitud entera de la secuencia de consulta (la ventana de comparación).
El término "identidad substancial" de las secuencias de polinucleótidos significa un polinucleótido que comprende una secuencia que tiene por lo menos 70% de identidad de secuencia, por ejemplo por lo menos 80% de identidad de secuencia, por lo menos 85% de identidad de secuencia, por lo menos 90% de identidad de secuencia, por lo menos 95% de identidad de secuencia, por lo menos 96% de identidad de secuencia, por lo menos 97% de identidad de secuencia, por lo menos 98% de identidad de secuencia, o por lo menos 99% de identidad de secuencia, comparado a una secuencia de referencia utilizando uno de los programas de alineación descrito utilizando parámetros estándar. Un experto en la técnica reconocerá que éstos valores pueden ser ajustados apropiadamente para determinar la identidad correspondiente de las proteínas codificadas por dos secuencias de nucleótidos tomando en cuenta la degeneración del codón, la similitud de los aminoácidos, el posicionamiento del marco de lectura y similares. La identidad substancial de las secuencias de aminoácido para estos fines normalmente significa una identidad de secuencia de por lo menos 60%, por ejemplo por lo menos 70%, por lo menos 80%, por lo menos 85%, por lo menos 90%, ø por lo menos 95%. Otra indicación de que las secuencias de nucleótidos son substancialmente idénticas es si dos moléculas hibridizan entre sí bajo condiciones rigurosas. Sin embargo, los ácidos nucleicos que no hibridizan entre sí bajo condiciones rigurosas todavía son substancialmente idénticos si los polipéptidos a los que codifican son substancialmente idénticos. Esto puede ocurrir, por ejemplo, cuando una copia de un ácido nucleico es creada utilizando la degeneración máxima del codón permitida por el código genético. Una indicación de que dos secuencias de ácidos nucleicos son substancialmente idénticas es que el polipéptido al que codifica el primer ácido nucleico sea inmunológicamente reactiva cruzado con el polipéptido codificado por el segundo ácido nucleico.
Los términos "identidad sustancial" en el contexto de un péptido indica que un péptido comprende una secuencia con por lo menos 70% de identidad de secuencia a una secuencia de referencia, por ejemplo por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, o por lo menos 99% de identidad de secuencia a la secuencia de referencia, sobre una ventana de comparación especificada. Opcionalmente, la alineación óptima es realizada utilizando el algoritmo de alineación de homología de Needleman y Wunsch, J. Mol. Biol. 48:443 (1970). Una indicación de que dos secuencias peptídicas son substancialmente idénticas es que un péptido sea inmunológicamente reactivo con anticuerpos levantados contra el segundo péptido. Así, un péptido es substancialmente idéntico a un segundo péptido, por ejemplo, donde los dos péptidos varían sólo por una sustitución conservadora. Los péptidos que son "substancialmente similares" comparten secuencias como fue notado antes excepto que las posiciones del residuo que no son idénticas pueden variar por cambios conservadores de aminoácidos.
Una "variante" de un gen o secuencia ácido nucleico es una secuencia que tiene por lo menos 65% de identidad con el gen o secuencia ácido nucleico referenciada, y puede incluir una o más deleciones de base, adiciones, o sustituciones con respecto a la secuencia referenciada. Las diferencias en las secuencias pueden ser el resultado de cambios, ya sea naturalmente o por diseño, en la secuencia o la estructura. Los cambios naturales pueden surgir durante el curso de la replicación o duplicación normal en la naturaleza de la secuencia de ácido nucleico particular. Los cambios diseñados pueden ser diseñados específicamente y pueden ser introducidos en la secuencia para propósitos específicos. Tales cambios específicos pueden ser realizados in vitro utilizando una variedad de técnicas de mutagénesis. Tales variantes de la secuencia generada específicamente pueden ser referidas como "mutantes" de la secuencia original.
Una "variante" de un péptido o proteína es una secuencia de péptido o proteína que varía en una o más posiciones de aminoácido con respecto al péptido o proteína de referencia. Una variante puede ser una variante que existe naturalmente o puede ser el resultado dé mutaciones espontáneas, inducidas o genéticamente diseñadas a la molécula de ácido nucleico que codifica el péptido o proteína variante. Un péptido variante también puede ser una variante químicamente sintetizada.
Una "variante conservadora" de un polipéptido es un polipéptido que tiene una o más sustituciones conservadoras de aminoácido con respecto al polipéptido de referencia, en el que la actividad, afinidad de sustrato, afinidad de unión del polipéptido no varía substancialmente de ese del polipéptido de referencia.
Un técnico experto puede producir igualmente variantes de polipéptido que tienen una sola o múltiples sustituciones de aminoácido, deleciones, adiciones, y/o reemplazo. Estas vahantes pueden incluir, entre otras: (a) variantes en las que uno o más residuos de aminoácido son sustituidos con aminoácidos conservadores o no conservadores; (b) variantes en las que uno o más aminoácidos son agregados; (c) variantes en las que por lo menos un aminoácido incluye un grupo sustituyente; (D) variantes en las que los residuos de aminoácidos de una especie son sustituidos por el correspondiente residuo en otra especie, ya sea en posiciones conservadas o no conservadas; y (e) variantes en las que una proteína diana es fusionada con otro péptido o polipéptido tal como un socio de fusión, una etiqueta de proteína u otra porción química, que puede conferir propiedades útiles a la proteína diana, tal como, por ejemplo, un eepítope para un anticuerpo. Las técnicas para obtener tales variantes, incluyendo genéticas (supresiones, deleciones, mutaciones, etc.), química, y técnicas enzimáticas son conocidas por los técnicos expertos. Como se utiliza en la presente, el término "mutación" se refiere a un cambio de la secuencia de ADN dentro de un gen o cromosoma de un organismo lo que tiene como resultado la creación de un nuevo carácter o rasgo no encontrado en el tipo parental, o en el proceso por el que tal cambio ocurre en un cromosoma, ya sea por una alteración en la secuencia de nucleótido de la codificación de ADN para un gen o a través de un cambio en el arreglo físico de un cromosoma. Tres mecanismos de mutación incluyen sustitución (intercambio de un par de base por otro), adición (la inserción de una o más bases en una secuencia), y la deleción (pérdida de uno o más pares de bases).
El término "hibridiza específicamente," como se utiliza en la presente, se refiere al proceso por el cual un ácido nucleico distintivamente o definitivamente forma pares de bases con regiones complementarias de por lo menos una cadena de la secuencia diana de ácido nucleico que no fue apareada originalmente al ácido nucleico. Un ácido nucleico que hibridiza selectivamente se somete a hibridación, bajo condiciones rigurosas de hibridación, de la secuencia de ácido nucleico a una secuencia diana de ácido nucleico especificado a un grado perceptiblemente más grande (por ejemplo, por lo menos 2 veces sobre fondo) que su hibridación a secuencias no diana de ácidos nucleico y a una exclusión sustancial de ácido nucleicos no diana. Selectivamente hibridizar secuencias tiene típicamente aproximadamente por lo menos 80% de identidad de secuencia, por lo menos 85% de identidad de secuencia, por lo menos 90% de identidad de secuencia, por ló menos 95% de identidad de secuencia, por lo menos 96% de identidad de secuencia, por lo menos 97% de identidad de secuencia, por lo menos 98% de identidad de secuencia, por lo menos 99% de identidad de secuencia, o aproximadamente 100% de identidad de secuencia (es decir, complementaria) entre sí.
El término "establemente integrado," como se utiliza en la presente, significa que el material genético exógeno o heterólogo es integrado en un genoma hospedero y es heredado por los descendientes de la célula.
El término "tioesterasa (TE)" o "tioéster hidrolasa", como se utiliza en la presente, se refiere a un grupo grande de enzima cuyos miembros hidrolizan el enlace de tioéster entre un grupo carbonilo y un átomo de azufre. Son clasificados por el Comité de Nomenclatura de la Unión Internacional dé Bioquímica y Biología Molecular (NC-IUBMB) en EC (la comisión de enzima) 3.1.2.1 a EC 3.1.2.27, así como EC 3.1.2 - para TEs no clasificadas. Los sustratos de 15 de estas 27 agrupaciones contienen la coenzima A (CoA), dos contienen proteínas portadoras de acilo (ACPs), cuatro tienen glutationa o sus derivados, una tiene ubiquitina, y dos contienen otras porciones. Además, tres agolpamientos han sido borrados (Cantu et al. (2010) Protein Science, 19:1281-1295).
El término "triaciloglicerol" o "triglicéridos," como se utiliza en la presente, se refiere a una clase de compuestos que consisten en gliceról (un alcohol de trihidroxi de tres carbono) con un ácido graso ligado a cada uno de los tres grupos OH por un enlace éster.
El término "péptido transitorio", como se utiliza en la presente, se refiere a una secuencia peptídica, a menudo en el N-terminal de una proteína precursora, que dirige un producto de gen a su destino celular específico, tal como plátido.
El término "subexpresado", como se utiliza en la presente, se refiere a la disminución de la cantidad de un gen o producto de gen con respecto a la cantidad de un gen o producto de gen bajo condiciones normales.
El término "vector" es utilizado en la presente para referirse a cualquier agente que actúa como un portador o transportador, tal como un fago, plásmido, cósmido, bácmido, fago o virus, al que otra secuencia o elemento genético (ya sea ADN o ARN) puede ser unida de manera qúe la secuencia o elemento pueda ser transportado dentro de una célula hospedera.
El término "vector de expresión," como se utiliza en la presente, se refiere generalmente a una molécula de ácido nucleico que ha sido construida de tal manera que, después de la inserción de una, molécula de ADN, su secuencia de codificación es transcrita apropiadamente en una molécula de ARN y en la molécula de ARN puede ser traducida opcionalmente a una proteína. El constructo de ácido nucleico, que puede ser un vector, es diseñado con frecuencia para contener secuencias reguladoras que actúan como las regiones mejoradoras y promotoras, que conducen a transcripción eficiente del marco de lectura abierto portado por el vector de expresión.
La base de datos "Uniprot," o Recurso de Proteína Universal, incluye bases de datos completas de proteínas que extrae de suizo-Prot, TrEMBL (biblioteca de datos de secuencia de nucleotidos de EMBL traducida), y la Base de datos de Secuencia de Proteínas. Las secuencias de proteínas pueden ser buscadas contra la base de datos de Uniprot en la uniprot.org.
El término "cera" o "ésteres cerosos," como se utiliza en la presente, se refiere a ésteres de ácidos grasos de cadena larga y alcoholes alifáticos monohídricos de cadena recta, que forman sólidos o sustancias flexibles bajo un conjunto identificado de condiciones físicas.
El término "tipo silvestre," como se utiliza en la presente, se refiere a un organismo o fenotipo como es encontrado en la naturaleza.
I. Microorganismo genéticamente diseñado para producir ácidos grasos libres v/o derivados La invención descrita proporciona microorganismos que comprenden moléculas de ácido nucleico recombinante que codifican las 4-hidroxibenzoil-CoA tioesterasas (4-HBTs) utilizadas para producir ácidos grasos libres y/o derivados de ácidos grasos libres. Los genes de 4-hidroxibenzoil-CoA tioesterasa fueron identificados por una pantalla funcional para el aumento de la producción de ácidos grasos libres y validados por un ensayo bioquímico específico utilizando acil-ACP como un sustrato. La familia de 4-hidroxibenzoil-CoA tioesterasa es designada como PF03061 por la base de datos anotada de bioinformática de las familias de proteínas (Bateman et al. (2000) Nucleic Acids Research 28:263-266; Bateman et al. (2006) Nucleic Acids Research 32:D138-D141 , Finn et al. (2010) Nucleic Acids Research 38:D21 1-222). Las tioesterasas de procarióticos expresadas en un microorganismo fotosintético como es proporcionado en la presente puede tener la designación de la Comisión de Enzima (EC) EC 3.1.2.23.
La súperfamilia de 4-hidroxibenzoil-CoA tioesterasas ha sido anotada anteriormente en la base de datos pública por su actividad hidrolizante hacia el 4-hidroxibenzoil-CoA. Basado en el análisis de bioinformática, caracterización bioquímica, y expresión de secuencias identificadas en microorganismos, la invención descrita proporciona que las enzimas de 4-hidroxibenzoil-CoA tioesterasa también posean actividad hidrolizante hacia los sustratos de acil-ACP y por lo tanto puedan ser utilizadas para producir ácidos grasos libres y/o derivados en microorganismos.
Según un aspecto, la invención presente proporciona un microorganismo que incluye una molécula recombinante de ácido nucleico que comprende una secuencia que codifica una 4-hidroxibenzoil-CoA tioesterasa. El microorganismo genéticamente diseñado puede producir por lo menos un ácido graso libre y/o derivado de ácido graso. La 4-hidroxibenzoil-CoA tioesterasa, cuando es expresada en un microorganismo, puede hidrolizar una molécula de acil-ACP.
Adicionalmente o alternativamente, la cantidad de por lo menos un ácido graso libre y/o derivado de ácido graso producido por el microorganismo genéticamente diseñado puede ser por lo menos dos veces la cantidad del ácido graso libre y/o derivado de ácido graso producido por el mismo microorganismo que no incluye un gen exógeno de 4-hidroxiberizoil-CoA tioesterasa. Por ejemplo, el microorganismo fotosintético que incluye la molécula recombinante de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa puede producir por lo menos 30 mg por litro, por ejemplo por lo menos 40 mg por litro o por lo menos 50 mg por litro, de ácidos grasos libres y/o derivados. Por ejemplo, el microorganismo hospedero puede expresar la tioesterasa de manera que uno o más ácidos grasos y/o derivados de ácido graso pueda ser producido.
El microorganismo genéticamente diseñado puede ser cualquier microorganismo, incluyendo, pero no limitado a, un heteroconto (incluyendo traustoquitridos), hongos, bacteria, microalga, ni cianobacteria. Ejemplos de anfitriones microbianos convenientes para el uso con la invención revelada incluyen, pero no se limitan a, los miembros de los géneros Clostrídium, Zymomonas, Escherichia, Salmonella, Rhodococcus, Pseudomonas, Bacillus, Lactobacillus, Enterococcus, Alcaligenes, Klebsiella, Paenibacillus, Arthrobacter, Corynebactenum, Brevibacterium, Pichia, Candida, Hansenula, y Saccharomyces. Ejemplos de anfitriones de traustoquitrido particular incluyen pero no se limitan a Schizochytrium sp. y Thraustochytrium sp.
El organismo hospedero genéticamente diseñado puede alternativamente o adicionalmente ser un microorganismo fotosintético, tal como, una microalga. Las algas eucarióticas representativas que pueden ser útiles como organismos hospederos pueden incluir, pero no se limitan a, algas verdes (clorofitas), las algas rojas (rodofitas), las diatomeas (bacilariofitas), prasinofitas, glaucofitas, cloraraquniofitas, euglenofitas, cromofitas, y dinoflagelados. Ejemplos no limitaticos de un género microalgal que puede contener una molécula exógena de ácido nucleico que codifica una aciUACP tioesterasa procariótica inclyen, pero no se limitan a, Achnanthes, Amphiprora, Amphora, Ankistrodesmus, Asteromonas, Boekelovia, Borodinella, Botryococcus, Bracteococcus, Chaetoceros, Cartería, Chlamydomonas, Chlorococcum, Chlorogonium, Chlorella, Chroomonas, Chrysosphaera, Cricosphaera, Crypthecodinium, Cryptomonas, Cyclotella, Dunaliella, Ellipsoidon, Emiliania, Eremosphaera, Ernodesmius, Euglena, Franceia, Fragilaria, Gloeothamnion, Haematococcus, Halocafeteria, Hymenomónas, Isochrysis, Lepocinclis, Micractinium, Monoraphidium, Nannochloris, Nannochloropsis, Navícula, Neochlorís, Nephrochloris, Nephroselmis, Nitzschia, Ochromonas, Oedogonium, Oocystis, Ostreococcus, Pavlova, Parachlorella, Paschería, Phaeodactylum, Phagus, Picochlorum, Platymonas, Pleurochrysis,, Pleurococcus, Prototheca, Pseudochlorella, Pseudoneochloris, Pyramimonas, Pyrobotrys, Scenedesmus, Skeletonema, Spyrógyra, Stichococcus, Tetraselmis, Thalassiosira, Viridiella, y Volvox.
Alternativamente, el microorganismo puede ser una especie cianobacterial. Ejemplos no limitativos de un género cianobacterial que puede incluir una molécula de ácido nucleico exógena que codifica una 4-hidroxibenzoil-CoA tioesterasa incluyen, pero no se limitan a, Agmenellum, Anabaena, Anabaenopsis, Anacystis, Aphanizomenon, Arthrospira, Asterocapsa, Borzia, Calothrix, Chamaesiphon, Chlorogloeopsis, Chroococcidiopsis, Chroococcus, Crinalium, Cyanobacterium, Cyanobium, Cyanocystis, Cyanospira, Cyanothece, Cylindrospermopsis, Cylindrospermum, Dactylococcopsis, Dermocarpella, Fischerella, Fremyella, Geitleria, Geitlerinema, Gloeobacter, Gloeocapsa, Gloeothece, Halospirulina, lyengaríella, Leptolyngbya, Limnothrix, Lyngbya, Microcoieus, Microcystis, Myxosarcina, Nodularía, Nostoc, Nostochopsis, Oscillatoria, Phormidium, Planktothrix, Pleurocapsa, Prochlorococcus, Prochloron, Prochlorothrix, Pseudanabaena, Rivularia, Schizothrix, Scytonema, Spirulina, Stanieria, Starria, Stigonema, Symploca, Synechococcus, Synechocystis, Thermosynechococcus, Tolypothrix, Trichodesmium, Tychonema, y Xenococcus. Por ejemplo, el microorganismo fotosintético puede ser una especie Synechococcus, Synechocystis, o Thermosynechococcus. Alternativamente, el microorganisma puede ser una especie Cyanobium, Cyanothece, o Cyanobacterium, o además alternativamente^ el microorganismo puede ser una especie Gloeobacter, Lyngbya o Leptolyngba.
El gen de 4-hidroxibenzoil-CoA tioesterasa puede ser cualquier gen de 4-hidroxibenzoil-CoA tioesterasa que, cuando se expresa en el microorganismo, puede tener como resultado la producción de ácidos grasos libres y/o derivados por el microorganismo. Las 4-hidroxibenzoil-CoA tioesterasas consideradas útiles en la presente pueden incluir miembros de la familia de 4-hidroxibenzoil-CoA tioesterasa (por ejemplo, PF03061 ; vea pfam.cgb.ki.se/ o pfam.janelia.org/ o pfam.sanger.ac.uk/) que cuando se consultan contra la base de datos anotada de bioinformática de familias de proteínas Pfam, puede demostar una coincidencia con la familia de Pfam de 4-hidroxibenzoil-CoA tioesterasa (PF03061) con una puntuación en bits mayor que la puntuación de acumulación de umbral (por ejemplo, una puntuación en bits mayor que 20.6), y/o puede demostrar una coincidencia con la Pfam-A con la familia de Pfam de 4-hidroxibenzoil-CoA tioesterasa con un valor esperado (valor e) menor que 0.01 (Bateman et al. (2000) Nucleic Acids Research 28:263-266; Bateman et al. (2006) Nucleic Acids Research 32:D138-D141 , Finn et al. (2010) Nucleic Acids Research 38:D21 1-222), Las 4-hidroxibenzoil-CoA tioesterasas expresadas en un microorganismo fotosintético como se proporciona en la presente pueden tener la designación de la Comisión de Enzima (EC) EC 3.1.2.23.
La invención presente se relaciona además a microorganismos que incluyen moléculas de ácido nucleico que codifican variantes de 4-hidroxibenzoil-CoA tioesterasas, por ejemplo, en las que las variantes tienen por lo menos 70% de identidad, por ejemplo por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100% de identidad, a las secuencias de aminoácido accesadas por los Números de Acceso de Genbank, tales como esos proporcionados en la presente, en que las variantes poseen la actividad hidrolizante acil-ACP, y la expresión de la variante en un microorganismo puede tener como resultado la producción de un ácido graso libre y/o derivado en una cantidad mayor que (por ejemplo por lo menos dos veces tanto como) esa producida por un microorganismo que no incluye la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa. Las relaciones de la función secuencia-estructura para las tioesterasas ha avanzado mucho en los últimos años (vea, por ejemplo, Dillon and Bateman, BMC Bioinformatics 2004, 5:109; Mayer and Shanklin, J. Biológica! Chem., 2005, 280: 3621-3627; Mayer and Shanklin, BMC PlantBiology, 2007, 7:1 ).
Además o alternativamente, el microorganismo genéticamente diseñado que incluye una molécula de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa puede producir por lo menos un ácido graso libre que tiene una longitud de cadena de acilo de 8 carbonos, de 10 carbonos, de 12 carbonos, de 14 carbonos, de 16 carbonos, de 18 carbonos, de 20 carbonos, de 22 carbonos, y/o de 24 carbonos. Además adicionalmente o alternativamente, los microorganismos genéticamente diseñados pueden producir por lo menos un ácido graso libre que tiene una longitud de cadena de acilo de 8 a 18 carbonos, por ejemplo de 12 a 16 carbonos.
Mientras que las 4-hidroxibenzoil-CoA tioesterasas son conocidas por su actividad hidrolizante de sustratos de 4-hidroxibenzoil-CoA, como es revelado en los Ejemplos en la presente, ahora se demuestra que las 4-hidroxibenzoil-CoA tioesterasas también son capaces de hidrolizar sustratos de acil-ACP que tienen una pluralidad de diferentes longitudes de cadena de acilo. Por ejemplo, la invención contempla el uso de 4-hidroxibenzoil-CoA tioesterasas que pueden tener preferencias de sustrato por uno o más sustratos de acil-ACP que tienen longitudes de cadena de acilo de 8, 10, 12, 14, 16, 18, 20, 22, y/o 24 carbonos. Adicionalmente o alternativamente, una 4-hidroxibenzoil-CoA tioesterasa puede hidrolizar uno o más sustratos de proteínas portadoras de acilo-acilo (ACP) que tienen una longitud de cadena de acilo de 8 a 18 carbonos, por ejemplo de 12 a 16 carbonos. Además adicionalmente o alternativamente, una 4-hidroxibenzoil-CoA tioesterasa de la invención presente puede, en algunas modalidades, tener su nivel más alto de actividad en un sustrato de acil-ACP que tiene una longitud de cadena de acilo de 8, 10, 12, 14, 16, y/o 18 carbonos.
En algunas modalidades, el microorganismo con el gen recombinante que expresa una 4-hidroxibenzoil-CoA tioesterasa puede producir predominantemente ácidos grasos libres que tienen longitudes de cadena de acilo de 8, 10, 12, 14, 16 y/o 18 carbonos y/o derivados de ácido graso que tienen un número total de carbonos de 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, y/o 36 carbonos. Adicionalmente o alternativamente, por lo menos 30 % en peso, por ejemplo por lo menos 40 % en peso, por lo menos 50 % en peso, por lo menos 60 % en peso, por lo menos 70 % en peso, por lo menos 80wt%, por lo menos 90 % en peso, o por lo menos 95 % en peso, de los ácidos grasos libres producidos por un microorganismo genéticamente diseñado como es revelado en la presente pueden ser ácidos grasos que tienen una longitud de cadena de acilo de 8, 10, 12, 14, 16, y/o 18 carbonos y/o derivados de ácidos grasos que tienen un número total de carbonos de 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 y/o 36 carbonos. Uno o más ácidos grasos libres o derivados de ácido graso producidos por el microorganismo genéticamente diseñado pueden ser saturados o pueden tener uno o más enlaces dobles.
En algunas modalidades, el microorganismo genéticamente diseñado que expresa una 4-hidroxibenzoil-CoA tioesterasa puede producir ácidos grasos libres y/o derivados de ácido graso de más de una longitud de cadena de acilo, por ejemplo, cualquier combinación de dos o más, que tienen longitudes de cadena de acilo de 8, 10, 12, 14, 16, 18, 20, 22, y/o 24 carbonos. En una de tales modalidades, por lo menos 50 % en peso, por ejemplo por lo menos 60 % en peso, por lo menos 70 % en peso, por lo menos 80 % en peso, por lo menos 90 % en peso, o por lo menos 95 % en peso, de los ácidos grasos libres y/o derivados producidos por un microorganismo genéticamente diseñado como es revelado en la presente puede tener longitudes de cadena de acilo de 8, 10, 12, 14, 16, 18, 20, 22, y/o 24 carbonos. Adicionalmente o alternativamente en tales modalidades, por lo menos 50 % en peso, por ejemplo por lo menos 60 % en peso, por lo menos 70 % en peso, por lo menos 80 % en peso, por lo menos 90 % en peso, o por lo menos 95 % en peso, de los ácidos grasos libres producidos por un microorganismo genéticamente diseñado como es revelado en la presente puede ser: ácidos grasos de C8 y C24, ácidos grasos de C8 y C22, ácidos grasos de C8 y C20, ácidos grasos de C8 y C18, ácidos grasos de C8 y C16, ácidos grasos de C8 y C14, ácidos grasos de C8 y C12, o ácidos grasos de C8 y C10; ácidos grasos de C10 y C24, ácidos grasos de C 0 y C22, ácidos grasos de C10 y C20, ácidos grasos de C10 y C18, ácidos grasos de C10 y C16, ácidos grasos de C10 y C14, o ácidos grasos de C10 y C12; ácidos grasos de C12 y C24, ácidos grasos de C12 y C22, ácidos grasos de C12 y C20, ácidos grasos de C12 y C18, ácidos grasos de C12 y C16, o ácidos grasos de C12 y C14; ácidos grasos de C14 y C24, ácidos grasos de C14 y C22, ácidos grasos de C14 y C20, ácidos grasos de C14 y C18, o ácidos grasos de C14 y C16; ácidos grasos de C16 y C24, ácidos grasos de 016 y C22, ácidos grasos de C16 y C20, y ácidos grasos de C16 y C18; o similares.
Alternativamente o además, el microorganismo genéticamente diseñado puede incluir una molécula de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa que tiene una secuencia de aminoácidos que tiene por lo menos 70% de identidad, por ejemplo por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, o por lo menos 95% de identidad, con SEQ ID NO: 1 , y el microorganismo puede producir un ácido graso que tiene una longitud de cadena de acilo de 8, 10, 12, 14, 16, y/o 18 carbonos (opcionalmente con por lo menos 50 % en peso de los ácidos grasos producidos tienen una longitud de cadena de acilo de 8 a 18 carbonos) y/o un derivado de ácido graso que tiene un número total de carbonos de 7 a 36 (por ejemplo de 7 a 32; de 1 1 a 30; y/o de 7, 8, 9, 10, 1 1 , 12, 13, 14, 15, 16, 17, 18, 20, 22, 24, 26, 28, 30, 32, 34, y/o 36 carbonos).
Ejemplos no limitativos de tioesterasas que tienen por lo menos 85% de identidad a SEQ ID NO: 1 incluyen: Tioesterasa putativa YneP de Bacillus licheniformis (DSM 13) (SEQ ID N0:6) que tiene el Número de Acceso de Genbank AAU23580 y el identificador de Genlnfo Gl: 52003638; Proteína hipotética BSNT_02984 óeBacillus subtilis (subsp. natto BEST195) (SEQ ID NO:7) que tiene el Número de Acceso de Genbank Accession BAI85489 y el Identificador de Genlnfo Gl: 291484414; Proteína sin caracterizar yneP de Bacillus subtilis (SEQ ID NO:8) que tiene el Número de Acceso de Genbank Q45061 y el Identificador de Genlnfo Gl: 257096998; acil-CoA tioesterasa putativa de Bacillus subtilis (subsp. spizizenii str. W23) (SEQ ID NO:9) que tiene el Número de Acceso de Genbank YP_003866210 y el Identificador de Genlnfo Gl:305674538; acil-CoA tioesterasa putativa de DSM7 de Bacillus amyloliquefaciens (SEQ ID NO: 10) que tiene el Número de Acceso de Genbank YP_003920487 y el Identificador de Genlnfo Gl:308173782; FZB42 YneP de Bacillus amyloliquefaciens (SEQ ID NO:1 1 ) que tiene el Número de Acceso de Genbank YP_001421379 y el Identificador de Genlnfo Gl: 154686218; 168 YneP de Bacillus subtilis subsp. subtilis str. (SEQ ID NO: 12) que tiene el Número de Acceso de Genbank CAA97601 y el Identificador de Genlnfo Gl:1405456; acil-CoA tioesterasa putativa de 1942 de Bacillus atrophaeus (SEQ ID NO:13) que tiene el Número de Acceso de Genbank ADP32363 y el Identificador de Genlnfo Gl:310868888; ATCC 7061 YneP de Bacillus pumilus (SEQ ID NO: 14) que tiene el Número de Acceso de Genbank ZP_03053441 y el Identificador de Genlnfo Gl: 194014824; 4-hidroxibenzoil-CoA tioesterasa de SAFR-032 Bacillus pumilus (SEQ ID NO: 15) que tiene el Número de Acceso de Genbank YP_001486942 y el Identificador de Genlnfo Gl: 157692480; proteína hipotética BSG1_15910 de SG-1 de Bacillus sp. (SEQ ID NO: 16) que tiene el Número de Acceso de Genbank ZP_0 858961 y el Identificador de Genlnfo Gl: 149180457; familia de proteínas de tioesterasa DSM 319 de Bacillus megaterium (SEQ ID NO: 17) que tiene el Número de Acceso de Genbank YP_003597734 y el Identificador de Genlnfo Gl:295704659; familia de proteínas de tioesterasa de QM B1551 de Bacillus megaterium (SEQ ID NO: 18) que tiene el Número de Acceso de Genbank YP_003563005 y el Identificador de Genlnfo Gl:294499305; súperfamilia de proteínas de tioesterasa de 36D1 de Bacillus coagulans (SEQ ID NO:19) que tiene el Número de Acceso de Genbank ZP_04433271 y el Identificador de Genlnfo Gl:229544212; súperfamilia de proteínas de tioesterasa de C56-YS93 de Geobacillus thermoglucosidasius (SEQ ID NO:20) que tiene el Número de Acceso de Genbank ZP_06810002 y el Identificador de Genlnfo Gl:295400022; súperfamilia de proteínas de tioesterasa de C56-T3 de Geobacillus sp. (SEQ ID NO:21) que tiene el Número de Acceso de Genbank ADI26934 y el Identificador de Genlnfo Gl:297253488; súperfamilia de proteínas de tioesterasa dé Y412MC61 Geobacillus sp. (SEQ ID NO:22) que tiene el Número de Acceso de Genbank ACX79004 y el Identificador de Genlnfo Gl:261376261 ; súperfamilia de proteínas de tioesterasa de WCH70 de Geobacillus sp. (SEQ ID NO:23) que tiene el Número de Acceso de Genbank YP_002949888 y el Identificador de Genlnfo Gl:239827264; proteína hipotética de GK1562 de HTA426 de Geobacillus kaustophilus (SEQ ID NO:24) que tiene el Número de Acceso de Genbank YP_147415 y el Identificador de Genlnfo Gl:56420097; súperfamilia de proteínas de tioesterasa de G11 MC16 de Geobacillus sp. (SEQ ID NO:25) que tiene el Número de Acceso de Genbank ZP_03147050 y el Identificador de Genlnfo Gl: 196248349; proteína del tipo 4-hidroxibenzoil-CoA tioesterasa de NG80-2 de Geobacillus thermodenitrificans (SEQ ID NO:26) que tiene el Número de Acceso de Genbank YP_001125525 y el Identificador de Genlnfo Gl:138895072; y la proteína hipotética B1491 1J2282 de NRRL B-14911 de Bacillus sp. (SEQ ID NO:27) que tiene el Número de Acceso de Genbank ZP_01 171315 y el Identificador de Genlnfo Gl:89098431.
Además adicionalmente o alternativamente, un microorganismo genéticamente diseñado puede incluir una molécula de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa que tiene una secuencia de aminoácidos que tiene por lo menos 70% de identidad, por ejemplo por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, o por lo menos 95% de identidad, con SEQ ID NO: 2, y el microorganismo pueden producir un ácido graso libre que tiene una longitud de cadena de acilo de 8, 10, 12, 14, 16, y/o 18 carbonos (que tiene por ejemplo una longitud de cadena de acilo de 8, 12, 16, y/o 18 carbonos y/o opcionalmente con por lo menos 50 % en peso de los ácidos grasos producidos tienen una longitud de cadena de acilo de 12 a 16 carbonos) y/o un derivado de ácido graso que tiene un número total de carbonos de 7 a 36 (por ejemplo de 7 a 32; de 11 a 30; y/o de 7, 8, 9, 10, 1 1 , 12, 13, 14, 15, 16, 17, 18, 20, 22, 24, 26, 28, 30, 32, 34, y/o 36 carbonos).
Ejemplos no limitativos de tioesterasas que tienen por lo menos 30% de identidad a SEQ ID NO: 2 incluyen: Tioesterasa de AMB-1 de Magnetospirillum magneticum (SEQ ID NO:28) que tiene el Número de Acceso de Genbank YP_422578 y el Identificador de Genlnfo Gl:83312314; Tioesterasa pronosticada de MS-1 COG0824 de Magnetospirillum magnetotacticum : (SEQ ID NO: 29) que tiene Número de Acceso de Genbank a ZP_00055337 y el Identificador de Genlnfo Gl: 23015565; acil oA tioesterasa asociada al sistema de to-pal de MCO de eBurkholderia cenocepacia (SEQ ID NO:30) que tiene el Número de Acceso de Genbank ACA89951 y el Identificador de Genlnfo Gl: 169815368; 4-hidroxibenzoil-CoA tioesterasa de BisA53 de Rhodopseudomonas palustris (SEQ ID NO:31) que tiene el Número de Acceso de Genbank YP_782882 y el Identificador de Genlnfo Gl: 115525971 ; 4-hidroxibenzoil-CoA tioesterasa de HI2424 de Burkholderia cenocepacia (SEQ ID NO:32) que tiene el Número de Acceso de Genbank ABK07557 y el Identificador de Genlnfo Gl:1 16646916; 4-hidroxibenzoil-CoA tioesterasa de PC184 de Burkholderia cenocepacia (SEQ ID NO:33) que tiene el Número de Acceso de Genbank ZP_04939537 y el Identificador de Genlnfo Gl:254246216; 4-hidroxibenzoil-CoA tioesterasa de MSR-1 de Magnetospirillum gryphiswaldense (SEQ ID NO:34) que tiene el Número de Acceso de Genbank CAM73991 y el Identificador de Genlnfo Gl: 144897127; acil-CoA tioesterasa asociada al sistema tol-pal de MEX-5 de Burkholderia ambifaria (SEQ ID NO:35) que tiene el Número de Acceso de Genbank ZP_029 1196 y el Identificador de Genlnfo Gl: 171322375; acil-CoA tioesterasa asociada al sistema tol-pal de MC40-6 de Burkholderia ambifaria (SEQ ID NO:36) que tiene el Número de Acceso de Genbank ACB63194 y el Identificador de Genlnfo Gl: 171992275; 4-hidroxibenzoil-CoA tioesterasa de AMMD de Burkholderia ambifaria (SEQ ID NO:37) que tiene el Número de Acceso de Genbank YP_772574 y el Identificador de Genlnfo Gl: 115350735; acil-CoA hidrolasa de cadena corta de CGDNIH1 de Granulibacter bethesdensis (SEQ ID NO:38) que tiene el Número de Acceso de Genbank YP_744923 y el Identificador de Genlnfo Gl:1 14327766; tioesterasa de 129PT de Haemophilus somñus (SEQ ID NO:39) que tiene el Número de Acceso de Genbank YP_718466 y el Identificador de Genlnfo Gl: 113460404; acil-CoA tioesterasa asociada al sistema tol-pal de 2336 de Haemophilus somnus (SEQ ID NO:40) que tiene el Número de Acceso de Genbank YP_001783484 y el Identificador de Genlnfo Gl: 170717543; tioesterasa de HI4320 de Proteus mirabilis (SEQ ID NO:41 ) que tiene el Número de Acceso de Genbank YP_002150349 y el Identificador de Genlnfo Gl: 197284477; acil-CoA tioesterasa asociada al sistema tol-pal de IOP40-10 de Burkholderia ambifaria (SEQ ID NO:42) que tiene el Número de Acceso de Genbank ZP_02892046 y el Identificador de Genlnfo Gl:170701069; tioesterasa de ATCC 29906 de Proteus mirabilis (SEQ ID NO:43) que tiene el Número de Acceso de Genbank ZP_03841041 y el Identificador de Genlnfo Gl:227356655; 4-hidroxibenzoil-CoA tioesterasa de BisB18 de Rhodopseudomonas palustris (SEQ ID NO:44) que tiene el Número de Acceso de Genbank YP_531800 y el Identificador de Genlnfo Gl:90423430; acil-CoA tioéster hidrolasa de B510 dé Azospirillum sp.(SEQ ID NO:45) que tiene el Número de Acceso de Genbank YP_003448162 y el Identificador de Genlnfo Gl:288957821 ; acil-CoA tioesterasa asociada al sistema tol-pal de de DX-1 de Rhodopseudomonas palustris (SEQ ID NO:46) que tiene el Número de Acceso de Geríbank ZP_06358294 y el Identificador de Genlnfo Gl:283840748¡ Súperfamilia de tioesterasa de BTAÍ1 de Bradyrhizobium sp.(SEQ ID NO:47) que tiene el Número de Acceso de Genbank ABQ38791 y el Identificador de Genlnfo Gl:146410285; subunidad de enzima putativa del tipo tioesterasa pequeña de SW de Rhodospirillum centenum (SEQ ID NO:48) que tiene el Número de Acceso de Genbank YP_002298014 y el Identificador de Genlnfo Gl:209965099; acil-CoA tioesterasa asociada al sistema tol-pal de OB3b de Methylosinus trichosporium (SEQ ID NO:49) que tiene el Número de Acceso de Genbank ZP_06889725 y el Identificador de Genlnfo Gl:296447812; 4-hidroxibenzoil-CoA tioesterasa de HaA2 de Rhodopseudomonas palustris (SEQ ID NO:50) que tiene el Número de Acceso de Genbank YP_487867 y el Identificador de Genlnfo Gl:86751371 ¡ y acil-CoA tioesterasa asociada al sistema tol-pal de PA1 de Methylobacteríum extorquens (SEQ ID NO:51 ) que tiene el Número de Acceso de Genbank ABY33133 y el Identificador de Genlnfo GM63665766.
En algunas modalidades, el microorganismo genéticamente diseñado que incluye una 4-hidroxibenzoil-CoA tioesterasa puede producir un aldehido graso, alcohol graso, y/o un éster ceroso, y puede incluir opcionalmente una o más moléculas de ácido nucleico que codifican una acil- CoA reductasa, ácido carboxílico reductasa, acil-ACP reductasa, aldehido graso reductasa, una cera sintasa, o una combinación de los mismos. Los ésteres cerosos incluyen una cadena de acilo (cadena A) en el lado del carbonilo del enlace éster y una cadena de éster (cadena B) conectada al oxígeno del enlace de éster, uno o ambos de los cuales puede derivarse de un ácido graso, por ejemplo, generado por una tioesterasa tal como la 4-hidroxibenzoil-CoA tioesterasa. Los ésteres cerosos 'pueden tener un número total de carbonos (una "longitud de cadena" A+B), por eejemplo, de 10 a 36 carbonos, por ejemplo de 16 a 36 carbonos, de 16 a 32 carbonos, o de 24 a 32 carbonos.
Adicionalmente o alternativamente, el microorganismo genéticamente diseñado que incluye una 4-hidroxibenzoil-CoA tioesterasa puede producir un alcano y/o alqueno y puede incluir opcionalmente por lo menos una molécula de ácido nucleico que codifica un ácido graso decarboxilasa, un aldehido graso decarbonilasa, una acil-CoA reductasa, un ácido carboxílico reductasa, una acil-ACP reductasa, o una combinación de los mismos. Los alcanos y/o alquenos producidos por y/o derivados de un microorganismo fotosintético que incluye una molécula de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa pueden, por ejemplo, tener una longitud de cadena de 7, 9, 1 1 , 13, 15, 17, 19, 21 , y/o 23 carbonos {por ejemplo, una o más longitudes de cadena numeradas impares de 7 a 17 carbonos, de 7 a 15 carbonos, o de 1 1 a 15 carbonos).
Además adicionalmente o alternativamente, un microorganismo genéticamente diseñado que puede producir un alcohol graso, aldehido graso, éster ceroso, alcano, o alqueno puede incluir opcionalmente una molécula de ácido nucleico que codifica una acil-CoA sintasa.
La molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa puede ser ventajosamente establemente integrada en el cromosoma del microorganismo hospedero, en un episoma autónomamente replicante, en un constructo de expresión, o en una combinación de los mismos. Adicionalmente o alternativamente, los microorganismos genéticamente diseñados pueden ser transformados con genes exógenos de procariotas por la introducción de constructos de expresión de ácido nucleico apropiados que pueden incluir, además del gen de interés, secuencias de expresión de genes y opcionalmente secuencias que pueden mediar la recombinación en el cromosoma hospedero.
Los constructos de expresión pueden ser introducidos en células procarióticas y eucariótics a través de técnicas convencionales de transformación o transfección. Los términos "transformación" y "transfección", la conjugación y la transducción, como se utilizan en el contexto presente, pretenden comprender una multiplicidad de métodos conocidos en la técnica para la introducción de ácido nucleico foráneo (por ejemplo ADN) en una célula hospedera, incluyendo, pero no limitado a, coprecipitación de fosfato de calcio o cloruro de calcio, transfección mediada por DEAE-dextrano, lipofección, competencia natural, transferencia mediada químicamente, electroporación, y/o bombardeo de partículas. Los métodos convenientes para la transformación o transfección de células hospederas pueden ser encontrados en Molecular Cloning - A Laboratory Manual (2010), Cold Spring Harbor Laboratory Press, el contenido del cual se incorpora como referencia en la presente.
Por ejemplo, las algas y bacterias fotosintéticas pueden ser transformadas por cualquier método conveniente, incluyendo, como ejemplos no limitativos, captación de ADN natural (Chung et al. (1998) FEMS Microbiol. Lett. 164: 353-361 ; Frigaard et al. (2004) Methods Mol. Biol. 274: 325^0; Zang et al. (2007) J. Microbiol. 45: 241-245), conjugación, transducción, transformación de perlas de vidrio (Kindle et al. (1989) J. Cell Biol. 109: 2589-601 ; Feng et al. (2009) Mol. Biol. Rep. 36: 1433-9; Patente de E.U.A. No. 5,661 ,017), transformación de triquita de carburo de silicio (Dunahay et al. (1997) Methods Mol. Biol. (1997) 62: 503-9), biolísticas (Dawson et al. (1997) Curr. Microbiol. 35: 356-62; Hallmann et al. (1997) 94: 7469-7474; Jakobiak et al. (2004) Protist 155:381-93; Tan et al. (2005) J. Microbiol. 43: 361-365; Steinbrenner et al. (2006) Appl Environ. Microbiol. 72: 7477-7484; Kroth (2007) Methods Mol. Biol. 390: 257-267; Patente de E.U.A. No. 5,661 ,017), electroporación (Kjaerulff et al. (1994) Photosynth. Res. 41 : 277-283; Iwai et al. (2004) Plant Cell Physiol. 45: 171-5; Ravindran et al. (2006) J. Microbiol. Methods 66: 174-6; Sun et al. (2006) Gene 377: 1340-649; Wang et al. (2007) Appl. Microbiol. Biotechnol. 76: 651-657; Chaurasia et al. (2008) J. Microbiol. Methods 73: 133-141 ; Ludwig et al. (2008) Appl. Microbiol. Biotechnol. 78: 729-35), transformación mediada por láser, o incubación con ADN en la presencia de o después de pre-tratamiento con cualquiera de dendrímeros de poli(amidoamina) (Pasupathy et al. (2008) Biotechnol. J. 3: 1078-82), poliétilen glicol (Ohnuma et al. (2008) Plant Cell Physiol. 49: 117-120), lípidos catiónicos (Muradawa et al. (2008) J. Biosci. Bioeng. 105: 77-80), dextrano, fosfato de calcio, o cloruro de calcio (Mendez-Alvarez et al. (1994) J. Bacteriol. 176: 7395-7397), opcionalmente después de tratamiento de las células con enzimas que degradan la pared celular (Perrone et al. (1998) Mol. Biol. Cell 9: 3351-3365). La transformación mediada por agrobacterias también puede ser realizada en células de alga, por ejemplo después de eliminar o dañar la pared celular del alga (por ejemplo, Publicación Internacional No. WO 2000/62601 ; Kumar et al. (2004) Plant Sci. 166: 731-738). Los métodos biolísticos son útiles para la transformación de los cloroplastos de plantas y especies ecuraióticas de algas (vea, por ejemplo, Ramesh et al. (2004) Methods Mol. Biol. 274: 355-307; Doestch et al. (2001) Curr. Genet. 39: 49-60; Patente de E.U.A. No. 7,294,506; y Publicaciones Internacionales No. WO 2003/091413, WO 2005/005643, y WO 2007/133558 (cada una de las referencias citadas es incorporada como referencia en su totalidad).
Para la expresión óptima de una proteína recombinante, en muchos casos puede ser beneficioso emplear secuencias de codificación que pueden producir ARNm con codones utilizados de manera preferencial por la célula hospedera para ser transformados. Así, para un aumento en la expresión de transgenes, el uso del codón del transgen puede coincidir con la desviación específica del codón del organismo en el cual el transgen es expresado. Por ejemplo, los métodos de recodificar genes para la expresión en microalgas son descritos en la Patente de E.U.A. No. 7,135,290, el contenido de la cual es incorporado como referencia. Todo o un subconjunto de los codones de un gen pueden ser cambiados para incorporar un codón preferido utilizado por el organismo hospedero. La información adicional para la optimización del codón está disponible, por ejemplo, en la base de datos de uso de codón de Genbank.
En algunas modalidades, la secuencia de nucleótldos que codifica la tioesterasa en microorganismos transformados con una molécula de ácido nucleico aislada incluyendo una secuencia ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa puede ser ligada operablemente a uno o más elementos de control de expresión y puede ser opcionalmente optimizada en codón para la expresión en el microorganismo.
Alternativamente o además, la molécula exógena de ácido nucleico como es revelado en la presente puede ser clonada en ;un vector de expresión para la transformación en un microorganismo tal como, por ejemplo, una microalga o una bacteria fotosintética. El vector puede incluir secuencias que promueven la expresión del transgen de interés (por ejemplo, un gen exógeno de 4-hidroxibenzoil-CoA tioesterasa) tal como un promotor heterólogo, y pueden incluir opcionalmente, para la expresión en células eucarióticas, sin limitación, una secuencia de intrón, una secuencia que tiene una señal de poliadenilación, etc. Alternativamente, si el vector no contiene a un promotor en el enlace operable con el gen de interés, el gen puede ser transformado en las células de manera que se vuelva operablemente enlazado a un promotor endógeno por recombinación homologa o integración de vector.
Los vectores diseñados para la expresión de un gen en microalgas pueden incluir a un promotor activo en las microalgas enlazadas operablemente al gen exógeno que es introducido. Una variedad de promotores y terminadores de gen que funcionan en las microalgas puede ser utilizada en vectores de expresión, incluyendo, pero no limitado a, los promotores y terminadores de procariotas o eucariotas, tal como, pero no limitado a, Chlamydomonas y otras algas (vea, por ejemplo, Plant Cell Physiol 49: 625-632, 2008), los promotores y terminadores de virus, y promotores y terminadores sintéticos.
Para la transformación de diatomeas, una variedad de promotores de gen que funcionan en diatomeas puede ser utilizada en estos vectores de expresión, incluyendo, pero no limitado a: promotores de Thalassiosira y otras algas de heterocontos, los promotores de virus, y promotores sintéticos. Los promotores de Thalassiosira pseudonana que pueden ser adecuados para uso en los vectores de expresión incluyen, sin limitación, un promotor de alfa-tubulina, un promotor de beta-tubulina, y un promotor de actina. Promoteres de Phaeodactylum tricornutum que pueden ser adecuados para uso en los vectores de expresión incluyen sin limitación, un promotor de alfa-tubulina, un promotor de beta-tubulina, y un promotor de actina. Los terminadores asociados con estos genes, otros genes de diatomea, o genes heterologos particulares pueden ser utilizados para detener la transcripción y proporcionar la señal apropiada para la poliadenilación.
Si se desea, para expresar la molécula exógena de ácido nucleico, tal como, 4-hidroxibenzoil-CoA tioesterasa, en el plástido, donde la biosíntesis de ácido graso ocurre en las microalgas, una secuencia de nucleótido que codifica un péptido transitorio de cloroplasto puede ser añadida al N-terminal de la molécula exógena de ácido nucleico. Alternativamente, la molécula exógena de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa puede ser introducida directamente en el cromosoma del plástido de microalgas sin interrumpir la capacidad fotosintética del plástido. Los métodos para la transformación de plástido son bien conocidos para introducir una molécula de ácido nucleico en un cloroplasto de célula de planta (vea, por ejemplo, las Publicaciones Internacionales Nos. WO 2010/019813 y WO 95/16783; Patentes de E.U.A. Nos. 5,451 ,513, 5,545,817, y 5,545,818; y McBride et al., Proc. Nati. Acad. Sci. USA 91 :7301-7305 (1994), cada uno de los cuales se incorpora como referencia en la presente).
En algunos casos, puede ser ventajoso expresar una enzima, tal como, pero no limitado a, una 4-hidroxibenzoil-CoA tioesterasa, en un cierto punto durante el crecimiento del organismo hospedero genéticamente diseñado para minimizar cualquier efecto dañino en el crecimiento de ese organismo y/o para llevar al máximo la producción del producto de ácido graso de interés. En estos casos, una o más moléculas exógenas de ácido nucleico que codifican una 4-hidroxibenzoil-CoA tioesterasa introducidas en el organismo genéticamente diseñado puede ser enlazada operablemente a un promotor de inducible. El promotor puede ser, por ejemplo, sin limitación, un promotor lac, un promotor tet (por ejemplo, Patente de E.U.A. No. 5,851 ,796), un promotor híbrido que incluye cualquiera o ambas porciones de un promotor tet o lac, un promotor que responde a hormonas (por ejemplo, un prornotor que responde a ecdisona; vea la Patente de E.U.A. No. 6,379,945), un promotor de metalotionien (Patente de E.U.A. No. 6,410,828), y/o un promotor relacionado con la patogénesis (PR) que puede responder a una sustancia química tal como, por ejemplo, ácido salicílico, etileno, tiamina, o BTH (Patente de E.U.A. No. 5,689,044). Un promotor inducible puede responder a la luz o la oscuridad (Patentes de E.U.A. Nos. 5,750,385 y 5,639,952), temperatura (Patente de E.U.A. No. 5,447,858; Abe et al., Plant Cell Physiol. 49: 625-632 (2008); Shroda et al. Plant J. 21 : 121-131 (2000)), o similares, o combinaciones de los mismos. La lista precedente pretende ser ejemplar y no limitativa. Las secuencias del promotor pueden ser de cualquier organismo, siempre que sean funcionales en el organismo hospedero. Los promotores inducibles, como se utilizan en los constructos de la invención presente, pueden utilizar una o más porciones/dominios de los promotores antes mencionados y/o otros promotores inducibles fusionados a por lo menos una porción de un promotor diferente que opera en el organismo hospedero para conferir inducibilidad en un promotor que opera en la especie hospedera.
Por ejemplo, para la transformación de cianobacteriaSi una variedad de promotores que funcionan en la cianobacteria puedé ser utilizada, incluyendo, pero no limitado a, promotores lac, tac y trc y a los derivados que son inducibles por la adición de promotores de isopropil ß÷?-1-tiogalactopiranósido (IPTG), que se asocian naturalmente con los genes de resistencia a antibióticos crecidos en los cromosomas de transposón o de bacterias (neomicina fosfotransferasa, cloranfenicol acetiltransferasa, espectinomicina adeniltransferasa, etc.), promoteres asociados con varios genes heterologos bacterianos y cianobacterianos nativos, promoteres de virus y fagos, y promotores sintéticos. Una modalidad de tal promotor incluye a un promotor de trcY inducible por IPTG (SEQ ID NO: 52). Los promotores aislados de cianobacterias que pueden ser utilizados pueden incluir, sin limitación, secA (secreción; controlado por el estado de redox de la célula), rbc (operón de Rubisco), psaAB (proteínas centrales de reacción PS I; reguladas por luz), y psbA (proteina de DI de PSII; inducible por luz).
Igualmente, una gran variedad de terminadores transcripcioriales pueden ser utilizados para la construcción de vectores de expresión. Ejemplos de terminadores posibles incluyen, pero no son limitados a, psbA, psaAB, rbc, secA, y a proteína de revestimiento T7.
Los vectores de transformación opcionalmente también pueden incluir un marcador seleccionable, tal como, pero no limitado a, un gen resistente a fármacos, un gen resistente a herbicida, una enzima metabólica o factor requerido para la supervivencia del hospedero (por ejemplo,, un marcador autotrófico), y similares, así como combinaciones de los mismos. Las células transformadas pueden ser seleccionadas opcionalmente con base en la capacidad de crecer en la presencia del marcador seleccionare bajo condiciones en las que las células que carecen del cásete de resistencia o marcador auxotrófico no crecerían. Alternativamente, un marcador no seleccionable puede estar presente en un vector, tal como un gen que codifica una proteína fluorescente o enzima que genera un producto perceptible de reacción.
Los vectores de expresión pueden ser introducidos en los microorganismos por métodos estándar, incluyendo, pero no limitados a, captación de ADN natural, conjugación, electroporación, bombardeo de partículas y abrasión con perlas de vidrio, fibras SiC, u otras partículas. Los vectores pueden ser, por ejemplo, (1) dirigidos para la integración en el cromosoma hospedero al incluir secuencias de flanqueo que permiten la recombinación homologa en el cromosoma, (2) dirigido para la integración en plásmidos endógenos incluyendo secuencias de flanqueo que permiten la recombinación homologa en los plásmidos endógenos, y/o (3) diseñados de manera que los vectores de expresión se replican dentro del hospedero escogido.
El microorganismo genéticamente diseñado puede comprender además una o más moléculas recombinantes de ácido nucleico que pueden aumentar la producción de ácidos grasos y/o derivados de ácido graso, tales como, por ejemplo, un gen que codifica una enzima acetil-CoA carboxilasá y/o un gen que codifica una ß-cetoacilo sintasa (KAS), tal como una enzima KAS III, KAS II, o KAS I. Adicionalmente o alternativamente, el microorganismo puede tener una expresión atenuada de un gen que codifica la acil-ACP sintasa, acil-CoA sintasa, acil-CoA deshidrogenasa, glicerol-3-fosfato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa, acetato cinasa, o similares, o una combinación de los mismos.
En algunas modalidades, el microorganismo diseñado puede ser un microorganismo fotosintético y el medio de cultivo puede ser un medio que no incluye un compuesto de carbono reducido para suministrar energía al microorganismo fotosintético genéticamente diseñado, e incluso el cultivo que comprende el microorganismo puede incluir por lo menos 5 mg por litro, por ejemplo por lo menos 10 mg por litro, por lo menos 20 mg por litro, por lo menos 30 mg por litro, Por lo menos 40 mg por litro, o por lo menos 50 mg por litro, de ácidos grasos libres y/o derivados de ácido graso producidos por el microorganismo.
La molécula recombinante de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa puede ser cualquiera como se describió antes, por ejemplo, un miembro de la familia Pfam PF03061 y/o, cuando se consulta contra la base de datos de Pfam, es una conincidencia con PF03061 con a puntuación en bits mayor que el valor de umbral de acumulación de 20.6. En algunos ejemplos, el microorganismo puede incluir una molécula recombinante de ácido nucleico que codifica un polipéptido que recluta al PF03061 de Pfam con una puntuación en bits mayor que 20.6 y un valor menor que 0.1 , en el que el polipéptido tiene una secuencia de aminoácidos que tiene por lo menos 50% de identidad, por lo menos 55% de identidad, por lo menos 60% de identidad, por lo menos 65% de identidad, por lo menos 70% de identidad, por ejemplo por lo menos 75%, Por lo menos 80%, por lo menos 85%, por lo menos 90%, o por lo menos 95% de identidad, con SEQ ID NO: 2, donde el rmicroorganism produce por lo menos un ácido graso libre o por lo menos un derivado de ácido graso. En algunos ejemplos, el microorganismo puede incluir una molécula recombinante de ácido nucleico que codifica un polipéptido que recluta el PF03061 de pfam con una puntuación en bits mayor que 20.6 y un valor e menor que 0.1, en el que el polipéptido tiene una secuencia de aminoácidos que tiene por lo menos 70% de identidad, por lo menos 75% de identidad, por lo menos 80% de identidad, por lo menos 85% de identidad, por lo menos 90% de identidad, por ejemplo por lo menos 95% de identidad, por lo menos 96% de identidad, por lo menos 97% de identidad, por lo menos 98% de identidad, por lo menos 99% de identidad, o aproximadamente 100% de identidad, con SEQ ID NO: 1 , donde el microorganismo produce por lo menos un ácido graso libre o por lo menos un derivado de ácido graso.
Como se menciona en la presente, la molécula de ácido nucleico puede ser enlazada operablemente a un promotor activo en el microorganismo fotosintético y opcionalmente una o más secuencias reguladoras de ácido nucleico adicionales, tales como, por ejemplo, una secuencia de terminador transcripcional. Adicionalmente o alternativamente, la molécula de ácido nucleico puede estar presente en un plásmido autoreplicante que es introducido en el microorganismo fotosintético, y/o puede estar integrado en el genoma del microorganismo fotosintético.
En algunas modalidades, los ácidos grasos y/o derivados de ácido graso pueden estar presentes en los medios, por ejemplo, como precipitados dentro o sobre, en o cerca de la superficie del medio, asociado con el recipiente del medio como gotículas, incluyendo gotículas suspendidas {por ejemplo, una emulsión), como una capa relativamente inmiscible que flota en la parte superior del mesio de cultivo acuoso, como una "nata", película, gel, semisólido, coloide, particulado fino, particulado, sólido, o agregado que puede ser dispersado, suspendido, o atrapado dentro del medio de cultivo, asociado con las células del microorganismo fotosintético, la fase separada en algún otro modo, o en una combinación de los mismos.
En modalidades preferidas, por lo menos un ácido graso libre producido por un cultivo como es revelado en la presente puede tener una longitud de cadena de acilo de 8 a 24 carbonos, por ejemplo de 8 a 18 carbonos, de 12 a 16 carbonos, o de 8, 10, 12, 14, 16, 18, 20, 22, y/o 24 carbonos. En modalidades donde por lo menos un derivado de ácido graso (tal como uno o más alcoholes grasos, aldehidos grasos, ésteres ceroso, aléanos, y alquenos) son producidos por un cultivo como es revelado en la presente, el por lo menos un derivado de ácido graso puede tener un número total de carbonos de 7 a 36, por ejemplo de 1 1 a 34, de 12 a 32, o de 7, 8, 9, 10, 1 1 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 26, 28, 30, 32, 34, y/o 36.
Ventajosamente, el medio de cultivo puede ser cualquiera apropiado para el crecimiento de un microorganismo hospedero fotosintético. En una modalidad, el cultivo puede incluir una fuente de carbono reducido, tal como, por ejemplo, uno o más azúcares o ácidos orgánicos que pueden ser utilizados por el microorganismo para el crecimiento, de manera que el microorganismo pueda crecer heterotróficamente o mixotrófica mente. Adicionalmente o alternativamente, el medio de cultivo no incluye una cantidad substancial de un compuesto de carbono reducido que puede ser utilizado por el organismo como una fuente de energía y/o incluye una fuente de carbono inorgánico, tal como C02 o bicarbonato.
II. Métodos de producir ácidos grasos libres y/o derivados Un aspecto de la invención presente se relaciona a un método para producir un ácido graso libre y/o derivado en un cultivo, el método comprende cultivar un microorganismo que incluye por lo menos una secuencia de ácido nucleico recombinante que codifica una 4-hidroxibenzoil-CoA tioesterasa en medio de crecimiento bajo condiciones que permiten la expresión de la 4-hidroxibenzoil-CoA tioesterasa. La expresión del gen exógeno de 4-hidroxibenzoil-CoA tioesterasa en el microorganismo puede tener como resultado la producción de por lo menos un ácido graso libre y/o derivado de ácido graso.
En una modalidad, el cultivo que incluye el microorganismo con el gen recombinante que expresa una 4-hidroxibenzoil-CoA tioesterasa puede producir por lo menos dos veces la cantidad del ácido graso y/o el derivado, comparado a un cultivo que es idéntico en todos los aspectos excepto que el microorganismo no incluye una secuencia de ácido nucleico recombinante que codifica una 4-hidroxibenzoil-CoA tioesterasa. Por ejemplo, el microorganismo que incluye la molécula recombinante de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa puede producir (y opcionalmente pero preferiblemente liberar y/o secretar) por lo menos 5 mg por litro, por ejemplo por lo menos 10 mg por litro, por lo menos 20 mg por litro, por lo menos 30 mg por litro, por lo menos 40 mg por litro, o por lo menos 50 mg por litro, de ácidos grasos libres y/o derivados de ácido graso.
El método puede comprender además el aislamiento/eliminación del ácido graso libre y/o derivado del cultivo, por ejemplo, de las células, del medio de crecimiento, o del cultivo entero. Por ejemplo, el aislamiento puede ser por extracción orgánica de las células enteras o lisadas, la eliminación de ácidos grasos libres o derivados de ácido graso como precipitados o de la capa superior del medio de cultivo ("despumado"), a través del uso de adsorbentes particulados, de burbujas, o de matrices que unen los ácidos grasos y/o los derivados, o similares, o cualquier combinación de los mismos.
Los microorganismo genéticamente diseñados pueden ser cualquiera como se describió en la presente que incluye una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa, cuya expresión puede tener como resultado la producción de ácidos grasos libres y/o derivados de ácido graso. La 4-hidroxiberízoil-CoA tioesterasa puede ser expresada por el microorganismo por lo menos por una porción del tiempo durante el que el microorganismo fotosintético es cultivado y/o con la administración de un inductor al cultivo. Ejemplos no limitativos de un inductor incluyen la lactosa o un análogo de la lactosa, tal como isopropil ß-D-1-tiogalactopiranósido, y la luz, que puede ser proporcionada como luz solar o luz artificial, tal como, por ejemplo, luz fluorescente.
Adicionalmente o alternativamente, el microorganismo genéticamente diseñado puede ser un microorganismo fotosintético y puede ser cultivado fototróficamente, en cuyo caso el medio de crecimiento típicamente no incluye una cantidad substancial de (por ejemplo, incluye ninguno de) una fuente de carbono reducido. Al crecer fototróficamente, el micoorganismo fotosintético utiliza la luz como su fuente de energía, y una fuente inorgánica de carbono, tal como C02 o bicarbonato, es utilizada para la síntesis de biomoléculas por el microorganismo. Alternativamente, una molécula o compuesto orgánico de carbono puede ser proporcionado en el medio de cultivo de un microorganismo cultivado fototróficamente, pero ya sea no puede ser tomado o metabolizado por la célula para la energía o no está presente en una cantidad efectiva para proporcionar energía suficiente para el crecimiento del cultivo celular.
En muchas modalidades, el cultivo puede incluir una fuente inorgánica de carbono, incluyendo, pero no limitado a, bicarbonato, carbonato de calcio, y/o CO2, presente en el aire, o proporcionado en forma enriquecida con respecto al C02 ambiental, por ejemplo, como 5 % en vol de C02 en el aire. Adicionalmente o alternativamente, los microorganismos fotos ¡ntéticos pueden ser expuestos a la luz para por lo menos por una porción del período de cultivo. Las fuentes de luz artificiales pueden ser utilizadas como la única fuente de luz o para aumentar o extender la luz natural.
"Cultivar" se refiere a fomentar intencionalmente el crecimiento (aumentos en el tamaño de célula, contenido celular, y/o actividad celular) y/o la propagación (aumento en los números de células, por ejemplo, a través de mitosis) de una o más células por el uso de condiciones seleccionadas y/o controladas. La combinación tanto del crecimiento como de la propagación puede ser denominada "proliferación". Ejemplos de condiciones seleccionadas y/o controladas pueden incluir el uso de un medio definido (con características conocidas, tal como pH, fuerza iónica, y fuente de carbono), temperatura especificada, tensión de oxígeno, niveles de bióxido de carbono, y crecimiento en un bioreactor, entre otros.
Los microorganismos fotosintéticos, tales como, microalgas o cianobacterias, pueden ser cultivadas fototróficamente, en ausencia de una cantidad substancial de una fuente fija de carbono, o mixotróficamente, donde los cultivos son suministrados con luz por lo menos por parte del día, y también son suministrados con una fuente reducida de carbono, tal como un azúcar (por ejemplo, glucosa, fructosa, galactosa, mannosa, ramnosa, arabinosa, xilosa, lactosa, sacarosa, maltosa), una forma ácida orgánica (por ejemplo, acetato, citrato, succinato), y/o glicerol. El microorganismo fotosintético, alternativamente, puede ser cultivado mixotróficamente, de manera que el organismo sea cultivado en la presencia de luz por lo menos por una parte del día, y también es proporcionado con una o más fuentes de carbono reducido. Las células pueden ser cultivadas alternativamente heterotróficamente, donde una fuente de carbono reducido es proporcionada en los medios para la energía y síntesis bioquímica. Un organismo fotosintético puede ser cultivado mixotróficamente por un espacio de tiempo, seguido por un período de crecimiento fototrófico, o viceversa.
Una variedad de medios para el crecimiento fototrófico y/o mixotrófico de algas y cianobacterias es conocido en la técnica, y los medios pueden ser optimizados para aumentar el crecimiento o la producción de productos de ácido graso para una especie particular.
Los microorganismos que pueden ser útiles de acuerdo con los métodos de la invención presente pueden ser encontrados en varias ubicaciones y ambientes a través del mundo. Como resultado dé su aislamiento de otras especies y su divergencia evolutiva resultante, el medio particular de crecimiento para el crecimiento y la generación: óptimos de constituyentes de lípidos y/o hidrocarburos puede variar. En algunos casos, ciertas cepas de microorganismos no pueden crecer en un medio particular de crecimiento a causa de la presencia de algún componente inhibitorio o la ausencia de algún requerimiento nutricional esencial necesario para la cepa particular del microorganismo.
El medio de crecimiento sólido y líquido están generalmente disponibles de una gran variedad de fuentes, como lo son instrucciones para la preparación de medios particulares propios de una gran variedad de cepas de microorganismos. Por ejemplo, varios medios de agua dulce y agua salada pueden incluir esos descritos en Barsanti, L and Gualtieri, P. (2005) Algae. Anatomy, Biochemistry, and Biotechnology, CRC Press, Taylor & Francis Group, Boca Ratón, FL, USA, que se incorpora en la presente como referencia para los medios y métodos de cultivo de algas. Las recetas del mesio algal también pueden ser encontradas en los sitios en red de varias colecciones de cultivos de algas, incluyendo, como ejemplos no limitativos, la Colección de Cultivos UTEX de Algas (sbs.utexas.edu/utex/media.aspx); Colección de Cultivos de Algas y Protozoarios (ccap.ac.uk/media/pdfrecipes); y Katedra Botaniky (/botany.natur.cuni.cz/algo/caup-media.html).
En algunas modalidades, los medios utilizados para cultivar un organismo que produce ácidos grasos puede incluir un aumento en la concentración de un metal (proporcionado típicamente como una sal y/o en una forma iónica) tal como, por ejemplo, sodio, potasio, magnesio, calcio, estroncio, bario, berilio, plomo, hierro, níquel, cobalto, estaño, cromo, aluminio, cinc, cobre, o similares, o las combinaciones de los mismos (metales especialmente multivalentes, tales como magnesio, calcio, y/o hierro), con respecto a una formulación de medio estándar, tal como, por ejemplo, medio BG-11 estándar (Medio de ATCC 616, Ejemplo 6), o un medio modificado tal como el Medio de ATCC 854 (BG-11 modificado para contener vitamina B12) o Medio de ATCC 617 (BG-11 modificado para la cianobacteria marina, que contiene NaCI y vitamina B 2) adicional.
Por ejemplo, un medio utilizado para cultivar microorganismos que producen ácidos grasos libres pueden incluir por lo menos de 2 veces, por ejemplo por lo menos de 3 veces, por lo menos de 4 veces, por lo menos de 5 veces, por lo menos de 6 veces, por lo menos de 7 veces, por lo menos de 8 veces, por lo menos de 9 veces, por lo menos de 10 veces, entre de 2 veces y de 10 veces, y/o entre de 10 veces y de 100 veces la cantidad de metal (por ejemplo, calcio) en comparación con un medio estándar. El medio utilizado para cultivar los microorganismos que pueden producir ácidos grasos libres pueden incluir, por ejemplo, por lo menos aproximadamente 0.5 mM, entre aproximadamente 0.5 mM y aproximadamente 1 mM, entre aproximadamente 1 mM y aproximadamente 2 mM, entre aproximadamente 2 mM y aproximadamente 5 mM, entre aproximadamente 5 mM y aproximadamente 10 mM, entre aproximadamente 10 mM y aproximadamente 25 mM, y más que 25 mM de metal (por ejemplo, calcio) en la formulación.
En modalidades adicionales, utilizando la cantidad en exceso de metal (por ejemplo, calcio) en el medio, por lo menos una porción dé los ácidos grasos puede ser secuestrada como precipitados de jabón, lo que puede tener como resultado una disminución de los efectos tóxicos de los ácidos grasos libres. La adición de metal (por ejemplo, calcio) en el medio puede alternativamente o adicionalmente aumentar la tolerancia del microorganismo en el medio con una concentración relativamente alta de ácidos grasos libres. Adicionalmente o alternativamente, las cepas que producen ácidos grasos pueden ser ventajosamente más robustas con un contenido en exceso de metal (por ejemplo, calcio). Aunque el componente en exceso sea descrito en la presente como un metal, es contemplado que el componente puede ser descrito más generalmente como una fuente de contraión de carboxilato, por ejemplo una fuente de contaión que forma jabón, una fuente de ion metálico (anotado como "metal" en la presente), una fuente de contraión multivalente (es decir, que tiene una valencia de +2 o mayor), una fuente de contraión divalente o alguna combinación. Para la producción de ácidos grasos y/o derivados de ácido graso, los microorganismos fotosintéticos pueden ser cultivados en interiores (por ejemplo, en fotobioreactores, en matraces sacudidos, en probetas, frascos, placas de microtitulación, en cajas de petri, o similares) o en exteriores (por ejemplo, en estanques, canales, zanjas, circuitos, canales, o similares). Adicionalmente o alternativamente, una fuente de carbono inorgánico (tal como, pero no limitado a, C02), incluyendo, pero no limitado a, aire, aire enriquecido con C02, o a gas de descarga, puede ser suministrado a los microorganismos fotosintéticos.
Adicionalmente o alternativamente, la invención presente puede incluir una o más de las modalidades siguientes.
Modalidad 1. Un microorganismo que comprende una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa, en donde la expresión de la 4-hidroxibenzoil-CoA tioesterasa en el microorganismo tiene como resultado la producción de por lo merlos un ácido graso libre y/o derivado de ácido graso.
Modalidad 2. El microorganismo según la modalidad 1 , en donde la 4-hidroxibenzoil-CoA tioesterasa hidroliza un acil-ACP.
Modalidad 3. El microorganismo según cualquiera de las modalidades anteriores, en donde el por lo menos un derivado de ácido graso comprende por lo menos un aldehido graso, por lo menos un alcohol graso, por lo menos un éster ceroso, por lo menos un alcano, por lo menos un alqueno, o una combinación de los mismos, y/o tiene un número total de carbonos de 7 a 36.
Modalidad 4. El microorganismo según cualquiera de las modalidades anteriores, en donde el microorganismo es capaz de producir por lo menos un ácido graso que tiene una longitud de cadena de acilo de 8 a 24 carbonos o de 8 a 18 carbonos.
Modalidad 5. El microorganismo según cualquiera de las modalidades anteriores, en donde por lo menos 30 % en peso de los ácidos grasos libres producidos por el microorganismo son ácidos grasos libres que tienen una longitud de cadena de acilo de 8 carbonos, de 10 carbonos, de 12 carbonos, de 14 carbonos, de 16 carbonos, de 18 carbonos, o de cualquier mezcla de los mismos.
Modalidad 6. El microorganismo según cualquiera de las modalidades anteriores, en donde la 4-hidroxibenzoil-CoA tioesterasá es procariótica y/o tiene por lo menos 70% de identidad de secuencia de aminoácido, por ejemplo por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo m^nos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100% de identidad de secuencia, a SEQ ID NO: 1 o SEQ ID NO: 2.
Modalidad 7. El microorganismo según cualquiera de las modalidades anteriores, en donde la molécula de ácido nucleico, que codifica la 4-hidroxibenzoil-CoA tioesterasa comprende la secuencia de nucleótidos SEQ ID NO: 3 o SEQ ID NO: 4.
Modalidad 8. El microorganismo según cualquiera de las modalidades anteriores, en donde la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa es establemente integrada en un cromosoma del microorganismo y/o está en un constructo de expresión.
Modalidad 9. El microorganismo según la modalidad 8, en dónde el constructo de expresión comprende a un promotor operablemente enlazado a la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa, en donde el promotor es funcional en el microorganismo.
Modalidad 10. El microorganismo según cualquiera de las modalidades anteriores, en donde el microorganismo comprende además por lo menos una molécula de ácido nucleico adicional que codifica por lo menos un polipéptido adicional tal como acetil-CoA carboxilasa o ß-cetoacil sintasa (KAS), en donde la expresión de la molécula adicional de ácido nucleico en el microorganismo fotosintético mejora la producción de ácidos grasos libres y/o derivados de ácido graso.
Modalidad 11. El microorganismo según cualquiera de las modalidades anteriores, en donde el microorganismo ha atenuado la expresión de por lo menos un gen que codifica una proteína que comprende una proteína portadora de acilo-acilo (ACP) sintasa, acil-CoA deshidrogenasa, g I i ce ro I- 3-f osf ato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa, acetato cinasa, y combinaciones de los mismos.
Modalidad 12. El microorganismo de cualquiera de las modalidades anteriores, en donde el microorganismo es una bacteria, un heteroconto, un traustoquitrido, o un hongo, y puede ser un miembro de los géneros Clostrídium, Zymomonas, Escherichia, Salmonella, Rhodococcus, Pseudomonas, Bacillus, Lactobacillus, Enterococcus, Alcaligenes, Klebsiella, Paenibacillus, Arthrobacter, Corynebacterium, Brevibacterium, Pichia, Candida, Hansenula, o Saccharomyces.
Modalidad 13. El microorganismo de cualquiera de las modalidades 1-11 , en donde el microorganismo es un microorganismo fotosintético, y puede ser una microalga o una cianobacteria.
Modalidad 14. Un método para producir un ácido graso libre y/o derivado de ácido graso en un cultivo, el método comprende cultivar un microorganismo en un medio de crecimiento, en donde el microorganismo comprende por lo menos una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa según cualquiera de las modalidades anteriores; y en donde el microorganismo es cultivado bajo una condición que permite la expresión del gen exógeno de 4-hidroxibenzoil-CoA tioesterasa durante un período de cultivo.
Modalidad 15. El método según la modalidad 14, en donde por lo menos una porción del ácido graso libre y/o ácido graso es secretada en el medio de crecimiento.
Modalidad 16. El método según modalidad 14 o la modalidad 15, en donde el microorganismo es un microorganismo fotosintético, y además en donde el medio de crecimiento no incluye una cantidad substancial de una fuente de carbono reducido, en donde el cultivo es proporcionado con por lo menos una fuente de carbono inorgánico, y/o en donde el cultivo es expuesto a la luz por lo menos por una porción del período de cultivo.
Modalidad 17. El método según cualquiera de modalidades 14-16, en donde el método comprende además aislar por lo menos un ácido graso libre y/o derivado del microorganismo, el medio de crecimiento, o del cultivo entero.
Modalidad 18: Una molécula de ácido nucleico aislada o recombinante que comprende una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos por lo menos 50%, por lo menos 55%, por lo menos 60%, por lo menos 65%, por lo menos 70%, por lo menos 75%, por lo menos 80%, por lo menos 85%, por lo menos 95%, por lo menos 97%, o aproximadamente 100% idéntica a SEQ ID NO: 2.
Modalidad 19: Una molécula de ácido nucleico aislada o recombinante que comprende una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos por lo menos 80%, por lo menos 85%, por lo menos 90%, por lo menos 95%, por lo menos 96%, por lo menos 97%, por lo menos 98%, por lo menos 99%, o aproximadamente 100% idéntico a SEQ ID NO: 1.
Modalidad 20: Una molécula de ácido nucleico aislada o recombinante según la Modalidad 18 o 19, en donde el polipéptido tiene actividad de acil-ACP tioesterasa.
A menos que sea definido de otro modo, todos los términos técnicos y científicos utilizados en la presente tienen el mismo significado como es comprendido comúnmente por una persona de experiencia ordinaria en la técnica a la que esta invención pertenece. Aunque pueden utilizarse cualesquiera métodos y materiales similares o equivalentes a esos descritos en la presente en la práctica o prueba de la presente invención, los métodos y los materiales preferidos ahora serán descritos. Todas las publicaciones mencionadas en la presente son incorporadas en la presente como referencia en su totalidad.
Las secuencias de ácido nucleico y aminoácidos identificadas por los Números de Acceso o Identificadores de Genlnfo también son incorporadas como referencia en la presente. Los números de acceso son identificaciones únicos para un registro de secuencia públicamente disponible en el sitio de Internet del National Center for Biotechnology Information (Centro Nacional de Información de Biotecnología) mantenido por el Unites States National Institutes of Health Instituto Nacional de Salud de los Estados Unidos), que puede ser accesado en ncbi. nlm. nih. gov. El número de identificación de secuencia "Identificador de Genlnfo" (Gl) es específico para una secuencia de nucleótidos o el aminoácidos. Si una secuencia cambia en cualquier manera, se asigna un nuevo número de Gl. Una herramienta de Historia de Revisión de Secuencia está disponible para rastrear varios números Gl, números de versión, y fechas de actualización para secuencias que aparecen en un registro específico de Genbank. Buscar y obtener secuencias de ácidos nucleicos o genes o secuencias de proteína con base en los números de Acceso y números de Gl es bien sabido en la técnica de la biología celular, de la bioquímica, de la biología molecular, y de la genética molecular.
Debe ser notado que como es utilizado en la presente y en las reivindicaciones anexas, las formas singulares "un", "una", y "el" incluyen la referencia plural a menos que el contexto dicte claramente lo contrario. El uso de "o" en una lista de dos o más artículos indica que cualquier combinación de los artículos es contemplada, por ejemplo, "A o B" indica que A solo, B solo, o ambos de A y B son pensados. Todos términos técnicos y científicos utilizados en la presente tienen el mismo significado.
Todos términos técnicos y científicos utilizados en la presente tienen el mismo significado.
Las publicaciones discutidas en la presente son proporcionadas únicamente para su revelación antes de la fecha de presentación dé la presente solicitud. Nada en la presente será interpretado como una admisión de que no se permite a la invención descrita anteceder tal publicación en virtud de invención previa. Además, las fecha de publicación provistas pueden ser diferentes de las fechas de publicación reales que pueden necesitar confirmarse de manera independiente.
EJEMPLOS Los ejemplos siguientes son expuestos para proporcionar á las personas con conocimientos ordinarios en la técnica con una revelación y descripción completa de cómo hacer y utilizar la invención descrita, y no pretenden limitar el alcance de lo que los inventores consideran como su invención ni pretenden representar que los experimentos siguienes son todos o los únicos experimentos realizados. Esfuerzos han sido realizados para asegurar certeza con respecto a los números utilizados (por ejemplo, cantidades, temperatura, etc.), pero algunos errores y desviaciones experimentales deben ser justificados. A menos que se indique lo contrario, las partes son partes en peso, peso molecular es peso molecular promedio en peso, la temperatura es en grados centígrados y presión es a o cercana a la atmosférica.
EJEMPLO 1 Generación de la Biblioteca Metaqenómica 1.1. Aislamiento de ADN metagenómico Para aislar los ADN metagenómicos que pueden contener genes novedosos de tioesterasa, ~20 litros de muestras de agua entera fueron recolectadas de un estanque de peces Pacific Aquafarms ubicado al norte de Saltón Sea en California del sur.
Aproximadamente 8L de agua fueron filtrados del sitio anterior, utilizando un tren de filtración de Acero Inoxidable Millipore, a través de filtros de ~20 pm, ~3 µ?t?, -0.8 µ??, y -0.1 pm. Un filtro de -0.1 µ?? fue colocado en una bolsa de congelador hermética al aire Ziploc® (S.C. Johnson, Racine, Wl). Una sección del filtro fue añadida al medio para la expansión de poblaciones de microorganismo para producir las bibliotecas metagenómicas. Una muestra del filtro fue cultivada en un medio de Caldo Luria (LB, por sus siglas en inglés) agitando a -225 rpm a aproximadamente 30°C, y otra mustera de filtro fue cultivada en medio de Caldo de Luria (LB) agitando a -225 rpm a aproximadamente 40°C, ambos durante la noche. Después del periodo de crecimiento, las suspensiones celulares fueron recolectadas por centrifugación a ~4,000g por aproximadamente 10 mins a temperatura ambiente (~20-25°C). Las perlas celulares fueron resuspendidas en -50 mM Tris-CI, pH -8.0 (conteniendo -10 mM EDTA, -100 pg/ml RNase A, -4 mg/ml Lisozima, -100 pg/ml Lisostafina, y -500U/ml Mutanolisina), y se incubó a -37°C con agitación (-100 rpm). Los homogenados fueron sedimentados por centrifugación por aproximadamente 30 min a ~16,000g a- 4°C. Los sobrenadantes fueron transferidos a nuevos tubos y mezclados coñ un volumen igual de etanol frío (aproximadamente -20°C) 100% de etanol para precipitar el ADN. El precipitado fue recolectado por centrifugacióñ a ~16,000g a- 4°C o enrollado en un anillo de inoculación estéril desechablé. El ADN fue lavado entonces en -75% de etanol y secado a temperatura ambiente y resuspendido en -50 mM de Tris-CI, pH -8.0, para fraccionamiento y construcción de la biblioteca. 1.2 Construcción de la Biblioteca de de ADN Metaqenómico e Investigación Funcional El ADN metagenómico aislado de la mustera metagenómica amplificada a~ 30°C y la muestra metagenómica amplificada a - 40°C fueron digeridas parcialmente con endonucleasa de restricción Saw3AI y enlazada en el sitio de BamHI del vector RB-RS1 de expresión/integración bacteriano/cianobacterial (SEQ ID NO: 5; figura 2) para generar bibliotecas genómicas a ~ 30°C y~ 40°C. El vector de expresión RB-RS1 fue construido utilizando una estructura principal de pUC del cual fue eliminado el gen de lactamasae que confiere resistencia a la ampicillina. El vector fue construido de manera que el promotor lac, el gen alfa lacZ, y un gen de resistencia de kanamicina fueron flanqueados por la secuencia RS1 "ascendente" y la secuencia RS1 "descendente" para la recombinación homólogá en el sitio RS1 en el genoma de Synechocystis (William et al. (1988) Methods in Enzymology, 167: 766-778). Las bibliotecas a ~30°C y ~40°C fueron transformadas en células competentes de E. coli K19, y las colonias resistentes a la kanamiciona fueron investifadas para la producción de ácidos grasos libres a través de Ensayo de Placa en Azul Nilo.
Un ensayo a base de placa fue utilizado para identificar las colonias recombinantes de E. coli que producen ácidos grasos libres en un medio sólido que contenía -10 pg/mL de Azul Nilo A (Alfa Aesar #A17174). El azul Nilo tiñe los lípidos polares (ácidos grasos, fosfolípidos) de azul. Las colonias fueron examinadas por inspección visual para tinción posicionando placas en una caja de luz estándar. Las colonias que despliegan un alto nivel de tinción de Azul Nilo A sobre los controles de fondo fueron seleccionadas, cultivadas, y después examinadas para determinar la cantidad total del ácido graso libre no esterificado (FFA) utilizando un kit de detección de ácido graso libre (#SFA-1 , Zenbio, Inc, Research Triangle Park, NC).
El contenido de ácido graso libre de las muestras que exhiben niveles elevados de ácido graso libre sobre los controles de fondo en el ensayo de placa de Azul Nilo y por el ensayo con el kit de detección de ácido graso libre fueron después analizadas por cromatografía de gas (GC) con detección de ionización de flama (GC-FID, por sus siglas en inglés). Doscientos clones que muestran niveles elevados de ácido graso libre en el análisis de GC-FID sobre los controles de fondo fueron seleccionados, y las secuencias de nucleótido de los clones fueron determinadas, i Después del secuenciamiento del ADN, la eliminación de clones redundantes, y análisis bioinformático, un patrón recurrente de clones que pertenecen a una familia de genes de 4-hidroxibenzoil-CoA tioesterasa fue observada. Entre la familia de los genes de 4-hidroxibenzoil-CoA tioesterasa, dos clones, 340-64 (SÉQ ID NO: 3) y 3-1 (SEQ ID NO: 4), fueron caracterizados en más detalle.
EJEMPLO 2 Expresión de ADN meta enómico en E. coli Para la expresión de los genes de tioesterasa procariótica en E. coli, ~1.2 ml_ de medio 2x YT que contenía ~50 pg/ml de espectinomicina y -1 mM de Isopropil ß-D-l-tiogalactopiranósido (IPTG) en un tubo de vidrio fue inoculado con ~30 microlitros de un cultivo saturado de cada cepa bacteriana y cultivado por aproximadamente 24 horas. Aproximadamente 0.6 mL del cultivo fue eliminado para el análisis bioquímico.
EJEMPLO 3 Análisis de muestras de ácido graso de E. coli Para la identificación y cuantificación de los ácidos grasos producidos por las cepas transformadas de E. coli, ~0.6 mL de los cultivos de E. coli fue agregado a frascos de vidrio de cromatografía de gas de -2 mL con tapas revestidas con PTFE (politetrafluoroetileno) (National Scientific). Cincuenta microlitros de un conjunto estándar interno incluyendo los ácidos grasos con longitudes de cadena del acilo de 9 carbonos (C9:0), 13 carbonos (C13:0), y 17 carbonos (C 7:0), cada uno a una concentración de ~600 pg/ml, en hexano, fueron agregados a la muestra de cultivo, seguido por ~50 microlitros de ~50% H2S04, ~100 microlitros de ~5M NaCI, y ~850 microlitros de hexano. La concentración final de cada estándar interno fue ~50 g/ml. Los ácidos grasos para formar el conjunto de estándar interno fueron comprados de Fluka o Nu Check Prep. Los cultivos fueron sometidos a vórtice y luego en un formador de vórtice de multi-tubo a ~2,500 rpm por ~30 min. Los frascos por último fueron centrifugados por ~3 min a -2500 rpm para proporcionar una buena separación entre las fases orgánica y acuosa. Las capas de hexano fueron muestreadas por un Gerstel MPS2L Autosampler.
Muestras de ácido graso de E. coli fueron analizadas utilizando un cromatógrafo de gas Agilent modelo 7890A equipado con un FID (detector de ionización de flama) que inluye una columna capilar J&W Scientific DB-FFAP (-15 m de longitud, -0.25 mm de diámetro interno, -0.25 pm de espesor de película) acoplado a un espectrofotómetro de masa Agilent 5975C. El horno de GC fue programado de la siguiente manera: ~140°C por -0.5 min., luego calentado a ~20°C/min. a ~230°C (mantener -5 min). La temperatura del inyector fue mantenida a ~250°C, y una división de -40: 1 de inyección de -1 µ? fue utilizada. Helio fue utilizado como un gas portador en un caudal de flujo de aproximadamente 1.2 ml/min. Los analitos fueron identificados por comparación de tiempos de retención a estándares individualmente inyectados. El intervalo de calibración para los analitos fue -2 pg/ml a -200 pg/ml para los ácidos grasos que tienen una longitud de cadena de 8 carbonos (C8.0) a 16 carbonos con un doble enlace (C16:1) y -0.5 ug/ml a -50 pg/ml para ácidos grasos que tienen una longitud de cadena de 18 carbonos si doble enlace (C18:0) a 18 carbonos con dos dobles enlaces (C18:2). Los experimentos de adición y recuperación en el cultivo celular entero mostraron que el método de extracción recuperó consistentemente dentro de un intervalo de aproximadamente 85%-1 15% de cada analito.
Como es mostrado en las figuras 3, 4, y 5, la expresión de las 4-hidroxibenzoil-CoA tioesterasas en E. coli tuvo como resultado un aumento de la producción de ácidos grasos libres en el cultivo, con los niveles de ácidos grasos libres estando tan altos o más alto que esos producidos por células de E. coli que expresan una tioesterasa de planta superior de una especie de Cuphea (marcada como control 25). Como es mostrado en la figura 3, la expresión de la 4-hidroxibenzoil-CoA tioesterasa 340-64 (SEQ ID NO: 3) en E. coli condujo a la producción de ácidos grasos libres que tienen una longitud de cadena de acilo de 8, 10, 12, 16, y 18 carbonos.
Como es mostrado en la figura 4, la expresión de 4-hidroxibenzoil-CoA tioesterasa 3-1 (SEQ ID NO: 2) en E. coli también tuvo como resultado la producción de ácidos grasos libres que tienen longitudes de cadena de acilo de 8, 10, 12, 16, y 18 carbonos, con la cantidad de ácidos grasos libres teniendo una longitud de cadena de acilo de 8, 10, 16, y 18 carbonos siendo mayor en el cultivo que contiene células que iexpresan la SEQ ID NO: 2 en comparación con cultivo de control que contiene células que expresan una tioesterasa de planta superior de la especie de Cuphea (marcada como control 25).
La figura 5 muestra el nivel de ácidos grasos libres producidos por células de E. coli K-19 (que carece de una acil-CoA sintasa funcional, una enzima en la trayectoria de la degradación de ácido graso) que expresa la tioesterasa 340-64 de la 4-hidroxibenzoil tioesterasa (SEQ ID NO: 3) o un control vacío de vector (control de RBRS1 EV). La cantidad de ácido graso libre fue normalizada a la O.D. de las células K19. La expresión de la 4-hidroxibenzoil-CoA tioesterasa de 340-64 (SEQ ID NO: 3) en células K19 también aumentó el nivel de ácidos grasos libres que tienen longitudes de cadena de acilo de 8, 10, 12, 14, 16, y 18 carbonos producidos por la cepa.
EJEMPLO 4 Ensayo de Acil-ACP Tioesterasa Ya que el ácido graso libre que produce células fue transformado con genes que codifican las 4-HBTs, no conocidos por generar ácidos grasos libres de acil-ACP, las enzimas fueron expresadas en cepas de E.coli para producir las enzimas para el uso en ensayos in vitro para determinar su actividad de tioesterasa en sustratos de acil-ACP.
Para este fin, las células de E. coli fueron trasnformadas con 340-64 (SEQ ID NO:3), 3-1 (SEQ ID NO:4), o con un vector vacío (SEQ ID NO:5) como un control, y la expresión fue inducida agregando isopropil ß-D-l-tiogalactopiranósido (IPTG) en el medio de cultivo de E. coli. Los cultivos (~ 10 mi) fueron inoculados con colonias únicas e incubados hasta que el OD del cultivo alcanzó -0.6, en cuyo momento el IPTG fue añadido a una concentración final de ~1 mM, y las células fueron permitidas crecer por la noche. Las células fueron entonces perladas, las perlas de células fueron lavadas con 1x de salina amortiguada con fosfato (PBS) y los extractos celulares fueron formados resuspendiendo las perlas en -0.5 mL de amortiguador de lisis celular xTractor (Clontech, Mountain View, CA).
El ensayo de acil-ACP tioesterasa fue realizado de la siguiente manera: ~5 µ? de -10 µ? de un sustrato de acil-ACP de C16 enzimáticamente sintetizado en un amortiguador (-100 mM Tris-HCI, pH -8.0, -100 mM NaC1 ) fue mezclado con -3 µ? de extractos celulares de ya sea células que producen 3-1 HBT, células que producen 340-64 HBT, o un extracto de control de células de E. coli que no expresan una tioesterasa (PE0045). Las mezclas fueron incubadas por- 5,~ 10, y -30 min, y las reacciones detenidas calentando a- 70°C por -5 min. Aproximadamente 10 µ? de colorante de carga de urea nativo 2.5x fue agregado a las mezclas de reacción. Las muestras fueron cargadas sobre -20% de -2.5M de gel de acrilamida nativo de urea y fueron corridas bajo condiciones no desnaturalizantes a -120 voltios por -60 mins. El gel fue teñido con tinción de gel Simplyblue™ (Invitrogen, Carlsbad, CA).
La figura 6 muestra los patrones de migración de los sustratos de acil-ACP en un gel nativo de acrilamida, que fueron incubados con extractos celulares formados de células de E.coli que expresan clones diferentes, o un extracto de control (PE0045). Las bandas 1-3 muestran los patrones de migración de sustratos de acil-ACP (-5 µ? de -10 µ?) incubados con -3 ul de amortiguador de lisis celular xTractor (Banda 1 ) o con un lisado formado de células que contienen un vector de control (PE0045, -3 µ?), por -5 mins (Banda 2) o ~10 mins (Banda 3). La banda 4 indica un marcador de tamaño de proteína. Las bandas 5-7 (marcadas como 3-1) muestran lod patrones de migración de sustratos de acil-ACP incubados con ~3 µ? de extracto (aproximadamente 5 mg/ml) formados de las células que expresan la 3-1 4-hidroxibenzoil tioesterasa (SEQ ID NO:2) por ~5 mins (Banda 5), ~10 mins (Banda 6), y ~30 mins (Banda 7), respectivamente. Las bandas 8-10 muestran los patrones de migración de los sustratos de acil-ACP incubados con los extractos formados de las células que expresan la 4- hidroxibenzoil tioesterasa de 340-64 (SEQ ID NO: 1) por ~5 min (Banda 8), -10 min (Banda 9), y ~30 min (Banda 10), respectivamente.
Como es mostrado en la figura 6, por contraste a un control (sustrato de acil-ACP con extracto de PE0045), la incubación de los sustratos de acil-ACP con los extractos celulares formados de células de E. coli que expresan 4-hidroxibenzoil-CoA tioesterasa de cualquiera de 340-64 (SEQ ID NO: 1) o 3-1 (SEQ ID NO: 2) llevó a un aumento dramático en la cantidad de ACPs libre, al disminuir la cantidad de los sustratos de ACP conjugados a los ácidos grasos (C16-ACP). Estos resultados indican que ambos del 3-1 (SEQ ID NO: 1 ) y 340-64 (SEQ ID NO: 2) posee una actividad hidrolizante hacia el sustrato de acil-ACP.
EJEMPLO 5 Transformación de Cianobacteria Plásmidos que contienen la 4-hidroxibenzoil-CoA tioesterasa de 340-64 y genes 3-1 son introducidos en un hospedero cianobacterial. Células de Synechocystis sp. PCC 6803 son transformadas esencialmente de acuerdo a Zang et al. (J. Microbiology, 2007, 45: 241-245, cuyo contenido se incorpora en la presente como referencia en su totalidad). Brevemente, las células son cultivadas bajo luz constante a una densidad óptica 730 (O.D.730) de aproximadamente 0.7 a 0.9 (an OD 3o de -0.25 corresponde a -1 x 108 células/ml) y cosechadas por centrifugación a ~2,000g por -15 mins a temperatura ambiente. La perla de células es resuspendida en aproximadamente 0.3 veces el volumen de crecimiento de medio BG-1 1 fresco y utilizado inmediatamente para la transformación. Aproximadamente 1 microgramo de ADN de plásmido (conteniendo un gen de 4-hidroxiberizoil-CoA tioesterasa) se agrega a -0.3 mi de células, mezcladas suavemente, y se incuba aproximadamente por -5 horas con iluminación a ~30°C sin agitación. Las células son diseminadas en un filtro (membrana de patrón perforado de Policarbonato de Whatmann Nuclepore, PC -47 mm, -0.2 mieras) colocado en placas de agar de -50 mi de BG-1 1 y se dejan recuperar por aproximadamente 16 a 24 horas después de lo cual el filtro es levantado y colocado en una placa de BG-1 1 fresco que contiene espectinomicina (-20 Mg/ml) para seleccionar los transformantes. Las colonias resultantes son investigadas además para la presencia de los genes de 4-hidroxibenzoil-CoÁ tioesterasa por PCR.
EJEMPLO 6 Cultivando la Cianobacteria Células de Synechocystis transformadas con los constructós de expresión que comprenden los genes 340-64 (SEQ ID NO:3) y 3-1 (SEQ ID NO:4) son cultivados fototróficamente, en la ausncencia de una fuente de carbono reducido, y utilizando luz como una fuente de energía. Aproximadamente diez mi de medio de BG-1 1 qjue contiene -1 mM IPTG en frascos de vidrio de ~20 mL son inoculados en un OD73orm de -0.6 y cultivados por -6.5 días (~150 rpm) a ~30°C con iluminación constante (~40 pEinsteins m'2 sec'1). Aproximadamente 0.6 mi del cultivo es eliminado para análisis bioquímico. Los ingredientes del medio BG-1 1 (medio de ATCC: Medio 616 de BG- 1 para algas azul turquesa) es así: Acido cítrico 6 mg Citrato de amonio férrico 6 mg EDTA 1 mg Na2C03 20 mg Mezcla A5 de Metales Traza (vea lo siguiente) 1 mi Agar (si se requiere) 10 g Agua destilada 1 L Ajustar pH final a -7.1 Autoclave a -121 °C por -15 minutos Composición de Mezcla A5 de Metal Traza: EJEMPLO 7 Análisis de muestras de ácido graso de cianobacteria ISynechocystis) Muestras de ácido graso de Synechocystis son analizadas en un cromatógrafo de gas Agilent modelo 7890A equipado con un FID (detector de ionización de flama) que incluye una columna capilar J&W Scientific DB-FFAP (~15 m longitud, ~0.25 mm de diámetro interno, ~0.25 pm de espesor de película) acoplado a un espectrofotómetro de masa Agilent 5975C. El horno de la cromatografía de gas es programado de la siguiente manera: ~140°C por ~0.5 min, luego calentado a ~20°C/min. a ~230°C (mantener por ~5 mins). La temperatura del inyector es mantenida a~ 250° C, y una división de 40:1 de inyección de -1.0 es utilizada. Helio es utilizado como un gas portador a un caudal de flujo de ~1.2 mL/min. Los analitos son identificados por comparación de los tiempos de retención de estándares inyectados individualmente.
Mientras la invención descrita ha sido descrita con referencia a las modalidades específicas de la misma, debe ser comprendido por los expertos en la técnica que varios cambios pueden ser realizados y equivalentes pueden ser sustituidos sin separarse del verdadero espíritu y alcance de la invención. Además, muchas modificaciones pueden ser realizadas para adaptar una situación particular, material, composición de la materia, procedimiento, paso o pasos del procedkímiento, al objetivo, el espíritu y el alcance de la invención descrita. Todas tales modificaciones pretenden estar dentro del alcance de las reivindicaciones anexas a la presente.

Claims (45)

NOVEDAD DE LA INVENCIÓN REIVINDICACIONES
1.- Un microorganismo que comprende una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa, en donde la expresión de la 4-hidroxibenzoil-CoA tioesterasa en el microorganismo tiene como resultado la producción de por lo menos un ácido graso libre y/o derivado de ácido graso.
2.- El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque la 4-hidroxibenzoil-CoA tioesterasa hidroliza un acil-ACP en el microorganismo.
3. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque el por lo menos un derivado de ácido graso comprende por lo menos un aldehido graso, por lo menos un alcohol graso, por lo menos un éster ceroso, por lo menos un alcano, por lo menos un alqueno, o una combinación de los mismos.
4. - El microorganismo de conformidad con la reivindicación 3, caracterizado además porque el por lo menos un derivado de ácido graso tiene un número total de carbonos de 7 a 36.
5. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque el microorganismo es capaz de producir por lo menos un ácido graso que tiene una longitud de cadena de acilo de 8 a 24 carbonos.
6. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque el microorganismo es capaz de producir por lo menos un ácido graso que tiene una longitud de cadena de acilo de 8 a 18 carbonos.
7. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque por lo menos 30 por ciento en peso de los ácidos grasos libres producidos por el microorganismo son ácidos grasos libres que tienen una longitud de cadena de acilo de 8 carbonos, de 10 carbonos, de 12 carbonos, de 14 carbonos, de 16 carbonos, de 18 carbonos, o cualquier mezcla de los mismos.
8. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque la 4-hidroxibenzoil-CoA tioesterasa es procariótica y tiene por lo menos 70% de identidad de secuencia de aminoácidos a SEQ ID NO: 1 o SEQ ID NO: 2.
9. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque la 4-hidroxibenzoil-CoA tioesterasa comprende una secuencia de aminoácidos que tiene por lo menos 70% dé identidad a SEQ ID NO: 1 o SEQ ID NO: 2.
10.- El microorganismo de conformidad con la reivindicación 1, caracterizado además porque la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa comprende una secuencia de aminoácidos de SEQ ID NO: 1 o SEQ ID NO: 2.
1 1.- El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa es integrada establemente en un cromosoma del microorganismo.
12.- El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa está en un constructo de expresión.
13. - El microorganismo de conformidad con la reivindicación 12, caracterizado además porque el constructo de expresión comprende a un promotor operablemente enlazado a la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa y en donde el promotor es funcional en el microorganismo.
14. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque el microorganismo comprende adicionalmente por lo menos una molécula de ácido nucleico que codifica por; lo menos un polipéptido adicional, en donde la expresión de la molécula de ácido nucleico adicional en el microorganismo aumenta la producción de un ácido graso libre y/o derivado de ácido graso.
15. - El microorganismo de conformidad con la reivindicación 14, caracterizado además porque la por lo menos una molécula de ácido nucleico adicional codifica la acetil-CoA carboxilasa o ß-cetoacil sintasa (KAS).
16. - El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque el microorganismo tiene una expresión atenuada de por lo menos un gen que codifica una proteína que comprende una proteína portadora de acilo-acilo (ACP) sintasa, acil-CoA deshidrogenasa, glicerol-3-fosfato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa, acetato cinasa, y combinaciones de los mismos.
17.- El microorganismo de conformidad con la reivindicación 1 , caracterizado además porque el microorganismo es un microorganismo fotosintético.
18. - El microorganismo fotosintético de conformidad con la reivindicación 17, caracterizado además porque el microorganismo fotosintético es una microalga o una cianobacteria.
19. - Un método para producir un ácido graso libre o un derivado de ácido graso en un cultivo, el método comprende cultivar un microorganismo en un medio de crecimiento, en donde el microorganismo comprende por lo menos una molécula recombinante de ácido nucleico que codifica una 4-hidroxibenzoil-CoA tioesterasa; en donde el microorganismo es cultivado bajo una condición que permite la expresión de la 4-hidroxibenzoil-CoA tioesterasa en el microorganismo durante un período de cultivo; y en donde la expresión de la 4-hidroxibenzoil-CoA tioesterasa en el microorganismo tiene como resultado la producción de por lo menos un ácido graso libre y/o por lo menos un derivado de ácido graso.
20. - El método de conformidad con la reivindicación 19, caracterizado además porque la 4-hidroxibenzoil-CoA tioesterasa hidro'liza el acil-ACP.
21. - El método de conformidad con la reivindicación 19, caracterizado además porque el por lo menos un derivado de ácido graso comprende por lo menos un aldehido graso, por lo menos un alcohol graso, por lo menos un éster ceroso, por lo menos un alcano, por lo menos un alqueno, o una combinación de los mismos.
22. - El método de conformidad con la reivindicación 19, caracterizado además porque el por lo menos un derivado de ácido graso producido por el microorganismo tiene un número total de carbonos de 7 a 36.
23. - El método de conformidad con la reivindicación 19, caracterizado además porque el por lo menos un ácido graso libre producido por el microorganismo tiene una longitud de cadena de acilo de 8 a 24 carbonos.
24. - El método de conformidad con la reivindicación 19, caracterizado además porque el por lo menos un ácido graso libre producido por el microorganismo tiene una longitud de cadena de acilo de 8 a 18 carbonos.
25. - El método de conformidad con la reivindicación 19, caracterizado además porque por lo menos 30 por ciento de peso de los ácidos grasos libres producidos por el microorganismo son ácidos grasos libres que tienen una longitud de cadena de acilo de 8 carbonos, de 10 carbonos, de 12 carbonos, de 14 carbonos, de 16 carbonos, de 18 carbonos, o cualquier mezcla de los mismos.
26. - El método de conformidad con la reivindicación 19, caracterizado además porque la 4-hidroxibenzoil-CoA tioesterasa tiene por lo menos 70% de identidad de secuencia de aminoácidos a SEQ ID NO: 1 o SEQ ID NO: 2.
27. - El método de conformidad con la reivindicación 19, caracterizado además porque la 4-hidroxibenzoil-CoA tioesterasa comprende una secuencia de aminoácidos SEQ ID NO: 1 o SEQ ID NO: 2.
28. - El método de conformidad con la reivindicación 19, caracterizado además porque la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa comprende una secuencia de nucleótidos de SEQ ID NO: 3 o SEQ ID NO: 4.
29. - El método de conformidad con la reivindicación 19, caracterizado además porque el microorganismo comprende además por lo menos una molécula de ácido nucleico adicional que codifica por lo menos un polipéptido adicional, en donde la expresión de la molécula de ácido nucleico adicional en el microorganismo aumenta la producción de un ácido graso libre y/o derivado de ácido graso.
30. - El método de conformidad con la reivindicación 29, caracterizado además porque la por lo menos una molécula de ácido nucleico adicional codifica la acetil-CoA carboxilasa o la ß-cetoacil sintasa (KAS).
31.- El método de conformidad con la reivindicación 19, caracterizado además porque el microorganismo tiene una expresión atenuada de por lo menos un gen que codifica una proteína que comprende proteína portadora de acilo-acilo (ACP) sintasa, acil-CoA deshidrogenasa, glicerol-3-fosfato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa, acetato cinasa, y combinaciones de los mismos.
32. - El método de conformidad con la reivindicación 19, caracterizado además porque la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa es integrada establemente en uh cromosoma del microorganismo.
33. - El método de conformidad con la reivindicación 19, caracterizado además porque la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa está en un constructo de expresión.
34.- El método de conformidad con la reivindicación 33, caracterizado además porque el constructo de expresión comprende a un promotor operablemente enlazado a la molécula de ácido nucleico que codifica la 4-hidroxibenzoil-CoA tioesterasa, en donde el promotor es funcional en el microorganismo.
35.- El método de conformidad con la reivindicación 19, caracterizado además porque por lo menos una porción del ácido graso libre y/o derivado de ácido graso es secretada en el medio de crecimiento.
36. - El método de conformidad con la reivindicación 19, caracterizado además porque el microorganismo es un microorganismo fotosintético.
37. - El método de conformidad con la reivindicación 36, caracterizado además porque el medio de crecimiento no incluye una cantidad substancial de una fuente de carbono reducido.
38. - El método de conformidad con la reivindicación 36, caracterizado además porque el cultivo es proporcionado con por lo menos una fuente de carbono inorgánico.
39. - El método de conformidad con la reivindicación 36, caracterizado además porque el cultivo es expuesto a la luz por lo menos por una porción del período de cultivo.
40. - El método de conformidad con la reivindicación 36, caracterizado además porque el microorganismo fotosintético es una microalga.
41.- El método de conformidad con la reivindicación 36, caracterizado además porque el microorganismo fotosintético es una cianobacteria.
42. - El método de conformidad con la reivindicación 19, caracterizado además porque el método comprende adicionalmente aislar por lo menos un ácido graso libre y/o derivado del microorganismo, Idel medio de crecimiento, o del cultivo entero.
43. - Una molécula aislada o recombinante de ácido nucleico que comprende una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos por lo menos 97% idéntica a SEQ ID NO: 1.
44.- Una molécula aislada o recombinante de ácido nucleico que comprende una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos por lo menos 50% idéntica a SEQ ID NO: 2.
45.- Una molécula aislada o recombinante de ácido nucleico que comprende una secuencia que codifica un polipéptido que tiene una secuencia de aminoácidos por lo menos 70% idéntica a SEQ ID NO: 2.
MX2013007288A 2010-12-23 2011-12-13 Microorganismos deseñados geneticamente que comprenden 4-hidroxibenzoil-coa tioesterasas y metodos de uso de los mismos para producir acidos grasos libes y derivados de acidos grasos. MX336787B (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201061426568P 2010-12-23 2010-12-23
PCT/US2011/064641 WO2012087670A2 (en) 2010-12-23 2011-12-13 Genetically engineered microorganisms comprising 4-hydroxybenzoly-coa thioesterases and methods of using the same for producing free fatty acids and fatty acid derivatives

Publications (2)

Publication Number Publication Date
MX2013007288A true MX2013007288A (es) 2014-01-31
MX336787B MX336787B (es) 2016-02-02

Family

ID=46314757

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2013007288A MX336787B (es) 2010-12-23 2011-12-13 Microorganismos deseñados geneticamente que comprenden 4-hidroxibenzoil-coa tioesterasas y metodos de uso de los mismos para producir acidos grasos libes y derivados de acidos grasos.

Country Status (10)

Country Link
US (1) US8846370B2 (es)
EP (1) EP2655648B1 (es)
CN (1) CN103958692B (es)
AU (1) AU2011349729B2 (es)
BR (1) BR112013016020A2 (es)
ES (1) ES2665516T3 (es)
IL (1) IL226779B (es)
MX (1) MX336787B (es)
PT (1) PT2655648T (es)
WO (1) WO2012087670A2 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9222111B2 (en) * 2011-03-24 2015-12-29 Kao Corporation Method of producing lauric acid-containing oil or fat
WO2012135668A1 (en) 2011-03-31 2012-10-04 Exxonmobil Research And Engineering Company Metabolic pathway targeting by transcription factor overexpression
AU2012316749B2 (en) 2011-09-27 2017-06-29 Exxonmobil Research And Engineering Company Acyl-ACP wax ester synthases
EP3013939A1 (en) * 2013-06-25 2016-05-04 Cellectis Modified diatoms for biofuel production
WO2015116671A2 (en) 2014-01-28 2015-08-06 Dsm Ip Assets B.V. Factors for the production and accumulation of polyunsaturated fatty acids (pufas) derived from pufa synthases
CN110892066A (zh) * 2017-07-21 2020-03-17 巴斯夫欧洲公司 转化细菌细胞的方法
CN108048425A (zh) * 2017-12-19 2018-05-18 湖北工业大学 一种对羟基苯甲酰-coa硫酯酶及其制备方法
CN109907210B (zh) * 2019-03-25 2021-12-31 河南农业大学 酰基辅酶a硫酯酶及其基因在降解玉米赤霉烯酮中的应用、降解玉米赤霉烯酮的制剂
CN112063645A (zh) * 2020-09-25 2020-12-11 南京工业大学 一种制备c14脂肪酸的方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5447858A (en) 1984-04-13 1995-09-05 Mycogen Plant Sciences, Inc. Heat shock promoter and gene
US5753475A (en) 1985-01-17 1998-05-19 Calgene, Inc. Methods and compositions for regulated transcription and expression of heterologous genes
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
US5639952A (en) 1989-01-05 1997-06-17 Mycogen Plant Science, Inc. Dark and light regulated chlorophyll A/B binding protein promoter-regulatory system
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
US5455167A (en) 1991-05-21 1995-10-03 Calgene Inc. Medium-chain thioesterases in plants
US5661017A (en) 1993-09-14 1997-08-26 Dunahay; Terri Goodman Method to transform algae, materials therefor, and products produced thereby
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
US5545817A (en) 1994-03-11 1996-08-13 Calgene, Inc. Enhanced expression in a plant plastid
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
MX9709156A (es) 1995-05-26 1998-03-31 Zeneca Ltd Un interruptor de gen que comprende un receptor ecdisona.
US5851796A (en) 1995-06-07 1998-12-22 Yale University Autoregulatory tetracycline-regulated system for inducible gene expression in eucaryotes
WO2000031283A2 (en) 1998-11-20 2000-06-02 Dow Agrosciences Llc Regulatory sequences useful for gene expression in plant embryo tissue
WO2000062601A1 (en) 1999-04-15 2000-10-26 Northeastern University Agrobacterium-mediated genetic transformation of multicellular marine algae, resultant strains and their products
US20030041353A1 (en) 2001-04-18 2003-02-27 Henry Daniell Mutiple gene expression for engineering novel pathways and hyperexpression of foreign proteins in plants
MXPA04010432A (es) 2002-04-23 2005-05-27 Scripps Research Inst Expresion de polipeptidos en cloroplastos, y composiciones y metodos para expresar los mismos.
US7135290B2 (en) 2003-04-12 2006-11-14 Solazyme, Inc. Methods and compositions for evolving hydrogenase genes
WO2005005643A2 (en) 2003-07-01 2005-01-20 Biolex, Inc. Chloroplast transformation of duckweed
EP2298797A3 (en) * 2004-01-09 2011-05-18 Novozymes Inc. Increased bacillus YweA expression
CN1926431A (zh) * 2004-01-09 2007-03-07 诺维信股份有限公司 地衣芽孢杆菌染色体
WO2008100251A1 (en) 2007-02-13 2008-08-21 Ls9, Inc. Modified microorganism uses therefor
US7678561B2 (en) 2006-05-09 2010-03-16 The Scripps Research Institute Robust expression of a bioactive mammalian protein in chlamydomonas chloroplast
MX2008014603A (es) 2006-05-19 2009-02-06 Ls9 Inc Produccion de acidos grasos y derivados de los mismos.
WO2010019813A2 (en) 2008-08-13 2010-02-18 Sapphire Energy, Inc. Production of fatty actds by genetically modified photosynthetic organisms
CN105647842A (zh) * 2008-12-23 2016-06-08 Reg生命科学有限责任公司 硫酯酶相关的方法和组合物
EP2655615A4 (en) * 2010-12-23 2014-04-23 Exxonmobil Res & Eng Co ACYL-ACP PROKARYOTIC THIOESTERASES FOR THE PRODUCTION OF FATTY ACIDS IN GENETICALLY MODIFIED MICROORGANISMS
AU2012316749B2 (en) * 2011-09-27 2017-06-29 Exxonmobil Research And Engineering Company Acyl-ACP wax ester synthases

Also Published As

Publication number Publication date
PT2655648T (pt) 2018-04-16
BR112013016020A2 (pt) 2017-07-11
WO2012087670A2 (en) 2012-06-28
EP2655648A2 (en) 2013-10-30
AU2011349729B2 (en) 2015-09-24
EP2655648B1 (en) 2018-01-17
ES2665516T3 (es) 2018-04-26
CN103958692B (zh) 2020-02-21
WO2012087670A3 (en) 2014-04-10
IL226779B (en) 2018-01-31
EP2655648A4 (en) 2015-06-03
US8846370B2 (en) 2014-09-30
AU2011349729A1 (en) 2013-07-04
CN103958692A (zh) 2014-07-30
US20120164713A1 (en) 2012-06-28
MX336787B (es) 2016-02-02

Similar Documents

Publication Publication Date Title
US8530207B2 (en) Photosynthetic microorganisms comprising exogenous prokaryotic acyl-ACP thioesterases and methods for producing fatty acids
EP2655648B1 (en) Genetically engineered microorganisms comprising 4-hydroxybenzoyl-coa thioesterases, methods of using the same for producing free fatty acids and fatty acid derivatives and 4-hydroxybenzoyl-coa thioesterases
US9175256B2 (en) Production of fatty acids and fatty acid derivatives by recombinant microorganisms expressing polypeptides having lipolytic activity
US9920340B2 (en) Acyl-ACP thioesterase genes and uses therefor
JP6209590B2 (ja) 脱水素酵素の発現によって脂肪酸合成を改善するための細胞系および方法
ES2678647T3 (es) Acil-ACP sintasas de éster de cera
US9096834B2 (en) Recombinant microorganisms comprising thioesterase and lysophosphatidic acid acyltransferase genes for fatty acid production
US8940508B2 (en) Enhancement of biomass production by disruption of light energy dissipation pathways
EP2814972B1 (en) Enhanced production of fatty acids and fatty acid derivatives by recombinant microorganisms
US20170267984A1 (en) Chlorophyllase overproduction to enhance photosynthetic efficiency

Legal Events

Date Code Title Description
FG Grant or registration