ES2633587T3 - Producción de ácidos grasos por expresión heteróloga de agrupamientos de genes a partir de mixobacterias - Google Patents

Producción de ácidos grasos por expresión heteróloga de agrupamientos de genes a partir de mixobacterias Download PDF

Info

Publication number
ES2633587T3
ES2633587T3 ES11721794.3T ES11721794T ES2633587T3 ES 2633587 T3 ES2633587 T3 ES 2633587T3 ES 11721794 T ES11721794 T ES 11721794T ES 2633587 T3 ES2633587 T3 ES 2633587T3
Authority
ES
Spain
Prior art keywords
seq
amino acid
acid sequence
gene
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11721794.3T
Other languages
English (en)
Inventor
Silke Wenzel
Shwan Rachid
Katja Gemperlein
Rolf Müller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universitaet des Saarlandes
Original Assignee
Universitaet des Saarlandes
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universitaet des Saarlandes filed Critical Universitaet des Saarlandes
Application granted granted Critical
Publication of ES2633587T3 publication Critical patent/ES2633587T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • C12P7/6432Eicosapentaenoic acids [EPA]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6427Polyunsaturated fatty acids [PUFA], i.e. having two or more double bonds in their backbone
    • C12P7/6434Docosahexenoic acids [DHA]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y103/00Oxidoreductases acting on the CH-CH group of donors (1.3)
    • C12Y103/01Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
    • C12Y103/01009Enoyl-[acyl-carrier-protein] reductase (NADH) (1.3.1.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/010511-Acylglycerol-3-phosphate O-acyltransferase (2.3.1.51)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Proceso de producción de ácidos grasos poliinsaturados por expresión de genes heterólogos de enzimas de la vía biosintética de ácidos grasos poliinsaturados en un organismo de producción, que comprende el cultivo del organismo de producción en presencia de una fuente de carbono fermentable, - en el que el organismo de producción se manipula genéticamente para comprender un primer gen, un segundo gen y un tercer gen, - en el que el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad de secuencia de aminoácidos de al menos el 59 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y - en el que el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoAtransacilasa que tiene una identidad de secuencia de aminoácidos de al menos el 57 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID NO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una proteína transportadora de acilos que tiene una identidad de secuencia de aminoácidos de al menos el 26 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoácidos de al menos el 47 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y - en el que el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud de cadena que tiene una identidad de secuencia de aminoácidos de al menos el 46 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoácidos de al menos el 42 % con respecto a una secuencia de aminoácidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT) caracterizado por que la aciltransferasa codificada es una acil-glicerol-fosfato aciltransferasa (AGPAT) que tiene una identidad de secuencia de aminoácidos de al menos el 50 % con respecto a una secuencia de aminoácidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID NO: 169, y secuencias de aminoácidos codificadas por una sección de secuencia de ácidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Produccion de acidos grasos por expresion heterologa de agrupamientos de genes a partir de mixobacterias
La invencion proporciona un metodo de produccion de acidos grasos poliinsaturados (AGPI) de cadena larga, preferentemente acidos grasos poliinsaturados omega-3, por expresion heterologa de agrupamientos de genes que codifican una via biosintetica de AGPI, procedentes de cepas especfficas de mixobacterias. Estos agrupamientos de genes unicos pueden clonarse e incorporate en una amplia serie de organismos que son adecuados para la produccion de AGPI en cantidades mejoradas, particularmente AGPI omega-3, por expresion heterologa.
Antecedentes tecnicos de la invencion
Los acidos grasos poliinsaturados de cadena larga, incluyendo los de la familia omega-3 que se conocen asimismo como AGPI u>-3 ("omega-3"), son acidos grasos interesantes en la naturaleza. Son importantes constituyentes de los fosfolfpidos que desempenan un papel en la disminucion de la rigidez de la membrana. El acido eicosapentaenoico (AEP) es un constituyente principal de los fosfolfpidos del cerebro humano y sirve como precursor de las prostaglandinas y resolvinas. Otro AGPI destacado de la familia omega-3 es el acido docosahexaenoico (ADH). La mejora en la funcion cognitiva y conductual en el desarrollo infantil parece estar correlacionada con altos niveles de este compuesto. Los AGPI omega-3, y en particular para ADH y AEP, han demostrado efectos beneficiosos sobre la salud p. ej., en la prevencion del cancer, artritis reumatoide, enfermedades cardiovasculares, mejora de la funcion inmunitaria, y salud ocular y cerebral (Teale, MC (ed.) 2006, "Omega-3 fatty acid research", Nova Science Publishers. Nueva York, y referencias en el mismo). Debido a estas propiedades beneficiosas, los AGPI omega-3 se estan utilizando ampliamente como lfpidos nutricionales en complementos de salud y dieteticos y como ingredientes funcionales en un amplio intervalo de alimentos. Los AGPI omega-3 comprenden actualmente uno de los segmentos de mayor y solido crecimiento del mercado en el sector de la industria de alimentos y bebidas, con un incremento esencial de la demanda en los ultimos anos. En estos dfas, el aceite de pescado es la fuente natural mas abundante y ampliamente utilizada de acidos grasos omega-3, pero la fuente designada sufre un exceso de pesca, carece de suministro de aceite de alta calidad con un contenido suficiente de ADH/AEP, y presenta problemas de calidad (olores, desaffos en la formula etc.). Procesos alternativos que implican algas y oomicetos como organismos productores se establecen o se estan desarrollando (Hinzpeter, Grasas y Aceites (2006) 57:336-342; Ward, Process Biochemistry (2005) 40:3627-3652). Dado que el suministro de aceite de pescado de alta calidad es cada vez mas limitado, se ha tratado de encontrar fuentes biologicas alternatives sostenibles. Se han explorado varios grupos de algas marinas durante mas de 20 anos y algunos productos basados en la biomasa de algas han llegado entretanto al mercado. Algunos oomicetos pertenecientes al grupo de los stramenopiles (un grupo de organismos eucariotas similares a las algas tambien conocido como "Chromophyta") tambien se notificaron ocasionalmente para producir los compuestos mencionados anteriormente (p. ej., de los generos Achyla y Pythium; (Aki, J. Ferm Bioeng. (1998) 86:504-507; Cheng, Biores. Technol. (1999) 67:101-110; Athalye, J. Agric. Food Chem. (2009) 57:2739-2744). En otros stramenopiles (p. ej., los generos Schizochytrium y Thraustochytrium; como se describe en los documentos US 7022512 y WO2007/068997) y en especies de Amphidinium dinofiagellate (documento US 2006/0099694), el ADH puede representar hasta el 48 % del contenido de acidos grasos de las celulas, que es el contenido mas elevado hasta ahora conocido en las eucariotas. No obstante, el cultivo de estos organismos a escala industrial aun supone un reto incluso despues de varios anos de desarrollo. Otras fuentes biologicas alternatives de AGPI omega-3 hasta el momento descubiertas son eubacterias procariotas [Nichols, Curr. Opin. Biotechnol. (1999) 10:240-246; Gentile, J. Appl. Microbiol. (2003) 95:1124-1133]. No obstante, la explotacion comercial de estos organismos para la produccion de AGPI a escala industrial se ve obstaculizada por las caracterfsticas de lento crecimiento de estos microorganismos psicrofilos, asf como su rendimiento y productividad inherentemente bajos. La expresion heterologa de agrupamientos de genes de AGPI omega-3 en los organismos adecuados industriales constituye una alternativa valida a la produccion de los AGPI omega-3 deseados a escala industrial, que tiene multiples ventajas en cuanto a los procesos de produccion que utilizan las cepas de tipo natural. Se ha establecido desde hace mucho tiempo que los AGPI omega-3 se biosintetizan de una manera similar a la de los metabolitos secundarios de los policetidos tanto en organismos procariotas como eucariotas (vease vista general de Metz, Science (2001) 293:290293), que permite la utilizacion de tecnicas para metodos similares como las que se han establecido en biotecnologfa microbiana a efectos de mejorar y modificar la produccion de agentes antibioticos y anticancerfgenos. Para las mixobacterias, este tipo de trabajo en relacion con la evaluacion de la biosfntesis de los metabolitos secundarios se ha descrito y se explica en revisiones recientes. (Wenzel, Curr. Opin. Biotechnol. (2005), 16:594-606; Wenzel, Curr. Opin. Drug Discov & Develop. (2009), 12 (2):220-230; Wenzel, Nat. Prod. Rep. (2009), 26 (11):1385- 1407).
La organizacion de los genes de AGPI en agrupamientos de genes permite su clonacion y transferencia a huespedes heterologos, que per se pueden ser organismos procariotas o eucariotas.
Los agrupamientos de genes que codifican las enzimas de la via sintetica para la biosfntesis de AGPI omega-3 se conocen de diversas bacterias marinas, incluyendo especies de los generos Moritella (Tanaka, Biotechnol. Lett. (1999) 21:641-646; Morita, Biochem Soc Trans 28:943-945 (2000)), Photobacterium (Allen, Microbiology (2002) 148:1903-1913), y Shewanella (Lee, J. Microbiol. Biotechnol. (2009) 19:881-887). Tales agrupamientos de genes biosintecticos de AGPI omega-3 bacterianos ya se transfirieron y se expresaron en Escherichia coli (Lee, Biotechnol.
5
10
15
20
25
30
35
40
45
50
55
60
65
Bioproc. Engin. (2006) 11:51 0-51 5; Orikasa, Biotechnol. Lett. (2006) 28:1841-1847; Orikasa, Biotechnol. Lett. (2007) 29:803-812). Ademas, la produccion heterologa de AEP se potencio mediante la sustitucion de secuencias promotoras en los agrupamientos de genes implicados en la biosfntesis (Lee, Biotechnol. Lett. (2008) 30:21392142). El agrupamiento de genes de AEP a partir de Shewanella sp. tambien se expreso en la cianobacteria marina transgenica del genera Synechococcus (Takeyama, Microbiology (1997) 143 (Pt 8):2725-2731 Orikasa, Biotechnol. Lett. (2007) 29,803-809), se observo una produccion heterologa de AEP potenciada en celulas de E. coli que co- expresan genes implicados en la biosfntesis de AEP y fragmentos de ADN exogeno incluyendo un gen de la catalasa de alto rendimiento. Los rendimientos de AEP aumentaron del 3 % al 12 % del contenido total de acidos grasos. Jiang (Methods in Enzymology (2009 ) 459,80-96) ha resumido la investigacion previa sobre la caracterizacion de los dominios de la protefna transportadora de acilos en tandem importantes en las sintasas de acidos grasos poliinsaturados, tambien represento diversos estudios que implicaban la expresion heterologa de los respectivos genes en Ecoli. Estos ejemplos muestran que es factible alcanzar la produccion heterologa de genes de AGPI omega-3 bacterianos, a pesar de que ningun producto comercial basado en tales tecnicas ha resultado hasta el momento. Hasta ahora nunca se han identificado agrupamientos de genes de AGPI omega-3 mixobacterianos y por consiguiente no se han expresado de manera heterologa. Las vfas biosinteticas de productos naturales mixobacterianos se han expresado con exito en una variedad de huespedes heterologos, incluyendo Pseudomonas putida (Gross, Chem. Biol, (2006) 13:1253-1264; Wenzel, Chem. Biol. (2005) 12 (3):349-356).
Debido a la gran importancia comercial de estos productos, existen varios ejemplos para la viabilidad de la expresion heterologa de los genes implicados en la biosfntesis de AGPI omega-3 a partir de varios organismos eucariotas y procariotas en plantas y hongos transgenicos. Como se ejemplifica por Domergue (Plant Physiol. (2003) 131, 16481660) y los genes biosinteticos de acidos grasos de la alga stramenopile, Phaeodactylum tricornutum, incluso la aclaracion de la biosfntesis de ciertas fuentes biologicas marinas que no son faciles de cultivar en el laboratorio han implicado a menudo su expresion heterologa en Saccharomyces cerevisiae u otras levaduras. Cipak (Free Radic. Biol. & Med. (2006) 40, 897-906) expreso un gen desaturasa a partir de la Hevea brasiliensis, arbol del caucho y tambien en S. cerevisiae. Tonon (2005, Plant Physiol. 138, 402-408) utilizo el mismo huesped para expresar y caracterizar una acil-coenzima A (acil-CoA) sintetasa que se descubrio de la minerfa genomica en la diatomea Thalassiosira pseudonana. Hsiao (2007, Mar. Biotechnol. 9,154-165) tambien utilizo S. cerevisiae como huesped para la expresion heterologa y la caracterizacion funcional de una delta-6 desaturasa a partir de la microalga marina Glossomastix chrysoplasta. Lee (2008, Biotechnol. Bioproc. Engin., 13, 524-532) ha demostrado con exito la actividad de la delta-9 elongasa, una enzima crucial en la biosfntesis de AGPI omega-3 a partir de stramenopile, Thraustochytrium aureum mediante la expresion heterologa en la levadura Pichia pastors. Li (Biotechnol. Lett., 31, 1011-1017) notifico una mejora en la produccion de acido araquidonico y acido eicosapentaenoico al aumentar el numero de copias de los genes que codifican la desaturasa y elongasa de acidos grasos a partir de la alga Phaeodactylum tricornutum en Pichia pastoris como huesped heterologo; no obstante, solo se alcanzaron porcentajes relativamente bajos de AGPI de 0,1 y 0,1 %, respectivamente del contenido de acidos grasos totales de Pichia pastoris. Esta ultima levadura, asf como Yarrowia lipolytica, Hansenula anomala, y otras levaduras metilotroficas y/u oleaginosas, parecen ideales para la produccion de AGPI, ya que son organismos productores industriales bien establecidos (Banlar, Appl. Microbiol. Biotechnol. (2009) 84, 47-865; Silva, J. Food, Agric & Environment. 2009, 7,268.273). Ademas, las levaduras oleaginosas, que son especialmente organismos de produccion preferentes y que son capaces de crecer en ambientes altamente lipofilos, pueden acumular grandes cantidades de lfpidos y pueden utilizar un amplio intervalo de hidrocarburos como sustratos. Otras aplicaciones de hongos semejantes a levaduras en microbiologfa y biotecnologfa industrial se han resumido por Porro (2005, Mol. Biotechnol. 31,245-259) e Idiris (2010, Appl. Microbiol. Biotechnol. 86:403-417).
Graham (Curr. Opin. Biotechnol. (2007) 18 (2), 142-147) ha resumido el estado de la tecnica en la ingenierfa metabolica de las plantas transgenicas para la biosfntesis de AGPI omega-3. Destaco, en particular, los recientes avances en el diseno racional de los cultivos de semillas oleaginosas con un contenido elevado de AGPI omega-3, pero tambien discutio varios factores que pueden ser responsables de los hasta ahora bajos rendimientos inherentes observados, que hasta el momento han impedido el desarrollo de procesos de produccion competitivos de AGPI mediante el uso de semillas oleaginosas u otras plantas de semillas. Taylor (Plant Biotechnol. J. (2009) 7, 925-938) ha identificado y clonado recientemente la 3-cetoacil-CoA sintasa de Cardamine graeca y notifico su expresion heterologa en semillas oleaginosas de Brassica, resultando en un aumento de las tasas de produccion de los AGPI, acido nervonico y notifico un aumento de 15 veces del acido nervonico en el huesped heterologo. No obstante, el acido nervonico es un AGPI omega-9, en lugar de un omega-3, y por el momento no ha alcanzado la importancia comercial de ADH y AEP. Ademas, el acido nervonico se deriva de la elongacion del acido oleico en la naturaleza.
Lee et al. (Biotech. Bioproc. Eng. (2006) 11, 510-515) describen la expresion heterologa de un agrupamiento de genes putativo de policetido sintetasa de Shewanella oneidensis MR-1 para la produccion de AEP en E. coli, el agrupamiento de genes se diferencia de la presente invencion al menos en que no comprende una acil-glicerol- fosfato aciltransferasa (AGPAT) como se describe en la presente memoria. El agrupamiento de genes se identifica solo como un fragmento de ADN de 20,195 kb obtenido por PCR larga utilizando un par de cebadores, cuyas secuencias nudeotidicas se dan, y por los tamanos del fragmento de restriccion generado por BglII y NdeI.
Orikasa et al. (Biotechnol. Lett. (2006) 28, 1841-1847) describen la sfntesis de ADH en E. coli mediante la expresion de un agrupamiento de genes a partir de Moritella marina MP-1. El agrupamiento de genes utilizado por Orikasa et
5
10
15
20
25
30
35
40
45
50
55
60
65
al., tampoco comprende una acil-glicerol-fosfato aciltransferasa (AGPAT) como se describe en la presente memoria pero en su lugar se describe otra aciltransferasa que es bastante diferente en terminos de identidad proteica (Ej. 7).
Otros documentos se refieren a la produccion de acidos grasos mediante el cultivo de productores naturales de los mismos. El documento WO 2010/063451A1 ensena en general un metodo de produccion de acidos grasos poliinsaturados mediante el cultivo de cepas especfficas mixobacterianas, pero falla, no obstante, en revelar cualquier secuencia especffica que podrfa utilizarse en la expresion heterologa. De manera similar, Garcia R et al., (J Bacteriol. abril de 2011; 193(8)1930-42) revisa el contenido intracelular de los acidos grasos en diversas cepas mixobacterianas, pero ni se refiere o desvela las secuencias genicas especfficas requeridas para la produccion de acidos grasos.
Schneiker et al. (Nature Biotechnology (2007) 25, 1281-1289) describen la secuenciacion del genoma completo de Sorangium cellulosum e identifican agrupamientos de genes de policetido sintetasa implicados en la sfntesis de compuestos antibioticos individuales. Una comparacion con el genoma de Myxococcus xanthus revelo una carencia de sintenia global.
Dickschat et al. (Org. Biomol. Chem. (2005) 3, 2824-2831) describen el analisis del perfil de los acidos grasos de Stigmatella aurantiaca utilizando GC-MS, y las etapas de sfntesis de la biosfntesis.
Hay una demanda de metodos para la produccion de AGPI, particularmente AGPI que contienen 3, 4 o mas dobles enlaces, cuyos metodos biosintetizan los AGPI de novo, en lugar de modificar, p. ej., alargar, otros acidos grasos que, a su vez, sirven como precursores.
Objeto de la invencion
Es un objeto de la invencion proporcionar un metodo para la produccion de AGPI que tiene ventajas en comparacion con los metodos de la tecnica anterior, preferentemente un proceso de produccion utilizando fermentacion de un microorganismo huesped que expresa las enzimas pertinentes de la via sintetica.
Descripcion general de la invencion
La invencion consigue el objeto por el proceso de produccion como se define en las reivindicaciones, especialmente al proporcionar las secuencias de ADN que codifican las enzimas de la vfa sintetica para la sfntesis de AGPI, un microorganismo que se manipula geneticamente para contener estas secuencias de ADN para la expresion heterologa, y un proceso de produccion de uno o mas acidos grasos poliinsaturados mediante el cultivo del microorganismo que se manipula geneticamente para contener secuencias de ADN que codifican las enzimas de la via sintetica para la sfntesis de AGPI para la expresion genica heterologa, comprendiendo el proceso preferentemente las etapas que consisten en
(i) proporcionar un organismo de produccion que comprenda un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados, siendo derivado dicho agrupamiento de genes de un organismo fuente que difiere del organismo de produccion; y que abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER;
(ii) cultivar el organismo de produccion de la etapa (i) en presencia de una fuente de carbono fermentable, tambien denominada cultivo, conforme la cual se producen uno o mas acidos grasos poliinsaturados; y
(iii) opcionalmente, recuperar uno o mas acidos grasos poliinsaturados, preferentemente aislar los acidos grasos poliinsaturados del caldo de fermentacion y/o del organismo de produccion.
Los inventores han descubierto sorprendentemente que los agrupamientos de genes biosinteticos de AGPI mixobacterianos, p. ej., derivados de Sorangium cellulosum y de Aetherobacter fasciculatus, que abarcan cada uno los genes pfa1, pfa2 y pfa3 y, por consiguiente, codifican las protefnas correspondientes Pfa1, Pfa2, y Pfa3, pueden utilizarse ventajosamente en la produccion de AGPI. El analisis de los loci biosinteticos muestra que la disposicion de los genes, asf como la organizacion de los dominios catalfticos en las protefnas biosinteticas difieren significativamente de las secuencias publicadas de los agrupamientos de genes de AGPI de diversos organismos. Para fines de la invencion, las expresiones secuencia de aminoacidos, peptido, protefna, y una seccion de uno de estos pueden utilizarse de manera intercambiable. La referenda a la funcion de una secuencia de aminoacidos codificada por una secuencia de acidos nudeicos puede incluir la referenda a la secuenaa de acidos nucleicos codificante, y ademas, la referenda a la funcion catalftica de un dominio puede tomarse como referenda a la seccion de secuencia de acidos nucleicos que codifica la seccion del peptido que tiene la funaon catalftica, cuya secaon de secuenca de acidos nucleicos tambien puede denominarse dominio de acidos nucleicos. Las secuencias y secciones de las mismas que se refieren como un dominio pueden incluir uno o mas centros catalfticos o dominios catalfticos, que p. ej., se designan de acuerdo con su funaon catalftica. Las identidades y similitudes de secuencia son preferentemente como se determina por el algoritmo ClustalW o Geneious que se describe en la presente memoria. Debido a la universalidad del codigo genetico, una secuenaa de acidos nucleicos que codifica un dominio se determina por la secuencia de aminoacidos del dominio, en la que preferentemente la secuencia de acidos nucleicos tiene un uso de codones o un sesgo de codones del microorganismo huesped que se manipula
5
10
15
20
25
30
35
40
45
50
55
60
65
geneticamente para contener genes heterologos que codifican el agrupamiento de genes de la enzima sintetica de AGPI, p. ej., una secuencia de acidos nucleicos que codifica el agrupamiento de genes y que tiene el uso del codon del microorganismo huesped.
En general, preferentemente el gen pfa 1 contiene un dominio I que comprende una secuencia de nucleotidos que codifica una enoil reductasa (ER), el gen pfa2 contiene un dominio Ila que comprende una secuencia de nucleotidos que codifica un dominio de cetosintasa (CS) y que codifica un dominio de malonil-CoA-transacilasa (MAT), un dominio lib que comprende una secuencia de nucleotidos que codifica al menos uno, preferentemente tres, cuatro o cinco dominios de la protefna transportadora de acilos (PPA), y un dominio iic que comprende una secuencia de nucleotidos que codifica un dominio de cetorreductasa (CR) y que codifica un dominio de deshidratasa (DH), y el gen pfa3 contiene un dominio Ilia que comprende una secuencia de nucleotidos que codifica un dominio de cetosintasa (CS) y que codifica un dominio del factor de longitud de cadena (FLC), un dominio IIIb que comprende una secuencia de nucleotidos que codifica uno, preferentemente dos dominios de deshidratasa (DH), y contiene un dominio IV* que comprende una secuencia de nucleotidos que codifica una acil-glicerol-fosfato aciltransferasa (AGPAT), en la que preferentemente los dominios se disponen de 5 a 3 en los respectivos genes. En el agrupamiento de genes sinteticos de Aetherobacter, entre la region IlIa y la region IIIb, se ha descubierto un dominio IV que codifica una acil transferasa. Por consiguiente, un dominio IV opcional que comprende una secuencia de nucleotidos que codifica un dominio de aciltransferasa (AT) se dispone en el gen pfa3 gen entre el dominio IlIa y el dominio IIIb, especialmente para la produccion de AEP y/o ADH. La acil-glicerol-fosfato aciltransferasa (AGPAT) codificada por el agrupamientos de genes, p. ej., por el dominio IV*, contenida preferentemente en pfa3, es una realizacion especffica de una aciltransferasa (AT).
Generalmente, el dominio I codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 12 o 13, SEQ ID NO: 43 o 44, SEQ ID NO: 74 o 75, SEQ ID NO: 108 o 109, SEQ ID NO: 132 o 133 y/o SEQ ID NO: 148 o 149;
el dominio Ila codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 15 o 16, SEQ ID NO: 46 o 47, SEQ ID NO: 77 o 78, SEQ ID NO: 111 o 112 y/o SEQ ID NO: 151 o 152;
el dominio lIb codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 18 o 19, SEQ ID NO: 49 o 50, SEQ ID NO: 80 o 81, SEQ ID NO: 114 o 115 y/o SEQ ID NO: 154 o 155;
el dominio IIc codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 21 o 22, SEQ ID NO: 52 o 53, SEQ ID NO: 83 o 84, SEQ ID NO: 117 o 118 y/o SEQ ID NO: 157 o 158;
el dominio IlIa codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 24 o 25, SEQ ID NO: 55 o 56, SEQ ID NO: 86 o 87, SEQ ID NO: 120 o 121 y/o SEQ ID NO: 160 o 161;
el dominio IIIb codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 27 o 28, SEQ ID NO: 58 o 59, SEQ ID NO: 89 o 90, SEQ ID NO: 123 o 124 y/o SEQ ID NO: 163 o 164.
El dominio IV opcional codifica una secuencia de aminoacidos que tiene una identidad de al menos el 85 % con respecto a una de SEQ ID NO: 92 o 93, SEQ ID NO: 126 o 127 y/o SEQ ID NO: 166 o 167.
Concretamente, la invencion proporciona un proceso de produccion de acidos grasos poliinsaturados mediante la expresion genica heterologa de las enzimas de la via biosintetica de acidos grasos poliinsaturados en un organismo de produccion, que comprende el cultivo del organismo de produccion en presencia de una fuente de carbono fermentable,
- en el que el organismo de produccion se manipula geneticamente para comprender un primer gen, un segundo gen y un tercer gen,
- en el que el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad de
secuencia de aminoacidos de al menos el 59 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y
- en el que el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoA-
transacilasa que tiene una identidad de secuencia de aminoacidos de al menos el 57 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID NO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una protefna transportadora de acilos que tiene una identidad de secuencia de aminoacidos de al menos el 26 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 47 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y
- en el que el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud de
cadena que tiene una identidad de secuencia de aminoacidos de al menos el 46 % con respecto a una
5
10
15
20
25
30
35
40
45
50
55
60
65
secuencia de aminoacidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 42 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT) caracterizado por que la aciltransferasa codificada es una acil-glicerol-fosfato aciltransferasa (AGPAt) que tiene una identidad de secuencia de aminoacidos de al menos el 50 % con respecto a una secuencia de aminoacidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID nO: 169, y secuencias de aminoacidos codificadas por una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
Preferentemente, cada uno de los genes, regiones y/o dominios codifica una secuencia de aminoacidos que tiene una identidad de al menos 60 %, al menos 85 %, al menos 90 %, y preferentemente al menos 95 % o al menos 98 % respecto a una o mas de las secuencias de aminoacidos para cada dominio como se da en la presente memoria, o como se codifica por una secuencia de acidos nucleicos para cada dominio como se da en la presente memoria.
Preferentemente, el dominio IV* codifica una secuencia de aminoacidos que tiene una identidad de secuencia de al menos el 50 %, 75 % o al menos el 84 %, mas preferentemente de al menos 90 %, 95 % o al menos 97 % o 98 % con respecto a una de las secuencias de aminoacidos dada para el dominio IV*, p. ej., a una secuencia de aminoacidos del dominio IV* contenida en el grupo que comprende o consiste en SEQ ID NO: 30, SEQ ID NO: 61 y/o una secuencia de aminoacidos del dominio IV* contenida en el grupo que comprende o consiste en SEQ ID NO: 95, SEQ ID NO: 129 o 130, SEQ ID NO: 135 y/o SEQ ID NO: 169, o como se codifica por una seccion de secuencia de acidos nucleicos que codifica un dominio IV*, p. ej., una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende o consiste en SEQ ID NO: 29, SEQ ID NO: 60 y/o en el grupo que comprende o consiste en SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
Ademas, el dominio IV* se contiene preferentemente en una secuencia de acidos nucleicos que codifica el producto genico Pfa3, preferentemente que codifica Pfa3 que tiene una identidad de secuencia de aminoacidos de al menos el 28 %, 30 %, al menos 32,5 %, o al menos 35 %, preferentemente al menos 40 %, al menos 42,5 %, al menos 54 %, mas preferente al menos 84 %, 90 % o 95 % con respecto a una de las secuencias de aminoacidos contenida en el grupo que comprende o consiste en SEQ ID NO: 10 y/o SEQ ID NO: 41 y/o en el grupo que comprende o consiste en SEQ ID NO: 72, SEQ ID NO: 106 y/o SEQ ID NO: 146.
Breve descripcion de los dibujos
La Figura 1 muestra una comparacion esquematica de agrupamientos de genes que codifican las vfas biosinteticas de acidos grasos poliinsaturados. Los organismos fuente se mencionan a la izquierda. Las abreviaturas (codigos proteicos) tienen los siguientes significados: ER = enoil reductasa; CS = beta-cetoacil sintasa; MAT = malonil-CoA- transacilasa; CR = cetorreductasa; DH = deshidratasa; FLC = factor de longitud de cadena; AT = aciltransferasa; PPA = protefna transportadora de acilos; AGPAT = acil-glicerol-fosfato aciltransferasa.
La Figura 2 muestra una construccion de acido nucleico para la expresion heterologa del agrupamiento de genes biosinteticos de AGPI a partir de Sorangium cellulosum So ce56 en otra mixobacteria p. ej., Myxococcus xanthus DK1622. Los genes biosinteticos de AGPI (pfa1, pfa2 y pfa3) estan bajo el control del promotor Ptet, la construccion se integra al azar en el cromosoma del huesped a traves de la transferencia del agrupamientos de genes mediada por transposones, transposasa: gen que codifica la transposasa, RI: repeticion invertida, ampR: gen de resistencia a ampicilina, BsdR: gen de resistencia a blasticidina, neoR: gen de resistencia a kanamicina, regulador tet: gen que codifica el represor del promotor Ptet, Ptet: promotor inducible de tetraciclina, oriT: origen de transferencia.
La Figura 3A muestra un cromatograma de cromatograffa de gases (CG) de extractos de acidos grasos celulares de S. cellulosum So ce56 de tipo de natural,
La Figura 3B muestra un cromatograma de cromatograffa de gases (CG) de extractos de acidos grasos celulares de M. xanthus::p15A-AGPI que alberga la construccion de expresion mostrada en la Figura 2,
La Figura 3C muestra un cromatograma de cromatograffa de gases (CG) de extractos de acidos grasos celulares de M. xanthus DK1622 de tipo natural.
La Figura 4 muestra una construccion de acidos nucleicos para la expresion heterologa del agrupamiento de genes biosinsteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 en otra mixobacteria p. ej., Myxococcus xanthus DK1622. Los genes biosinteticos de AGPI (pfa1, pfa2 y pfa3) estan bajo el control del promotor Ptet, la construccion se integra en el cromosoma del huesped a traves de sitios MX9 attB. mx9: gen que codifica la MX9 integrasa y que contiene el sitio de union del fago MX9 (attP), zeoR: gen de resistencia a zeocina, ampR: gen de resistencia a ampicilina, p15A ori: origen de replicacion de p15A neoR: gen de resistencia a kanamicina, Ptet: promotor inducible de tetraciclina.
La Figura 5 muestra un analisis por CG de los extractos de acidos grasos celulares de M. xanthus DK1622 de tipo
natural (A) y de extractos de acidos grasos celulares de M. xanthus::pPfaAf-Ptet-mx9.2 que alberga el agrupamiento de genes que contiene pfa1, pfa2 y pfa3 de la SEQ ID NO 63 (B). Los lfpidos celulares se hidrolizaron y los acidos grasos se derivatizaron para que pudiesen ser analizados por GC-MS. Se muestran derivados de los siguientes acidos grasos: acido hexadecanoico (16:0;1), acido iso-heptadienoico (iso-17:2u>5, 11; 2)acido heptadecenoico 5 (17:1u>7; 3), acido iso-heptadecenoico (iso-17:1u>5; 4), acido iso-heptadecanoico (iso-17:0; 5), acido iso-3-hidroxi-
pentadecanoico (iso-3-OH-15:0; 6), acido hexadecenoico (16:to7; 7), acido hidroxi -hexadecanoico (2-OH-16:0, 3- OH-16:0; 8), acido hidroxi-heptadecanoico (2-OH-17:0, 3-Oh-17:0; 9), acido eicosapentaenoico (20:5u>3, 6, 9, 12, 15; 10), acido iso-pentadecanoico (iso-15:0; 11), y acido docosahexaenoico (22:6 u>3, 6, 9, 12, 15 , 18; 12).
10 La Figura 6 muestra un arbol del metodo de Neighbour-Joining generado a partir de NCBI-BLASTn que muestra las afinidades de las secuencias de ADNr 16S de Aetherobacter fasciculatus.
La Figura 7 muestra un arbol del metodo de Neighbour-Joining basado en una secuencia del gen de ADNr 16S mixobacteriano, y que muestra la posicion filogenetica de AEP y ADH que producen cepas de Sorangium 15 cellulosum.
Breve descripcion del listado de secuencias
Sorangium cellulosum (Soce56)
Secuencia de ADN que codifica todo el agrupamiento implicado en la biosmtesis de AGPI: SEQ ID NO: 1;
nt (nucleotidos) 1..1.650 de SEQ ID NO: 1 son codones (CDs) de pfa1 que codifica la protema: SEQ ID NO: 2
nt 1.677..9.389 de SEQ ID NO: 1 son CDS de pfa2 que codifica la protema: SEQ ID NO: 3
nt 9.386..17.176 de SEQ ID NO: 1 son CDS de pfa3 que codifica la protema: SEQ ID NO: 4
Secuencia de ADN que codifica pfa1: SEQ ID NO: 5
CDS de pfa1 que codifica la protema de SEQ ID NO: 6
Secuencia de ADN que codifica pfa2: SEQ ID NO: 7
CDS de pfa2 que codifica la protema de SEQ ID NO: 8
Secuencia de ADN que codifica pfa3 SEQ ID NO: 9
CDS de pfa3 que codifica la protema de SEQ ID NO: 10
Secuencia de ADN que codifica el dominio I: SEQ ID NO: 11
CDS de I que codifica la protema de SEQ ID NO: 12
Protema del dominio I: SEQ ID NO: 13
Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 14
CDS de IIa que codifica la protema de SEQ ID NO: 15
Proteina del dominio IIa: SEQ ID NO: 16
Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 17
CDS de IIb que codifica la protema de SEQ ID NO: 18
Protema del dominio de IIb: SEQ ID NO: 19
Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 20
CDS de IIc que codifica la protema de SEQ ID NO: 21
Protema del dominio de IIc: SEQ ID NO: 22
Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 23
CDS de IIIa que codifica la protema de SEQ ID NO: 24
Protema del dominio de IIIa: SEQ ID NO: 25
Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 26
CDS de IIIb que codifica la protema de SEQ ID NO: 27
Protema del dominio de IIIb: SEQ ID NO: 28
Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 29
CDS de IV* que codifica la proteina de SEQ ID NO: 30
Protema del dominio de IV*: SEQ ID NO: 31
20
Sorangium cellulosum Soce 377
Secuencia de ADN que codifica todo el agrupamiento implicado en la biosmtesis de AGPI: SEQ ID NO: 32
nt 1..1.650 de SEQ ID NO: 32 son CDS de pfa1 que codifica la protema: SEQ ID NO: 33
nt 1.677..9.380 de SEQ ID NO: 32 son CDS de pfa2 que codifica la protema: SEQ ID NO: 34
nt 9.377..17.221 de SEQ ID NO: 32 son CDS de pfa3 que codifica la proteina: SEQ ID NO: 35
Secuencia de ADN que codifica pfa1: SEQ ID NO: 36
CDS de pfa1 que codifica la protema de SEQ ID NO: 37
Secuencia de ADN que codifica pfa2: SEQ ID NO: 38
CDS de pfa2 que codifica la protema de SEQ ID NO: 39
Secuencia de ADN que codifica pfa3 de SEQ ID NO: 40
CDS de pfa3 que codifica la protema de SEQ ID NO: 41
Secuencia de ADN que codifica el dominio I: SEQ ID
CDS de I que codifica la protema de SEQ ID NO: 43
Sorangium cellulosum Soce 377
NO: 42
Protefna del dominio I: SEQ ID NO: 44
Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 45
CDS de IIa que codifica la protefna de SEQ ID NO: 46
Protefna del dominio IIa: SEQ ID NO: 47
Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 48
CDS de IIb que codifica la protefna de SEQ ID NO: 49
Protefna del dominio de IIb: SEQ ID NO: 50
Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 51
CDS de IIc que codifica la protefna de SEQ ID NO: 52
Protefna del dominio de IIc: SEQ ID NO: 53
Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 54
CDS de IIIa que codifica la protefna de SEQ ID NO: 55
Protefna del dominio de IIIa: SEQ ID NO: 56
Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 57
CDS de IIIb que codifica la protefna de SEQ ID NO: 58
Protefna del dominio de IIIb: SEQ ID NO: 59
Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 60
CDS de IV* que codifica la protefna de SEQ ID NO: 61
Protefna del dominio de IV*: SEQ ID NO: 62
Aetherobacter fasciculatus SBSr002
Secuencia de ADN que codifica todo el agrupamiento implicado en la biosfntesis de AGPI: SEQ ID NO: 63
nt 1..1.608 de SEQ ID NO: 63 son codones (CDS) de pfa1 que codifica la protefna: SEQ ID NO: 64
nt 1.644..8.312 de SEQ ID NO: 63 son CDS de pfa2 que codifica la protefna: SEQ ID NO: 65
nt 8.309..16.219 de SEQ ID NO: 63 son CDS de pfa3 que codifica la protefna: SEQ ID NO: 66
Secuencia de ADN que codifica pfal: SEQ ID NO: 67
CDS de pfa1 que codifica la protefna de SEQ ID NO: 68
Secuencia de ADN que codifica pfa2: SEQ ID NO: 69
CDS de pfa2 que codifica la protefna de SEQ ID NO: 70
Secuencia de ADN que codifica pfa3 de SEQ ID NO: 71
CDS de pfa3 que codifica la protefna de SEQ ID NO: 72
Secuencia de ADN que codifica el dominio I: SEQ ID NO: 73
CDS de I que codifica la protefna de SEQ ID NO: 74
Protefna del dominio I: SEQ ID NO: 75
Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 76
CDS de IIa que codifica la protefna de SEQ ID NO: 77
Protefna del dominio IIa: SEQ ID NO: 78
Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 79
CDS de IIb que codifica la protefna de SEQ ID NO: 80
Protefna del dominio de IIb: SEQ ID NO: 81
Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 82
CDS de IIc que codifica la protefna de SEQ ID NO: 83
Protefna del dominio de IIc: SEQ ID NO: 84
Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 85
CDS de IIIa que codifica la protefna de SEQ ID NO: 86
Protefna del dominio IIIa: SEQ ID NO: 87
Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 88
CDS de IIIb que codifica la protefna de SEQ ID NO: 89
Protefna del dominio IIIb: SEQ ID NO: 90
Secuencia de ADN que codifica el dominio IV: SEQ ID NO: 91
CDS de IV que codifica la protefna de SEQ ID NO: 92
Protefna del dominio IV: SEQ ID NO: 93
Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 94
CDS de IV* que codifica la protefna de SEQ ID NO: 95
Protefna del dominio de IV*: SEQ ID NO: 96
Aetherobacter sp. SBSr008
Secuencia de ADN que codifica todo el agrupamiento implicado en la biosfntesis de AGPI: SEQ ID NO: 97
nt 1..1.608 de SEQ ID NO: 97 son CDS de pfa1 que codifica la protefna: SEQ ID NO: 98
nt 1.644..8.342 de SEQ ID NO: 97 son CDS de pfa2 que codifica la protefna: SEQ ID NO: 99
nt 18.339..16.243 de SEQ ID NO: 97 son CDS de pfa3
Aetherobacter sp. SBSr008
que codifica la protefna: SEQ ID NO: 100
Secuencia de ADN que codifica pfal: SEQ ID NO: 101
CDS de pfa1 que codifica la protefna de SEQ ID NO: 102
Secuencia de ADN que codifica pfa2: SEQ ID NO: 103
CDS de pfa2 que codifica la protefna de SEQ ID NO: 104
Secuencia de ADN que codifica pfa3 de SEQ ID NO: 105
CDS de pfa3 que codifica la protefna de SEQ ID NO: 106
Secuencia de ADN que codifica el dominio I: SEQ ID NO: 107
CDS de I que codifica la protefna de SEQ ID NO: 108
Protefna del dominio I: SEQ ID NO: 109
Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 110
CDS de IIa que codifica la proteina de SEQ ID NO: 111
Protefna del dominio IIa: SEQ ID NO: 112
Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 113
CDS de IIb que codifica la protefna de SEQ ID NO: 114
Proteina del dominio IIb: SEQ ID NO: 115
Secuencia de ADN que codifica el dominio IIc: SEQ ID NO: 116
CDS de IIc que codifica la protefna de SEQ ID NO: 117
Protefna del dominio IIc: SEQ ID NO: 118
Secuencia de ADN que codifica el dominio IIIa: SEQ ID NO: 119
CDS de IIIa que codifica la protefna de SEQ ID NO: 120
Protefna del dominio IIIa: SEQ ID NO: 121
Secuencia de ADN que codifica el dominio IIIb: SEQ ID NO: 122
CDS de IIIb que codifica la protefna de SEQ ID NO: 123
Protefna del dominio IIIb: SEQ ID NO: 124
Secuencia de ADN que codifica el dominio IV: SEQ ID NO: 125
CDS de IV que codifica la protefna de SEQ ID NO: 126
Protefna del dominio IV: SEQ ID NO: 127
Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 128
CDS de IV* que codifica la protefna de SEQ ID NO: 129
Protefna del dominio IV*: SEQ ID NO: 130
Aetherobacter rufus SBSr003
Secuencia de ADN que codifica el dominio I: SEQ ID NO: 131
CDS de I que codifica la proteina de SEQ ID NO: 132
Protefna del dominio I: SEQ ID NO: 133
Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 134
CDS de IV* que codifica la protefna de SEQ ID NO: 135
Proteina del dominio IV*: SEQ ID NO: 136
Minicystis rosea SBNa008
Secuencia de ADN que codifica todo el agrupamiento implicado en la biosfntesis de AGPI: SEQ ID NO: 137
nt 1..1.632 de SEQ ID NO: 137 son CDS de pfa1 que codifica la protefna: SEQ ID NO: 138
nt 1.659..8.327 de SEQ ID NO: 137 son CDS de pfa2 que codifica la protefna: SEQ ID NO: 139
nt 18.324..17.191 de SEQ ID NO: 137 son CDS de pfa3 que codifica la protefna: SEQ ID NO: 140
Secuencia de ADN que codifica pfa1: SEQ ID NO: 141
CDS de pfa1 que codifica la protefna de SEQ ID NO: 142
Secuencia de ADN que codifica pfa2: SEQ ID NO: 143
CDS de pfa2 que codifica la protefna de SEQ ID NO: 144
Secuencia de ADN que codifica pfa3 de SEQ ID NO: 145
CDS de pfa3 que codifica la proteina de SEQ ID NO: 146
Secuencia de ADN que codifica el dominio I: SEQ ID NO: 147
CDS de I que codifica la protefna de SEQ ID NO: 148
Protefna del dominio I: SEQ ID NO: 149
Secuencia de ADN que codifica el dominio IIa: SEQ ID NO: 150
CDS de IIa que codifica la proteina de SEQ ID NO: 151
Protefna del dominio IIa: SEQ ID NO: 152
Secuencia de ADN que codifica el dominio IIb: SEQ ID NO: 153
CDS de IIb que codifica la protefna de SEQ ID NO: 154
Protefna del dominio IIb: SEQ ID NO: 155
Secuencia de ADN que codifica el dominio IIc: SEQ ID
CDS de IIc que codifica la protefna de SEQ ID NO: 157
5
10
15
20
25
30
35
40
45
50
Minicystis rosea SBNa008
NO: 156
Protefna del dominio Ilc: SEQ ID NO: 158
Secuencia de ADN que codifica el dominio llla: SEQ ID NO: 159
CDS de llla que codifica la protefna de SEQ ID NO: 160
Protefna del dominio llla: SEQ ID NO: 161
Secuencia de ADN que codifica el dominio lllb: SEQ ID NO: 162
CDS de lllb que codifica la protefna de SEQ ID NO: 163
Protefna del dominio lllb: SEQ ID NO: 164
Secuencia de ADN que codifica el dominio IV: SEQ ID NO: 165
CDS de IV que codifica la protefna de SEQ ID NO: 166
Protefna del dominio IV: SEQ ID NO: 167
Secuencia de ADN que codifica el dominio IV*: SEQ ID NO: 168
CDS de IV* que codifica la protefna de SEQ ID NO: 169
Protefna del dominio IV*: SEQ ID NO: 170
SEQ ID NO: 1 es la secuencia de ADN de todo el agrupamiento de genes pfa de Sorangium cellulosum Soce56 que comprende 17.176 pb. El gen pfa1 se ubica desde la posicion 1 a la posicion 1.650, el gen pfa2 se ubica desde la posicion 1.677 a la posicion 9.389, y el gen pfa3 se ubica desde la posicion 9.386 a la posicion 17.176 y se solapa con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 2 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa1, SEQ ID NO: 3 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa2, SEQ ID NO: 4 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 5 con la secuencia de aminoacidos codificada como SEQ ID NO: 6. El gen pfa2 se muestra por separado como SEQ ID NO: 7 con la secuencia de aminoacidos codificada como SEQ ID NO: 8. El gen pfa3 se muestra por separado como SEQ ID NO: 9 con la secuencia de aminoacidos codificada como SEQ ID NO: 10.
SEQ ID NO: 32 es la secuencia de ADN de Sorangium cellulosum Soce377 que comprende 17.221 pb, en la que el gen pfa1 se ubica desde la posicion 1 a la posicion 1.650, el gen pfa2 se ubica desde la posicion 1.677 a la posicion 9.380, y el gen pfa3 se ubica desde la posicion 9.377 a la posicion 17.221 y se solapa con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 33 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa1, SEQ ID NO: 34 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa2, SEQ ID NO: 35 es la secuencia de protefnas de SEQ ID NO: 1 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 36 con la secuencia de aminoacidos codificada como SEQ ID NO: 37. El gen pfa2 se muestra por separado como SEQ ID NO: 38 con la secuencia de aminoacidos codificada como SEQ ID NO: 39. El gen pfa3 se muestra por separado como SEQ ID NO: 40 con la secuencia de aminoacidos codificada como SEQ ID NO: 41.
SEQ ID NO: 63 es la secuencia de ADN de todo el agrupamiento de genes pfa (16.219 pb) procedente de Aetherobacter fasciculatus SBSr002 (DSM 21835). El gen pfa1 se ubica desde la posicion 1 a la posicion 1.608, el gen pfa2 se ubica desde la posicion 1.644 a la posicion 8.312, y el gen pfa3 se ubica desde la posicion 8.309 a la posicion 16.219, superpuesto con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 64 es la secuencia de protefnas de SEQ ID NO: 63 codificada por el gen pfa1, SEQ ID NO: 65 es la secuencia de protefnas de SEQ ID NO: 63 codificada por el gen pfa2, SEQ ID NO: 66 es la secuencia de protefnas de SEQ ID NO: 63 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 67 con la secuencia de aminoacidos codificada como SEQ ID NO: 68. El gen pfa2 se muestra por separado como SEQ ID NO: 69 con la secuencia de aminoacidos codificada como SEQ ID NO: 70. El gen pfa3 se muestra por separado como SEQ ID NO: 71 con la secuencia de aminoacidos codificada como SEQ ID NO: 72.
SEQ ID NO: 97 es la secuencia de ADN de todo el agrupamiento de genes pfa (16.243 pb) procedente de Aetherobacter SBSr008. El gen pfa1 gen se ubica desde la posicion 1 a la posicion 1.608, el gen pfa2 se ubica desde la posicion 1.644 a la posicion 8.342, y el gen pfa3 se ubica desde la posicion 8.339 a la posicion 16.243, superpuesto con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se muestran. SEQ ID NO: 98 es la secuencia de protefnas de SEQ ID NO: 97 codificada por el gen pfa1, SEQ ID NO: 99 es la secuencia de protefnas de SEQ ID NO: 97 codificada por el gen pfa2, SEQ iD NO: 100 es la secuencia de protefnas de SEQ ID NO: 97 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 101 con la secuencia codificada de aminoacidos como SEQ ID NO: 102. El gen pfa2 se muestra por separado como SEQ ID NO: 103 con la secuencia de aminoacidos codificada como SEQ ID NO: 104. El gen pfa3 se muestra por separado como SEQ ID NO: 105 con la secuencia de aminoacidos codificada como SEQ ID NO: 106.
SEQ ID NO: 137 es la secuencia de ADN de todo el agrupamiento de genes pfa (17.191 pb) procedente de Aetherobacter SBNa008. El gen pfa1 se ubica desde la posicion 1 a la posicion 1.632, el gen pfa2 se ubica desde la posicion 1.659 a la posicion 8.327, y el gen pfa3 se ubica desde la posicion 8.324 a la posicion 17.191, superpuesto con pfa2. Las secuencias de protefnas codificadas por los genes pfa1, pfa2 y pfa3, respectivamente, tambien se
5
10
15
20
25
30
35
40
45
50
55
60
65
muestran. SEQ ID NO: 138 es la secuencia de protefnas de SEQ ID NO: 137 codificada por el gen pfal, SEQ ID NO:
139 es la secuencia de protefnas de SEQ ID NO: 137 codificada por el gen pfa2, SEQ ID NO: 140 es la secuencia de protefnas de SEQ ID NO: 137 codificada por el gen pfa3. El gen pfa1 se muestra por separado como SEQ ID NO: 141 con la secuencia codificada de aminoacidos como SEQ ID NO: 142. El gen pfa2 se muestra por separado como SEQ ID NO: 143 con la secuencia de aminoacidos codificada como SEQ ID NO: 144. El gen pfa3 se muestra por separado como SEQ ID NO: 145 con la secuencia de aminoacidos codificada como SEQ ID NO: 146.
Para Aetherobacter SBSr003, se dan las siguientes regiones del agrupamiento implicado en la sfntesis de AGPI: gen I como SEQ ID NO: 131 con la protefna codificada como SEQ ID nO: 132 y por separado como SEQ ID NO: 133, dominio IV* como SEQ ID NO: 134 con la protefna codificada como SEQ ID NO: 135 y por separado como SEQ ID NO: 136. Como SBSr003 se deposita bajo el Tratado de Budapest como DSM 23122 (DsMZ, Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH, Inhoffenstr. 7b, 38124 Braunschweig, Alemania, el 7 de octubre de 2007), el agrupamiento de genes sinteticos de AGPI de esta bacteria se abarca para los fines de la invencion. Este agrupamiento de genes contiene las secuencias codificantes dadas para SBSr003, y preferentemente se extiende desde su gen I a su dominio IV*. Preferentemente, este agrupamiento de genes de DSM 23122 codifica una secuencia de aminoacidos que tiene al menos una identidad de 60 %, al menos 85 %, al menos 90 %, y preferentemente al menos 95 % o al menos 98 % con respecto a una o mas de las secuencias de aminoacidos de los genes sinteticos de AGPI de Aetherobacter, especialmente con respecto a la secuencia de aminoacidos codificada por SEQ ID NO: 63 (secuencias de aminoacidos SEQ ID NO: 64 y 68, SEQ ID NO: 65 y 70, e incluyendo la SEQ ID NO: 64 y 72 ), por SEQ ID NO: 97 (secuencias de aminoacidos SEQ ID NO: 98 y 102, SEQ ID NO: 99 y 104, e incluyendo la SEQ ID NO: 100 y 106) y/o con respecto a la secuencia de aminoacidos codificada por la SEQ ID NO: 137 (secuencias de aminoacidos SeQ ID NO: 138 y 142, SEQ ID NO: 139 y 144, e incluyendo la SEQ ID NO:
140 y 146).
Descripcion detallada
Los inventores han identificado agrupamientos de genes biosinteticos de AGPI mixobacterianos a partir de la cepa de Sorangium cellulosum 56 (Soce56) y la cepa 377 (Soce377), asf como de Aetherobacter fasciculatus SBSr002 DSM 21835, Aetherobacter sp. SBSr008, Mnicystis rosea SBNa008, y en parte de Aetherobacter rufus SBSr003. El analisis de los loci biosinteticos de estos organismos fuente muestra que la disposicion de los genes, asf como la organizacion de los dominios catalfticos en las protefnas biosinteticas son altamente homologas pero difieren significativamente de las secuencias publicadas de los agrupamientos de genes de AGPI a partir de varios organismos (vease la Figura 1).
Un primer aspecto de la invencion se refiere a un proceso de produccion de uno o mas acidos grasos poliinsaturados por medio de la expresion genica heterologa, comprendiendo el proceso las etapas que consisten en:
(i) proporcionar un organismo de produccion que comprenda un agrupamiento de genes que codifica una vfa biosintetica de acidos grasos poliinsaturados, siendo derivado dicho agrupamiento de genes de un organismo fuente que difiere del organismo de produccion; y que abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER;
(ii) cultivar el organismo de produccion de la etapa (i) en presencia de una fuente de carbono fermentable, conforme la cual se producen uno o mas acidos grasos poliinsaturados; y
(iii) opcionalmente, recuperar uno o mas acidos grasos poliinsaturados.
El proceso de acuerdo con la invencion es util para la produccion de acidos grasos poliinsaturados (AGPI). La expresion "acido graso poliinsaturado" se utiliza en la presente memoria en el sentido generalmente conocido por el experto. Preferentemente, los acidos grasos poliinsaturados son acidos monocarboxflicos que comprenden de 12 a 30 atomos de carbono, mas preferentemente 18 a 24 atomos de carbono, particularmente de manera preferente 20 o 22 atomos de carbono. Preferentemente, la expresion "acido graso poliinsaturado" se refiere a una cadena hidrocarbonada larga compuesta de 18 o mas atomos de carbono que tienen al menos 2, preferentemente al menos 3 o al menos 4 dobles enlaces y un grupo carboxilato terminal. Preferentemente, los acidos grasos poliinsaturados comprenden al menos 2, mas preferentemente al menos 3, aun mas preferentemente al menos 4, al menos 5 o al menos 6 grupos etilenicamente insaturados (dobles enlaces C=C), que preferentemente no estan conjugados entre sf. Para los fines de la invencion, la expresion "acido graso poliinsaturado" tambien abarca derivados de acidos carboxflicos poliinsaturados tales como los derivados hidroxi y/o las sales. Como se conoce en el campo, un acido graso se puede esterificar para formar trigliceridos y/o fosfolfpidos, asf como esfingolfpidos. De este modo, en una realizacion, la presente invencion tambien se refiere a tales productos esterificados. Ademas, el producto de acidos grasos de la presente invencion puede ser libre de acidos grasos. Los acidos grasos libres tienen un grupo carboxilo libre, no estan conectados qufmicamente a cualquier otro compuesto incluyendo triacilgliceridos, fosfolfpidos o esfingolfpidos, y pueden estar presentes libremente en cualquier compartimiento de la celula.
En una realizacion preferente, al menos 1, mas preferentemente al menos 2, aun mas preferentemente al menos 3 y lo mas preferentemente todos los grupos etilenicamente insaturados tienen una configuracion cis [(Z)-configuracion].
5
10
15
20
25
30
35
40
45
50
55
60
65
Los acidos grasos poliinsaturados tfpicos son acido oleico, acido linoleico, acido alfa-linolenico, acido gamma- linolenico, acido dihomo-gamma-linolenico, acido araquidonico, acido 5,8,11,14,17-eicosapentaenoico (AEP), acido docosatetraenoico, acido estearidonico, acido eicosatetraenoico (ETE), acido 7,10,13,16,19-docosapentaenoico y acido 4,7,10,13,16,19-docosahexaeonico (ADH). Los acidos grasos poliinsaturados preferentes se seleccionan entre el grupo que consiste en (18:3), (18:4), (18:5), (20:3), (20:4), (20:5), (22:3), (22:4), (22:5), y (22:6).
En una realizacion particularmente preferente, los acidos grasos poliinsaturados son acidos grasos poliinsaturados u>-3. Los acidos grasos poliinsaturados preferentes se seleccionan entre el grupo que consiste en (18:3 -3^(18:4u>- 3), (18:5u>-3), (20:3u>-3), (20:4u>-3), (20:5u>-3), (22:3u>-3), (22:4u>-3), (22:5u>-3), y (22:6u>-3). Ejemplos preferentes de acidos grasos poliinsaturados u>-3 incluyen acido a -linolenico (18:3 AAL), acido eicosa-cis-5,8,11,14,17-pentaenoico (20:5 u>-3 AEP) y acido docosa-cis-4,7,10,13,16,19-hexaenoico (22:6 u>-3 ADH). En una realizacion preferente adicional, los acidos grasos insaturados omega-3 se seleccionan entre acido eicosapentaenoico (AEP), acido docosahexaenoico (ADH) y mezclas de los mismos. Estos compuestos tambien se conocen con sus nombres triviales acido timnodonico para AEP y acido cervonico para ADH, respectivamente.
En una realizacion particularmente preferente, uno o mas acidos grasos poliinsaturados se seleccionan entre el grupo que consiste en acido hexadecadienoico (16:2), acido hexadecenoico (16:1), acido hexadecanoico (16:0), acido heptadecenoico (17:1u>7), acido iso-heptadienoico (iso-17:2u>5, 11), acido iso-heptadecenoico (iso-17:1u>5), acido iso-heptadecanoico (iso-17:0), acido iso-3-hidroxi-pentadecanoico (iso-3-OH-15:0), acido y-linolenico (18:3 u>6), acido linoleico (18:2 u>6), acido octadecenoico (18:1), acido octadecanoico (18:0), acido 2-hidroxi-heptadecanoico (2- OH-17:0), acido 2-hidroxi-heptadecenoico (2-OH-17:1), acido hidroxi-hexadecanoico (2-OH-16:0, 3-OH-16:0), acido iso-pentadecanoico (iso-15:0) y acido eicosadienoico (20:2j6). De acuerdo con el proceso de la invebo, se producen uno o mas acidos grasos poliinsaturados. Asf, el proceso de acuerdo con la invencion produce normalmente una composicion a partir de la cual uno o mas acidos grasos poliinsaturados pueden recuperarse y aislarse, respectivamente, como se describe en la etapa opcional (iii).
Preferentemente, el proceso de acuerdo con la invencion produce una composicion que comprende mas de un acido graso poliinsaturado, p. ej., una composicion de al menos 2 o 3 AGPI, en la que un acido graso poliinsaturado particular es el ingrediente principal.
En una realizacion preferente, el contenido de un acido graso poliinsaturado particular asciende a al menos 40 % en peso, mas preferentemente al menos 45 % en peso, aun mas preferentemente al menos 50 % en peso, aun mas preferentemente al menos 55 % en peso, incluso mas preferentemente al menos 60 % en peso, lo mas preferentemente al menos 65 % en peso y en particular al menos 70 % en peso, basado en el peso total de todos los acidos grasos poliinsaturados contenidos en el composicion. En otra realizacion preferente, el contenido de dicho acido graso poliinsaturado particular asciende a al menos 75 % en peso, mas preferentemente al menos 80 % en peso, aun mas preferentemente al menos 82 % en peso, aun mas preferentemente al menos 84 % en peso, incluso mas preferentemente al menos 86 % en peso, mas preferentemente al menos 88 % en peso y en particular al menos 90 % en peso, basado en el peso total de todos los acidos grasos poliinsaturados contenidos en la composicion.
La invencion se refiere a un proceso de produccion de uno o mas acidos grasos poliinsaturados por medio de la expresion genica heterologa. Un experto conoce la expresion "expresion genica heterologa". Preferentemente, la expresion genica heterologa se define como la sfntesis de protefnas exogenas en un organismo huesped (organismo de produccion) despues de la transformacion de ese organismo por genes portadores de vectores de un organismo diferente (organismo fuente). Por "expresion genica" se entiende la produccion de un polipeptido funcional a traves de la transcripcion de un segmento de acido nucleico en ARNm y la traduccion del ARNm en una protefna. Por "expresion genica heterologa" se entiende generalmente que un acido nucleico, no presente de forma natural en el genoma del organismo de produccion, esta presente en el organismo de produccion y se vincula operativamente a las secuencias de acidos nucleicos promotoras y terminadoras de una manera que se expresa en el organismo de produccion. La expresion "vinculado operativamente" se refiere a la asociacion de un gen con una secuencia que controla su expresion en un fragmento de acido nucleico unico. Por ejemplo, un promotor se vincula operativamente con una secuencia codificante cuando es capaz de regular la expresion de esa secuencia codificante. Asimismo, en el presente contexto, la expresion genica heterologa se refiere ademas a la presencia de un acido nucleico con una funcion similar a un acido nucleico presente de forma natural, en la que la expresion de dicho producto de acido nucleico heterologo cambia la composicion de acidos grasos. Por expresion heterologa de un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados se entiende que varios genes se expresan de forma heterologa, cuyos productos genicos constituyen etapas en una via, no presentes de forma natural en el organismo de produccion.
De acuerdo con la etapa (i) del proceso de acuerdo con la invencion, se proporciona un organismo de produccion que comprende un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados. Para los fines de la memoria descriptiva, la expresion "agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados" se refiere a cualquier agrupamiento de genes que codifica una via biosintetica que es capaz de sintetizar uno o mas acidos grasos poliinsaturados por medio del organismo de produccion. Por expresion heterologa del agrupamiento de genes, varios genes se expresan de forma heterologa, cuyos productos genicos constituyen etapas en una via, no presentes de forma natural en el organismo de produccion. El agrupamiento de
5
10
15
20
25
30
35
40
45
50
55
60
65
genes puede comprender uno o mas genes, cada uno de los cuales puede codificar de forma independiente una protefna y/o enzima mono- o polifuncional. Para los fines de la memoria descriptiva, un gen se considera generalmente como una unidad de la herencia en un organismo vivo. Normalmente es un tramo de ADN que codifica un tipo de protefna o una cadena de ARN que tiene una funcion en el organismo. Preferentemente, un gen se define como una region localizable de la secuencia genomica, que corresponde a una unidad de herencia, que se asocia con regiones reguladoras, regiones transcritas, y/u otras regiones secuenciales funcionales.
Preferentemente, el agrupamiento de genes abarca al menos dos genes, mas preferentemente al menos 3 genes. Preferentemente, el agrupamiento de genes abarca como maxmo cuatro genes, mas preferentemente como maximo 3 genes. En una realizacion particularmente preferente, el agrupamiento de genes comprende exactamente tres genes, es decir, consiste en tres genes y, opcionalmente, material genetico entre dichos tres genes.
De acuerdo con la invencion, el agrupamiento de genes se deriva de un organismo fuente diferente del organismo de produccion. En este contexto, "derivado" significa preferentemente que el agrupamiento de genes procede de un organismo de origen natural (tipo natural) o de un organismo modificado geneticamente como organismo fuente. En este sentido, "originar" no significa necesariamente que el agrupamiento de genes haya sido biosintetizado por el organismo fuente, sino que tambien debe incluir metodos de amplificacion biotecnologicos, tales como PCR y sfntesis de novo a partir de componentes adecuados, tales como fosfoamiditas.
Cuando el agrupamiento de genes se origina a partir de un organismo geneticamente modificado, como organismo fuente, el genoma de dicho organismo geneticamente modificado tiene preferentemente una homologfa con su correspondiente organismo de origen natural (tipo natural) de al menos 90 %, mas preferentemente al menos 92 %, aun mas preferentemente al menos 94 %, aun mas preferentemente al menos 96 %, incluso mas preferentemente al menos 97 %, lo mas preferentemente al menos 98 % y en particular al menos 99 %. Para los fines de la invencion, el grado de "homologfa" se basa preferentemente en una comparacion de dos secuencias utilizando el algoritmo de BLASTn 2.2.22 de la url
http://blast.ncbi.nlm.nih.gov/Blast.cgi que se describe adicionalmente en Zhang Z et al. (2000) J Comput Biol 7: 203-214.
Preferentemente, el numero de pares de bases (pb) que forma el agrupamiento de genes de acuerdo con la invencion esta dentro del intervalo de 5.000 a 30.000 pb, mas preferentemente 7.000 a 28.000 pb, aun mas preferentemente 9.000 a 26.000 pb, aun mas preferentemente 11.000 a 24.000 pb, lo mas preferentemente 13.000 a 22.000 pb y en particular 15.000 a 20.000 pb, o 16.200 a 17.300 pb.
De acuerdo con la invencion, el agrupamiento de genes abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER. En este sentido "subsecuencia" del agrupamiento de genes significa una secuencia de ADN ubicada en el agrupamiento de genes y dentro de un marco de lectura, cuya subsecuencia es mas corta que la secuencia de ADN general del agrupamiento de genes. En este sentido "aguas abajo" significa preferentemente mas cerca del extremo 3' de la secuencia de ADN. De este modo, la subsecuencia At se ubica mas cerca del extremo 3' que la subsecuencia ER. Un experto sabe que los peptidos o protefnas pueden calificarse como enoil reductasas y aciltransferasas, respectivamente, es decir, cuyos requisitos deben satisfacerse en relacion con la actividad biocatalftica.
Generalmente, una enoil reductasa es un tipo de enzima que actua sobre los grupos enoil. Las enoil reductasas se clasifican preferentemente en la categorfa EC 1.3 (oxidorreductasas que actuan sobre el grupo CH-CH de los donantes), subcategorfa EC 1.3.1 (con NAD o NADP como aceptor).
Generalmente, una aciltransferasa es un tipo de enzima transferasa que actua sobre grupos acilo. Las aciltransferasas se clasifican preferentemente en la categorfa EC 2.3 y comprenden las subcategorfas EC 2.3.1 (aciltransferasas que transfieren grupos distintos de los grupos amino-acilo), EC 2.3.2 (aminoaciltransferasas), y EC 2.3.3 (aciltransferasas que convierten grupos acilo en grupos alquilo tras la transferencia) desde las cuales la aciltransferasa de acuerdo con la invencion se seleccionan preferentemente.
De acuerdo con la invencion, la subsecuencia ER y/o subsecuencia AT no necesitan codificar protefnas y enzimas independientes separadas, respectivamente. Mas bien, es posible que la subsecuencia ER y/o subsecuencia AT codifiquen dominios de una protefna/enzima multifuncional que comprende la actividad biocatalftica respectiva entre otras actividades biocatalfticas. Asf, para los fines de la memoria descriptiva, la expresion "que codifica un(a)..." es sinonimo de "que codifica un peptido o protefna que tiene la actividad o funcionalidad de un(a)..., opcionalmente entre otras actividades o funcionalidades".
Preferentemente, el agrupamiento de genes comprende un primer gen, un segundo gen y un tercer gen, en el que el segundo gen se ubica aguas abajo con respecto al primer gen; y el tercer gen se ubica aguas abajo con respecto al segundo gen. En una realizacion preferente, la subsecuencia ER se ubica en el primer gen y/o la subsecuencia AT, que preferentemente es AGPAT, se ubica en el tercer gen.
En una realizacion preferente de la invencion, la subsecuencia ER codifica una protefna/enzima monofuncional que
5
10
15
20
25
30
35
40
45
50
55
60
65
no comprende dominios adicionales que exhiban otras actividades biocatalfticas. De acuerdo con la presente realizacion preferente, la subsecuencia ER se ubica preferentemente en el primer gen, para los fines de la memoria descriptive, preferentemente, tambien se refiere como "gen pfal". De este modo, la expresion heterologa del gen pfal en el organismo de produccion produce preferentemente una protefna/enzima preferentemente monofuncional que exhibe actividad enoil reductasa.
En una realizacion preferente de la invencion, la subsecuencia AT codifica un dominio de una protefna/enzima polifuncional que exhibe actividad aciltransferasa en el dominio codificado por la subsecuencia AT y exhibe adicionalmente actividades biocatalfticas adicionales en otros dominios codificados por mas subsecuencias. De acuerdo con la presente realizacion preferente, la subsecuencia AT se ubica preferentemente en el tercer gen, para los fines de la memoria descriptiva, preferentemente, tambien referido como "gen pfa3". De este modo, la expresion heterologa del gen pfa3 en el organismo de produccion produce preferentemente una protefna/enzima preferentemente polifuncional que exhibe actividad aciltransferasa en el dominio codificado por la subsecuencia AT, asf como actividades biocatalfticas adicionales en otros dominios que, a su vez, se codifican por otras subsecuencias que tambien se ubican en el gen pfa3.
Preferentemente, la enoil reductasa codificada por la subsecuencia ER tiene una identidad proteica con SEQ ID NO: 2 y/o con SEQ ID NO: 6 de al menos 46 %, mas preferentemente al menos 48 %, aun mas preferentemente al menos 50 %, aun mas preferentemente al menos 52 %, incluso mas preferentemente al menos 54 %, lo mas preferentemente al menos 56 %, y en particular al menos 58 %.
Preferentemente, la aciltransferasa codificada por la subsecuencia AGPAT tiene una identidad proteica con SEQ ID NO: 30 y/o con SEQ ID NO: 31 de al menos 2,5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos 7,5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 12,5 %, incluso mas preferentemente al menos 15 %, lo mas preferentemente al menos 17,5 %, y en particular al menos 20 %, una identidad proteica de al menos preferentemente 22 %, p. ej., como se determina por medio del software Geneious y la herramienta de alineamiento Geneious Aignment, como se especifica en la presente memoria.
Preferentemente, la enoil reductasa codificada por la subsecuencia ER tiene una similitud proteica con SEQ ID NO: 2 y/o con SEQ ID NO: 6 de al menos 66 %, mas preferentemente al menos 67 %, aun mas preferentemente al menos 68 %, aun mas preferentemente al menos 69 %, incluso mas preferentemente al menos 70 %, lo mas preferentemente al menos 71 %, y en particular al menos 72 %.
Preferentemente, la aciltransferasa codificada por la subsecuencia AGPAT tiene una similitud proteica con SEQ ID NO: 66, SEQ ID NO: 72, SEQ ID NO: 31, SEQ ID NO: 62, SEQ ID NO: 96, SEQ ID NO: 130, SEQ ID NO: 136 y/o con SEQ ID NO: 170 de al menos 2,5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos
7,5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 15 %, incluso mas
preferentemente al menos 20 %, preferentemente al menos 22 %, lo mas preferentemente al menos 25 %, y en particular al menos 27,5 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Aignment, como se especifica en la presente memoria.
Preferentemente, la subsecuencia ER tiene una identidad por pares de ADN con SEQ ID NO: 67 y/o con SEQ ID NO: 63 nt 1-1.608 de al menos 60 %, mas preferentemente al menos 62 %, aun mas preferentemente al menos
64 %, aun mas preferentemente al menos 66 %, incluso mas preferentemente al menos 67 %, lo mas
preferentemente al menos 68 %, y en particular al menos 69 %.
Preferentemente, la subsecuencia AGPAT tiene una identidad por pares de ADN con SEQ ID NO: 63, nt 8.30916.219 y SEQ ID NO: 71 y/o con SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 136 y/o SEQ ID NO: 170 de al menos 46 %, mas preferentemente al menos 48 %, mas preferentemente al menos 50 %, aun mas preferentemente al menos 52 %, aun mas preferentemente al menos 54 %, incluso mas preferentemente al menos 56 %, mas preferentemente al menos 58 %, y en particular al menos 60 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Clustal W, como se especifica en la presente memoria. Para los fines de la memoria descriptiva, identidad proteica es sinonimo de identidad de secuencia de protefnas, identidad por pares de ADN es sinonimo de identidad por pares de la secuencia de ADN y similitud proteica es sinonimo de similitud de la secuencia de protefnas.
La identidad proteica, similitud proteica e identidad por pares de ADN (alineamiento) se determinan en general preferentemente por medio del programa Geneious (
http://www.geneious.com/) utilizando una de las siguientes herramientas de alineamiento: Geneious Aignment (Drummond AJ, Ashton B, Cheung M, Heled J, Kearse M, Moir R, Stones-Havas S, Thierer T, Wilson A (2009) Geneious Pro v5.4.2, disponible en
http://www.geneious.com/). La identidad por pares de ADN puede determinarse alternativamente utilizando la herramienta Clustal W2.0.11 Aignment (Thompson, Nucleic Acids Res. 1994, 4673-4680). Los ajustes de parametros para la comparacion de secuencias proteicas son como indica preferentemente ClustalW Aignment: matriz de coste: BLOSUM, coste de apertura de huecos: 10, coste de extension de huecos: 0,1. Los ajustes de parametros para la comparacion de secuencias de ADN son como se indica preferentemente (A) Geneious Aignment: matriz de coste: 51 % de similitud (5,0/-3,0), penalizacion de apertura de huecos: 12, penalizacion de extension de huecos: 3, tipo de alineamiento:
5
10
15
20
25
30
35
40
45
50
55
60
65
alineamiento global con huecos de extremo libres, y (B) Clustal W2.0.11 Alignment: matriz de coste: IUB, coste de apertura de huecos: 15, coste de extension de huecos: 6,66.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion abarca ademas una subsecuencia CS que codifica una cetosintasa (en lo sucesivo tambien referida como cetosintasa cs1) y/o al menos una subsecuencia DH que codifica una deshidratasa (en lo sucesivo tambien referida como deshidratasa dh1). En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion abarca ademas una subsecuencia CS que codifica una cetosintasa (en lo sucesivo tambien referida como cetosintasa cs1), una subsecuencia FLC que codifica un factor de longitud de cadena y/o al menos una subsecuencia DH que codifica una deshidratasa (en lo sucesivo tambien referida como deshidratasa dh1). Un experto sabe que los peptidos o protefnas pueden calificarse como cetosintasas, factores de longitud de cadena, y deshidratasas, respectivamente, es decir, cuyos requerimientos deben satisfacerse en relacion con la actividad biocatalftica. Generalmente, una beta-cetoacil sintasa es un tipo de enzima sintasa que sintetiza la cadena de carbono en un tipo de condensacion de Claisen. Las beta- cetoacil sintasas se clasifican preferentemente en la categorfa EC 2.3.1.41. Generalmente, un factor de longitud de cadena controla la longitud de cadena del acido graso a sintetizar. El factor de longitud de cadena tambien desempena un papel destacado en la sfntesis de policetido (cf. p. ej., Y Tang et al., J Am Chem Soc. 2003, 125(42), 12708-9).
Generalmente, una deshidratasa es un tipo de enzima que cataliza la eliminacion de oxfgeno e hidrogeno a partir de compuestos organicos en forma de agua (deshidratacion). Existen cuatro clases de deshidratasas: deshidratasas que actuan en esteres de 3-hidroxiacil-CoA reductasa (sin cofactores); deshidratasas que actuan en esteres de 2- hidroxiacil-CoA reductasa (reaccion radical, grupo que contiene [4Fe-4S]); deshidratasas que actuan en esteres 4- hidroxiacil-CoA (que contiene [4Fe-4S] y FAD); y deshidratasas que contienen un agrupamiento [4Fe-4S] como sitio activo (aconitasa, fumarasa, serina deshidratasa), a partir de las cuales se selecciona preferentemente la deshidratasa de acuerdo con la invencion. Preferentemente, las deshidratasas se clasifican en EC 4.2.1 (hid ro- liasas). Los ejemplos preferentes de deshidratasas son hidroxi-acil-deshidratasas, particularmente las p-hidroxi-acil- deshidratasas. En una realizacion preferente, la deshidratasa se selecciona entre el grupo que consiste en crotonoil- [protefna transportadora de acilos] hidratasa (EC 4.2.1.58), 3-hidroxioctanoil-[protefna transportadora de acilos] deshidratasa (EC 4.2.1.59), 3-hidroxidecanoil-[protefna transportadora de acilos] deshidratasa (EC 4.2.1.60), 3- hidroxipalmitoil-[protefna transportadora de acilos] deshidratasa (EC 4.2.1.61), enoil-CoA hidratasa de cadena larga (EC 4.2. 1.74), 3-hidroxipropionil-CoA deshidratasa (EC 4.2.1.116), y 4-hidroxibutanoil-CoA deshidratasa (EC 4.2.1.120).
En una realizacion preferente, la subsecuencia CS, la subsecuencia FLC, al menos una subsecuencia DH y/o la subsecuencia AT se ubican en el mismo gen, preferentemente en el tercer gen (es decir pfa3), que codifica preferentemente una protefna multifuncional que comprende al menos tres dominios, mas preferentemente al menos cuatro dominios y en particular preferentemente al menos cinco dominios.
En una realizacion preferente, el tercer gen codifica una protefna multifuncional que tiene al menos cuatro, preferentemente al menos cinco funcionalidades diferentes, en las que las subsecuencias que codifican las funcionalidades individuales diferentes abarcan la subsecuencia AT que codifica una aciltransferasa y en las que dicha subsecuencia AT se ubica aguas abajo con respecto a las otras subsecuencias.
En una realizacion preferente, el agrupamiento de genes, preferentemente el tercer gen (es decir, pfa3) comprende dos subsecuencias DH que codifican dos deshidratasas, a saber, deshidratasa dh1 y deshidratasa dh2, que pueden ser identicas o diferentes.
Preferentemente, el agrupamiento de genes abarca ademas una subsecuencia CS que codifica una cetosintasa (en lo sucesivo tambien referida como cetosintasa cs2), un subsecuencia MAT que codifica una malonil-CoA- transacilasa, al menos una subsecuencia PPA que codifica una protefna transportadora de acilos (en lo sucesivo referida como acp1), una subsecuencia CR que codifica una cetorreductasa y/o una subsecuencia DH que codifica una deshidratasa (en lo sucesivo tambien referida como deshidratasa dh3). La cetosintasa cs2 puede ser identica o diferente de la cetosintasa cs1 anteriormente mencionada.
La deshidratasa dh3 puede ser identica o diferente de las deshidratasas dh1 y dh2 anteriormente mencionadas, respectivamente.
Un experto sabe que los peptidos o protefnas pueden calificarse como malonil-CoA-transacilasa, protefna transportadora de acilos, y cetorreductasas, respectivamente, es decir, que los requerimientos deben satisfacerse en relacion con la actividad biocatalftica.
Generalmente, una malonil-CoA-transacilasa (tambien referida como [protefna transportadora de acilos] S- maloniltransferasa) cataliza la transferencia de un grupo malonilo de coenzima A a una protefna transportadora de acilos. Preferentemente, las malonil-CoA-transacilasas se clasifican en la categorfa EC 2.3.1.39.
Generalmente, una protefna transportadora de acilos es un pequeno polipeptido con el cual la cadena de carbono/o
5
10
15
20
25
30
35
40
45
50
55
60
65
acilo creciente se une por medio de un enlace tioester durante la biosfntesis (TDH Bugg (ed.) en Introduction to Enzym and Coenzyme Chemistry, 2a ed, 2004, Blackwell Publishing).
Generalmente, una cetorreductasa es una enzima que reduce grupos ceto. Preferentemente, las cetoreductasas se clasifican en la categorfa EC 1.1.1.184.
En una realizacion preferente, la subsecuencia CS, la subsecuencia MAT, al menos una subsecuencia PPA la subsecuencia CR y/o la subsecuencia DH se ubican en el mismo gen, preferentemente en el segundo gen (es decir, pfa2).
En una realizacion preferente, el agrupamiento de genes, preferentemente el segundo gen (es decir, pfa2) comprende al menos dos subsecuencias PPA que codifican dos protefnas transportadoras de acilos, a saber, protefnas transportadoras de acilos acp1 y protefna transportadora de acilos acp2, que pueden ser identicas o diferentes. En una realizacion preferente, el numero total de subsecuencias PPA que codifican las protefnas transportadoras de acilos es 5 o menos (acp1, acp2, acp3, acp4 y acp5). Dichas 5 o menos protefnas transportadoras de acilos pueden ser identicas o diferentes.
En una realizacion particularmente preferente, el agrupamiento de genes de acuerdo con la invencion comprende un primer gen (pfa1), un segundo gen (pfa2) y un tercer gen (pfa3), en el que el segundo gen se ubica opcionalmente aguas abajo con respecto al primer gen y el tercer gen se ubica opcionalmente aguas abajo con respecto al segundo gen; y
una subsecuencia ER que codifica un peptido o protefna que exhibe una actividad enoil reductasa, una subsecuencia CS2 que codifica un peptido o protefna que exhibe una actividad cetosintasa (cs2), una subsecuencia MAT que codifica un peptido o protefna que exhibe una actividad malonil-CoA-transacilasa, al menos una subsecuencia PPA que codifica un peptido o protefna que exhibe una funcionalidad de la protefna transportadora de acilos, una subsecuencia CR que codifica un peptido o protefna que exhibe una actividad cetorreductasa, una subsecuencia DH3 que codifica un peptido o protefna que exhibe una actividad deshidratasa (dh3), una subsecuencia CS1 que codifica un peptido o protefna que exhibe una actividad cetosintasa (cs1), una subsecuencia FLC que codifica un peptido o protefna que exhibe una funcionalidad del factor de longitud de cadena; dos subsecuencias DH1 y DH2 que codifican un peptido o protefna que exhibe una actividad deshidratasa (dh1 y dh2), y una subsecuencia AT que codifica un peptido o protefna que exhibe una actividad aciltransferasa; en la que la subsecuencia ER se ubica preferentemente en el primer gen (pfa1); las subsecuencias CS2, MAT, PPA CR y DH3 se ubican en el segundo gen (es decir, pfa2); y las subsecuencias CS1, FLC, DH1, DH2, y AT se ubican en el tercer gen (es decir, pfa3).
Preferentemente, las subsecuencias tienen el siguiente orden en el agrupamiento de genes (aguas arriba-aguas abajo, es decir, 5 -3'): ER, CS2, MAT, nPPA, CR, DH3, CS1, FLC, DH1, Dh2, AT, en el que n se refiere al numero de PPA preferentemente 1,2, 3, 4 o 5.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que codifica una protefna Pfa1 que tiene una identidad proteica con la SEQ ID NO: 2, SEQ ID NO: 6 y/o con SEQ ID NO: 33, SEQ ID NO: 37 (Soce) y/o SEQ ID NO: 64, SEQ ID NO: 68 (Aetherobacter) y/o SEQ ID NO: 98, SEQ ID NO: 102 (Aetherobacter) y/o SEQ ID NO: 138, SEQ ID NO: 142 (Aetherobacter) de al menos 30 %, al menos 32,5 %, al menos 35 %, al menos 37,5 %, al menos 40 %, mas preferentemente al menos 42,5 %, al menos 44 %, aun mas preferentemente al menos 45 %, al menos 46,5 %, aun mas preferentemente al menos 47,5 %, incluso mas preferentemente al menos 49 %, al menos 50 %, al menos 51,5 %, lo mas preferentemente al menos 52,5 %, y en particular al menos 54 %, al menos 55 %, al menos 56 %, al menos 56,5 % aun mas preferentemente al menos 58 % o, al menos 59 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica en la presente memoria. La protefna Pfa1 puede codificarse por una secuencia de ADN que tiene al menos 54 %, mas preferentemente al menos 56 %, aun mas preferentemente al menos 58 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 % con la SEQ ID NO: 5 y/o con la SEQ ID NO: 36 (Soce) y/o SEQ ID NO: 67 y/o SEQ ID NO: 101 y/o SEQ ID NO: 141 (Aetherobacter), determinada preferentemente por medio del software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que codifica una protefna Pfa2 que tiene una identidad proteica con SEQ ID NO: 3, SEQ ID NO: 8 y/o con SEQ ID NO: 34, SEQ ID NO: 39 (Soce) y/o SEQ ID NO: 65, SEQ ID NO: 70 (Aetherobacter) y/o SEQ ID NO: 99, SEQ ID NO: 104 (Aetherobacter) y/o SEQ ID NO: 139, SEQ ID NO: 144 (Aetherobacter) de al menos 30 %, al menos 32,5 %, al menos 35 %, al menos 37,5 %, al menos 40 %, mas preferentemente al menos 42,5 %, al menos 44 %, aun mas preferentemente al menos 45 %, al menos 46,5 %, aun mas preferentemente al menos 47,5 %, incluso mas preferentemente al menos 49 %, al menos 50 %, al menos 51,5 %, lo mas preferentemente al menos 52,5 %, y en particular al menos 54 %, al menos 55 %, al menos 56 %, al menos 56,5 % aun mas preferentemente al menos 58 %, al menos 59 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 %, determinada preferentemente por medio del
5
10
15
20
25
30
35
40
45
50
55
60
65
software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica en la presente memoria. La protefna Pfa2 puede codificarse por una secuencia de ADN que tiene al menos 54 %, mas preferentemente al menos 56 %, aun mas preferentemente al menos 58 %, aun mas preferentemente al menos
60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 % con la SEQ ID NO: 7 y/o con SEQ ID NO: 38 (Soce) y/o SEQ ID NO: 69 y/o SEQ ID NO: 103 y/o SEQ ID NO: 143 (Aetherobacter), determinada preferentemente por medio del software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que codifica una protefna Pfa3 que tiene una identidad proteica con la SEQ ID NO: 4, SEQ ID NO: 10 y/o con SEQ ID NO: 35, SEQ ID NO: 41 (Soce) y/o SEQ ID NO: 66, SEQ ID NO: 72 (Aetherobacter) y/o SEQ ID NO: 100, SEQ ID NO: 106 (Aetherobacter) y/o SEQ ID NO: 140, SEQ ID NO: 146 (Aetherobacter) de al menos 28 %, al menos 31 %, al menos 34 %, al menos 35 %, al menos 37 %, al menos 40 %, mas preferentemente al menos 43 %, al menos 46 %, aun mas preferentemente al menos 48 %, al menos 50 %, aun mas preferentemente al menos 52 %, incluso mas preferentemente al menos 54 % o al menos 56 %, aun mas preferentemente al menos 58 %, al menos 59 %, aun mas preferentemente al menos 60 %, incluso mas preferentemente al menos 62 %, lo mas preferentemente al menos 64 %, y en particular al menos 66 %, determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica en la presente memoria. La protefna Pfa3 puede codificarse por una secuencia de ADN que tiene al menos 49 %, mas preferentemente al menos 51 %, al menos 53,5 %, aun mas preferentemente al menos 56 %, al menos 57 %, al menos 58,5 %, aun mas preferentemente al menos 59 %, incluso mas preferentemente al menos 61 %, lo mas preferentemente al menos
63.5 %, y en particular al menos 66 % con la SEQ ID NO: 9 y/o con SEQ ID NO: 40 (Soce) y/o SEQ ID NO: 71 y/o SEQ ID NO: 105 y/o SEQ ID NO: 145 (Aetherobacter), determinada preferentemente por medio del software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
En una realizacion preferente, el agrupamiento de genes de acuerdo con la invencion comprende una subsecuencia que tiene una identidad por pares de AdN con SEQ ID NO: 1 y/o con SEQ ID NO: 32 (Soce) y/o con SEQ ID NO: 63, con SEQ ID NO: 97 y/o con SEQ ID NO: 137 (Aetherobacter) de al menos 49 %, mas preferentemente al menos 51 %, aun mas preferentemente al menos 53 %, mas preferentemente al menos 53,5 %, aun mas preferentemente al menos 55 %, aun mas preferentemente al menos 56 %, incluso mas preferentemente al menos 57 %, aun mas preferentemente al menos 58,5 %, lo mas preferentemente al menos 59 %, incluso mas preferentemente al menos
61 %, lo mas preferentemente al menos 63,5 %, y en particular al menos 66 %, como se determina preferentemente por medio de el software Geneious y la herramienta de alineamiento ClustalW, como se especifica en la presente memoria.
Preferentemente, el numero de pb del agrupamiento de genes que se abarca por cualquiera de las subsecuencias anteriores es de al menos 50 %, mas preferentemente al menos 55 %, aun mas preferentemente al menos 60 %, aun mas preferentemente al menos 65 %, incluso mas preferentemente al menos 70 %, lo mas preferentemente al menos 75 % y en particular al menos 80 %, del numero total de pb del agrupamiento de genes.
En general, el tipo de organismo de produccion que se emplea preferentemente en el proceso de acuerdo con la invencion no esta particularmente limitado.
Las mixobacterias se clasifican cientfficamente en el reino de manera preferente: bacterias, filo, proteobacterias, clase: deltaproteobacterias, orden: Myxococcales.
Para los fines de la invencion, los terminos "mixobacterias" y "cepa mixobacteriana" se refieren preferentemente a cualquier especie u otros miembros de microorganismos que pertenecen al orden de Myxococcales.
El termino utilizado "miembros" se utiliza preferentemente para cualquier cepa mixobacteriana de la invencion que se define como un vecino homologo de Aetherobacter.
Para los fines de la invencion, todas las relaciones taxonomicas utilizadas son acordes a Brenner DJ, et al. (eds.) Bergey's Manual of Systematic Bacteriology, 2a ed., Nueva York: Springer, especialmente los metodos de la invencion se refieren a esta norma.
Preferentemente, el genoma del organismo de produccion tiene un contenido GC de al menos 50,0 %, mas preferentemente al menos 52,5 %, aun mas preferentemente al menos 55,0 %, aun mas preferentemente al menos
57.5 %, incluso mas preferentemente al menos 60,0 %, lo mas preferentemente al menos 62,5 %, y en particular al menos 65,0 %.
Preferentemente, el organismo de produccion se selecciona entre el grupo que consiste en eubacterias gramnegativas, eubacterias grampositivas, hongos y levaduras.
De acuerdo con el proceso de acuerdo con la invencion, la produccion transcurre por medio de la expresion genica heterologa en un organismo de produccion que comprende un agrupamiento de genes derivado de un organismo
5
10
15
20
25
30
35
40
45
50
55
60
65
fuente que difiere del organismo de produccion.
El requisito previo mfriimo para satisfacer este requerimiento es que el organismo de produccion no sea identico al organismo de tipo natural que sirve como organismo fuente, es decir, el organismo fuente del que se origina el agrupamiento de genes identificado.
En una realizacion preferente, el organismo de produccion y el organismo fuente son microorganismos.
En lo que se refiere al grado taxonomico de la relacion, el organismo de produccion y el organismo fuente pertenecen preferentemente a diferentes especies o generos; mas preferentemente a diferentes infratribus, subtribus o tribus; aun mas preferentemente a diferentes infrafamilias, subfamilias o familias; aun mas preferentemente a diferentes subordenes u ordenes; incluso mas preferentemente a diferentes subgrupos o grupos; lo mas preferentemente a diferentes subclases o clases; y en particular a diferentes subfilos, filos, reinos o dominios.
En una realizacion preferente, el organismo de produccion es un organismo procariotico, preferentemente seleccionado entre eubacterias gramnegativas y eubacterias grampositivas.
Las eubacterias gramnegativas preferentes incluyen bacterias, proteobacterias, gammaproteobacterias (incluye Pseudomonas, Escherichia, Myxococcus); particularmente preferentes son Pseudomonas putida (proteobacterias, gammaproteobacterias), pseudomonadales, pseudomonadaceae, Pseudomonas, Escherichia coli (proteobacterias, gammaproteobacterias), Enterobacterales, Enterobacteriaceae, Escherichia, Myxococcus xanthus (proteobacterias), deltaproteobacterias, Myxococcales, cystobacterineae, myxoooccaceae, myxococcus.
Las eubacterias grampositivas preferentes incluyen actinobacterias; son particularmente preferentes los miembros de los generos Corynebacterium, Rhodococcus, Streptomyces, Bacillus, Corynebacterium glutamicum (bacterias), actinobacterias, actinobacteiidae, actinomycetales, corynebacterineae, corynebacteriaceae, corynebacterium, Rhodococcus jostii (bacterias, actinobacterias, actinobacteridae, actinomycetales, corynebacterineae), nocardiaceae, Rhodococcus, Streptomyces coelicolor (bacterias, actinobacterias, actinobacteridae, actinomycetales,
streptomydneae, streptomycetaceae, streptomyces).
En otra realizacion preferente, el organismo de produccion es un organismo eucariota, preferentemente seleccionado entre hongos y levaduras.
Los hongos y las levaduras preferentes incluyen Pichia pastoris (ascomycota, saccharomycetes, saccharomycetidae, pichiaceae, pichia), Saccharomyces cerevisiae (ascomycota, saccharomycetes, saccharomycetidae), saccharomycetaceae, Saccharomyces, hansenula spp. ascomycota, saccharomycetes, saccharomycetidae, saccharomycetaceae, Torulaspora spp. ascomycota, saccharomycetes, saccharomycetidae, saccharomycetaceae, Yarrowia lipolytica hongos; dikarya; ascomycota; saccharom yceta; saccharomycotina; saccharomycetes; saccharomycetales; dipodascaceae (incluyendo su etapa asexual, Candida lipolytica).
En una realizacion preferente, el organismo de produccion es una levadura metilotrofica u oleaginosa, es decir, la levadura que tiene una fisiologfa que le permite crecer en metanol y que por lo general tambien acumula una gran cantidad de acidos grasos para conservar energfa. Las preferentes son Hansenula, Pichia, Candida, Torulopsis, yarrowia y tambien la levadura basidiomycete Rhodotorula.
Normalmente, el organismo de produccion tiene un estado GRAS, es decir, esta generalmente reconocido como seguro.
De acuerdo con el proceso de la invencion, el agrupamiento de genes se deriva de un organismo fuente. El organismo fuente puede ser cualquier organismo que comprende un agrupamiento de genes que codifica una vi'a biosintetica del acido graso poliinsaturado y abarca una subsecuencia ER que codifica una enoil reductasa y una subsecuencia AT que codifica una aciltransferasa, en la que la subsecuencia AT se ubica aguas abajo con respecto a la subsecuencia ER.
Preferentemente, el organismo fuente se selecciona entre mixobacterias.
Se cree que las mixobacterias han evolucionado como un grupo monofiletico de organismos en el orden Myxococcales, un subgrupo delta en proteobacterias. En la actualidad, 3 subordenes (Cystobacterineae, Nannocystineae, y Sorangiineae) se reconocen en las mixobacterias [Reichenbach H (2005) Orden VIII. Myxococcales Tchan, Pochon y Prevot 1948, 398AL. En Brenner DJ, et al. (eds.) Bergey's manual of Systematic Bacteriology, 2a ed., vol. 2, parte C, pags. 1.059-1.072, Nueva York: Springer]. Estos subordenes se dividen en seis familias, a saber, Cystobacteraceae, Myxococcaceae, Nannocystaceae, Kofleriaceae, Polyangaceae y Phaselicystidaceae.
La familia Myxococcaceae se compone de los generos Myxococcus, Corallococcus y Pyxidicoccus. En la familia relacionada Cystobacteraceae, se conocen cinco generos (Cystobacter, Archangium, Hyalangium, Melittangium y
5
10
15
20
25
Stigmatella). Nannocystaceae del suborden Nannocsytineae se componen de Nannocystis y dos generos marinos (Enhygromyxa y Plesiocystis). Su familia relacionada Kofleriaceae se compone del genero terrestre Kofleria y el genero marino Heliangium. La familia Polyangiaceae abarca los generos Jahnella, Chondromyces, Polyangium, Byssovorax y Sorangium. Hasta el momento, los dos ultimos son los unicos generos conocidos de microorganismos degradadores de celulosa entre el orden; la mayorfa de los otros grupos taxonomicos son diffciles de aislar y cultivar. El genero recientemente descubierto, Phaselicystis, es el unico genero de la familia recientemente erigido Phaselicystidaceae [Garcia RO et al. (2009) Int J Syst Evol Microbiol 59:1524-1530]. En la actualidad, 20 generos son reconocibles y validamente descritos en mixobacterias para contener todos los aislados terrestres y marinos conocidos.
Myxococcales incluyen los siguientes subordenes ejemplificados que, a su vez, incluyen las siguientes familias ejemplificadas, generos ejemplificados y especies ejemplificadas. El organismo fuente se selecciona preferentemente entre cualquiera de las siguientes especies:
suborden familia genero especies (ejemplos preferentes
Cystob acerineae
Cystob acteraceae
Myxococcaceae
Nannocystineae
Haliangiaceae
(Kofleariaceaea)
Nannocystaceae
Sorangiinae
Phaselicystidaceae
Polyangiaceae
Sorangium
Archangium Cystob acter Hyalangium Melittangium Stigmatella
Anaeromyxob acter Corallococcus Myxococcus Pyxidiococcus
Haliangium
Nannocystis
Plesiocystis
Enhygromyxa Enhygromyxa salina
Phaselicystis
Polyangium
Jahnella
Chondromyces
Byssovorax Byssovorax cruenta
Aetherobacter Aetherobacter fasciculatus (DSM
21835)
Aetherobacterrufus (DSM 23122) Aetherobacter sp. (DSM 23098)
Sorangium cellulosum
Las relaciones filogeneticas como se infiere a partir de una comparacion de datos de la secuencia de ADNr 16S de los generos y especies representativos cuyos cultivos viables son existentes, se presentan en la Fig. 5.
En una realizacion preferente, el agrupamiento de genes se deriva de una cepa mixobacteriana que pertenece al suborden Soiang'ineae del orden Myxococcales. En otra realizacion preferente, el agrupamiento de genes se deriva de una cepa mixobacteriana que pertenece al suborden Polyangiaceae del orden Myxococcales. En una realizacion preferente, la cepa mixobacteriana se selecciona entre las cepas Aetherobacter fasciculatus DSM 21835, Aetherobacter rufus DSM 23122, y Aetherobacter sp. DSM 23098. En otra realizacion preferente, la cepa mixobacteriana es Sorangium cellulosum So ce56.
En una realizacion preferente, el agrupamiento de genes se deriva de una cepa mixobacteriana que produce una composicion que comprende acidos grasos poliinsaturados, en la que el contenido de acidos grasos poliinsaturados omega-3 es al menos el 10 %, preferentemente al menos 15 % en peso de contenido de acidos grasos celulares totales de la composicion.
5
10
15
20
25
30
35
40
45
50
55
60
65
Una vez que un agrupamiento de genes deseado de un organismo fuente se ha identificado y aislado, se puede expresar en un organismo de produccion. Para los fines de expresar de forma heterologa tal agrupamiento de genes en un organismo de produccion, este se vincula operativamente a una secuencia promotora y terminadora utilizando tecnicas o patrones de clonacion convencionales en los procedimientos in vitro, tales como fusion por PCR. El termino "promotor" se refiere a una secuencia de ADN capaz de controlar la expresion de un gen. Las construcciones que contienen agrupamientos de genes de interes pueden introducirse en el organismo de produccion por tecnicas convencionales. Estas tecnicas incluyen la transformacion, tal como, por ejemplo, en S. cerevisiae, la transformacion de acetato de litio, formacion de esferoplastos, y el uso de un mutante karl n.° 15 (Georgieva, B. et al, (2002) Meth. Enzymol. 350:278-89), fusion de protoplastos, lipofeccion, transfeccion, transduccion, conjugacion, infeccion, impacto balfstico, electroporacion, o cualquier otro metodo que introduce el ADN exogeno en la celula del organismo de produccion. Por razones de simplicidad, un organismo de produccion manipulado de esta manera se referira como "transform ado", "recombinante" o "geneticamente modificado". La construccion que se introduce en el organismo de produccion contiene preferentemente ademas del casete de expresion un gen marcador, que permite la identificacion de celulas transformadas y, en el caso de la expresion extracromosomica, tambien evita que la celula pierda la construccion.
La etapa (ii) del proceso de acuerdo con la invencion comprende el cultivo del organismo de produccion de la etapa
(i) en presencia de una fuente de carbono fermentable por la cual se producen uno o varios acidos grasos poliinsaturados.
Normalmente, los organismos de produccion se fermentan en un medio nutriente que contiene una fuente de carbono fermentable y un material protefnico. Las fuentes de carbono preferentes incluyen glucosa, azucar marron, sacarosa, glicerol, almidon, almidon de mafz, lactosa, dextrina, melaza, y similares. Las fuentes de nitrogeno preferentes incluyen harina de semilla de algodon, licor de maceracion del mafz, levadura, levadura de cerveza autolizada con solidos lacteos, soja triturada, harina de semillas de algodon, harina de mafz, solidos lacteos, digerido pancreatico de casefna, solidos de destilerfa, licores de peptona de origen animal, carne y trozos de hueso, y similares. Las combinaciones de estas fuentes de carbono y nitrogeno se pueden utilizar ventajosamente. No hay necesidad de anadir metales traza, p. ej., cinc, magnesio, manganeso, cobalto, hierro y similares, al medio de fermentacion ya que el agua del grifo y los ingredientes no purificados se utilizan como componentes del medio.
Preferentemente, la fuente de carbono fermentable esta libre de acidos grasos, preferentemente se selecciona entre el grupo que consiste en monosacaridos, oligosacaridos, polisacaridos, y aminas que contienen metanol y carbono.
La fermentacion a gran escala para cultivos de produccion se puede inducir a cualquier temperatura conductora para un crecimiento satisfactorio de los organismos de produccion entre aproximadamente 18 y 32 °C y preferentemente a aproximadamente 28 °C. Habitualmente, la produccion optima de los compuestos se obtiene en aproximadamente 2 a 8 dfas de fermentacion, y preferentemente en aproximadamente 4 a 5 dfas de fermentacion.
La produccion puede llevarse a cabo en matraces de agitacion pero tambien en medios solidos y fermentadores agitados. Cuando el crecimiento se lleva a cabo en matraces de agitacion o en grandes recipientes y tanques, es preferible utilizar la forma vegetativa, en lugar de la forma de esporas de los organismos de produccion para la inoculacion. Esto evita un retraso pronunciado en la produccion de los compuestos de AGPI y la utilizacion ineficaz asistente del equipo. En consecuencia, es deseable producir un inoculo vegetativo en un medio nutriente acuoso mediante la inoculacion de este medio con una alfcuota de un cultivo terrestre o inclinado. Cuando un inoculo vegetativo activo joven ha sido por lo tanto asegurado, se transfiere asepticamente a otros matraces de agitacion u otros dispositivos adecuados para la fermentacion de organismos de produccion. El medio en el que se produce el inoculo vegetativo puede ser el mismo, o diferente, al utilizado para la produccion de compuestos, siempre que se obtenga el crecimiento adecuado del microorganismo.
En general, se utiliza la siembra de las cepas bacterianas y la fermentacion y la produccion de compuestos en la fermentacion aerobia sumergida en recipientes agitados. La produccion es independiente de los contenedores, fermentadores y procedimientos iniciadores utilizados. Los compuestos tambien se pueden obtener por cultivo en matraz de agitacion, o en otros recipientes especialmente disenados, tales como tanques de fermentacion aero- elevado o Biowave. Para fermentaciones en grandes volumenes es preferible utilizar un inoculo vegetativo. El inoculo vegetativo se prepara inoculando un pequeno volumen del medio de cultivo con la forma de esporas o un sedimento liofilizado del organismo. El inoculo vegetativo se transfiere entonces a un recipiente de fermentacion, en el que, despues de un tiempo de incubacion adecuado, los compuestos se producen con un rendimiento optimo.
Como es habitual en el proceso de cultivo aerobio sumergido, el aire esteril se dispersa por el medio de cultivo. Para un crecimiento eficiente del organismo, el volumen del aire utilizado se encuentra en el intervalo de aproximadamente 0,25 a aproximadamente 0,5 vvm. Una tasa optima en un recipiente de 10 l es de aproximadamente 0,3 vvm con agitacion proporcionada por impulsores convencionales que giran a aproximadamente 240 rpm. La adicion de una pequena cantidad (es decir, 1 ml/l) de un agente antiespumante, tal como silicona para medios de fermentacion es necesaria si la formacion de espuma se convierte en un problema. Para los organismos microaerofilos puede ser favorable reducir aun mas la aireacion a efectos de soportar la
5
10
15
20
25
30
35
40
45
50
55
60
65
produccion de biomasa. La fermentacion se lleva a cabo por lo general en el modo por lotes, pero para lograr un mejor crecimiento y un mayor rendimiento del producto, fermentaciones por lotes semicontinuos pueden llevarse a cabo mediante el suministro de la fuente de nutrientes requerida para cultivar un cultivo una vez que se ha deplecionado en el medio de cultivo original.
Los productos deseados estaran normalmente presentes en su mayorfa en la biomasa de las cepas bacterianas fermentadas, pero en caso de su sobreproduccion, pueden ubicarse tambien en el filtrado de cultivo del caldo de fermentacion. El caldo de cultivo se puede separar por filtracion en un filtro prensa.
La etapa (iii) del proceso de acuerdo con la invencion solo es opcional y comprende la recuperacion de uno o mas acidos grasos poliinsaturados producidos en la etapa (ii).
Los metodos adecuados para la recuperacion de acidos grasos son conocidos por el experto e incluyen extraccion, cromatograffa y similares. En particular, una variedad de procedimientos se puede emplear para aislar y purificar los compuestos de AGPI a partir del caldo de fermentacion, por ejemplo, mediante procedimientos cromatograficos de adsorcion seguidos de elucion con un disolvente adecuado, cromatograffa en columna, cromatograffa de particion, por extraccion con fluidos supercrfticos, y combinaciones de los metodos antes mencionados.
Un aspecto adicional de la invencion se refiere a un metodo para producir uno o mas acidos grasos poliinsaturados por medio de la expresion genica heterologa de genes que codifican las enzimas de la via biosintetica para la sfntesis de AGPI como se describe en la presente memoria, comprendiendo el metodo preferentemente las etapas de:
(i) proporcionar un organismo de produccion que comprende un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados, derivando dicho agrupamiento de genes de un organismo fuente que difiere del organismo de produccion; y que abarca una primera subsecuencia y/o una segunda subsecuencia,
en la que la protefna codificada por dicha primera subsecuencia tiene una identidad proteica con la secuencia de aminoacidos de Pfa1 de al menos 46 %, mas preferentemente al menos 48 %, aun mas preferentemente al menos 50 %, aun mas preferentemente al menos 52 %, incluso mas preferentemente al menos 54 %, lo mas preferentemente al menos 56 %, y en particular al menos 58 %; determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica con mas detalle en la presente memoria; y/o
que codifica una protefna que tiene una identidad proteica con la secuencia de aminoacidos de Pfa2 de al menos
2.5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos 7,5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 12,5 %, incluso mas preferentemente al menos 15 %, lo mas preferentemente al menos 17,5 %, y en particular al menos 20 %; y/o
la protefna codificada por dicha segunda subsecuencia tiene una identidad proteica con la secuencia de aminoacidos de Pfa3 de al menos 2,5 %, mas preferentemente al menos 5,0 %, mas preferentemente al menos
7.5 %, aun mas preferentemente al menos 10 %, aun mas preferentemente al menos 12,5 %, incluso mas preferentemente al menos 15 %, lo mas preferentemente al menos 17,5 %, y en particular al menos 20 %; determinada preferentemente por medio del software Geneious y la herramienta de alineamiento Geneious Alignment, como se especifica con mas detalle en la presente memoria;
(ii) cultivar el organismo de produccion de la etapa (i) en presencia de una fuente de carbono fermentable por medio de la cual se producen uno o mas acidos grasos poliinsaturados; y
(iii) opcionalmente, recuperar uno o mas acidos grasos poliinsaturados.
Preferentemente, la primera subsecuencia es una subsecuencia ER como se describe anteriormente y/o la segunda subsecuencia es una subsecuencia AT como se describe anteriormente.
Todas las realizaciones preferentes que se han descrito en relacion con el primer aspecto de la invencion (proceso de acuerdo con la invencion) tambien se refieren de manera analoga a este aspecto de la invencion (metodo de acuerdo con la invencion) y por lo tanto, no se repiten de aquf en adelante.
Se desvela adicionalmente en la presente memoria una composicion que comprende al menos dos acidos grasos poliinsaturados diferentes obtenibles por el proceso de acuerdo con la invencion y el metodo de acuerdo con la invencion, respectivamente.
La filogenia es conforme con las caracterfsticas morfologicas y fisiologicas de las mixobacterias. Lo mas importante, los perfiles de acidos grasos como se infiere por analisis por GC-MS del contenido de acidos grasos celulares se utilizan generalmente y se consideran aceptables para la segregacion taxonomica de mixobacterias, asf como muchos otros grupos de organismos bacterianos, ya que se descubrio que era una caracterfstica constante, al menos cuando se aplica una metodologfa estandarizada. Las primeras aplicaciones de esta tecnica se realizaron en la decada de 1980 [Tornabenet G (1985) Methods in Microbiology 18, 209-234]. Por lo tanto, tales perfiles de acidos grasos basados en GC-MS (o CG) se han utilizado ampliamente en la filogenia y la taxonomfa bacteriana.
5
10
15
20
25
30
35
40
45
50
55
60
65
Asf, los agrupamientos de genes derivados de diferentes especies competentes individuales, es decir especies diferentes que son capaces de produdr AGPI, dan productos de diferente composicion, es decir, productos que contienen diferentes AGPI y/o AGPI en diferentes cantidades. De este modo, los productos que pueden obtenerse por los diferentes procesos tienen caracterfsticas individuales que los distinguen entre si.
Un aspecto adicional de la invencion se refiere a un organismo de produccion transformado que comprende un agrupamiento de genes que codifica una via biosintetica de acidos grasos poliinsaturados como se ha definido anteriormente.
La invencion se describe ahora con mayor detalle con referenda a las figuras y por medio de ejemplos que, sin embargo, no deben interpretarse como limitantes del alcance de las reivindicaciones.
Aetherobacter fasciculatus, actualmente tambien denominada SBSr002, se deposito de acuerdo con el Tratado de Budapest en el DMSZ, Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH, Inhoffenstr. 7 B, 38124 Braunschweig, Alemania, el 27 de agosto de 2008, con el numero de deposito DSM 21835. Aetherobacter rufus, actualmente tambien denominada SBSr003, se deposito ante el DSMZ con el numero de deposito DSM 23122, y Aetherobacter sp, actualmente tambien denominada SBSr008, se deposito ante el DSMZ con el numero de deposito DSM 23098 ante DSMZ el 12 de noviembre de 2009.
A. fasciculatus DSM 21835 se identifico como un miembro de la clase mixobacterias, orden Myxococcales mostrando el enjambre caracterfstico de las celulas vegetativas gramnegativas, con forma de baston finas, formacon de cuerpos de fructificacion, y actividad bacteriolftica. La cepa es aerobia con respecto a aerobio facultativo, quimioheterotrofico, y tambien exhibe resistencia a diversos antibioticos. Los acidos grasos principales son C22:6 (aado docosahexaenoico), iso-C15:0, ante-iso C17:0 y C20:5 (acido eicosapentaenoico). El contenido de G + C del ADN genomico es 68,9 % en moles. La secuencia de ADNr 16S muestra una identidad del 96 % con respecto a Byssovorax cruenta de degradacion de celulosa y 95 % con respecto a Sorangium cellulosum. Esto demuestra claramente que la cepa pertenece al suborden Sorangiineae del orden Myxococcales. Ademas, la singularidad en las fases de crecimiento morfologico y el innovador perfil de acidos grasos, implican claramente que DSM 21835 pertenece a un nuevo taxon que se clasifica de forma propuesta como perteneciente al genero innovador Aetherobactery a la especie innovadora A. fasciculatus.
Ejemplo 1: Generacion de una construccion de expresion para un agrupamiento de genes biosinteticos para la codificacion de la produccion de AGPI
a) Subclonacion de los genes de AGPI y construccion de las construcciones de expresion:
Los genes de AGPI se subclonaron a partir de los cromosomas de las cepas de mixobacterias productoras de AGPI mediante la generacion de bibliotecas genomicas (p. ej., utilizando un cosmido, fosmido, vectores YAC o BAC) o mediante la amplificacion de genes de AGPI o fragmentos de los mismos por PCR seguido de subclonacion de los productos de PCR. Alternativamente, los genes de AGPI se subclonaron utilizando metodos que se basan en la recombinacion, p. ej., la tecnologfa de recombinacon Red/ET (Zhang Y, Nat. Genet. 1998, 20:123-128; Zhang Y, Nat. Biotechnol. 2000, 18:1314-1317) o la recombinadon en levaduras (Kouprina N, Nature Protocols 2008, 3:371377; Larionov V, P. Natl. Acad. Sci. EE.UU. 1996, 93:491-496; Wolfgang MC, Proc Natl. Acad. Sci. EE.UU. 2003, 100:8484-8489). En otro enfoque, las secuencias de ADN nativas o artificiales de genes de AGPI se sintetizaron qufimicamente de novo (p. ej., mediante sfntesis genica, que esta disponible comerdalmente). Un plasmido preferente que contiene todo el agrupamiento de genes de pfa1, pfa2, pfa3 se muestra en la Fig. 2. Los elementos de RI que flanquean el agrupamiento de genes son opcionales y preferentes para la co-transformacion de la seccion del plasmido que contiene el agrupamiento de genes y los elementos de RI de flanqueo con un gen que codifica una transposasa, que puede contenerse en la misma o en una construccion de acido nucleico separada.
Para movilizar los genes de AGPI, la construccion de expresion se modifico con elementos geneticos que permiten la transferencia, propagacion y control de la expresion en el huesped heterologo. Para la transferencia a traves de la conjugacion, se anade un origen de transferencia (oriT) a la construccion de expresion. Para la propagacion de los genes de AGPI en la celula huesped, las construcciones de expresion se equiparon con un origen de replicacion, que es funcional en la cepa huesped, o la construccon de expresion se integro en el cromosoma huesped utilizando diversos metodos. Para integrar al azar los genes de AGPI en el cromosoma huesped por transposicion (Fu J, Nucleic Acids Res. 2008, 36:e113), el agrupamiento de genes biosinteticos de AGPI junto con un marcador de seleccion adecuado se flanquea por elementos de repeticion invertida (RIs) y la construccion de expresion contiene la transposasa del transposon marino pMycoMar (vease la Figura 2) (Rubin EJ, P. Natl. Acad. Sci. EE.UU. 1999, 96:1645-1650). La integracion dirigida en el cromosoma huesped se logro mediante la recombinacion homologa o por medio de sitios de union al fago especffico del huesped catalizados por integrasas dedicadas (p. ej., sitios de union mX8 o MX9 en mixobacterias (Magrini V. J. Bacteriol. 1999, 181:4050-4061; Julien B, J. Bacteriol. 2003, 185:6325-6330), o el sitio de uniorfPC31 en actinomicetos (Kieser T: Practical Streptomyces Genetics. Norwich, Inglaterra: Fundacion John Innes, 2000)).
5
10
15
20
25
30
35
40
45
50
55
60
65
Para permitir y/u optimizar la expresion heterologa, el agrupamiento de genes biosinteticos de AGPI se modifico por elementos geneticos de modificacion por ingenierfa genetica implicados en la transcripcion/traduccion (p. ej., modificacion por ingenierfa genetica de promotores o sitios de union al ribosoma) o mediante la adaptacion de los codones de genes de AGPI para el uso del codon del huesped heterologo. Para la expresion heterologa en mixobacterias, las estructuras promotoras nativas se intercambiaron con PT7A1, Pm, Ptet (vease la Figura 2), el promotor npt derivado de tn5 u otros promotores (p. ej., promotores que estimulan la expresion de las vfas del metabolito secundario nativo). Para optimizar el perfil de produccion de AGPI, se modificaron por ingenierfa genetica las maquinarias biosinteticas de AGPI mixobacterianas (p. ej., mutacion/insercion/delecion/intercambio de dominios catalfticos) mediante la modificacion de los genes biosinteticos.
Eiemplo 2: Transferencia del agrupamiento de genes en un organismo huesped para la produccion heterologa de AGPI
Las construcciones de expresion de los agrupamientos de genes biosinteticos de AGPI mixobacterianos se transfirieron a las cepas huesped heterologas mediante electroporacion, conjugacion u otros metodos de transformacion (p. ej., transformacion de protoplastos/esferoblastos o utilizando la competencia natural). Los transformantes se analizaron genotfpicamente para la presencia (y la integracion correcta) de las construcciones que contienen el gen de AGPI. Las cepas huesped que contienen los agrupamientos de genes biosinteticos de AGPI mixobacterianos se cultivaron en condiciones apropiadas (p. ej., para M. xanthus: medio CTT a 30 °C durante 2-4 dfas). La produccion de AGPI se analizo por cromatograffa de gases acoplada a espectrometrfa de masas (GC-MS) utilizando el metodo FAME, p. ej., analisis de esterificacion metflica de acidos grasos.
Ejemplo 3: Generacion de una construccion de expresion para el agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 mediante metodos de clonacion convencionales
El agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 se amplifico por PCR a partir de ADN cromosomico. Para ello, el agrupamiento de genes se dividio en varias regiones, que se amplificaron individualmente mientras que los sitios de restriccion adecuados se introdujeron con las secuencias de cebadores. En total, 7 fragmentos se amplificaron por PCR: el gen completo pfa1 sin su secuencia promotora nativa (1, Swal-Spel-pfa1-HpaI), el extremo 5' del gen pfa2 (2, HpaI-5'pfa2-HindIII), la seccion central del gen pfa2 (3, HindIII-CRpfa2-NheI), el extremo 3 del gen pfa2 (4, Nhel -3'pfa2-AseI), el extremo 5' del gen pfa3 (5, AseI-5'pfa3- HindIII), la seccion central del gen pfa3 (6, HindIII-CRpfa3-NheI), y el extremo 3' del gen pfa3 (7, NheI-3'pfa3-SspI- PacI). Los productos de PCR se subclonaron mediante metodos de restriccion y ligamiento convencionales en un vector de clonacion de copias elevado (p. ej., derivado de pUC18). La subclonacion del fragmento 1 condujo al plasmido pPfa1, la subclonacion de fragmentos 2-4 en el mismo vector genero el plasmido pPfa2 y la subclonacion de los fragmentos 5-7 en el mismo vector proporciono el plasmido pPfa3. En la siguiente etapa, los tres genes biosinteticos de AGPI (pfa1, pfa2 y pfa3) se subclonaron en el mismo plasmido. Para ello, los genes pfa2 y pfa3 se ligaron en el plasmido pPfa1 que alberga el gen pfa1 que genera la construccion pPfa1-2-3. Los elementos geneticos requeridos para la expresion de los genes pfa en el huesped heterologo (secuencias promotoras, genes reguladores, sitios de union al ribosoma) se ligaron a traves de los sitios de restriccion SwaI-Spel derivados del fragmento 1. Los casetes requeridos para la transferencia y la replicacion o integracion en el cromosoma huesped se introdujeron a traves de sitios de restriccion unicos del plasmido pPfa1-2-3.
Ejemplo 4: Generacion de una construccion de expresion para el agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 mediante tecnicas de recombinacion genetica
El agrupamiento de genes biosinteticos de AGPI se subclono directamente a partir de ADN cromosomico de A. fasciculatus DSM 21835 mediante tecnicas de recombinacion. Para ello, el ADN genomico se digirio con enzimas de restriccion de corte en las regiones flanqueantes del agrupamiento de genes biosinteticos de AGPI revelando una mezcla de fragmentos de ADN genomico. Un casete que contiene un origen de replicacion, asf como un marcador de seleccion (p. ej., p15Aori-cmR de pACYC184 o p15Aori-ampR de pACYC177) se amplifico por PCR y brazos de homologfa a ambos extremos del fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se introdujeron con la secuencia del cebador. Ademas, se introdujeron sitios de restriccion unicos (p. ej., PacI) para la subclonacion posterior de casetes de transferencia junto con el brazo de homologfa del extremo 3' del agrupamiento de genes. El fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se subclono a continuacion en el producto de PCR por recombinacion homologa doble in vivo. La construccion recombinante se modifico adicionalmente mediante una segunda etapa de doble recombinacion homologa para integrar un gen de resistencia amplificado por PCR y flanqueado por dos brazos de homologfa y sitios de restriccion (p. ej., SwaI y Spel) en el extremo 5' del agrupamiento de genes biosinteticos de AGPI. A continuacion, la construccion obtenida se modifico por ingenierfa genetica adicionalmente mediante metodos de clonacion convencionales para introducir casetes requeridos para la transferencia y la expresion heterologa: elementos geneticos requeridos para la expresion de los genes pfa en el huesped heterologo (secuencias promotoras, genes reguladores, sitios de union a ribosomas) se ligaron a traves de sitios de restriccion SwaI-Spel y casetes requeridos para la transferencia y replicacion o integracion en el cromosoma del huesped se introdujeron a traves de sitios de
5
10
15
20
25
30
35
40
45
50
55
60
65
Ejemplo 5: Transformacion del agrupamiento de genes biosinteticos de AGPI a partir de Aetherobacter fasciculatus DSM 21835 en organismos huesped y expresion heterologa
M. xanthus se cultivo en medio CTT (10 g/l de casitona, 10 ml/l de tampon Tris, 1 ml/l de tampon fosfato de potasio (pH 7,6; 86 ml de K2HPO4 1 M + 13,4 ml de KH2PO41 M), 10 ml/l de sulfato de magnesio 0,8 M) a 30 °C hasta que se alcanzo la DO600 de 0,5. 10 ml del cultivo bacteriano se centrifugaron a 13.000 rpm a 4 °C, el sedimento celular se lavo dos veces con agua destilada helada y finalmente se resuspendio en 40 pl de agua helada. La suspension celular se sometio a electroporacion con la construccion de expresion en una cubeta de electroporacion de 0,1 cm helada bajo las siguientes condiciones: 400 Q, 25 pF y 650 V para lograr una longitud de pulso de 8-9 ms. Despues, se anadio 1 ml de medio CTT y se incubaron las celulas durante 18 h a 30 °C. 3 ml de agar suave CTT (medio CTT mas 7,5 g/l de agar) que contiene 25 pl de 50 mg/ml de kanamicina se anadieron al cultivo y la mezcla se vertio sobre la superficie de placas de agar cTt (medio CTT mas 15 g/l de agar). Las placas se incubaron durante 3 dfas a 30 °C hasta que las colonias mutantes aparecieron. Los transform antes se analizaron luego genotfpica y fenotfpicamente.
Ejemplo 6: Produccion heterologa de AGPI
Mutantes de M. xanthus que albergan el agrupamiento de genes biosinteticos de AGPI se cultivaron en medio CTT suplementado con 50 pg/ml de kanamicina a 30 °C durante 3-5 dfas. El cultivo se centrifugo y se extrajeron los AGPI. Los acidos grasos celulares se extrajeron utilizando el metodo FAME [Bode HB et al. (2006) J. Bacteriol 188:6524-6528; Ring MW et al. (2006), J Biol Chem 281:36691-36700 (2006)]. Alfcuotas (1 pl) de los extractos se analizaron mediante GC-MS. Identificacion de los acidos grasos celulares incluyendo AEP y ADH: acidos grasos celulares incluyendo los AGPI omega-3 (AEP y ADH) se identificaron basandose en los patrones de fragmentacion y el tiempo de retencion. Estos acidos grasos (AG) se compararon con un patron de referencia de la mezcla por FAME (Sigma-Aldrich) que contiene 37 esteres metflicos de acidos grasos. La presencia de ADH y AEP se confirmo utilizando estandares de referencia de Sigma-Aldrich (cis-4,7,10,13,16,19-ADH, cis-5,8,11,14,17-AEP).
La construccion de acidos nucleicos para la expresion heterologa del agrupamiento de genes biosinteticos de AGPI a partir de Sorangium cellulosum So ce56 puede utilizarse para la expresion heterologa de los productos genicos sinteticos en las eubacterias o en otras mixobacteras, p. ej., Myxococcus xanthus DK1622.
La Fig. 3 muestra el resultado analftico de la produccion de AGPI por M. xanthus que contiene el agrupamiento de genes pfa1, pfa2, pfa3 de Soce56 (SEQ ID NO: 1) de una construccion de acido nucleico de acuerdo con la Fig. 2.
Como un ejemplo adicional para la produccion de AGPI utilizando un microorganismo productor que esta geneticamente manipulado para contener el agrupamiento de genes que codifica Pfa1, Pfa2 y Pfa3 para la expresion heterologa, M. xanthus se transformo con una construccion de acido nucleico como se muestra en la Fig. 4, que contenfa pfa1, pfa2, pfa3 clonado a partir de Aetherobacter SBSr002 (SEQ ID NO: 63, o alternativamente, SEQ ID NO: 67, SEQ iD NO: 69 y SEQ ID NO: 71). En detalle, el ADN genomico de DSM 21835 se digirio con el corte de ScaI en las regiones flanqueantes del agrupamiento de genes biosinteticos de AGPI revelando una mezcla de fragmentos de ADN genomico. Un casete que contiene un origen de replicacion p15A asf como un gen de resistencia a ampicilina (p15A ori-ampR de pACYC177) se amplifies por PCR y brazos de homologfa a ambos extremos del fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se introdujeron con la secuencia del cebador. Ademas, un sitio de restricdon unico PacI para la subdonacion posterior de casetes de transferencia se introdujo junto con el brazo de homologfa del extremo 3' del agrupamiento de genes. El fragmento de ADN genomico que alberga el agrupamiento de genes biosinteticos de AGPI se subclono a continuacion en el producto de PCR por doble recombinacion homologa in vivo. La construccion recombinante se modifico adicionalmente mediante una segunda etapa de doble recombinacion homologa para integrar un gen de resistencia a kanamicina, asf como un promotor Ptet amplificado por PCR y flanqueado por dos brazos de homologfa en el extremo 5' del agrupamiento de genes biosinteticos de AGPI. A continuacion, la construccion se modifico adicionalmente por ingenierfa genetica mediante metodos de clonacion convencionales: El casete zeoR-mx9 que contiene un gen de resistencia a zeocina y un gen que codifica la integrasa Mx9 con sitios de union correspondiente a fagos (attP) para la integracion en el cromosoma del huesped se introdujo a traves del sitio de restricdon unico PacI en el extremo 3' del agrupamiento de genes biosinteticos de AGPI. La construccion de expresion de AGPI se transforma entonces en M. xanthus DK1622. Los transformantes se analizaron genotfpica y fenotfpicamente. Los transformantes de M. xanthus que albergan el agrupamiento de genes biosinteticos de AGPI se cultivaron en medio CTT suplementado con 60 pg/ml de kanamicina y 20 pg/ml de zeocina a 30 °C durante 2-3 dfas. El cultivo se centrifugo y se extrajeron los AGPI, se esterificaron y se analizaron por GC-MS.
Como un ejemplo adicional para la producdon de AGPI mediante el cultivo de un organismo de produccion en un proceso de la invencion, se utilizo un biorreactor agitado de 10 l (Biostat E, Braun Melsungen) para cultivar la cepa de M. xanthus que alberga el agrupamiento de genes de AGPI de Soce56, y por separado M. xanthus que alberga el agrupamiento de genes de AGPI de Aetherobacter fasciculatus, cada una como se describe en la presente memoria, en el medio apropiado a 2 l/min de aireacion, agitacion a 120 rpm a 28 °C durante 5 a 7 dfas. Para la inoculacion, se
5
10
15
20
25
30
35
40
utilizaron precultivos en matraces de agitacion durante 72 h. Los analisis de AGPI metilado mostraron 0,4 a 1,6 % de acido Y-linolenico para cada cepa y 0,6 % de ADH para M. xanthus que expresa el agrupamiento de genes de A. fasciculatus en la biomasa seca.
Ejemplo 7: Comparacion de secuencias
Los dominios catalfticos en las nuevas sintasas de AGPI mixobacterianas se anotaron utilizando diversas herramientas bioinformaticas que se enumeran en la seccion siguiente, donde ER = enoil reductasa, CS = p-cetoaal sintasa, MAT = malonil/acetil transferasa, PPA = protefna transportadora de acilos, CR = p-cetoacilrreductasa, DH = p-hidroxiacil deshidratasa:
el dominio Pfa1_ER se anoto por alineamientos con las secuencias correspondientes de Shewanella sp. SCRC- 2738, Moritella marina MP-1, Photobacterium proiundum TC 9, y Schizochytrium sp. CACT_20888. Pfa2_CS-MAT-PPAs-CR se anoto con el analisis PKS/NRPS de Jacques Ravel, sitio web (
http://nrps.igs.umaryland.edu/nrps/).
Pfa2_DH se anoto por alineamientos con las secuencias correspondientes de Shewanella sp. SCRC-2738, Moritella marina MP-1, Photobacterium proiundum SS9, y Schizochytrium sp. CACT_20888.
Pfa3_CS-FLC-DH-DH se anoto con la busqueda de secuencias Pfam (
http://pfam.sanger.ac.uk/).
Pfa3_AT se anoto por alineamientos con las secuencias correspondientes de Shewanella sp. SCRC-2738, Moritella marina MP-1, Photobacterium proiundum SS9, y Schizochytrium sp. CACT_20888. En una busqueda de secuencias BlastP (Instituto Nacional del Cancer, EE. Uu.:
http://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Proteins) y Pfam (version 24.0; The Wellcome Trust Sanger Institute, Cambridge, RU:
http://pfam.sanger.ac.uk/), el acierto mas significativo representa un dominio AT, pero puede ser que sirva a otra funcion. Los dominios actualmente adicionales no identificados pueden codificarse en los genes descritos en la presente memoria. Ademas de las diferencias de organizacion entre los agrupamientos de genes, las regiones funcionales comparables en los agrupamientos de genes mixobacterianos, como se define en la Figura 1, muestran un nivel inesperadamente bajo de identidad de secuencias en la protefna, asf como en el nivel de ADN con respecto a los genes biosinteticos de AGPI conocidos (tabla 1) como se muestra en las tablas 2 y 3. La similitud de secuencias entre los genes de AGPI mixobacterianos de la invencion es en general mas alta (vease la tabla 4).
Tabla.1::^gru2am^^osd:egenes.b|o|i^B^:osconocidoscom2ara^/os.que_co^f^|n:AGPI^^^i|as
Cepa
| N° de acceso a GenBank Producto Referenda
Metz, Science 2001, 293:
Shewanella sp.
U73935.1 APE/ADP 290-293
SCRC-2738
Takeyama, Microbiol. 1997, 143:2725-2731 Tanaka, Biochem. Soc.
Moritella marina
Trans. 2000, 28:943-945:
MP-1 CACT_15381
AB025342.2 ADH Morita, Biotecnhol. Lett. 1999, 21:641-646
Photob acterium
AF409100.1 APE Allen, Microbiol. 2002,
profundum SS9
AF378327.2 148:1903-1913
Schizochytrium sp.
AF378328.2 ADH/ADP Metz, Science 2001
CACT_20888
AF378329.2
Numero de acceso a BLAST de Sorangium cellulosum Soce56: YP001611455.1
La siguiente comparacion de secuencias de las secuencias (AGPAT) del dominio IV* mixobacteriano del agrupamiento de genes de AGPI de Sorangium cellulosum So CE56 (= So ce56) y AGPAT de Aetherobacter fasciculatus DSM 21835 (= A. fasciculatus) con las secuencias correspondientes de los microorganismos comparativos Methylibium petroleiphilum PM1 (1a lfnea de cada cuadro) Clostridium sp. 7_2_43FAA (2a lfnea de cada cuadro), Talaromyces stipitatus CACT 10500 (3a lfnea de cada cuadro), y Pseudomonas putida GB-1 (4a lfnea de cada cuadro) muestran cada una importantes diferencias en las secuencias, tanto a nivel de ADN como proteico.
Tabla 2: Comparacion de secuencias del dominio IV* con dominios conocidos
Bloque superior: So ce56 frente a microorganismos comparativos Bloque inferior: A. fasciculatus frente a microorganismos comparativos
Tipo
herramienta Dominio IV*
55,1
Identidad por pares de ADN [%]
Geneious 15,8 49,4
53,7
Tipo
herramienta Dominio IV*
ClustalW 50,2 35.4 43.4 47,6
Identidad proteica [%]
ClustalW 9 8 8 8
Similitud proteica [%]
ClustalW 14 15 16 13
tipo
herramienta Dominio IV*
Identidad por pares de ADN [%]
Geneious 53,2 57,1 48,5 52,0
ClustalW
49,5 33,2 39,4 47,7
Identidad proteica [%]
ClustalW 14 12 16 17
Similitud proteica [%]
ClustalW 23 22 28 26
Las identidades y similitudes mas bien bajas del dominio IV* de Sorangium y Aetherobacterrespecto a los dominios funcionalmente similares de organismos conocidos muestran que los genes sinteticos utilizados en la invencion difieren significativamente de los genes previamente conocidos.
5
Comparacion de los dominios genicos de AGPI mixobacterianos y dominios de proteinas con genes/protefnas de AGPI bacterianos comparativos
La comparacion de la secuencia de la tabla 3 de los dominios de genes de AGPI de la invencion con dominios 10 homologos de microorganismos conocidos muestra importantes diferencias de secuencia entre los genes de la invencion y los genes conocidos, tanto a nivel de ADN como proteico.
Tabla 3: Comparacion de secuencias con genes comparativos
tipo
herramienta Regiones de agrupamientos de AGPI
I
IIa IIb IIc IIIa IIIb IV* vs. IV
Identidad por pares de ADN [%]
Geneious 53,6 53,5 52,4 50,2 50.0 51.1 55,2 50,9 53,7 48.1 46,3 47.2 47,0 44,6 46,5 50,3 46,7 49,5 46.8 45,0 45.8
ClustalW
51,8 50,1 50,3 46,6 45,9 47,1 53,0 49,4 50,3 43,4 41,8 43,1 42,8 40,4 42,2 45,9 41.5 42.6 401 37,8 37,6
Identidad proteica [%]
ClustalW 45 44 44 37 35 36 41 39 41 21 26 25 23 22 24 31 28 31 9 11 12
Similitud proteica [%]
ClustalW 65 63 64 51 51 51 56 56 56 34 40 38 36 35 38 44 42 44 23 25 26
tipo
herramienta I IIa IIb IIc IIIa IIIb IV IV* vs. IV
Identidad por pares de ADN [%]
Geneious 53,1 50,2 58,6 48,5 47,6 49,4 48,2 46,8
5
10
15
20
25
30
35
40
45
50
tipo
herramienta I IIa IIb IIc IIIa IIIb IV IV* vs. IV
51,8 49,9 54,8 46,9 45,8 47,2 45,4 46,7
53,6 50,9 57,5 47,2 46,4 49,1 47,6 45,9
50,5 46,0 54,6 42,9 43,9 45,3 43,4 40,4
ClustalW 49,1 47,2 52,5 40,9 42,0 41,7 39,7 38,5
51,7 47,3 54,3 42,1 42,3 45,0 40,9 39,9
Identidad proteica [%]
45 36 26 22 24 23 8 8
ClustalW 44 36 30 24 23 23 8 8
44 37 29 24 25 25 9 9
Similitud proteica [%]
64 50 34 35 38 36 16 16
ClustalW 63 50 41 38 37 36 14 15
63 51 37 36 39 35 16 18
Bloque superior: So ce56 comparada con los genes de AGPI de Shewanella (Ia linea de cada cuadro), Moritella marina (2a linea de cada cuadro), Photobacterium profundum (3a linea de cada cuadro),
Bloque inferior: A. fasciculatus comparada con los genes de AGPI de Shewanella (1a linea de cada cuadro), Moritella marina (2a linea de cada cuadro), Photobacterium profundum (3a linea de cada cuadro.)
f Los alineamientos se realizaron con el programa Geneious como se especifica en la presente memoria.
$ Definicion de las regiones alineadas:
Generalmente, los dominios del agrupamiento de genes de Soce y Aetherobacter (SBSr002) son como se describen en la breve descripcion del listado de secuencias.
Dominio I (comparacion de secuencias de ADN): la secuencia completa del gen de pfal de Soce56 y pfal de A. fasciculatus (SBSr002) se alineo contra las secuencias completas de genes de pfaD (= orf8) de Shewanella sp. SCRC-2738 (n.° acceso: U73935.1/30.730-32.361 nt), orf11 de Moritella marina MP-1 (n.° acceso: AB025342.2/27.119-28.735 nt) y pfaD de Photobacterium profundum SS9 (n.° acceso: AF409100.1/23.166-24.800 nt).
Dominio I (comparacion de secuencias proteicas): las secuencias de protefnas completas de Pfa1 de Soce56 o Pfa1 de A. fasciculatus se alinearon contra las secuencias de protefnas completas de PfaD (= orf8) de Shewanella sp. SCRC-2738 (n.° acceso: AAB81126.1/1-543 aa), Orf11 de Moritella marina MP-1 (n.° acceso: bAa89385.1/1-538 aa) y PfaD de Photobacterium profundum SS9 (n.° de acceso: AAL01063.1/1-544 aa).
Dominio IIa (comparacion de secuencias de ADN): el gen pfa2 de Soce56 y el gen pfa2 de A. fasciculatus se alinearon con el gen pfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1), con respecto al gen orf de Moritella marina MP-1 (n.° de acceso: AB025342.2) y al gen pfaA de Photobacterium profundum SS9 (n.° de acceso: AF409100.1).
Dominio IIa (comparacion de secuencias proteicas): la protefna Pfa2 de So ce56 y la protefna Pfa2 de A. fasciculatus se alinearon contra la protefna PfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81123.1), el extremo N-terminal de la protefna Orf8 de Moritella marina MP-1 (n.° de acceso: BAA89382.2) y el extremo N- terminal de la protefna PfaA de Photobacterium profundum SS9 (n.° de acceso: AAL01060.1).
Dominio IIb de (comparacion de secuencias de ADN): el gen pfa2 de So ce56 se alineo contra la seccion central del gen pfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1), el gen orf8 de Moritella marina MP-1 (n.° de acceso: AAB025342.2) el gen pfaA de Photobacterium profundum SS9 (n.° de acceso: AF409100.1).
Dominio IIb (comparacion de secuencias proteicas): la protefna Pfa2 de So ce56 se alineo contra la seccion central de la protefna PfaA (= orf5) de Shewanella sp. ScRc-2738 (n.° de acceso: AAB81123.1/1.244-1.747 aa), la seccion central de la protefna Orf8 de Moritella marina MP-1 (n.° de acceso: BAA89382.2/1.251-1734 aa) y la seccion central de la protefna PfaA a partir de Photobacterium profundum SS9 (n.° de acceso: AAL01060.1/1.227-1.700 aa).
Dominio IIc (comparacion de secuencias de ADN): el gen pfa2 de So ce56 y el gen pfa2 de A. fasciculatus se alinearon contra el extremo 3' del gen pfaA (= orf5) a partir de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/19.147-22.176 nt), el extremo 3' del gen orf8 de Moritella marina MP-1 (n.° de acceso: AB025342.2/15.213-17.969 nt) y el extremo 3' del gen pfaA de Photobacterium profundum SS9 (n.° de acceso: AF409100.1/12.554-15.175 nt).
Dominio IIc (comparacion de secuencias proteicas): la protefna Pfa2 de So y la protefna Pfa2 de A. fasciculatus se alinearon contra el extremo C-terminal de la protefna PfaA (= orf5) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81123.1/1.748-2.756 aa), el extremo C-terminal de la protefna orf8 de Moritella marina MP-1 (n.° de acceso: BAA89382.2/1.735-2.652 aa) y el extremo C-terminal de la protefna PfaA de Photobacterium profundum SS9 (n.° de
5
10
15
20
25
30
35
40
45
50
acceso: AAL01060.1/1.701-2.573 aa).
Dominio Ilia (comparacion de secuencias de ADN): el gen pfa3 de So ce56 y el extremo 5' del gen pfa3 de A. fasciculatusse alinearon contra el extremo 5' del gen de pfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/24.518-27.868 nt), el extremo 5' del gen orf10 de Moritella marina MP-1 (n.° de acceso: AB025342.2/20.847-24.044 nt) y el extremo 5' del gen pfaC de Photobacterium profundum SS9 (n.° de acceso: AF409100.1/17.271-20.528 nt).
Dominio Ilia (comparacion de secuencias proteicas): la protefna Pfa3 de So ce56 y la protefna Pfa3 de A. fasciculatus se alinearon contra el extremo N-terminal de la protefna pfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81125.1/1-1.117 aa), el extremo N-terminal de la protefna Orf10 de Moritella marina MP-1 (n.° de acceso: BAA89384.1/1-1.066 aa) y el extremo N-terminal de la protefna de PfaC de Photobacterium profundum SS9 (n.° de acceso: AAL01062.1/1-1.086 aa).
Dominio lllb (comparacion de secuencias de ADN): el gen pfa3 de Soce56 y el gen pfa3 de A. fasciculatus se alinearon contra el extremo 3' del gen de pfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/27.869-30.532 nt), el extremo 3' del gen orf10 gen de Moritella marina MP-1 (n.° de acceso: AB025342.2/24.045-26.882 nt) y el extremo 3' del gen pfaC de Photobacterium profundum SS9 (n.° de acceso: AF409100.1/20.529-23.147 nt).
Dominio lllb (comparacion de secuencias proteicas): la protefna Pfa3 de So ce56 y la seccion central de la protefna Pfa3 de A. fasciculatus se alinearon contra el extremo C-terminal de la protefna PfaC (= orf7) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81125.1/1.118-2.004 aa), el extremo C-terminal de la protefna Orf10 de Moritella marina MP-1 (n.° de acceso: BAA89384.1/1.067-2.011 aa) y el extremo C-terminal de la protefna PfaC de Photobacterium profundum SS9 (n.° de acceso: AA_01062.1/1.087-1.958 aa).
Dominio lV* (comparacion de secuencias de ADN): el pfa3 de So ce56 y el extremo 3' del gen pfa3 de A. fasciculatus se alinearon contra las secuencias de genes completas de pfaB (= orf6) de Shewanella sp. SCRC-2738 (n.° de acceso: U73935.1/22.176-24.518 nt), orf9 de Moritella marina MP-1 (n.° de acceso: AB025342.2/18.126-20.723 nt) y pfaB de Photobacterium Profundum ES9 (n.° de acceso: AF409100.1/15.175-17.274 nt).
Dominio lV* (comparacion de secuencias proteicas): la protefna Pfa3 de Soce56 y la protefna Pfa3 de A. fasciculatus se alinearon contra las secuencias de protefnas completas de PfaB (= orf6) de Shewanella sp. SCRC-2738 (n.° de acceso: AAB81124.1/1-780 aa), de Orf9 Moritella marina MP-1 (n.° de acceso: BAA89383.1/1-865 aa) y PfaB de Photobacterium Profundum Es9 (n.° de acceso: AAL01061.1/1-699 aa).
La Figura 1 muestra las regiones antes definidas l, lla, llb, llc, llla, lV si es aplicable, lllb y lV*.
De nuevo, la comparacion de secuencias de dominios de genes de AGPl de Soce56 y Aetherobacter con las de Schizochytrium muestra la homologfa de secuencia muy baja de los genes de la invencion con respecto a los genes conocidos de la sfntesis de AGPl.
Tabla 4: Comparacion de secuencias de genes/protefnas de AGPl mixobacterianos con genes/protefnas de AGPl a partir de Schizochytrium sp.
Bloque superior: Soce56 frente a Schizochytrium sp.
Bloque inferior: A. fasciculatus frente a Schizochytrium sp*.
tipo
herramienta Dominio del agrupamiento de AGPl$
la
lb lla llb llc llla lllb lV* vs. lV
ldentidad por pares de ADN [%]
Geneious 59,2 61,4 55,6 60,9 56,7 52,9 54,1 “510
ClustalW
55,8 58,8 51,5 57,4 52,6 48,5 50,0 43,3
ldentidad proteica [%]
ClustalW 37 38 30 32 26 22 26 10
Similitud proteica [%]
ClustalW 57 57 44 42 39 34 38 20
tipo
herramienta la lb lla llb llc llla lllb lV lV* vs. lV
ldentidad por pares de
Geneious 58,3 61,3 55,9 62,8 56,7 52,8 54,9 53,2 51,1
ADN [%]
ClustalW 55,6 59,0 52,2 61,7 51,9 49,7 49,3 50,1 45,5
ldentidad proteica [%]
ClustalW 40 41 29 15 26 23 21 16 11
Similitud proteica [%]
ClustalW 57 58 43 21 42 35 31 26 22
$ Definicion de los dominios alineados: Los dominios del agrupamiento de genes de Soce56 y Aetherobacter (SBSr002) son como se describen en la breve descripcion del listado de secuencias.
5
10
15
20
25
30
35
40
45
50
55
60
65
Los dominios comparativos de Schizochytrium fueron:
Dominio Ia (comparacion de secuencias de ADN): extremo 3' del gen orfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378328.2/4.500-6.180 nt).
Dominio la (comparacion de secuencias proteicas): extremo C-terminal de la protefna OrfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72880.2/1500-2059 aa).
Dominio lb (comparacion de secuencias de ADN): extremo 3' del gen orfC (= subunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378329.2/2.848-4.509 nt).
Dominio lb (comparacion de secuencias proteicas): extremo C-terminal de la protefna OrfC (= SubunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72881.2/950-1.502 aa).
Dominio lla (comparacion de secuencias de ADN): extremo 5' del gen orfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378327.2/1-3.699 nt).
Dominio lla (comparacion de secuencias proteicas): seccion del extremo N-terminal de la protefna OrfA (= SubunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72879.2/1-1.233 aa).
Dominio llb (comparacion de secuencias de ADN): Gen orfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378327.2/3.700-6.198 nt).
Dominio llb (comparacion de secuencias proteicas): la protefna OrfA (= SubunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72879.2/1.234-2.066 aa).
Dominio llc (comparacion de secuencias de ADN): extremo 3' del gen orfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378327.2/6.199-8.733 nt).
Dominio llc (comparacion de secuencias proteicas): seccion del extremo C-terminal de la protefna OrfA (= subunidadA) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72879.2/2.067-2.910 aa).
Dominio llla (comparacion de secuencias de ADN): extremo 5' del gen orfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378328.2/1-3.150 nt).
Dominio llla (comparacion de secuencias proteicas): seccion del extremo N-terminal de la protefna OrfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72880.2/1-1.050 aa).
Dominio lllb (comparacion de secuencias de ADN): extremo 5' del gen orfC (= subunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378329.2/1-2.847 nt).
Dominio lllb (comparacion de secuencias proteicas): seccion del extremo N-terminal de la protefna OrfC (= subunidadC) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72881.2/1-949 aa).
Dominio lV (comparacion de secuencias de ADN): la region central del gen orfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AF378328.2/3.151-4.497 nt) se compare con el dominio lV* de Sorangium, y con los dominios lV y lV* de Aetherobacter, respectivamente.
Dominio lV (comparacion de secuencias proteicas): la region central de la protefna OrfB (= subunidadB) de Schizochytrium sp. CACT_20888 (numero de acceso: AAK72880.2/1.051-1.499 aa) se comparo con el dominio lV* de Sorangium, y con los dominios lV y lV* de Aetherobacter, respectivamente.
Una comparacion de secuencias entre los genes de AGPl en el nivel de ADN y de protefna muestra importantes homologfas de secuencia entre los dominios, genes y agrupamientos de genes de la invencion, en especial en el grupo de los dominios, genes y agrupamientos de genes de Sorangium, y en el grupo de los dominios, genes y agrupamientos de genes de Aetherobacter, respectivamente.
La Tabla 5 muestra a continuacion el resultado de la comparacion de secuencias para los dominios de Aetherobacter SBSr002 y SBSr008 (bloque superior), para los dominios de Aetherobacter SBSr002 y SBSr003 (bloque medio), y para los dominios de Aetherobacter SBSr008 y SBSr003 (bloque inferior).
La Tabla 6 muestra a continuacion el resultado de la comparacion de secuencias para los dominios de Sorangium, Soce56 y Soce377.
Los dominios utilizados en estas comparaciones son los descritos en el listado de secuencias.
Tabla 5: Comparacion de aenes/proteinas de AGPI micobacterianos de Aetherobacter
tipo
herramienta Dominios de los agrupamientos de AGPI
I
IIa IIb IIc IIIa IIIb IV IV* vs. IV
Identidad por pares de ADN [%]
Geneious 99,0 97,8 95,9 96,3 98,6 96,9 98,3 96,8
ClustalW
99,0 97,8 95,9 96,3 98,6 96,9 98,3 96,8
Identidad proteica [%]
ClustalW 99 97 99 96 98 96 98 95
Similitud proteica [%]
ClustalW 99 98 99 97 98 97 99 98
tipo
herramienta I IV*
Identidad por pares de ADN [%]
Geneious 92,3 85,6
ClustalW
92,3 85,4
Identidad proteica [%]
ClustalW 94 84
Similitud proteica [%]
ClustalW 96 88
tipo
herramienta I IV*
Identidad por pares de ADN [%]
Geneious 92,5 85,9
ClustalW
92,5 85,5
Identidad proteica [%]
ClustalW 94 84
Similitud proteica [%]
ClustalW 97 89
5 Tabla 6: Comparacion de aenes/proteinas de AGPI micobacterianos de Sorangium
tipo
herramienta Dominios de los agrupamientos de AGPI
I
IIa IIb IIc IIIa IIIb IV*
Identidad por pares de ADN [%]
Geneious 98,2 95,8 91,1 97,8 96,1 97,0 96,9
ClustalW
98,2 95,8 91,1 97,8 95,9 97,0 96,9
Identidad proteica [%]
ClustalW 98 94 90 97 94 95 97
Similitud proteica [%]
ClustalW 99 96 91 97 95 96 98
Estos analisis muestran los grados significativos de identidad de los dominios del agrupamiento de genes de AGPI para los grupos de genes de Sorangium y para el grupo de genes de Aetherobacter, respectivamente, en 10 combinacion con un grado significative de identidad de secuencia encontrado entre Sorangium y Aetherobacter, especialmente con respecto al dominio IV*.
Ademas, los dominios del agrupamiento de genes sinteticos de AGPI de Sorangium y Aetherobactertienen una alta identidad y similitud de protefnas como se muestra en la Tabla 7 a continuacion, que es, p. ej., significativamente 15 mayor que la identidad y similitud de protefnas, respectivamente, de Sorangium y Aetherobacter hacia las regiones y dominios de organismos conocidos pertinentes, p. ej., hacia los dominios funcionalmente similares de Shewanella, Moritella marina, y Photobacterium profundum como se muestra en la tabla 3, y hacia Schizochytrium como se muestra en la tabla 4.
20 Tabla 7: Comparacion de genes/protefnas de AGPI mixobacterianos de Sorangium y Aetherobacter
tipo
herramienta Dominios de los agrupamientos de AGPI
I
IIa IIb IIc IIIa IIIb IV*
Identidad por pares de ADN [%]
Geneious 70,4 69,8 67,5 65,9 65,3 69,0 63,5
ClustalW
69,2 68,0 66,1 63,7 62,3 67,1 62,0
Identidad proteica [%]
Geneious 59 58 27 47 46 42 22
ClustalW
59 57 26 47 47 42 24
Similitud proteica [%]
Geneious 73 67 34 61 56 49 29
ClustalW
73 68 33 60 56 50 31
Por consiguiente, las enzimas de la via sintetica de AGPI de la invencion contienen un dominio que tiene actividad AGPAT y una secuencia de aminoacidos que es al menos 50 %, 85 %, 90 % o al menos 95 % identica a al menos 25 una secuencia de aminoacidos de un dominio IV* de Sorangium y/o de Aetherobacter como se describe en la presente memoria.

Claims (15)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    1. Proceso de produccion de acidos grasos poliinsaturados por expresion de genes heterologos de enzimas de la via biosintetica de acidos grasos poliinsaturados en un organismo de produccion, que comprende el cultivo del organismo de produccion en presencia de una fuente de carbono fermentable,
    - en el que el organismo de produccion se manipula geneticamente para comprender un primer gen, un
    segundo gen y un tercer gen,
    - en el que el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad de
    secuencia de aminoacidos de al menos el 59 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y
    - en el que el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoA-
    transacilasa que tiene una identidad de secuencia de aminoacidos de al menos el 57 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID NO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una protefna transportadora de acilos que tiene una identidad de secuencia de aminoacidos de al menos el 26 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 47 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y
    - en el que el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud de
    cadena que tiene una identidad de secuencia de aminoacidos de al menos el 46 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 42 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT) caracterizado por que la aciltransferasa codificada es una acil-glicerol-fosfato aciltransferasa (AGPAt) que tiene una identidad de secuencia de aminoacidos de al menos el 50 % con respecto a una secuencia de aminoacidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID nO: 169, y secuencias de aminoacidos codificadas por una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
  2. 2. Proceso de acuerdo con la reivindicacion 1, caracterizado por que el dominio IV* esta contenido en una secuencia de acidos nucleicos que codifica el producto genico Pfa3 que tiene una identidad de secuencia de aminoacidos de al menos el 28 % con respecto a una secuencia de aminoacidos contenida en el grupo que comprende SEQ ID NO: 10 y/o SEQ ID NO: 41, SEQ ID NO: 72, SEQ ID NO: 106 y/o SEQ ID NO: 146.
  3. 3. Proceso de acuerdo con la reivindicacion 1 o 2, caracterizado por que el tercer gen contiene un dominio IV que codifica una aciltransferasa (AT) que tiene una identidad de secuencia de aminoacidos de al menos el 98 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 93, SEQ ID NO: 127 y/o SEQ ID NO: 167, cuyo dominio IV se dispone entre el dominio IIIa y el dominio IIIb.
  4. 4. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el primer gen codifica una enoil reductasa que tiene una identidad de secuencia de aminoacidos de al menos el 30 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 6, SEQ ID NO: 37, SEQ ID NO: 68, SEQ ID NO: 102, SEQ ID NO: 132 y/o SEQ ID NO: 142.
  5. 5. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el segundo gen codifica una cetosintasa, una malonil-CoA-transacilasa, una protefna transportadora de acilos, una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 30 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 8, SEQ ID NO: 39, SEQ ID NO: 70, SeQ ID NO: 104 y/o SEQ ID NO: 144.
  6. 6. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el tercer gen codifica una cetosintasa, un factor de longitud de cadena, una deshidratasa, y la acil-glicerol-fosfato aciltransferasa (AGPAT) que tiene una identidad de secuencia de aminoacidos de al menos el 28 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 10, SEQ ID NO: 41, SEQ ID NO: 72, SeQ ID NO: 106 y/o SEQ ID NO: 146.
  7. 7. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el organismo de produccion se manipula geneticamente para codificar una protefna que tiene una identidad de secuencia de aminoacidos de al menos el 30 % con respecto a una secuencia de aminoacidos codificada por una secuencia de
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    ADN del grupo que consiste en SEQ ID NO: 1, SEQ ID NO: 32, SEQ ID NO: 63, SEQ ID NO: 97, SEQ ID NO: 137.
  8. 8. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que la identidad de secuencia de aminoacidos es de al menos el 60 %, de al menos el 85 %, de al menos el 90 % o de al menos el 95 %.
  9. 9. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que la fuente de carbono fermentable esta libre de acidos grasos.
  10. 10. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el acido graso poliinsaturado comprende al menos 3 grupos etilenicamente insaturados.
  11. 11. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el organismo de produccion se selecciona entre el grupo que consiste en eubacterias gramnegativas, eubacterias grampositivas, mixobacterias, hongos y levaduras
  12. 12. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que el organismo de produccion se selecciona entre el grupo que consiste en Yarrowia lipolytica o Pseudomonas putida.
  13. 13. Proceso de acuerdo con una de las reivindicaciones precedentes, caracterizado por que
    i) un acido graso poliinsaturado esta presente en al menos 40 % en peso basado en el peso total de todos los acidos grasos poliinsaturados contenidos en la composicion y/o
    ii) el acido graso poliinsaturado es acido eicosapentanoico (AEP), acido docosahexanoico (ADH), acido linoleico y/o acido linolenico.
  14. 14. Uso de un organismo de produccion, como se define en una cualquiera de las reivindicaciones 1 a 13, para la produccion de acidos grasos poliinsaturados.
  15. 15. Uso de un primer gen, de un segundo gen y de un tercer gen, para construir un organismo de produccion, en el que
    - el primer gen contiene un dominio I que codifica una enoil reductasa que tiene una identidad de secuencia de aminoacidos de al menos el 59 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 13, SEQ ID NO: 44, SEQ ID NO: 75, SEQ ID NO: 109, SEQ ID NO: 133 y/o SEQ ID NO: 149, y
    - el segundo gen contiene un dominio IIa que codifica una cetosintasa y una malonil-CoA-transacilasa que tiene una identidad de secuencia de aminoacidos de al menos el 57 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 16, SEQ ID NO: 47, SEQ ID nO: 78 y/o SEQ ID NO: 112, un dominio IIb que codifica al menos una protefna transportadora de acilos que tiene una identidad de secuencia de aminoacidos de al menos el 26 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 19, SEQ ID NO: 50, SEQ ID NO: 81, SEQ ID NO: 115 y/o SEQ ID NO: 155; y un dominio IIc que codifica una cetorreductasa y una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 47 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 22, SEQ ID NO: 53, SEQ ID NO: 84, SEQ ID NO: 118 y/o SEQ ID NO: 158; y
    - el tercer gen contiene un dominio IIIa que codifica una cetosintasa y un factor de longitud de cadena que tiene una identidad de secuencia de aminoacidos de al menos el 46 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 25, SEQ ID NO: 56, SEQ ID NO: 87, SEQ ID NO: 121 y/o SEQ ID NO: 161; y un dominio IIIb que codifica al menos una deshidratasa que tiene una identidad de secuencia de aminoacidos de al menos el 42 % con respecto a una secuencia de aminoacidos del grupo que contiene SEQ ID NO: 28, SEQ ID NO: 59, SEQ ID NO: 90, SEQ ID NO: 124 y/o SEQ ID NO: 164, y un dominio que codifica una aciltransferasa (AT), caracterizado por que la aciltransferasa codificada es una acil- glicerol-fosfato aciltransferasa (AGPAT) que tiene una identidad de secuencia de aminoacidos de al menos el 50 % con respecto a una secuencia de aminoacidos codificada por el dominio IV* contenido en el grupo que comprende SEQ ID NO: 30, SEQ ID NO: 61, SEQ ID NO: 95, SEQ ID NO: 129, SEQ ID NO: 135 y/o SEQ ID NO: 169, y secuencias de aminoacidos codificadas por una seccion de secuencia de acidos nucleicos contenida en el grupo que comprende SEQ ID NO: 29, SEQ ID NO: 60, SEQ ID NO: 94, SEQ ID NO: 128, SEQ ID NO: 134 y/o SEQ ID NO: 168.
ES11721794.3T 2010-05-31 2011-05-30 Producción de ácidos grasos por expresión heteróloga de agrupamientos de genes a partir de mixobacterias Active ES2633587T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20100005644 EP2390343A1 (en) 2010-05-31 2010-05-31 Production of fatty acids by heterologous expression of gene clusters from myxobacteria
EP10005644 2010-05-31
PCT/EP2011/058863 WO2011151298A1 (en) 2010-05-31 2011-05-30 Production of fatty acids by heterologous expression of gene clusters from myxobacteria

Publications (1)

Publication Number Publication Date
ES2633587T3 true ES2633587T3 (es) 2017-09-22

Family

ID=42790932

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11721794.3T Active ES2633587T3 (es) 2010-05-31 2011-05-30 Producción de ácidos grasos por expresión heteróloga de agrupamientos de genes a partir de mixobacterias

Country Status (7)

Country Link
US (2) US9127298B2 (es)
EP (2) EP2390343A1 (es)
JP (2) JP6200807B2 (es)
DK (1) DK2576799T3 (es)
ES (1) ES2633587T3 (es)
PT (1) PT2576799T (es)
WO (1) WO2011151298A1 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2367950T3 (en) 2008-12-01 2017-07-17 Univ Saarland PREPARATION OF OMEGA-3 FAT ACIDS USING MYXOBACTERIA
US10131897B2 (en) 2014-03-03 2018-11-20 Synthetics Genomics, Inc. Molecules associated with fatty acid biosynthetic pathways and uses thereof
CN104328145B (zh) * 2014-10-20 2017-05-17 南京大学 一种用基因工程大肠杆菌生产不饱和脂肪酸的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6451567B1 (en) 1988-09-07 2002-09-17 Omegatech, Inc. Fermentation process for producing long chain omega-3 fatty acids with euryhaline microorganisms
CA2395622A1 (fr) 2002-07-22 2004-01-22 Edwin Bourget Procede d'enrichissement en lipides et en acides gras omega-3 dans les cultures d'algues
EP1963481A2 (en) 2005-12-16 2008-09-03 Avestha Gengraine Technologies PVT Ltd Docosahexaenoic acid (dha) producing thraustochytrid strain - sc1
DK2367950T3 (en) 2008-12-01 2017-07-17 Univ Saarland PREPARATION OF OMEGA-3 FAT ACIDS USING MYXOBACTERIA

Also Published As

Publication number Publication date
EP2390343A1 (en) 2011-11-30
WO2011151298A1 (en) 2011-12-08
JP2016136962A (ja) 2016-08-04
JP2013529912A (ja) 2013-07-25
US20130196391A1 (en) 2013-08-01
US20160017388A1 (en) 2016-01-21
EP2576799A1 (en) 2013-04-10
US9574215B2 (en) 2017-02-21
DK2576799T3 (en) 2017-08-07
US9127298B2 (en) 2015-09-08
JP6200807B2 (ja) 2017-09-27
EP2576799B1 (en) 2017-04-26
PT2576799T (pt) 2017-07-13

Similar Documents

Publication Publication Date Title
US10246726B2 (en) Photosynthetic production of 3-hydroxybutyrate from carbon dioxide
JP7261815B2 (ja) ネルボン酸を生産する組換え酵母菌株およびその使用
CA2687523A1 (en) Chimeric pufa polyketide synthase systems and uses thereof
CN103842502A (zh) 制备具有改良的脂肪链长度和饱和度特性的脂肪酸及其衍生物
CN110157654A (zh) 一种纳豆芽孢杆菌重组菌及其构建方法与应用
CN105647822B (zh) 一株过表达来源于寄生疫霉的ω-3脱饱和酶的重组高山被孢霉、其构建方法及应用
US9574215B2 (en) Production of fatty acids by heterologous expression of gene clusters from myxobacteria
CN113817782B (zh) 一种庚二酸的全生物合成方法
Zhang et al. Manipulation of triacylglycerol biosynthesis in Nannochloropsis oceanica by overexpressing an Arabidopsis thaliana diacylglycerol acyltransferase gene
CN113286890A (zh) 脂氧合酶催化从多不饱和脂肪酸(pufa)产生不饱和c10-醛
CN102295691A (zh) Bccp2基因及其在提高植物及藻类油脂含量方面的应用
CN111094558A (zh) 对产生中链脂肪酸衍生物具有改善的活性的硫酯酶变体
JP6816970B2 (ja) 多価不飽和脂肪酸ポリケチドシンターゼ及びその利用
CN105861339B (zh) 一株过表达gtp 环式水解酶基因的重组高山被孢霉、其构建方法及应用
WO2022105841A1 (zh) 一种脂肪酸延长酶基因和酯化酶基因在酵母合成神经酸和油脂中的应用
JP4221476B2 (ja) イコサペンタエン酸生合成遺伝子群をクローニングしたプラスミド及びイコサペンタエン酸を産生するラン藻
WO1996021735A1 (fr) Genes codant un groupe d'enzymes de biosynthese pour l'acide icosapentaenoique (epa) et procede d'obtention dudit acide
JP6619229B2 (ja) アラキドン酸生産ポリケチドシンターゼ及びその利用
JP7009009B2 (ja) 高分子量コポリマーを合成するための遺伝子
KR101390327B1 (ko) 긴사슬 지방산 과발현용 형질전환 대장균의 제조방법
CN114891822B (zh) 高产γ-亚麻酸卷枝毛霉重组菌的构建方法、该方法构建的重组菌及应用
WO2017097218A1 (zh) 来源于寄生疫霉的用于合成多不饱和脂肪酸的ω-3脂肪酸脱饱和酶、含所述脂肪酸脱饱和酶的载体、重组微生物及其应用
JP2021524262A (ja) コリネ型細菌由来のD−キシロースデヒドロゲナーゼおよびD−キシロネートの生産(Herstellung)方法
KR20110002130A (ko) 부탄올 생성능을 가지는 재조합 미생물 및 이를 이용한 부탄올의 제조방법
CN110066812A (zh) 植物亚麻酸合成酶基因CsFAD2-2及其应用