ES2930286T3

ES2930286T3 - Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina

Info

Publication number: ES2930286T3
Application number: ES18192520T
Authority: ES
Inventors: Massimo Merighi; Ian Matthew Heidtman; John M Mccoy
Original assignee: Glycosyn LLC
Current assignee: Glycosyn LLC
Priority date: 2013-03-14
Filing date: 2014-03-14
Publication date: 2022-12-09
Anticipated expiration: 2034-03-14
Also published as: EP3467100B1; EP2970872B1; DK2970872T3; HUE060672T2; ES2700274T3; DE14769797T1; US11618912B2; US10415069B2; DK3467100T3; DK2970872T1; EP2970872A4; US20160024543A1; EP4166650A1; CA2904091A1; US20180057849A1; US20200190548A1; EP3467100A1; EP2970872A1; US9758803B2; WO2014153253A1

Abstract

La invención proporciona composiciones y métodos para diseñar bacterias para producir oligosacáridos sialilados y que contienen N-acetilglucosamina, y el uso de los mismos en la prevención o tratamiento de infecciones. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina Campo de la invención

La invención proporciona composiciones y métodos para producir oligosacáridos purificados; en particular, ciertos oligosacáridos que contienen N-acetilglucosamina y/o sialilados, que normalmente se encuentran en la leche humana.

Antecedentes de la invención

La leche humana contiene un conjunto diverso y abundante de oligosacáridos neutros y ácidos (oligosacáridos de la leche humana, hMOS). Muchas de estas moléculas no son utilizadas directamente por los bebés en su nutrición, pero, sin embargo, tienen un papel fundamental en el establecimiento de un microbioma intestinal sano, en la prevención de enfermedades y en la función inmunológica. Antes de la invención, la capacidad de producir hMOS de forma económica a gran escala, era problemática. Por ejemplo, la producción de hMOS a través de la síntesis química se ha visto limitada por problemas estéreo-específicos, disponibilidad de precursores, impurezas del producto y alto coste general. Como tal, existe una necesidad apremiante de nuevas estrategias para fabricar grandes cantidades de hMOS a bajo coste para una variedad de aplicaciones comerciales.

Sumario de la invención

La invención presenta métodos eficientes y económicos para producir oligosacáridos que contienen N-acetilglucosamina y/o sialilados. La invención se expone en el conjunto de reivindicaciones que se adjunta.

La invención proporciona un método para producir un oligosacárido que contiene N-acetilglucosamina en una bacteria que comprende las siguientes etapas: proporcionar una bacteria que comprenda un gen de UDP-GlcNA:Gala/p-R p 3-N-acetilglucosaminiltransferasa exógeno y una permeasa de lactosa funcional; y cultivar la bacteria en presencia de lactosa, en donde dicha bacteria comprende la sobreexpresión de

(a) un gen nagC, uno o más genes glm, o cualquier combinación de los mismos;

(b) un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;

(c) el gen nagC de E. coli;

(d) el gen nagC y el gen glmS;

(e) el gen nagC y el gen glmY; o

(f) el gen nagC y el gen glmZ. Después, el oligosacárido que contiene N-acetilglucosamina se obtiene de la bacteria o de un sobrenadante de cultivo de la misma.

La invención proporciona además un método para producir un oligosacárido sialilado en una bacteria, que comprende las siguientes etapas: proporcionar una bacteria que comprenda un gen exógeno de sialil-transferasa, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de permeasa lactosa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE), que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, y cultivar dicha bacteria en presencia de lactosa. Después, el oligosacárido sialilado se recupera de la bacteria o de un sobrenadante de cultivo de la misma. Específicamente, una capacidad sintética de ácido siálico comprende la expresión de CMP-Neu5Ac sintetasa exógena, una sintasa de ácido siálico exógena y una UDP-GlcNAc-2-epimerasa exógena, o una variante funcional o su fragmento.

En el método para producir oligosacáridos sialilados se prefiere que la bacteria comprenda además la capacidad de aumentar la producción de UDP-GlcNAc. Por "capacidad de aumentar la producción" se entiende que la bacteria hospedadora produce más del 10 %, 20 %, 50 %, 100 %, 2 veces, 5 veces, 10 veces o más, de un producto que la bacteria nativa, endógena. Preferentemente, la bacteria sobreexpresa un regulador endógeno positivo de la síntesis de UDP-GlcNAc. En ambos métodos de producción de oligosacáridos sialilados y/o que contengan N-acetilglucosamina, la bacteria sobreexpresa, por ejemplo, el gen nagC de Escherichia coli. Alternativamente, la bacteria sobreexpresa el gen glmS (L-glutamina:D-fructosa-6-fosfato aminotransferasa) de Escherichia coli, o alternativamente, sobreexpresa el gen glmY de Escherichia coli (un regulador positivo de la traducción de glmS), o alternativamente, sobreexpresa el gen glmZ de Escherichia coli (otro regulador positivo de la traducción de glmS, glmY y glmZ que se describen en Reichenbach et al., Nucleic Acids Res 36, 2570-80 (2008)). Alternativamente, en ambos métodos de producción de oligosacáridos sialilados y/o que contengan N-acetilglucosamina, la bacteria sobreexpresa cualquier combinación de tales enfoques. Por ejemplo, la bacteria sobreexpresa nagC y glmS. Alternativamente, la bacteria sobreexpresa nagC y glmY. Alternativamente, en ambos métodos de producción de oligosacáridos sialilados y/o que contengan N-acetilglucosamina, la bacteria sobreexpresa nagC y glmZ. Los métodos también incluyen la sobreexpresión de cualquier variante o fragmento funcional de nagC, glmS, glmY y glmZ y cualquier combinación de los mismos. Por "sobreexpresión" se entiende que la transcripción del gen o del producto genético codificado es un 10 %, 20 %, 50 %, 2 veces, 5 veces, 10 veces o más, que el nivel expresado o producido por el gen nativo, natural o endógeno correspondiente.

La descripción detalla la manipulación de genes y rutas en bacterias tales como la enterobacteria Escherichia coli K12 (E. coli), que conduce a un alto nivel de síntesis de hMOS. Otras cepas de E. coli adecuadas para su uso en la presente invención incluyen, E. coli MG1655, E. coli W3110, E. coli DHSaE, E. coli B, E. coli C y E. coli W. Varias especies bacterianas son adecuadas para su uso en los métodos de biosíntesis de oligosacáridos, por ejemplo, Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum o Xanthomonas campestris. Las bacterias del género Bacillus son adecuadas para su uso, incluyendo Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus y Bacillus circulans. De manera similar, las bacterias de los géneros, Lactobacillus y Lactococcus se modifican utilizando los métodos descritos, incluidos, entre otros, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispatus, Lactobacillus gasseri, Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii y Lactococcus lactis. Streptococcus thermophiles y Proprionibacterium freudenreichii también son especies bacterianas adecuadas para la invención. También se incluyen cepas, modificadas como se describe, de los géneros Enterococcus (p. ej., Enterococcus faecium y Enterococcus thermophiles), Bacteroides (p. ej., Bacteroides caccae, Bacteroides cellulosilyticus, Bacteroides dorei, Bacteroides eggerthii, Bacteroides finegoldii, Bacteroides fragilis, Bacteroides nordii, Bacteroides ovatus, Bacteroides salyersiae, Bacteroides thetaiotaomicron, Bacteroides uniformis, Bacteroides vulgatus y Bacteroides xylanisolvens), Bifidobacterium (p. ej., Bifidobacterium longum, Bifidobacterium infantis y Bifidobacterium bifidum), Parabacteroides (p. ej., Parabacteroides distasonis, Parabacteroides goldsteinii, Parabacteroides johnsonii y Parabacteroides merdae), Prevotella (p. ej., Prevotella copri), Sporolactobacillus spp., Micromomospora spp., Micrococcus spp., Rhodococcus spp. y Pseudomonas (p. ej., Pseudomonas fluorescens y Pseudomonas aeruginosa). Las bacterias que comprenden las características descritas en el presente documento se cultivan en presencia de lactosa, y se recupera un oligosacárido sialilado, o que contiene N-acetilglucosamina, ya sea de la propia bacteria o de un sobrenadante de cultivo de la misma. El oligosacárido sialilado, o que contiene N-acetilglucosamina, se purifica para su uso en productos terapéuticos o nutricionales, o las bacterias se utilizan directamente en dichos productos.

La bacteria comprende un gen endógeno de p-galactosidasa delecionado o inactivado (es decir, no funcional). Por ejemplo, el gen de la p-galactosidasa comprende un gen lacZ de E. coli (por ejemplo, con el número de registro del GenBank V00296.1 (Gl: 41901)). El gen lacZ endógeno de la E. coli se deleciona o se inactiva funcionalmente, pero de tal manera que la expresión del gen de la lactosa permeasa (lacY) en dirección 3' permanece intacta, es decir, en la bacteria también está presente un gen funcional de la lactosa permeasa. Por delecionado se entiende que falta una parte de la secuencia codificante o que falta toda la secuencia codificante, de manera que no se produce ningún producto génico. Un gen "inactivado" no produce ningún producto génico que funcione como el gen nativo, natural o endógeno. Por ejemplo, la actividad funcional de un producto génico de p-galactosidasa inactivado se reduce al 10 %, 20 %, 50 % o 100 %, 1 vez, 2 veces, 5 veces o 10 veces menos, que la actividad funcional del producto génico nativo, natural o endógeno.

El gen de la lactosa permeasa es un gen endógeno de la lactosa permeasa o un gen exógeno de la lactosa permeasa. Por ejemplo, el gen de la lactosa permeasa comprende un gen lacY de E. coli (por ejemplo, con el número de registro del GenBank V00295.1 (Gl:41897)). Muchas bacterias poseen la capacidad intrínseca de transportar lactosa desde el medio de crecimiento a la célula, utilizando una proteína transportadora que es un homólogo de la lactosa permeasa de E. coli (por ejemplo, como se encuentra en Bacillus licheniformis), o un transportador que es un miembro de la ubicua familia de transportadores de azúcar PTS (por ejemplo, como se encuentra en Lactobacillus casei y Lactobacillus rhamnosus). Para bacterias que carezcan de una capacidad intrínseca de transportar lactosa extracelular al citoplasma celular, esta capacidad la confiere un gen transportador de lactosa exógeno (por ejemplo, lacY de E. coli) proporcionado en construcciones de ADN recombinante, y se suministra en un vector de expresión plasmídico o como genes exógenos integrados en el cromosoma hospedador.

Para la producción de oligosacáridos que contengan N-acetilglucosamina, la bacteria comprende, además de la sobreexpresión de

(c) el gen nagC de E. coli;

(d) el gen nagC y el gen glmS;

(e) el gen nagC y el gen glmY; o

(f) el gen nagC y el gen glmZ, un gen de UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa exógeno o una variante funcional o su fragmento. Este gen exógeno de UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa se obtiene de una cualquiera de diversas fuentes, por ejemplo, el gen LgtA descrito de N. meningitides (SEQ ID NO: 16, registro de proteína del Genbank AAF42258.1) o de N. gonorrhoeae (registro de proteína del Genbank ACF31229.1). Además, comprende un gen de lactosa permeasa funcional. Opcionalmente, un gen adicional de glucosiltransferasa exógeno se coexpresa en la bacteria que comprende una UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa exógena. Por ejemplo, un gen de la p-1,4galactosiltransferasa se coexpresa con el gen de UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa. Este gen exógeno de p-1,4-galactosiltransferasa se obtiene de una cualquiera de diversas fuentes, por ejemplo, la descrita de N. meningitidis, el gen LgtB (registro de proteína del Genbank AAF42257.1), o de H. pylori, el gen Lex2B (SEQ ID NO: 17 registro de proteína del Genbank NP_207619.1). Opcionalmente, el gen exógeno adicional de glucosiltransferasa coexpresado en la bacteria que comprende un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa es un gen de p-1,3-galactosiltransferasa, por ejemplo, que se describe de E. coli O55:H7, el gen WbgO (SEQ ID NO: 18 registro de proteína del Genbank YP_003500090.1), o de H. pylori, el gen jhp0563 (registro de proteína del Genbank AEZ55696.1). En la presente invención también se incluyen variantes y fragmentos funcionales de cualquiera de las enzimas descritas anteriormente.

En una realización, los oligosacáridos que contienen N-acteilglucosamina, producidos por los métodos descritos en el presente documento, incluyen Lacto-N-triosa 2 (LNT2), Lacto-N-tetraosa (LNT), Lacto-N-neotetraosa (LNnT), Lacto-N- fucopentaosa I (Ln F I), Lacto-N-fucopentaosa II (LNF II), Lacto-N-fucopentaosa III (LNF III), Lacto-N-fucopentaosa V (LNF V), Lacto-N-difucohexaosa I (LDFH I), Lacto-N-difucohexaosa II (LDFH II) y Lacto-N-neodifucohexaosa II (LFNnDFH II).

Para la producción de sialil-oligosacáridos, la bacteria comprende un gen exógeno de sialil-transferasa, además de una ruta catabólica deficiente en ácido siálico y una capacidad sintética de ácido siálico. Por ejemplo, el gen de sialiltransferasa exógeno codifica a(2,3) sialil-transferasa o el gen de sialil-transferasa exógeno codifica a(2,6) sialiltransferasa o el gen de sialil-transferasa exógeno codifica a(2,8) sialiltransferasa. Adicionalmente, se incluye un gen funcional de lactosa permeasa. Los genes exógenos de sialil-transferasa se obtienen de una cualquiera de varias fuentes, por ejemplo, las descritas de N. meningitidis, N. gonorrhoeae, y de varios organismos del género Photobacterium. Ejemplos de a(2,8) sialiltransferasas, útiles para la producción de ácido polisialico, se encuentran, por ejemplo, en Campylobacter jejuni (CstII: ADN52706) y en Neisseria meningitides (o siaD: AAA20478).

Las bacterias utilizadas en el presente documento para producir hMOS, están modificadas por ingeniería genética para que comprendan un aumento de la reserva de lactosa intracelular (en comparación con el tipo natural) y para que comprendan la actividad de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y/o sialil-transferasa. Opcionalmente, también comprenden la actividad de p-1,4-galactosiltransferasa o p-1,3-galactosiltransferasa, y/o la actividad de a-1,2-, a-1,3- y/o a-1,4-fucosiltransferasa. En algunos casos, la bacteria comprende además un gen funcional de E. coli lacZ+ natural, insertado en un gen endógeno, por ejemplo, el gen lon en E. coli o el gen thyA en E. coli. De esta manera, la bacteria comprende además una mutación en un gen lon o una mutación en el gen thyA. En estos casos, el gen lacZ endógeno de la E. coli se elimina o se desactiva funcionalmente, pero de tal manera que la expresión del gen de la lactosa permeasa (lacY) en dirección 3' permanece intacta. El organismo manipulado de esta manera conserva la capacidad de transportar la lactosa desde el medio de crecimiento y de desarrollar una acumulación de lactosa intracelular para utilizar como un aceptor de azúcar en la síntesis de oligosacáridos, al tiempo que mantiene un bajo nivel de actividad de beta-galactosidasa intracelular útil para una variedad de fines. Por ejemplo, la invención también incluye: a) métodos para el marcado fenotípico de un locus genético en una célula hospedadora con p-galactosidasa negativa utilizando un inserto del gen de p-galactosidasa (p. ej., LacZ) diseñado para producir un nivel bajo, pero fácilmente detectable, de la actividad de la p-galactosidasa, b) métodos para detectar fácilmente la contaminación por bacteriófagos líticos en las series de fermentación mediante la liberación y detección de p-galactosidasa citoplásmica en el medio de cultivo celular y c) métodos para agotar un cultivo bacteriano de lactosa residual al final de las series de producción. a), b) y c) se logran utilizando un inserto génico de p-galactosidasa funcional (por ejemplo, lacZ) cuidadosamente diseñado para dirigir la expresión de un nivel bajo, pero detectable, de la actividad de p-galactosidasa en una célula hospedadora con p-galactosidasa negativa. Opcionalmente, la bacteria comprende además una mutación en un gen lacA. Preferentemente, la bacteria acumula un aumento de la acumulación de lactosa intracelular y produce un bajo nivel de beta-galactosidasa. Un aumento de la acumulación intracelular es cuando la concentración de lactosa en la bacteria hospedadora es al menos un 10 %, 20 %, 50 %, 2 veces, 5 veces o 10 veces más alta, que la de la bacteria nativa o natural.

En un aspecto, el oligosacárido de la leche humana producido por bacterias modificadas genéticamente comprende una molécula de ácido nucleico exógena que codifica una UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un ácido nucleico exógeno que codifica la p-1,4-galactosiltransferasa es la lacto-N-neotetraosa (LNnT). En otro aspecto, el oligosacárido de la leche humana producido por bacterias modificadas genéticamente comprende una molécula de ácido nucleico exógena que codifica una UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un ácido nucleico exógeno que codifica la p-1,3-galactosiltransferasa es la lacto-N-tetraosa (LNT).

En el presente documento se describen composiciones que comprenden una célula bacteriana que produce el oligosacárido de la leche humana LNnT (lacto-N-neotetraosa), en donde la célula bacteriana comprende una UDP-GlcNAc exógena:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un ácido nucleico exógeno que codifica una p-1,4-galactosiltransferasa. La célula bacteriana puede ser E. coli. El gen UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa exógeno se obtiene de una cualquiera de varias fuentes, por ejemplo, el gen LgtA descrito de N. meningitides. El gen de la p-1,4-galactosiltransferasa exógeno se obtiene de una cualquiera de varias fuentes, por ejemplo, la descrita de N. meningitidis, el gen LgtB, o de H. pylori, el gen jhp0765.

La bacteria comprende un aumento de la producción de UDP-GIcNAc. El medio para lograr esto es mediante la sobreexpresión de un regulador endógeno positivo de la síntesis de UDP-GlcNAc; es decir, la sobreexpresión del gen nagC de Escherichia coli.

En un aspecto, esta sobreexpresión de nagC se logra proporcionando copias adicionales del gen nagC en un vector plasmídico o integrando copias adicionales del gen nagC en el cromosoma de la célula hospedadora. Alternativamente, la sobreexpresión se logra modulando la fuerza de la secuencia de unión al ribosoma que dirige la traducción de nagC o modulando la fuerza de la transcripción de nagC que dirige el promotor. Además, la acumulación intracelular de UDP-GlcNAc puede mejorarse por otros medios, por ejemplo, por la sobreexpresión del gen glmS de Escherichia coli (L-glutamina:D-fructosa-6-fosfato aminotransferasa), o alternativamente por la sobreexpresión del gen glmY de Escherichia coli (un regulador de traducción positivo de glmS), o alternativamente mediante la sobreexpresión del gen glmZ de Escherichia coli (otro regulador de traducción positivo de glmS), o alternativamente utilizando simultáneamente una combinación de enfoques. En una realización preferida, por ejemplo, los genes nagC (SEQ ID NO: 19 registro de proteína del Genbank BAA35319.1) y glmS (^sE^qID NO: 20 registro de proteína del Genbank NP_418185.1) que codifican las secuencias proporcionadas en el presente documento, se sobreexpresan simultáneamente en la misma célula hospedadora para aumentar la acumulación intracelular de UDP-GlcNAc. Otros componentes del metabolismo de UDP-GlcNAc incluyen: (GlcNAc-1-P) N-acetilglucosamina-1-fosfato; (GlcN-1-P) glucosamina-1-fosfato; (GlcN-6-P) glucosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; y (Fruc-6-p) fructosa-6-fosfato. Las bacterias que comprenden las características descritas en el presente documento se cultivan en presencia de lactosa, y se recupera la lacto-N-neotetraosa, ya sea de la propia bacteria (es decir, mediante lisis) o de un sobrenadante de cultivo de la misma.

También se encuentra dentro de la invención una bacteria aislada de E. coli, como se describe anteriormente, y se caracteriza por que comprende un gen de p-galactosidasa endógeno delecionado o inactivado, un gen lacA inactivado o delecionado y un gen funcional de lactosa permeasa (lacY).

En el presente documento también se describen composiciones que comprenden una célula bacteriana que produce el oligosacárido de la leche humana 6'-SL (6'-sialil-lactosa), en donde la célula bacteriana comprende un gen de sialil-transferasa exógeno que codifica la a(2,6) sialil-transferasa. La célula bacteriana puede ser E. coli. El gen de sialil-transferasa exógeno utilizado para la producción de 6'-SL se obtiene de una cualquiera de varias fuentes, por ejemplo, las descritas de diversos organismos del género Photobacterium. En otro aspecto más, el oligosacárido de la leche humana producido por bacterias modificadas genéticamente que comprende una molécula de ácido nucleico exógena que codifica una a(2,3) sialiltransferasa es 3'-SL (3'-sialil-lactosa). El gen de la sialiltransferasa exógeno utilizado para la producción de 3'-SL se obtiene de una cualquiera de varias fuentes, por ejemplo, las descritas de N. meningitidis y N. gonorrhoeae.

Además, la bacteria contiene una ruta catabólica deficiente en ácido siálico. Por "ruta catabólica del ácido siálico" se entiende una secuencia de reacciones, generalmente controlada y catalizada por enzimas, que da como resultado la degradación del ácido siálico. En el presente documento se describe una ruta catabólica del ácido siálico ilustrativa en Escherichia coli. En la ruta catabólica del ácido siálico descrita en el presente documento, el ácido siálico (Neu5Ac; ácido N-acetilneuramínico) se degrada con las enzimas NanA (ácido N-acetilneuramínico liasa), NanK (N-acetilmanosamina quinasa) y NanE (N-acetilmanosamina-6-fosfato epimerasa), todas ellas codificadas en el operón nanATEKyhcH, y reprimidas por NanR (http://ecocyc.org/ECOLI). Una ruta catabólica deficiente en ácido siálico se diseña en Escherichia coli por medio de una mutación en los genes endógenos nanA (N-acetilneuraminato liasa) (por ejemplo, número de registro del GenBank D00067.1 (GI:216588)) y/o nanK (N-acetilmanosamina quinasa) (por ejemplo, número de registro del GenBank (aminoácido) BAE77265.1 (GI:85676015), y/o nanE (N-acetilmanosamina-6-fosfato epimerasa, GI: 947745). Opcionalmente, el gen nanT (transportador de N-acetilneuraminato) también está inactivado o mutado. Otros intermedios del metabolismo del ácido siálico incluyen: (ManNAc-6-P) N-acetilmanosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; (GlcN-6-P) glucosamina-6-fosfato; y (Fruc-6-p) fructosa-6-fosfato. En algunas realizaciones preferidas, nanA está mutado. En otras realizaciones preferidas, nanA y nanK están mutados, mientras que nanE sigue siendo funcional. En otra realización preferida, nanA y nanE están mutados, mientras que nanK no está mutado, inactivado o eliminado. Una mutación es uno o más cambios en la secuencia de ácido nucleico que codifica el producto génico de nanA, nanK, nanE y/o nanT. Por ejemplo, la mutación puede suponer 1, 2, 5, 10, 25, 50 o l0o cambios en la secuencia de ácido nucleico. Por ejemplo, nanA, nanK, nanE y/o nanT están mutados por una mutación nula. Las mutaciones nulas, como se describen en el presente documento, abarcan sustituciones, adiciones, eliminaciones o inserciones de aminoácidos que causan una pérdida de la función de la enzima (es decir, una actividad reducida o nula) o una pérdida de la enzima (es decir, ningún producto génico). Por delecionado se entiende que la región codificante se elimina en su totalidad o en parte, de manera que no se produce ningún producto génico. Por inactivado se entiende que la secuencia codificante se ha alterado de tal manera que el producto génico resultante es funcionalmente inactivo o codifica un producto génico con menos del 100 %, 80 %, 50 % o 20 % de la actividad del producto génico endógeno nativo o natural. Un gen o una proteína "no mutado(a)" no difiere de una secuencia codificante nativa, natural o endógena en 1, 2, 5, 10, 20, 50, 100, 200 o 500 codones más, o con respecto a la secuencia de aminoácidos codificada correspondiente.

Además, la bacteria (por ejemplo, E. coli) también comprende una capacidad sintética de ácido siálico. Por ejemplo, la bacteria comprende una capacidad sintética de ácido siálico a través de la provisión de una 2-epimerasa UDP GIcNAc exógena (por ejemplo, neuC de Campylobacter jejuni (SEQ ID NO: 13, GenBank AAK91727.1; GI:15193223) o equivalente (por ejemplo, neuC de E. coli S88 GenBank YP_002392936.1; GI:218560023), una Neu5Ac sintasa (por ejemplo, neuB de C. jejuni (SEQ ID NO: 14 AAK91726.1GenBank GI:15193222) o equivalente, (por ejemplo, sintasa del ácido siálico de Flavobacterium limnosediminis, GenBank GI:559220424), y/o una CMP-Neu5Ac sintetasa (por ejemplo, neuA de C. jejuni (SEQ ID NO: 15 GenBank AAK91728.1; GI:15193224) o equivalente, (p. ej., CMP-ácido siálico sintasa de Vibrio brasiliensis, GenBank GI:493937153). También se describen variantes funcionales y fragmentos.

La bacteria de la presente invención, que comprende una capacidad sintética de ácido siálico, tiene una producción mayor de UDP-GlcNAc por la sobrexpresión del regulador endógeno positivo de la síntesis de UDP-GlcNAc, nagC. Un medio ilustrativo para lograr esto es, p. ej., mediante la sobreexpresión simultánea de los genes nagC y glmS de Escherichia coli. Esta sobreexpresión de nagC y glmS se logra proporcionando copias adicionales de los genes nagC y glmS en un vector plasmídico, o integrando copias adicionales de los genes nagC y glmS en el cromosoma de la célula hospedadora. Alternativamente, la sobreexpresión se logra mediante la modulación de la fuerza de la secuencia de unión al ribosoma que dirige nagC (descrito por Sleight et al, Nucleic Acids Res. Mayo de 2010; 38 (8): 2624-2636) y/o la traducción de nagC y glmS, o mediante la modulación de la fuerza del promotor, o promotores, que dirige(n) la transcripción de nagC y glmS (Sleight et al, Nucleic Acids Res. Mayo de 2010; 38 (8): 2624-2636). Las bacterias que comprenden las características descritas en el presente documento se cultivan en presencia de lactosa y, en el caso en que las células comprendan una a(2,6) sialiltransferasa (por ejemplo, Photobacterium spp JT-ISH-224 (SEQ ID NO: 21 registro de proteína del Genbank BAF92026.1), se recupera 6'-sialil-lactosa, ya sea de la propia bacteria o de un sobrenadante de cultivo de la misma. En el caso en que las células comprendan una a(2,3) sialiltransferasa, (por ejemplo, Neisseria meningitidis 1 st (registro de proteína del Genbank NP273962.1) se recupera 3'-sialilactosa de la propia bacteria (por ejemplo, por lisis de la bacteria) o de un sobrenadante de cultivo de la misma.

También dentro de la invención se encuentra una bacteria aislada de E. coli que comprende un gen de pgalactosidasa endógeno delecionado o inactivado, un gen exógeno de sialil-transferasa, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de lactosa permeasa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuramina liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE) que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, en particular

(a) en donde dicha bacteria comprende además un gen de p-galactosidasa recombinante que proporciona un nivel bajo, pero detectable, de actividad de p-galactosidasa; o

(b) un gen exógeno de UDP-GlcNAc: Gala/p-R p 3-N-acetilglucosaminiltransferasa y un gen funcional de lactosa permeasa.

Se describe un oligosacárido purificado que contiene N-acetilglucosamina o sialilado producido por los métodos descritos anteriormente. Un oligosacárido purificado, por ejemplo, 6'-SL, es uno que es al menos 90 %, 95 %, 98 %, 99 % o 100 % (p/p) en peso del oligosacárido deseado. La pureza se evalúa mediante cualquier método conocido, por ejemplo, cromatografía de capa fina u otras técnicas electroforéticas o cromatográficas conocidas en la técnica. Se describe un método para purificar un oligosacárido que contiene N-acetilglucosamina o sialilado producido por la bacteria modificada genéticamente descrita con anterioridad, cuto método consiste en separar el oligosacárido sialilado o que contiene N-acetilglucosamina deseado (por ejemplo, 6'-SL) de contaminantes en un extracto o lisado de células bacterianas, o de un sobrenadante de cultivo de células bacterianas. Los contaminantes incluyen ADN bacteriano, proteínas y componentes de la pared celular, y productos glucídicos de color amarillo/pardo que algunas veces se forman en el medio de cultivo procedentes de reacciones químicas espontáneas.

Los oligosacáridos se purifican y se utilizan en diversos productos para el consumo humano y animal, como los animales de compañía (perros, gatos) y el ganado (bovino, equino, ovino, caprino o porcino, así como las aves de corral). Por ejemplo, una composición farmacéutica que comprende 6'-sialil-lactosa (6'-SL) purificada y un excipiente es adecuada para la administración oral. Se producen grandes cantidades de 6'-SL en hospedadores bacterianos, por ejemplo, una bacteria de E. coli que comprende una sialiltransferasa heteróloga, por ejemplo, una a(2,6) sialiltransferasa heteróloga. Una bacteria de E. coli que comprende una acumulación citoplásmica mejorada de cada uno de los siguientes: lactosa y CMP-Neu5Ac, es útil en tales sistemas de producción. En el caso de la lactosa, las rutas metabólicas y los genes endógenos de E. coli se manipulan de manera que se genere un aumento de las concentraciones citoplásmicas de lactosa, en comparación con los niveles encontrados en E. coli natural. Por ejemplo, las bacterias contienen al menos un 10 %, 20 %, 50 %, 2 veces, 5 veces, 10 veces o más, de los niveles en una bacteria natural correspondiente que carece de las modificaciones genéticas descritas anteriormente. En el caso de CMP-Neu5Ac, los genes endógenos del catabolismo de Neu5Ac están inactivados y los genes exógenos de la biosíntesis de CMP-Neu5Ac, introducidos en E. coli, dan como resultado la generación de una reserva citoplásmica de CMP-Neu5Ac que no se encuentra en la bacteria natural.

Un método para producir una composición farmacéutica que comprende una hMOS purificada se lleva a cabo cultivando la bacteria descrita anteriormente, purificando la hMOS producida por la bacteria y combinando la hMOS con un excipiente o vehículo para producir un suplemento dietético para administración oral. Estas composiciones son útiles en métodos para prevenir o tratar enfermedades entéricas y/o respiratorias en bebés y adultos. Por consiguiente, las composiciones se administran a un sujeto que padece o está en riesgo de desarrollar una enfermedad de este tipo utilizando métodos conocidos de terapia clínica.

La invención proporciona aumentar, en E. coli, la concentración intracelular del nucleótido azúcar uridina difosfato N-acetilglucosamina (UDP-GlcNAc). Esto se logra mediante la sobreexpresión del regulador positivo endógeno bifuncional de la síntesis de UDP-GlcNac y del represor del catabolismo de glucosamina y N-acetilglucosamina, nagC, opcionalmente, de forma simultánea con el gen que codifica la L-glutamina:D-fructosa-6-fosfato aminotransferasa, glmS.

La invención también proporciona aumentar, en E. coli, la concentración intracelular de lactosa, en células cultivadas en presencia de lactosa, mediante el uso de manipulaciones de genes endógenos de E. coli implicados en la importación, exportación y catabolismo de la lactosa. En particular, en el presente documento se describen métodos para aumentar los niveles de lactosa intracelular en E. coli genéticamente diseñados para producir un oligosacárido de la leche humana mediante la incorporación de una mutación lacA en la E. coli modificada genéticamente. La mutación lacA impide la formación de acetil-lactosa intracelular, que no solo elimina esta molécula como contaminante de las purificaciones posteriores, sino que también elimina la capacidad de E. coli para exportar el exceso de lactosa de su citoplasma, lo que facilita enormemente las manipulaciones intencionadas de la reserva de lactosa intracelular de E. coli.

También se describen células hospedadoras bacterianas con la capacidad de acumular un depósito de lactosa intracelular mientras que simultáneamente poseen niveles bajos y funcionales de actividad citoplásmica de pgalactosidasa, por ejemplo, como lo proporciona la introducción de un gen recombinante funcional de E. coli lacZ, o de un gen de la p-galactosidasa de cualquiera de una serie de otros organismos (por ejemplo, el gen lac4 de Kluyveromyces lactis (por ejemplo, número de registro del GenBank M84410.1 (GI:173304)). Los niveles bajos y funcionales de p-galactosidasa citoplásmica incluyen niveles de actividad de p-galactosidasa de entre 0,05 y 200 unidades, por ejemplo, entre 0,05 y 5 unidades, entre 0,05 y 4 unidades, entre 0,05 y 3 unidades, o entre 0,05 y 2 unidades (para una definición estándar véase: Miller JH, laboratorio CSH. Experiments in molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.; 1972). Sin embargo, este bajo nivel de actividad de pgalactosidasa citoplasmática, aunque no es lo suficientemente alto como para disminuir significativamente la acumulación de lactosa intracelular, es muy útil para tareas tales como el marcado fenotípico de locus genéticos deseables durante la construcción de reservas de células hospedadoras, para la detección de la lisis celular debida a contaminaciones de bacteriófagos no deseados en los procesos de fermentación, para facilitar la eliminación de la lactosa residual no deseada al final de las fermentaciones, o para fines de CC (control de calidad) de la fermentación durante el proceso (es decir, como un fenotipo no estándar, la provisión de un fenotipo débil lacz ayuda en las evaluaciones de pureza del cultivo).

Los métodos para purificar un oligosacárido sialilado, o que contiene N-acetilglucosamina, producido mediante los métodos de la invención o descrito en la misma, se llevan a cabo uniendo el oligosacárido procedente de un lisado de células bacterianas o de un sobrenadante de cultivo de células bacterianas de la bacteria, a una columna de carbono, y posteriormente eluyéndolo de la columna. Los oligosacáridos purificados que contienen N-acetilglucosamina o sialilados, se producen mediante los métodos de la invención o descritos en la misma.

Se describe un vector, por ejemplo, un vector que contiene un ácido nucleico. El vector puede incluir además uno o más elementos reguladores, por ejemplo, un promotor heterólogo. Los elementos reguladores pueden unirse operativamente a un gen de proteína, a un gen de proteína de fusión o a una serie de genes unidos a un operón para expresar la proteína de fusión. Para conservar de manera estable el vector plasmídico dentro de la célula, se incluye un marcador de selección dentro de su secuencia, tal como un gen de resistencia a antibióticos o un gen que complemente una auxotrofía nutricional de la bacteria hospedadora. Por ejemplo, en E. coli, una deficiencia de timidina causada por un defecto cromosómico en el gen de la timidilato sintasa (thyA) puede complementarse con una copia natural transmitida por el plásmido del gen thyA (M. Belfort, GF Maley, F. Maley, Proceedings of the National Academy of Sciences 80, 1858 (1983)). Alternativamente, una deficiencia de adenina causada por una deficiencia cromosómica en el gen de la adenilosuccinato sintetasa (purA) (S.A. Wolfe, J. M. Smith, J. Biol Chem 263, 19147-53 (1988)) puede complementarse con una copia natural transmitida por el plásmido del gen purA. Se pueden utilizar dos vectores de plásmidos simultáneamente dentro de la misma célula bacteriana empleando distintos marcadores de selección, por ejemplo, un plásmido que utilice la selección de thyA y otro que utilice la selección de purA, y utilizando dos replicones de plásmidos compatibles, por ejemplo, en E. coli, dos de estos replicones compatibles comprenden el replicón ColE1 (pUC) y el replicón p15A (pACYC) (R.E. Bird, J Bacteriol 145, 1305-9 (1981)). En otro aspecto más, la invención comprende una célula recombinante aislada, por ejemplo, una célula bacteriana que contiene la molécula o moléculas de ácido nucleico o el vector o vectores mencionados anteriormente. Las secuencias de ácido nucleico pueden integrarse opcionalmente en el genoma.

Se describe un método para tratar, prevenir o reducir el riesgo de infección en un sujeto, que comprende, administrar a dicho sujeto, una composición que comprende un oligosacárido de leche humana, purificado a partir de un cultivo de una cepa recombinante de la presente invención, en donde el hMOS se une a un patógeno y en el que el sujeto está infectado o en riesgo de infección con el patógeno. La infección puede estar causada por un virus tipo Norwalk o Campylobacter jejuni. El sujeto puede ser un mamífero que necesite tal tratamiento. El mamífero es, por ejemplo, cualquier mamífero, por ejemplo, un ser humano, un primate, un ratón, una rata, un perro, un gato, una vaca, un caballo o un cerdo. Por ejemplo, las composiciones se formulan en piensos para animales (por ejemplo, peletes, croquetas, puré) o complementos alimenticios para animales de compañía, por ejemplo, perros o gatos, así como ganado o animales criados para el consumo de alimentos, por ejemplo, ganado vacuno, ovejas, cerdos, gallinas y cabras. El hMOS purificado puede formularse en un polvo (por ejemplo, polvo de fórmula infantil o polvo de suplemento nutricional para adultos, cada uno de los cuales se mezcla con un líquido como agua o zumo antes del consumo) o en forma de comprimidos, cápsulas o pastas o se incorpora como componente en productos lácteos como la leche, cremas, quesos, yogures o kéfir, o como componente en cualquier bebida, o se combina en una preparación que contiene cultivos microbianos vivos destinados a servir como probióticos, o en preparaciones prebióticas destinadas a mejorar el crecimiento de microorganismos beneficiosos ya sea in vitro o in vivo. Por ejemplo, el azúcar purificado (por ejemplo, LNnT o 6'-SL) se puede mezclar con una bacteria de los géneros Bifidobacterium o Lactobacillus en una composición nutricional probiótica (es decir, las bifidobacterias son componentes beneficiosos de una flora intestinal normal y también se sabe que utilizan hMOS para el crecimiento).

Todos los genes descritos en el presente documento, también incluyen una descripción de los productos génicos codificados correspondientes. Como tales, los usos de genes exógenos como se describen en el presente documento abarcan ácidos nucleicos que codifican las secuencias de productos génicos descritos en el presente documento. El experto en la materia podría generar fácilmente secuencias de ácido nucleico que codifiquen las secuencias de proteínas descritas en el presente documento e introducir dichas secuencias en vectores de expresión para llevar a cabo la presente invención.

La expresión "sustancialmente puro", en referencia a un polipéptido, polinucleótido u oligosacárido dado, significa que el polipéptido, polinucleótido u oligosacárido carece sustancialmente de otras macromoléculas biológicas. El polipéptido, polinucleótido u oligosacárido sustancialmente puro es al menos un 75 % (por ejemplo, al menos 80, 85, 95 o 99 %) puro en peso seco. La pureza se puede medir mediante cualquier método estándar calibrado apropiado, por ejemplo, mediante cromatografía en columna, electroforesis en gel de poliacrilamida, cromatografía en capa fina (TLC) o análisis por HPLC.

Se describen polinucleótidos, polipéptidos y oligosacáridos que se purifican y/o se aíslan. Purificado define un grado de esterilidad que es seguro para la administración a un sujeto humano, por ejemplo, que carece de agentes infecciosos o tóxicos. Específicamente, como se utiliza en el presente documento, una molécula de ácido nucleico, polinucleótido, polipéptido, proteína u oligosacárido "aislada" o "purificada", carece sustancialmente de cualquier otro material o medio de cultivo celular cuando se produce mediante técnicas recombinantes, o de precursores químicos u otros productos químicos cuando se sintetizan químicamente. Por ejemplo, las composiciones de hMOS purificadas tienen al menos un 60 % en peso (peso seco) del compuesto de interés. La preparación puede tener al menos el 75 %, al menos el 90 % y al menos el 99 % en peso, del compuesto de interés. La pureza se mide mediante cualquier método estándar calibrado apropiado, por ejemplo, mediante cromatografía en columna, electroforesis en gel de poliacrilamida, cromatografía en capa fina (TLC) o análisis por HPLC. Por ejemplo, una "proteína purificada" se refiere a una proteína que se ha separado de otras proteínas, lípidos y ácidos nucleicos con los que está naturalmente asociada. La proteína puede constituir al menos un 10, 20, 5070, 80, 90, 95, 99-100 % en peso seco de la preparación purificada.

Por "ácido nucleico aislado" se entiende un ácido nucleico que carece de los genes que lo flanquean en el genoma natural del organismo del cual procede el ácido nucleico. La expresión, por ejemplo: (a) un ADN que forma parte de una molécula de ADN genómico natural, pero que no está flanqueado por las dos secuencias de ácido nucleico que flanquean esa parte de la molécula en el genoma del organismo en el que se produce de manera natural (b) un ácido nucleico incorporado en un vector o en el ADN genómico de un procariota o eucariota de tal manera que la molécula resultante no sea idéntica a ningún ADN genómico o vector natural; (c) una molécula distinta, tal como un ADNc, un fragmento genómico, un fragmento producido por la reacción en cadena de la polimerasa (PCR), o un fragmento de restricción; y (d) una secuencia de nucleótidos recombinante que forma parte de un gen híbrido, es decir, un gen que codifica una proteína de fusión. Las moléculas de ácido nucleico aisladas incluyen además moléculas producidas sintéticamente, así como cualquier ácido nucleico que se haya alterado químicamente y/o que tenga estructuras modificadas. Por ejemplo, el ácido nucleico aislado es un polinucleótido de ADNc o ARN purificado.

Un "promotor heterólogo", cuando está unido operativamente a una secuencia de ácido nucleico, se refiere a un promotor que no está asociado naturalmente con la secuencia de ácido nucleico.

El término "sobreexpresar", como se utiliza en el presente documento, se refiere a que la transcripción del gen o del producto génico codificado tiene un nivel que es un 10 %, 20 %, 50 %, 2 veces, 5 veces, 10 veces o mayor, en comparación con el nivel expresado o producido por un gen nativo, natural o endógeno en una bacteria en la que se produce de manera natural. Por ejemplo, la bacteria hospedadora descrita en el presente documento está diseñada para sobreexpresar una transcripción génica exógena o un producto génico codificado de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa, nagC, glmS, glmY, glmZ, una sialil-transferasa, una p-galactosiltransferasa, una afucosiltransferasa, CMP-Neu5Ac sintetasa, una ácido siálico sintasa o una UDP-GIcNAc 2-epimerasa, es decir, un gen o producto génico con una secuencia correspondiente a la de una bacteria distinta de la bacteria hospedadora.

Los términos "tratar" y "tratamiento", como se utilizan en el presente documento, se refieren a la administración de un agente o una formulación a un individuo clínicamente sintomático afectado por una afección, un trastorno o una enfermedad adversos, a fin de lograr una reducción en la gravedad y/o frecuencia de los síntomas, eliminar los síntomas y/o su causa subyacente, y/o facilitar la mejora o la reparación del daño. Los términos "prevenir" y "prevención" se refieren a la administración de un agente o una composición a un individuo clínicamente asintomático que es susceptible a una afección, un trastorno o una enfermedad adversa en particular y, por lo tanto, se relaciona con la prevención de la aparición de síntomas y/o su causa subyacente.

Por las expresiones "cantidad eficaz" y "cantidad terapéuticamente eficaz" de una formulación o componente de formulación, se entiende una cantidad no tóxica pero suficiente de la formulación o componente para proporcionar el efecto deseado.

La expresión de transición "que comprende", que es sinónimo de "que incluye", "que contiene" o "caracterizado por", es inclusiva o abierta y no excluye elementos o etapas de métodos no citados adicionales. Por el contrario, la frase de transición "que consiste en" excluye cualquier elemento, etapa o ingrediente no especificado en la reivindicación. La frase de transición "que consiste esencialmente en" limita el alcance de una reivindicación a los materiales o a las etapas especificados "y aquellos que no afectan materialmente a las características básicas y novedosas" de la invención reivindicada.

Otras características y ventajas de la invención serán evidentes a partir de la siguiente descripción y de las reivindicaciones. A menos que se defina lo contrario, todos los términos técnicos y científicos utilizados en el presente documento, tienen el mismo significado que entiende comúnmente cualquier experto en la técnica a la que pertenece la presente invención. Aunque pueden utilizarse métodos y materiales similares o equivalentes a los descritos en el presente documento en la práctica o en el ensayo de la presente invención, a continuación, se describen métodos y materiales adecuados. En caso de conflicto con cualquiera de las patentes extranjeras publicadas y solicitudes de patentes citadas en el presente documento, las presentaciones de Genbank y NCBI indicadas con el número de registro citado en el presente documento y en la bibliografía científica citada en el presente documento, prevalecerá la presente memoria descriptiva, incluidas las definiciones. Además, los materiales, métodos y ejemplos son solo ilustrativos y no pretenden ser limitativos.

Breve descripción de los dibujos

La Fig. 1 es un esquema que muestra las rutas metabólicas y los cambios introducidos en ellas para diseñar la síntesis de 2'-fucosillactosa (2'-FL) en Escherichia coli (E. coli). Específicamente, se ilustra la ruta de la síntesis de lactosa y la ruta de la síntesis de GDP-fucosa. En la ruta de la síntesis de GDP-fucosa: manA = fosfomanosa isomerasa (PMI), manB = fosfomanomutasa (PMM), manC = manosa-1-fosfato guanililtransferasa (GMP), gmd = GDP-manosa-4,6-deshidratasa, fcl = GDP-fucosa sintasa (GFS) y AwcaJ = UDP-glucosa transferasa transportadora de lípidos mutada.

La Fig. 2 es un esquema que muestra las rutas metabólicas implicadas en la síntesis de UDP-GlcNAc (uridín difosfato N-acetilglucosamina) y en el catabolismo de la glucosamina y N-acetilglucosamina en E. coli. En el esquema: (GlcNAc-1-P) N-acetilglucosamina-1-fosfato; (GlcN-1-P) glucosamina-1-fosfato; (GlcN-6-P) glucosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; y (fruc-6-P) fructosa-6-fosfato; glmS (L-glutamina: D-fructosa-6-fosfato aminotransferasa), glmM (fosfoglucosamina mutasa), glmU (N-acetil glucosamina-1-fosfato uridiltransferasa y glucosamina-1-fosfato acetiltransferasa fusionada), nagC (activador transcripcional bifuncional/proteína represora), nagA (N-acetilglucosamina-6-fosfato desacetilasa) y nagB (glucosamina-6-fosfato desaminasa), nagE (transportador de N-acetilglucosamina) y manXYZ (transportador de glucosamina).

La Fig. 3 es un esquema que muestra las rutas metabólicas y un ejemplo (que utiliza deleciones nanT, nanA y nanK) de los cambios introducidos en ellas para diseñar la síntesis de 6'-sialil-lactosa (6'-SL) en E. coli. Las abreviaturas son: (Neu5Ac) ácido N-acetilneuramínico, ácido siálico; (AnanT) transportador de ácido N-acetilneuramínico mutado; (AnanA) ácido N-acetilneuramínico liasa mutado; (ManNAc) N-acetilmanosamina; (AnanK) N-acetilmanosamina quinasa mutada; (nanE); N-acetilmanosamina-6-fosfato epimerasa de tipo natural; (ManNAc-6-P) N-acetilmanosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; (GlcN-6-P) Glucosamina-6-fosfato; (Fruc-6-P) Fructosa-6-fosfato; (neuA), ácido CMP-N-acetilneuramínico sintasa; (CMP-Neu5Ac) ácido CMP-N-acetilneuramínico; (neuB), ácido N-acetilneuramínico sintasa; (neuC) UDP-GlcNAc-2-epimerasa; y (UDP-GlcNAc) uridín difosfato N-acetilglucosamina.

La Fig. 4 es un esquema que ilustra la nueva configuración de genes diseñados en el locus thyA de Escherichia coli en cepas utilizadas para producir oligosacáridos que contienen N-acetilglucosamina.

La Fig. 5 es un mapa plasmídico de pG292, que expresa el gen lgtA de p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis.

La Fig. 6 es un mapa plasmídico de pG221, que expresa, como un operón, el gen lgtA de p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis y el gen wbgO de p(1,3)-galactosiltransferasa de E. coli 0SS:H7. La Fig. 7 es un mapa plasmídico de pG222, que expresa, como un operón, el gen lgtA de p (1,3)-Nacetilglucosaminiltransferasa de N. meningitidis y el gen 4GalT (jhp0765) de p (1,4)-galactosiltransferasa de H. pylori.

La Fig. 8 ilustra esquemáticamente las reacciones enzimáticas necesarias para producir, a partir de lactosa, a través del trisacárido intermedio lacto-N-triosa 2 (LNT2), los dos oligosacáridos de la leche humana: Lacto-N-tetraosa (LNT) y Lacto-N-neotetraosa (LNnT). Se presenta un cromatograma de capa fina (a la izquierda) de muestras de medio de cultivo tomadas de cultivos de E. coli a pequeña escala y que demuestran la síntesis de LNT2, LNT y LNnT. Se presenta un segundo cromatograma de capa fina (a la derecha) de muestras de medio de cultivo tomadas de un cultivo de E. coli en un biorreactor de 15 l, que demuestra la síntesis de LNnT.

La Fig. 9 es un mapa plasmídico de pG317, un vector de bajo número de copias, que expresa como un operón, bajo el control del promotor lac de E. coli, los genes neuB, neuC y neuA de Campylobacter jejuni ATCC43438, que codifican N-acetilneuraminato sintasa, UDP-N-acetilglucosamina 2-epimerasa y N-acetilneuraminato citidililtransferasa, respectivamente.

La Fig. 10 es un mapa plasmídico de pG315, un vector de copias múltiples, que expresa un gen que codifica una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224, bajo el control del promotor lac de E. coli.

La Fig. 11 es una fotografía de un cromatograma de capa fina que muestra 6'-SL en medio de cultivo producido por la cepa E547 de E. coli (AnanRATEK), que contiene plásmidos que expresan una a(2,3) sialiltransferasa y neuA, neuB y neuC de bacteria. La Fig. 11 también muestra un análisis de TLC de sobrenadantes de cultivos de dos fermentaciones que producen 6'-sialilactosa (6'-SL). Las muestras de la izquierda de la figura se toman de una fermentación de una cepa de E. coli que contiene pG315 (que lleva un RBS fuerte frente al gen de la a(2,6) sialiltransferasa en el vector). Las muestras de la derecha de la figura se toman de una fermentación de una cepa de E. coli que contiene una variante cercana de pG315 que lleva un RBS más débil frente al gen de la a(2,6) sialiltransferasa.

La Fig. 12 es un mapa plasmídico de pG345, un vector de copias múltiples, que expresa un gen que codifica una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224, bajo el control de un sitio de unión al ribosoma más débil (SEQ ID NO: 8) y el promotor lac de E. coli.

La Fig. 13 es un esquema que muestra las rutas metabólicas y un segundo ejemplo (que utiliza las deleciones nanT, nanA y nanE) de los cambios introducidos en ellas para diseñar la síntesis de 6'-sialil-lactosa (6'-SL) en E. coli. Las abreviaturas son: (Neu5Ac) ácido N-acetilneuramínico, ácido siálico; (AnanT) transportador de ácido N-acetilneuramínico mutado; (AnanA) ácido N-acetilneuramínico liasa mutado; (ManNAc) N-acetilmanosamina; (nanK) N-acetilmanosamina quinasa de tipo natural; (AnanE) N-acetilmanosamina-6-fosfato epimerasa mutada; (ManNAc-6-P) N-acetilmanosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; (GlcN-6-P) glucosamina-6-fosfato; (Fruc-6-P) Fructosa-6-fosfato; (neuA), sintetasa del ácido CMP-N-acetilneuramínico; (CMP-Neu5Ac) ácido CMP-N-acetilneuramínico; (neuB), ácido N-acetilneuramínico sintasa; (neuC) UDP-GlcNAc-2-epimerasa; y (UDP-GlcNAc) uridín difosfato N-acetilglucosamina.

La Fig. 14 ilustra el análisis de TLC de sedimentos y/o sobrenadantes celulares de tres experimentos de fermentación a escala piloto que utilizan tres cepas de E. coli que llevan varias combinaciones de mutaciones nan.

La Fig. 15 es un esquema que ilustra la ubicación de la deleción del gen realizada dentro del operón nan de E. coli para generar el locus mutante [nanA, nanT, nanE, nanK+] de las cepas E1017 y E1018.

La Fig. 16 es una gráfica de la curva de crecimiento de la densidad celular de cuatro cultivos de E680 transformados con pG292, inducidos o no inducidos por la adición de triptófano, y en presencia o ausencia de lactosa en el medio de crecimiento. Se observa abundante lisis celular en los cultivos que contienen lactosa. La Fig. 17 es un mapa plasmídico de pG356, que expresa, como un operón, los genes glmS y nagC de E. coli. pG356 lleva un origen de replicación p15A y dos marcadores de selección ampC y purA.

La Fig. 18 es una traza de parámetros de fermentación y un análisis del sobrenadante del cultivo de TLC (para la producción de LNnT) de un cultivo en biorreactor de 1,5 l de E796 transformado con pG222.

Fig. 19 es una traza de parámetros de fermentación y un análisis del sobrenadante del cultivo de TLC (para la producción de LNnT) de un cultivo en biorreactor de 1,5 l de E866 transformado con pG222 y pG356.

Descripción detallada de la invención

En el presente documento, se describen construcciones genéticas y métodos para la producción de oligosacáridos de leche humana (hMOS) que contienen N-acetilglucosamina y sialiloligosacáridos. Con el fin de producir hMOS que contengan tanto N-acetilglucosamina como sialilo, es necesario aprovechar la reserva celular de UDP-GlcNAc. Hacerlo puede ser difícil, ya que UDP-GlcNAc es un metabolito esencial para las bacterias (utilizado para fabricar la pared celular). Las construcciones, composiciones y métodos de la invención, o como se describen, superan las dificultades del pasado al mejorar la reserva de UDP-GlcNAc, una estrategia que representa una ventaja en la producción de ambas clases de hMOS. Otras distinciones sobre los enfoques anteriores representan mejoras y/o confieren ventajas sobre las estrategias anteriores.

hMOS

Los glucanos de la leche humana, que comprenden tanto oligosacáridos (hMOS) como sus glucoconjugados, desempeñan un papel importante en la protección y el desarrollo de los lactantes humanos y, en particular, en el tubo gastrointestinal (GI) infantil. Los oligosacáridos de la leche que se encuentran en varios mamíferos, difieren mucho, y su composición en seres humanos es única (Hamosh M., 2001 Pediatr Clin North Am, 48: 69-86; Newburg D. S., 2001 Adv Exp Med Biol, 501: 3-10). Además, los niveles de glucano en la leche materna cambian a lo largo de la lactancia y también varían mucho entre individuos (Morrow A. L. et al., 2004 J Pediatr, 145: 297-303; Chaturvedi P et al., 2001 Glycobiology, 11: 365-372). Anteriormente, una exploración completa de los roles de hMOS estaba limitada por la incapacidad de caracterizar y medir adecuadamente estos compuestos. En los últimos años se han desarrollado métodos cuantitativos sensibles y reproducibles para el análisis de hMOS neutros y ácidos (Erney, R., Hilty, M., Pickering, L., Ruiz-Palacios, G., y Prieto, P. (2001) Adv Exp Med Biol 501, 285-297. Bao, Y., y Newburg, D. S. (2008) Electrophoresis 29, 2508-2515). Se han identificado aproximadamente 200 oligosacáridos distintos en la leche humana, y las combinaciones de un pequeño número de epítopos simples son responsables de esta diversidad (Newburg DS, 1999 Curr_Med Chem, 6: 117-127; Ninonuevo M. et al., 2006 J Agric Food Chem, 54: 7471-74801). Los hMOS se componen de 5 monosacáridos: D-glucosa (Glc), D-galactosa (Gal), N-acetilglucosamina (GlcNAc), L-fucosa (Fuc) y ácido siálico (ácido N-acetil neuramínico, Neu5Ac, NANA). Los hMOS generalmente se dividen en dos grupos según sus estructuras químicas: compuestos neutros que contienen Glc, Gal, GlcNAc y Fuc, unidos a un núcleo de lactosa (Galp1-4Glc), y compuestos ácidos que incluyen los mismos azúcares y, a menudo, las mismas estructuras del núcleo, más NANA (Charlwood J. y otros, 1999 Anal_Biochem, 273: 261-277; Martin-Sosa y otros, 2003 J Dairy Sci, 86: 52-59; Parkkinen J. y Finne J., 1987 Methods Enzymol, 138: 289-300; Shen Z. et al., 2001 J Chromatogr A, 921: 315-321). Aproximadamente el 70-80 % de los oligosacáridos en la leche humana están fucosilados. Una proporción más pequeña de los oligosacáridos en la leche humana está sialilada, o está fucosilada y sialilada.

Curiosamente, los hMOS, como clase, sobreviven de manera muy eficiente a través del intestino de los bebés, en función de su transporte deficiente a través de la pared intestinal y de su resistencia a la digestión por las enzimas intestinales humanas (Chaturvedi, P., Warren, C.D., Buescher, C.R., Pickering, L.K. y Newburg, D.S. Adv Exp Med Biol 501, 315-323 (2001)). Una consecuencia de esta supervivencia en el intestino, es que los hMOS pueden funcionar como prebióticos, es decir, están disponibles para servir como una fuente de carbono abundante para el crecimiento de microorganismos comensales del intestino residentes (Ward, R.E., Niñonuevo, M., Mills, D.A., Lebrilla, C.B. y German, J.B. (2007) Mol Nutr Food Res 51, 1398-1405). Recientemente, hay un creciente interés en el papel de la dieta y los agentes prebióticos en la determinación de la composición de la microflora intestinal, y en la comprensión de la relación entre la microflora intestinal y la salud humana (Roberfroid, M., Gibson, G.R., Hoyles, L., McCartney, A.L., Rastall, R., Rowland, I., Wolvers, D., Watzl, B., Szajewska, H., Stahl, B., Guarner, F., Respondek, F., Whelan, K., Coxam, V., Davicco, M.J., Léotoing, L., Wittrant, Y., Delzenne, N.M, Cani, P.D., Neyrinck, A.M. y Meheust, A. (2010) Br J Nutr 104 Suppl 2, S1-63).

Diversos glucanos de la leche humana poseen homología estructural con los receptores celulares de enteropatógenos, y cumplen funciones en la defensa de los patógenos al actuar como "señuelos" de los receptores moleculares. Por ejemplo, las cepas patógenas de Campylobacter se unen específicamente a los glucanos en la leche humana que contiene el epítopo H-2, es decir, 2'-fucosil-W-acetillactosamina o 2'-fucosillactosa (2'-FL); la unión de Campylobacter y la infectividad son inhibidas por 2'-FL y otros glucanos que contienen este epítopo H-2 (Ruiz-Palacios, G.M., Cervantes, L.E., Ramos, P., Chavez-Munguia, B. y Newburg, D.S. (2003) J Biol Chem 278, 14112 14120). De manera similar, algunos patógenos diarreogénicos de E. coli son fuertemente inhibidos in vivo por hMOS que contiene restos de fucosa ligados en 2'. Varias cepas principales de calicivirus humanos, especialmente los norovirus, también se unen a glucanos fucosilados ligados en 2', y esta unión es inhibida por los glucanos fucosilados ligados en 2' de la leche humana. El consumo de leche humana con altos niveles de estos fucosiloligosacáridos ligados en 2' se ha asociado a un menor riesgo de norovirus, Campylobacter, ST de diarrea asociada a E. coli y diarrea de moderada a grave de todas las causas en una cohorte mexicana de niños lactantes (Newburg D.S. et al., 2004 Glycobiology, 14: 253-263; Newburg D.S. et al., 1998 Lancet, 351: 1160-1164). También se sabe que varios agentes patógenos utilizan glucanos sialilados como sus receptores hospedadores, tales como el virus de la gripe (Couceiro, J. N., Paulson, J.C. & Baum, L.G. Virus Res 29, 155-165 (1993)), de la paragripe (Amonsen, M., Smith, D.F., Cummings, R.D. y Air, G.M. J Virol 81, 8341-8345 (2007) y rotovirus (Kuhlenschmidt, T. B., Hanafin, W.P, Gelberg, H.B. y Kuhlenschmidt, M.S. Adv Exp Med Biol 473, 309-317 (1999)). El epítopo sialil-Lewis X lo utiliza Helicobacter pylori (Mandavi, J., Sondén, B., Hurtig, M., Olfat, F.O. et al.,. Science 297, 573-578 (2002)), Pseudomonas aeruginosa (Scharfman, A., Delmotte, P., Beau, J., Lamblin, G., et al., Glycoconj J 17, 735 740 (2000)), y algunas cepas de norovirus (Rydell, G.E., Nilsson, J., Rodriguez-Díaz, J., Ruvoen-Clouet, N., et al. Glycobiology 19, 309-320 (2009)).

El nucleótido azúcar uridina difosfato N-acetilglucosamina (UDP-GlcNAc) es un intermediario metabólico clave en las bacterias, donde participa en la síntesis y el mantenimiento de la envoltura celular. En todas las clases bacterianas conocidas, UDP-GlcNAc se usa para elaborar peptidoglucanos (mureína); un polímero que comprende la pared celular bacteriana cuya integridad estructural es absolutamente esencial para el crecimiento y la supervivencia. Además, las bacterias gramnegativas utilizan UDP-GlcNAc para la síntesis de lípido A, un componente importante de la membrana celular externa. Por lo tanto, para las bacterias, la capacidad de mantener una reserva intracelular adecuada de UDP-GlcNAc es crítica.

La biosíntesis de ciertos oligosacáridos de la leche humana (hMOS) se ha logrado en cepas modificadas por ingeniería genética de la bacteria Escherichia coli K12. Como se describe en el presente documento, los hMOS fucosilados simples, p. ej. 2'-fucosillactosa (2'-FL), 3-fucosillactosa (3-FL) y lactodifucotetraosa (LDFT), se producen de manera eficiente por la E. coli viva mediante la mejora artificial de las reservas intracelulares existentes de GDPfucosa (el nucleótido donador de azúcar) y la lactosa (el azúcar aceptor de azúcar), y para utilizar estas reservas mejoradas como sustratos para fucosiltransferasas recombinantes heterólogas (Figura 1). Dado que ni las reservas de lactosa ni de GDP-fucosa son esenciales para la supervivencia de E. coli, la biosíntesis de hMOS fucosilados simple se logra con buenos rendimientos sin consecuencias negativas sobre el crecimiento o la viabilidad de la bacteria hospedadora. Sin embargo, para sintetizar hMOS más complejos en E. coli, se requiere el uso de la reserva bacteriana crítica de UDP-GlcNAc, con los consiguientes posibles impactos en la viabilidad celular.

La reserva de UDP-GlcNAc en E. coli se produce a través de la acción combinada de tres genes glmS, glmS (L-glutamina:D-fructosa-6-fosfato aminotransferasa), glmM (fosfoglucosamina mutasa) y el gen glmU bifuncional (N-acetil glucosamina-1-fosfato uridiltransferasa y glucosamina-1-fosfato acetil transferasa fusionadas) (Figura 2). Estos tres genes dirigen un flujo constante de carbono a UDP-GlcNAc, un flujo que se origina con fructosa-6-fosfato (una molécula abundante del metabolismo central de energía). La expresión de los genes glm está bajo control positivo de la proteína activadora de la transcripción, NagC.

Cuando E. coli encuentra glucosamina o N-acetil-glucosamina en su entorno, cada una de estas moléculas se transporta a la célula a través de proteínas transportadoras específicas de membrana y se utilizan para complementar el flujo de carbono a la reserva de UDP-GlcNAc o, alternativamente, son consumidas para generar energía, bajo la acción de los productos génicos del operón nag (es decir, nagA [N-acetilglucosamina-6-fosfato desacetilasa] y nagB [glucosamina-6-fosfato desaminasa]). A diferencia de los genes glm, la expresión de nagA y nagB están bajo el control transcripcional negativo, pero por la misma proteína reguladora que la de los genes glm, es decir, NagC. NagC es, por tanto, bifuncional, capaz de activar la síntesis de UDP-GlcNAc, mientras que al mismo tiempo reprime la degradación de la glucosamina-6-fosfato y la N-acetilglucosamina-6-fosfato.

La unión de NagC a secuencias de ADN reguladoras específicas (operadores), tanto si dicha unión da lugar a la activación o represión génica, es sensible a las fluctuaciones a nivel citoplásmico del inductor y metabolito de molécula pequeña, GlcNAc-6-fosfato. Las concentraciones intracelulares de GlcNAc-6-fosfato aumentan cuando la N-acetilglucosamina está disponible como una fuente de carbono en el entorno y, por lo tanto, en estas condiciones, la expresión de los genes glm (esenciales para mantener la reserva vital de UDP-GlcNAc) disminuiría, a menos que se ponga en juego un mecanismo compensatorio. E. coli mantiene un nivel inicial de síntesis de UDP-GlcNAc a través de la expresión continua de nagC dirigida por dos promotores constitutivos, ubicados en el gen nagA en dirección 5'. Este nivel constitutivo de la expresión de nagC se complementa aproximadamente tres veces en condiciones en las que se induce el operón nag degradante y, de este modo, E. coli garantiza un nivel adecuado de expresión del gen glm en todas las condiciones, incluso cuando se utiliza N-acetilglucosamina como fuente de carbono.

Muchos hMOS incorporan GlcNAc en sus estructuras directamente, y muchos también incorporan ácido siálico, un azúcar cuya síntesis implica el consumo de UDP-GlcNAc (FIG. 3, FIG. 13). Por tanto, la síntesis de muchos tipos de hMOS en E. coli diseñada por ingeniería genética conlleva el riesgo significativo de una reducción del rendimiento del producto y de la viabilidad celular comprometida que da lugar al agotamiento de la reserva de UDP-GlcNAc de la bacteria. Una forma de abordar este problema durante la síntesis por ingeniería de hMOS que contiene GlcNAc o ácido siálico, es aumentar la reserva de UDP-GlcNAc mediante la sobreexpresión simultánea de nagC, o preferentemente, mediante la sobreexpresión simultánea de nagC y glmS.

Aunque los estudios sugieren que los glucanos de la leche humana podrían utilizarse como prebióticos y como agentes antimicrobianos antiadherentes, la dificultad y el coste de producir cantidades adecuadas de estos agentes de una calidad adecuada para el consumo humano, ha limitado sus pruebas a gran escala y su utilidad percibida. Lo que se ha necesitado es un método adecuado para producir los glucanos apropiados en cantidades suficientes a un coste razonable. Antes de la invención, hubo intentos de utilizar varios enfoques sintéticos distintos para la síntesis de glucanos. Los nuevos enfoques químicos pueden sintetizar oligosacáridos (Flowers, H.M. Methods Enzymol 50, 93-121 (1978); Seeberger, P.H. Chem Commun (Camb) 1115-1121 (2003)), pero los reactivos para estos métodos son costosos y posiblemente tóxicos (Koeller, K.M. & Wong, C.H. Chem Rev 100, 4465-4494 (2000)). Las enzimas expresadas a partir de organismos modificados (Albermann, C., Piepersberg, W. y Wehmeier, U.F. Carbohydr Res 334, 97-103 (2001); Bettler, E., Samain, E., Chazalet, V., Bosso, C., et al., Glycoconj J 16, 205-212 (1999); Johnson, KF Glycoconj J 16, 141-146 (1999); Palcic, M.M. Curr Opin Biotechnol 10, 616-624 (1999); Wymer, N. & Toone, E.J. Curr Opin Chem Biol 4, 110-119 (2000) proporcionan una síntesis precisa y eficaz (Palcic, M.M. Curr Opin Biotechnol 10, 616-624 (1999)); Crout, D. H. y Vic, G. Curr Opin Chem Biol 2, 98-111 (1998)), pero el alto coste de los reactivos, en especial el de los nucleótidos de azúcar, limita su utilidad para la producción a gran escala y bajo costo. Se han diseñado microbios mediante ingeniería genética para que expresen las glucosiltransferasas que son necesarias para sintetizar oligosacáridos de la reserva innata de bacterias de los azúcares de nucleótidos (Endo, T., Koizumi, S., Tabata, K., Kakita, S. y Ozaki, A. Carbohydr Res 330, 439-443 (2001); Endo, T., Koizumi, S., Tabata, K. y Ozaki, A. Appl Microbiol Biotechnol 53, 257-261 (2000); Endo, T. y Koizumi, S. Curr Opin Struct Biol 10, 536-541 (2000); Endo, T., Koizumi, S., Tabata, K., Kakita, S. y Ozaki, A. Carbohydr Res 316, 179-183 (1999); Koizumi, S., Endo, T., Tabata, K. y Ozaki, A. Nat Biotechnol 16, 847-850 (1998)). Sin embargo, los bajos rendimientos generales del producto y la alta complejidad del proceso, han limitado la utilidad comercial de estos enfoques.

Antes de la invención, que permite la producción asequible de grandes cantidades de hMOS neutros y ácidos, no había sido posible investigar completamente la capacidad de esta clase de molécula para inhibir la unión de patógenos, o incluso explorar su amplia gama de otras posibles funciones.

Antes de la invención, la síntesis química de hMOS era posible, pero estaba limitada por problemas de estéreoespecificidad, disponibilidad de precursores, impurezas del producto y alto coste general (Flowers, H.M. Methods Enzymol 50, 93-121 (1978); Seeberger, P.H. Chem Commun (Camb) 1115-1121 (2003); Koeller, K.M. & Wong, C.H. Chem Rev 100, 4465-4494 (2000)). Además, antes de la invención, también era posible la síntesis enzimática in vitro, pero estaba limitada por la necesidad de precursores costosos de nucleótido-azúcar. La invención supera los inconvenientes de estos intentos previos al proporcionar nuevas estrategias para fabricar grandes cantidades de oligosacáridos de la leche humana para su uso como suplementos dietéticos. La invención hace uso de una bacteria de E. coli (u otra bacteria) diseñada por ingeniería genética para producir oligosacáridos sialilados a niveles comercialmente viables, por ejemplo, los métodos de la invención, o como se describen, permiten la producción de 3'-SL a > 50 g/l en biorreactores.

Variantes y fragmentos funcionales

La presente invención presenta la introducción de genes exógenos en bacterias para manipular las rutas para aumentar las reservas de UDP-GlcNAc, para producir oligosacáridos sialilados y para producir oligosacáridos que contengan N-acetilglucosamina. En cualquiera de los métodos de la invención, o como se describen, los genes o productos génicos pueden ser variantes o fragmentos funcionales de los mismos.

Una variante de cualquiera de los genes, o productos génicos descritos en el presente documento, puede tener una identidad de secuencia del 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % con las secuencias de ácido nucleico o de aminoácidos descritas en el presente documento. La expresión "% de identidad", en el contexto de dos o más secuencias de ácido nucleico o polipéptido, se refiere a dos o más secuencias o subsecuencias que son iguales o que tienen un porcentaje específico de residuos de aminoácidos o nucleótidos que son iguales, cuando se comparan y alinean para obtener una máxima correspondencia, según lo medido utilizando uno de los siguientes algoritmos de comparación de secuencias o mediante inspección visual. Por ejemplo, el % de identidad es relativo a la longitud total de las regiones codificantes de las secuencias que se comparan, o a la longitud de un fragmento concreto o de un dominio funcional del mismo.

Las variantes, como se describen, también incluyen homólogos, ortólogos o parálogos de los genes o productos génicos, como se describen, que conservan la misma función biológica que la de los genes o productos génicos especificados en el presente documento. Estas variantes pueden utilizarse indistintamente con los genes enumerados en estos métodos. Dichas variantes pueden demostrar un porcentaje de homología o de identidad, por ejemplo, un 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad en dominios conservados importantes para la función biológica, tal como en un dominio funcional, por ejemplo, un dominio catalítico.

Para la comparación de secuencias, una secuencia actúa como una secuencia de referencia, con la que se comparan las secuencias de prueba. Cuando se utiliza un algoritmo de comparación de secuencias, las secuencias de prueba y de referencia se introducen en un ordenador, se designan las coordenadas de la subsecuencia, si es necesario, y se designan los parámetros del programa del algoritmo de la secuencia. El algoritmo de comparación de secuencias calcula después el porcentaje de identidad de secuencia de la secuencia o secuencias de prueba en relación con la secuencia de referencia, en función de los parámetros del programa designados. El porcentaje de identidad se determina utilizando BLAST y PSI-BLAST (Altschul et al., 1990, J Mol Biol 215: 3, 403-410; Altschul et al., 1997, Nucleic Acids Res 25:17, 3389-402). Para la búsqueda de PSI-BLAST, se emplearon los siguientes parámetros ilustrativos: (1) un umbral esperado de 10; (2) un coste por hueco de Existencia: 11 y Extensión: 1; (3) la matriz empleada fue BLOSUM62; (4) el filtro para regiones de baja complejidad estaba "activado".

Los cambios pueden introducirse por mutación en la secuencia de ácido nucleico o secuencia de aminoácidos de cualquiera de los genes o productos genéticos descritos en el presente documento, lo que lleva a cambios en la secuencia de aminoácidos de la proteína o enzima codificada, sin alterar la capacidad funcional de la proteína o enzima. Por ejemplo, pueden realizarse sustituciones de nucleótidos que conducen a sustituciones de aminoácidos en residuos de aminoácidos "no esenciales" en la secuencia de cualquiera de las secuencias expresamente descritas en el presente documento. Un residuo de aminoácido "no esencial" es un residuo en una posición en la secuencia que se puede alterar de la secuencia de tipo natural del polipéptido sin alterar la actividad biológica, mientras que un residuo de aminoácido "esencial" es un residuo en una posición que se requiere para la actividad biológica. Por ejemplo, no es probable que los residuos de aminoácidos que se conservan entre los miembros de una familia de proteínas sean susceptibles de mutación. Sin embargo, otros residuos de aminoácidos (por ejemplo, aquellos que están mal conservados entre los miembros de la familia de proteínas) pueden no ser tan esenciales para la actividad y, por lo tanto, es más probable que sean susceptibles de alteración. Por lo tanto, se describen moléculas de ácido nucleico que codifican las proteínas o enzimas descritas en el presente documento que contienen cambios en los residuos de aminoácidos con respecto a las secuencias de aminoácidos descritas en el presente documento que no son esenciales para la actividad.

Puede crearse una molécula de ácido nucleico aislada que codifique una proteína homóloga a cualquiera de los genes descritos en el presente documento, introduciendo una o más sustituciones, adiciones o deleciones de nucleótidos en la secuencia de nucleótidos correspondiente, de manera que, en la proteína codificada, se introducen una o más sustituciones, adiciones o deleciones de aminoácidos.

En una secuencia de ácido nucleico, pueden introducirse mutaciones de modo que la secuencia de aminoácidos codificada se altere mediante técnicas estándar, tales como mutagénesis dirigida y mutagénesis mediada por PCR. Las sustituciones conservativas de aminoácidos se realizan en uno o más residuos de aminoácidos no esenciales predichos. Una "sustitución conservativa de aminoácido" es aquella en la que el residuo de aminoácido se reemplaza por un residuo de aminoácido que tiene una cadena lateral similar. En la técnica se han definido familias de residuos de aminoácidos que tienen cadenas laterales similares. Ciertos aminoácidos tienen cadenas laterales con más de una característica clasificable. Estas familias incluyen aminoácidos con cadenas laterales básicas (por ejemplo, lisina, arginina, histidina), cadenas laterales ácidas (por ejemplo, ácido aspártico, ácido glutámico), cadenas laterales polares sin carga (por ejemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, triptófano, cisteína), cadenas laterales no polares (por ejemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, tirosina, triptófano), cadenas laterales beta-ramificadas (por ejemplo, treonina, valina, isoleucina) y cadenas laterales aromáticas (por ejemplo, tirosina, fenilalanina, triptófano, histidina). Por lo tanto, un residuo de aminoácido no esencial predicho en un polipéptido dado se reemplaza por otro residuo de aminoácido de la misma familia de cadenas laterales. Alternativamente, en otra realización, pueden introducirse mutaciones aleatoriamente a lo largo de toda o parte de una secuencia codificante dada, tal como mediante mutagénesis de saturación, y los mutantes resultantes pueden seleccionarse para determinar la actividad biológica del polipéptido dado para identificar mutantes que conservan la actividad. A la inversa, la invención también proporciona variantes con mutaciones que mejoran o aumentan la actividad biológica endógena. Después de la mutagénesis de la secuencia de ácido nucleico, la proteína codificada puede expresarse mediante cualquier tecnología recombinante conocida en la técnica y puede determinarse la actividad de la proteína. El experto en la materia puede medir fácilmente un aumento, una disminución o eliminación de una actividad biológica determinada de las variantes como se describe, es decir, midiendo la capacidad para mediar en la modificación, síntesis o degradación de los oligosacáridos (a través de la detección de los productos).

También se desvelan fragmentos funcionales de los genes o productos génicos como se describen. Un fragmento, en el caso de estas secuencias, y en el de las restantes que se proporcionan en el presente documento, se define como una parte del todo que es menor que el todo. Además, el tamaño de un fragmento varía desde un solo nucleótido o aminoácido dentro de una secuencia de polinucleótidos o polipéptidos hasta unos pocos nucleótidos o aminoácidos que la secuencia completa de polinucleótidos o polipéptidos. Por último, un fragmento se define como cualquier parte de una secuencia completa de polinucleótidos o polipéptidos que es intermedia entre los extremos definidos anteriormente.

Por ejemplo, los fragmentos de cualquiera de las proteínas o enzimas como las descritas o codificadas por cualquiera de los genes como los que se desvelan, pueden tener de 10 a 20 aminoácidos, de 10 a 30 aminoácidos, de 10 a 40 aminoácidos, de 10 a 50 aminoácidos, de 10 a 60 aminoácidos, de 10 a 70 aminoácidos, 10 a 80 aminoácidos, 10 a 90 aminoácidos, 10 a 100 aminoácidos, 50 a 100 aminoácidos, 75 a 125 aminoácidos, 100 a 150 aminoácidos, 150 a 200 aminoácidos, 200 a 250 aminoácidos, 250 a 300 aminoácidos, 300 a 350 aminoácidos, 350 a 400 aminoácidos, 400 a 450 aminoácidos o de 450 a 500 aminoácidos. Los fragmentos incluidos en la presente invención comprenden fragmentos que conservan fragmentos funcionales. Como tales, los fragmentos pueden conservar los dominios catalíticos que se requieren o que son importantes para la actividad funcional. Los fragmentos pueden determinarse o generarse utilizando la información de secuencias del presente documento, y los fragmentos pueden probarse para determinar la actividad funcional utilizando métodos estándar conocidos en la técnica. Por ejemplo, la proteína codificada puede expresarse mediante cualquier tecnología recombinante conocida en la técnica y su actividad puede determinarse. La función biológica de dicho fragmento puede medirse midiendo la capacidad de sintetizar o modificar un sustrato oligosacarídico o, por el contrario, de catabolizar un sustrato oligosacarídico.

Ejemplo 1. Diseño de E. coli para generar cepas hospedadoras para la producción de oligosacáridos de leche humana que contengan N-acetilglucosamina

El protótrofo de E. coli K12, W3110, se eligió como acervo precursor para la biosíntesis de hMOS. Esta cepa se había modificado anteriormente en el locus ampC a través de la introducción de una construcción represora P^trpB-cI+ inducible por triptófano (McCoy, J. y Lavallie, E. Current protocols in molecular biology/edited by Frederick M. Ausubel et al., (2001)), que permite la producción económica de proteínas recombinantes del promotor P^ldel fago A (Sanger, F., Coulson, A.R., Hong, G.F., Hill, D.F. y Petersen, G.B. J Mol Biol 162, 729-773 (1982)) mediante la inducción con concentraciones milimolares de triptófano (Mieschendahl, M., Petri, T. & Hanggi, U. Nature Biotechnology 4, 802-808 (1986)). La cepa G1724, un derivado de E. coli W3110 que contiene la construcción represora P^trpB-cI+ inducible por triptófano en ampC, se usó como base para posteriores manipulaciones de la cepa de E. coli.

La biosíntesis de hMOS requiere la generación de una reserva celular de lactosa mejorada. Esta mejora se logró en la cepa G1724 realizando diversas manipulaciones del cromosoma utilizando ingeniería genética mediada por recombinación (recombineering) de los genes red del bacteriófago A (A Red) (Court, D.L., Sawitzke, J.A. y Thomason, L.C. Annu Rev Genet 36, 361-388 (2002)) y transducción generalizada del fago P1 (Thomason, L.C., Costantino, N. & Court, D.L. Mol Biol, Capítulo 1, Unidad 1.17 (2007)). La capacidad de la cepa hospedadora de E. coli para acumular lactosa intracelular se diseñó por primera vez mediante la deleción simultánea del gen endógeno de p-galactosidasa (lacZ) y el gen represor del operón de lactosa (lacI). Durante la construcción de esta deleción, el promotor laclq se colocó inmediatamente en dirección 5' del gen de la lactosa permeasa, lacY. La cepa modificada mantiene así su capacidad para transportar lactosa desde el medio de cultivo (a través de LacY), pero se deleciona para la copia de tipo natural del gen lacZ (p-galactosidasa) responsable del catabolismo de la lactosa. Por lo tanto, cuando la cepa modificada se cultiva en presencia de lactosa exógena, se crea una reserva de lactosa intracelular. Una modificación adicional útil para aumentar la reserva de lactosa libre en el citoplasma (y, por lo tanto, para aumentar el rendimiento final de hMOS), es la incorporación de una mutación lacA. LacA es una lactosa acetiltransferasa que solo es activa cuando se acumulan altos niveles de lactosa en el citoplasma de E. coli. La alta osmolaridad intracelular (p. ej., causada por una alta reserva de lactosa intracelular) puede inhibir el crecimiento bacteriano, y la E. coli ha desarrollado un mecanismo para protegerse de la alta osmolaridad intracelular causada por la lactosa "marcando" el exceso de lactosa intracelular con un grupo acetilo utilizando LacA, y después expulsando activamente la acetil-lactosa de la célula (Danchin, A. Bioessays 31, 769-773 (2009)). Por lo tanto, la producción de acetil-lactosa en E. coli diseñada para producir oligosacáridos de la leche humana no es conveniente ya que reduce el rendimiento general. Además, la acetil-lactosa es un producto secundario que complica los esquemas de purificación de los oligosacáridos. La incorporación de una mutación lacA resuelve estos problemas, ya que llevar una deleción del gen lacA hace que la bacteria no sea capaz de sintetizar acetil-lactosa.

Se introdujo una mutación thyA (timidilato sintetasa) delecionando casi por completo el gen thyA y reemplazándolo por un gen de E. coli lacZ+ funcional insertado, de tipo natural, pero sin promotor, que llevaba el sitio de unión al ribosoma 2.8 (SEQ ID NO: 10) (AthyA::(2.8RBS lacZ+, kanr)). Para realizar la construcción, se utilizó ingeniería genética mediada por recombinación A Red. La Fig. 4 ilustra la nueva configuración de genes diseñados de este modo en el locus thyA. Se describe la secuencia completa de ADN de la región, con anotaciones en formato GenBank. La secuencia de ADN genómico que rodea la inserción lacZ+ en la región thyA se expone en la SEQ ID NO: 1.

El defecto thyA puede complementarse en trans suministrando un gen thyA de tipo natural en un plásmido de copias múltiples (Belfort, M., Maley, G. F. & Maley, F. Proceedings of the National Academy of Sciences, 80, 1858 (1983)). Esta complementación se utiliza en el presente documento como un medio de mantenimiento del plásmido (eliminando la necesidad de un esquema de selección de antibióticos más convencional para mantener el número de copias del plásmido).

Más adelante se muestra el genotipo de la cepa E680. La cepa E680 incorpora todos los cambios descritos anteriormente y es una cepa hospedadora adecuada para la producción de oligosacáridos que contienen N-acetilglucosamina.

F'402 proA+B+, Placlq-lacY, A(lacI-lacZ)158, AlacA398 / araC, Agpt-mhpC, AthyA::(2.8RBS lacZ+, KAN), rpoS+, rph+, ampC::(Ptrp T7g10 RBS-AcI+, CAT)

La cepa E796 es una cepa similar a la E680 y lleva una mutación thyA (timidilato sintetasa), introducida delecionando casi por completo el gen thyA y reemplazándolo por un gen de E. coli lacZ+ funcional insertado, de tipo natural, pero sin promotor, que lleva el sitio de unión al ribosoma 0.8 (SEQ ID NO: 11) (AthyA::(0.8RBS lacZ+, KAN). Más adelante se muestra el genotipo de la cepa E796. La cepa E796 incorpora todos los cambios descritos anteriormente y es una cepa hospedadora adecuada para la producción de oligosacáridos que contienen N-acetilglucosamina.

F'402 proA+B+, Placlq-lacY, A(lacI-lacZ)158, AlacA398 / araC, Agpt-mhpC, AthyA::(2.8RBS lacZ+, KAN), rpoS+, rph+, ampC::(Ptrp T7g10 RBS-AcI+, CAT)

La cepa E866 es una cepa similar a la E796 y es útil para la selección de plásmidos dobles. La cepa E866 también lleva una mutación thyA (timidilato sintetasa), introducida delecionando casi por completo el gen thyA y reemplazándolo por un gen de E. coli lacZ+ funcional insertado, de tipo natural, pero sin promotor, que lleva el sitio de unión al ribosoma 0.8 (SEQ ID NO: 11) (AthyA::(0.8RBS lacZ+, KAN).Además de la deleción de thyA, E866 también lleva una deleción del gen purA. Más adelante se muestra el genotipo de la cepa E866. La cepa E866 incorpora todos los cambios descritos anteriormente y es una cepa hospedadora adecuada para la producción de oligosacáridos que contienen N-acetilglucosamina.

F'402 proA+B+, Placlq-lacY, A(lacI-lacZ)158, AlacA398 / araC, Agpt-mhpC, AthyA::(0.8RBS lacZ+), rpoS+, rph+, ampC::(Ptrp T7g10 RBS-AcI+, CAT), ApurA727::KAN

Ejemplo 2. Producción de oligosacáridos de leche humana que contienen N-acetilglucosamina en E. coli: Lacto-N-tetraosa (LNT) y Lacto-N-neotetraosa (LNnT)

La primera etapa en la síntesis (a partir de un precursor de lactosa) tanto de Lacto-N-tetraosa (LNT) como de LactoN-neotetraosa (LNnT), es la adición de un residuo de p(1,3)N-acetilglucosamina a la lactosa, utilizando una p(1,3)-N-acetilglucosaminiltransferasa heteróloga para formar Lacto-N-triosa 2 (LNT2). El plásmido pG292 (ColEI, thyA+, bla+, P^L-lgtA) (SEQ ID NO: 2, FIG. 5) lleva el gen IgtA p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis y puede dirigir la producción de LNT2 en la cepa de E. coli E680 en condiciones de cultivo apropiadas. pG221 (ColEI, thyA+, bla+, PL-lgtA-wbgO) (SEQ ID NO: 3, FIG. 6) es un derivado de pG292 que lleva (dispuesto como un operón) tanto el gen lgtA p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis como el gen wbgO p(1,3)-galactosiltransferasa de E. coli O55:H7. pG221 dirige la producción de LNT en la cepa de E. coli E680 en condiciones de cultivo apropiadas. pG222 (ColEI, thyA+, bla+, P^L-IgtA-4GalT) (SEQ ID NO: 4, FIG. 7) es un derivado de pG292 que lleva (dispuesto como un operón) tanto el gen lgtA p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis como el gen 4GalT (jhp0765) p(1,4)-galactosiltransferasa de H. pylori. pG222 dirige la producción de LNnT en la cepa de E. coli E680 en condiciones de cultivo apropiadas.

La adición de triptófano al medio de crecimiento que contiene lactosa de cultivos de una cualquiera de las cepas derivadas de E680 transformadas con los plásmidos pG292, pG221 o pG222 conduce, para cada combinación particular de E680/plásmido, a la activación del triptófano del hospedador de E. coli, a la utilización del represor TrpR, a la subsiguiente represión de P^trpB y a la consiguiente disminución de los niveles citoplásmicos de cI, lo que produce una des-represión de P^l, una expresión de lgtA, lgtA+wbgO o IgtA+4GalT, respectivamente, y la producción de LNT2, LNT o LNnT, respectivamente.

Para la producción de LNT2, LNT o LNnT en cultivos de laboratorio a pequeña escala (<100 ml), las cepas se cultivaron a 30 °C en un medio selectivo que carecía tanto de timidina como de triptófano hasta la fase exponencial temprana (p. ej., sales M9, glucosa al 0,5 %, casaminoácidos al 0,4 %). Después se añadió lactosa a una concentración final de 0,5 o 1 %, junto con triptófano (200 pM final) para inducir la expresión de las respectivas glucosiltransferasas, impulsadas por el promotor P^l. Al final del período de inducción (~ 24 h), se realizó un análisis de TLC en partes alícuotas del medio de cultivo acelular. La Fig. 8 ilustra esquemáticamente las reacciones enzimáticas necesarias para producir, a partir de la lactosa, a través del trisacárido intermedio lacto-N-triosa 2 (LNT2), los dos oligosacáridos de la leche humana; Lacto-N-tetraosa (LNT) y Lacto-N-neotetraosa (LNnT). Se presenta un cromatograma de capa fina (a la izquierda) de muestras de medio de cultivo tomadas de cultivos de E. coli a pequeña escala y que demuestran la síntesis de LNT2, LNT y LNnT (utilizando cultivos de E680 inducidos que contienen lactosa transformados con pG292, pG221 o pG222, respectivamente). Se presenta un segundo cromatograma de capa fina (a la derecha) de muestras de medio de cultivo tomadas de un cultivo en biorreactor de 15 l de E. coli E680/pG222 y que demuestra la síntesis de LNnT (así como el hMOS, la Lacto-N-neohexaosa y LNnH de mayor peso molecular).

Aunque los resultados anteriores demuestran claramente cómo es posible sintetizar oligosacáridos que contienen GlcNAc (es decir, LNT2, LNT y LNnT) en E. coli modificada, la FIG. 14 ilustra un problema serio al tratar de utilizar la reserva de UDP-GlcNAc de E. coli durante dicha síntesis. En la Fig. 14 se cultivaron cuatro cultivos distintos de E680, transformados con pG292, en presencia y en ausencia de lactosa, y con la expresión de LgtA tanto inducida como no inducida mediante la adición de triptófano. Se puede ver claramente que se produce una lisis celular masiva en los cultivos donde está presente la lactosa, es decir, en aquellos cultivos en los que LgtA reduce la reserva celular de UDP-GlcNAc añadiendo GlcNAc a la lactosa (y fabricando LNT2). Al hacerlo, la UDP-GlcNAc se desvía de la biosíntesis de la pared celular hacia la biosíntesis de hMOS y se produce la lisis celular. Esta lisis puede controlarse fácilmente no solo por la caída precipitada en la densidad del cultivo como se aprecia en la figura, sino también por la aparición de ADN en el medio de cultivo.

Ejemplo 3. El aumento de la reserva de UDP-GlcNAc celular impide la lisis celular durante la biosíntesis de LNnT en E. coli diseñada

Para examinar el impacto de la mejora de la reserva celular de UDP-GlcNAc en E. coli durante la síntesis de hMOS que contiene N-acetilglucosamina, se construyó el plásmido pG356 que llevaba el replicón p15A (Figura 19 y SEQ ID NO: 12). El plásmido pG356 lleva un replicón p15A (compatible con los replicones ColE1), marcadores de selección purA y ampC, y un operón sintético (bajo el control del promotor pL) que lleva los genes glmS (que codifica L-glutamina:D-fructosa-6-fosfato aminotransferasa) y nagC (que codifica el activador/represor transcripcional bifuncional de los operones glm y nag) de E. coli. Cuando el promotor pL está activo en las cepas que llevan el plásmido pG356, aumenta la reserva de UDP-GlcNAc. La cepa E796 (véase el ejemplo 1) se transformó con pG222 (figura 7), y la cepa E866 (véase el ejemplo 1) se transformó con pG222 (FIG. 7) y pG356 (figura. 19). (Las cepas E796 y E866 son isogénicas excepto por la mutación purA encontrada en E866 que se utiliza para la retención del plásmido pG356). Se realizaron procesos de fermentación idénticos de 1,5 l en cada una de las cepas transformadas. Se siguió la densidad óptica de los cultivos y la biosíntesis de LNnT, junto con los parámetros de fermentación estándar. Como puede observarse en la fig. 18, el cultivo E796/pG222 produjo LNnT, pero se produjo lisis cuando la densidad celular DO⁶⁰⁰alcanzó un valor de 75 y al final de la fermentación se obtuvo una densidad celular final que alcanzó un valor DO⁶⁰⁰de solo 50. En cambio (figura 19) con el cultivo E866/pG222+pG356 (donde la expresión de los genes glmS y bagC mejora la reserva intracelular de UDP-GlcNAc), también se produjo LNnT, pero sin apreciarse lisis celular. En este cultivo, la densidad celular al final de la fermentación alcanzó una DO⁶⁰⁰de 108, más del doble de la densidad alcanzada con E796/pG222.

Ejemplo 4. Producción de 6'-sialillactosa (6r-SL) mediante E. coli diseñada (AnanRATEK)

Para la producción de 6'-sialillactosa, se diseñó Escherichia coli GI724 (ATCC55151) con un conjunto de mutaciones que causaban la acumulación citoplásmica del precursor de lactosa no acetilado y que impedían la degradación del ácido N-acetil-5-neuramínico (Figura 3). En particular, se delecionaron los genes lacZ (p-galactosidasa) y lacA (lactosa acetil transferasa) del operón lac, dejando al represor Laclq y a la permeasa LacY completamente funcionales. La permeasa LacY puede activarse con promotores débiles (por ejemplo, lac8) o fuertes (por ejemplo, Ptac). En este ejemplo, todo el operón nan (nanRATEK; genes estructurales y reguladores implicados en la degradación del ácido neuramínico) se delecionó. Las manipulaciones del genoma de E. coli se lograron utilizando una combinación de técnicas genéticas moleculares estándar, específicamente ingeniería genética mediada por recombinación A Red, intercambios de alelos con vectores suicidas de selección positiva y transducciones P1 (Figura 3). A continuación se muestra el genotipo hospedador de la cepa E781, adecuado para la producción de hMOS sialilados:

ampC::( Ptrp-AcI+), laclq lacPL8, AnanRATEK471, AlacZ690, AlacA 745

Para producir 6'-sialil-lactosa, la reserva celular de UDP-GlcNAc debe convertirse en el precursor activado de azúcar-nucleótido, CMP-NeuAc, que, a su vez, puede funcionar como una molécula donadora para un aceptor de azúcar (es decir, lactosa) en una reacción catalizada por sialiltransferasa (figura 3). Para este propósito, se expresaron de forma constitutiva tres genes de Campylobacter jejuni ATCC43438, que codificaban i) UDP-N-acetilglucosamina 2-epimerasa (NeuC), ii) N-acetilneuraminato sintasa (NeuB) y iii) N-Acetilneuraminato citidliltransferasa (NeuA), en la cepa de E. coli diseñada anteriormente, junto con un gen que codificaba una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224 (SEQ ID NO: 21 registro de proteína del Genbank BAF92026). Los genes neu se expresaron a partir de un vector plasmídico de bajo número de copias (pG317, Figura 9, SEQ ID NO: 5) que llevaba un promotor lac constitutivo (pBBRI ori, cat+, Plac), mientras que el gen de la a(2,6)sialiltransferasa se expresó a partir de un vector plasmídico de alto número de copias (pG315, Figura 10, SEQ ID NO: 6) que llevaba un promotor lac constitutivo (ColE1 ori, bla+, Plac). Para impedir la síntesis de productos secundarios, la expresión relativa del gen de la a(2,6)sialiltransferasa en comparación con los genes neu se modula diseñando diferentes sitios de unión al ribosoma (RBS, ribosomal binding sites) que proporcionan diversos grados de eficiencia traduccional en dirección 5' del gen de la a(2,6)sialiltransferasa. Las cepas diseñadas se cultivaron a alta densidad en fermentadores a escala piloto utilizando una estrategia de cultivo discontinuo a semicontinuo. La figura 11 es un análisis de TLC de sobrenadantes de cultivos de dos fermentaciones de este tipo, siendo las muestras de la izquierda de la figura muestras tomadas de una fermentación de una cepa que contiene pG315 (y, por lo tanto, que lleva el RBS presentado en la SEQ ID NO: 7 frente al gen de a(2,6)sialiltransferasa en el vector). Las muestras de la derecha de la figura son muestras tomadas de una fermentación de una cepa que contiene una variante cercana de pG315 (pG345, FIG. 12, SEQ ID NO: 9, que lleva el RBS más débil presentado en la SEQ ID NO: 8 delante del gen de a(2,6)sialiltransferasa y reemplazando el RBS presentado en la SEQ ID NO: 7). En ambos casos, el precursor de lactosa se añadió a una densidad celular DO⁶⁰⁰de 50 y la conversión eficiente a productos finales se logró en las 48 horas posteriores a la adición de lactosa. El rendimiento final de 6'SL se incrementó cuando se utilizó el plásmido con el RBS más débil en dirección 5' del gen de la a(2,6)sialiltransferasa y, además, el nivel del producto secundario KDO-lactosa se redujo significativamente al utilizar este RBS más débil. La identidad de la 6'-SL purificada mediante cromatografía en columna con carbón activo se confirmó mediante espectrometría de masas con IEE (ionización por electropulverización) y resonancia magnética nuclear (RMN).

Ejemplo 5. Producción de 6,-sialillactosa (6r-SL) mediante E. coli diseñada. (AnanA, AnanATE)

Para la producción de 6 'sialil-lactosa, se diseñó Escherichia coli GI724 (ATCC55151) con un conjunto de mutaciones que causaban la acumulación citoplásmica del precursor de lactosa no acetilada y que impedían la degradación del ácido N-acetil-5-neuramínico (Figura 13). En particular, se delecionaron los genes lacZ (pgalactosidasa) y lacA (lactosa acetil transferasa) del operón lac, dejando el represor Laclq y la permeasa LacY completamente funcionales. La permeasa LacY puede activarse con promotores débiles (por ejemplo, lac8) o fuertes (por ejemplo, Ptac). Aunque todo el operón nan (nanRATEK; genes estructurales y reguladores implicados en la degradación del ácido neuramínico) se puede delecionar para suprimir el catabolismo del ácido neuramínico como en el Ejemplo 4, también son adecuadas deleciones minoritarias que abarcan solo los genes nanA o nanA, nanT y nanE o nanA y nanE. En todos los casos en los que se mutó el gen nanE, los últimos 104 pb del gen nanE se dejaron intactos para permitir la transcripción/traducción no alterada de nanK en dirección 3', aunque son posibles otras longitudes de la secuencia nanE residual. Las manipulaciones del genoma de E. coli se lograron utilizando una combinación de técnicas genéticas moleculares estándar, específicamente ingeniería genética mediada por recombinación A Red, intercambios de alelos con vectores suicidas de selección positiva y transducciones P1 (Figura 13). A continuación se muestran los genotipos hospedadores de las cepas E971, E1017 y E1018, adecuados para la producción de hMOS sialilados con diversos rendimientos y purezas:

ampC::(Ptrp-Ad+), laclq lacPL8, AnanA::kanR, AlacZ690, AlacA::scar,

ampC::(Ptrp-Ad+), laclqlacPL8, AnanATE::kanR::nanK+, AlacZ690, AlacA::scary

ampC::(Ptrp-Ad+), laclqlacPL8, AnanATE::cicat::nanK+, lacz690 AlacA::scar, respectivamente.

Para producir 6'-sialil-lactosa, la reserva celular de UDP-GIcNAc se debe convertir en el precursor activado de azúcar-nucleótido, CMP-NeuAc, que, a su vez, puede funcionar como una molécula donadora para un aceptor de azúcar (es decir, lactosa) en una reacción catalizada por sialiltransferasa (figura 13). Para este propósito, se expresaron de forma constitutiva tres genes de Campylobacter jejuni ATCC43438, que codificaban i) UDP-N-acetilglucosamina 2-epimerasa (NeuC), ii) N-acetilneuraminato sintasa (NeuB) y iii) N-Acetilneuraminato citidililtransferasa (NeuA), en la cepa de E. coli diseñada anteriormente, junto con un gen que codificaba una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224. Los genes neu se expresaron a partir de un vector plasmídico de bajo número de copias (pG317, Figura 9, SEQ ID NO: 5) que llevaba un promotor lac constitutivo (pBBRI ori, cat+, Plac), mientras que el gen de la a(2,6) sialiltransferasa se expresó desde el RBS débil de la SEQ iD NO: 8 en un vector plasmídico de alto número de copias (pG345, figura 12, SEQ ID NO: 9) que lleva un promotor lac constitutivo (ColEI ori, bla+, Plac). Las cepas diseñadas se cultivaron a alta densidad en fermentadores a escala piloto utilizando una estrategia discontinua a semicontinua. La figura 14 es un análisis de TLC de sedimentos o sobrenadantes de cultivo de tres de estas fermentaciones. El panel A muestra la producción y acumulación de 6'SL en las células de tres acervos genéticos (solo se muestran las mutaciones nan relevantes de las cepas E971, E1017 y E1018), el panel B y C muestran la producción y acumulación de 6'SL en el medio extracelular (sobrenadantes) en las cepas E971, E1017 y E1018 (solo se muestran las mutaciones nan relevantes) con rendimientos volumétricos máximos estimados de 15 g por litro de sobrenadante. En todos los casos, el precursor de lactosa se añadió a una densidad celular DO⁶⁰⁰de 40 y la conversión en equilibrio a productos finales se logró en aproximadamente 90 horas a partir de la adición de lactosa (EFT, Elapsed Fermentation Time, es el tiempo de fermentación transcurrido).

A continuación, se enumeran las diversas secuencias mostradas en el presente documento.

SEQ ID NO: 1

>E680_thyA::2.8RBS_lacZ cepa de Escherichia coli

GCAGCGGAACTCACAAGGCACCATAACGTCCCCTCCCTGATAACGCTGATACrGTGGTCG CGGTTATGCCAGTTGGCATCTTCACGTAAATAGAGCAAATAGTCCCGCGCCTGGCTGGCG GTTTGCCATAGCCGrTGCGACTGCTGCCAGTATTGCCAGCCATAGAGTCCACTTGCGCTT AGCATGACCAAAATCAGCATCGCGACCAGCGTTTCAATCAGCGTATAACCACGTTGTGTT TTCATGCCGGCAGTATGGAGCGAGGAGAAAAAAAGACGAGGGCCAGTTTCTATTTCTTCG GCGCATCrTCCGGACTATTTACGCCGTTGCAGGACGTTGCAAAATTTCGGGAAGGCGTCT CGAAGAAXXXAACGGAGGGXAAAAAAACCGACGCACACXGGCGXCGGCXCXGGCAGGAXG TTTCGTAATTAGATAGCCACCGGCGCTTTattaaacctactATGACCATGATTACGGATT CACTGGCCGTCGTTrTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATC GCCTTGCAGCACATCCCCCXTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATC GCCCTTCCCAACAGrTGCGCAGCCTGAATGGCGAATGGCGCTTTGCCTGGTTTCCGGCAC CAGAAGCGGXGCCGGAAAGCXGGCXGGAGIGCGAXCXXCCXGAGGCCGAXACIGXCGXCG TCCCCTCAAACTGGCAGATGCACGGTTACGATGCGCCCATCTACACCAACGTGACCTATC CCATTACGGTCAATCCGCCGTTTGTTCCCACGGAGAATCCGACGGGTTGTTACTCGCTCA CAXTXAAIGXXGAXGAAAGCTGGCIACAGGAAGGCCAGACGCGAAXTATXXXXGAIGGCG TTAACTCGGCGTTTCATCTGTGGTGCAACGGGCGCTGGGTCGGTTACGGCCAGGACAGTC GTTTGCCGTCTGAAITTGACCTGAGCGCATTTTTACGCGCCGGAGAAAACCGCCTCGCGG

rGATGGTGCTGCGCXGGAGTGACGGCAGTTATCXGGAAGATCAGGATATGTGGCGGATGA GCGGCAXXXXCCGXGACGXCXCGTXGCXGCAXAAACCGACXACACAAATCAGCGAXXXCC AXGTTGCCACXCGCXXTAAXGATGAXXXCAGCCGCGCXGXACTGGAGGCXGAAGTXCAGA XGTGCGGCGAGXXGCGTGACXACCXACGGGTAACAGTTXCXTTAXGGCAGGGTGAAACGC AGGICGCCAGCGGCACCGCGCCITICGGCGGIGAAAIIAICGAIGAGCGIGGIGGIIAIG CCGATCGCGXCACACXACGXCXGAACGXCGAAAACCCGAAACTGXGGAGCGCCGAAAXCC CGAATCXCXAXCGXGCGGXGGXTGAACXGCACACCGCCGACGGCACGCTGAXXGAAGCAG AAGCCTGCGATGTCGGTTTCCGCGAGGTGCGGAITGAAAATGGTCTGCTGCTGCTGAACG GCAAGCCGXXGCXGAXTCGAGGCGXTAACCGXCACGAGCAXCAXCCTCTGCAXGGTCAGG XCATGGAXGAGCAGACGAXGGXGCAGGAXAXCCXGCXGAXGAAGCAGAACAACTTXAACG CCGTGCGCTGTTCGCATTAICCGAACCATCCGCIGTGGIACACGCIGTGCGACCGCTACG GCCTGXAXGXGGXGGATGAAGCCAATAXXGAAACCCACGGCATGGXGCCAAXGAAXCGXC XGACCGAXGAXCCGCGCXGGCXACCGGCGAXGAGCGAACGCGTAACGCGAAXGGTGCAGC GCGATCGXAATCACCCGAGXGTGAXCATCTGGTCGCTGGGGAATGAATCAGGCCACGGCG CTAATCACGACGCGCXGXAXCGCTGGAXCAAAXCXGTCGAXCCIXCCCGCCCGGXGCAGX AXGAAGGCGGCGGAGCCGACACCACGGCCACCGAXAXXAXXTGCCCGATGXACGCGCGCG XGGATGAAGACCAGCCCTXCCCGGCTGTGCCGAAATGGXCCATCAAAAAATGGCTTXCGC XACCTGGAGAGACGCGCCCGCXGAXCCXTTGCGAATACGCCCACGCGATGGGXAACAGXC XXGGCGGXTTCGCXAAAXACXGGCAGGCGTXXCGTCAGXAXCCCCGTXTACAGGGCGGCX XCGTCXGGGACXGGGXGGAXCAGTCGCXGATXAAATATGAXGAAAACGGCAACCCGXGGX CGGCTIACGGCGGTGATTTXGGCGATACGCCGAACGATCGCCAGTXCTGTATGAACGGTC XGGTCXXXGCCGACCGCACGCCGCAXCCAGCGCXGACGGAAGCAAAACACCAGCAGCAGX XXXTCCAGXXCCGXXXAXCCGGGCAAACCAXCGAAGXGACCAGCGAAXACCXGTTCCGXC ATAGCGAXAACGAGCTCCTGCACTGGATGGTGGCGCIGGAXGGXAAGCCGCTGGCAAGCG GXGAAGXGCCXCXGGATGXCGCTCCACAAGGXAAACAGXXGATXGAACTGCCXGAACXAC CGCAGCCGGAGAGCGCCGGGCAACXCTGGCXCACAGXACGCGTAGXGCAACCGAACGCGA CCGCAXGGXCAGAAGCCGGGCACAXCAGCGCCXGGCAGCAGTGGCGXCTGGCGGAAAACC TCAGTGTGACGCICCCCGCCGCGTCCCACGCCAICCCGCAICTGACCACCAGCGAAATGG ATTTTTGCATCGAGCTGGGT^ TAAGCGTTGGCAArTTAACCGCCAGTCAGGCTTTCTTT CACAGAXGTGGAXXGGCGAXAAAAAACAACXGtXGACGCCGCTGCGCGAXCAGTTCACCC GTGCACCGCTGGATAACGACATTGGCGTAAGTGAAGCGACCCGCATTGACCCXAACGCCT GGGTCGAACGCXGGAAGGCGGCGGGCCAXTACCAGGCCGAAGCAGCGXTGXXGCAGXGCA CGGCAGAXACACXXGCTGAXGCGGXGCXGAXXACGACCGCXCACGCGXGGCAGCAXCAGG GGAAAACCTTATXTATCAGCCGGAAAACCTACCGGATTGAXGGTAGTGGTCAAATGGCGA XXACCGXIGAXGXTGAAGXGGCGAGCGAIACACCGCAXCCGGCGCGGATXGGCCXGAACX GCCAGCXGGCGCAGGXAGCAGAGCGGGTAAACXGGCXCGGATTAGGGCCGCAAGAAAACX AXCCCGACCGCCXXACrGCCGCCTGXIXXGACCGCTGGGAXCTGCCAXTGXCAGACAXGX ATACCCCGXACGXCXTCCCGAGCGAAAACGGXCIGCGCXGCGGGACGCGCGAATXGAATX AIGGCCCACACCAGXGGCGCGGCGACITCCAGXICAACAXCAGCCGCXACAGICAACAGC AACXGAXGGAAACCAGCCAXCGCCAXCXGCXGCACGCGGAAGAAGGCACAXGGCXGAAXA TCGACGGXTTCCATATGGGGATTGGTGGCGACGACXCCTGGAGCCCGTCAGTATCGGCGG AAXXCCAGCXGAGCGCCGGXCGCXACCAXXACCAGXXGGXCXGGXGXCAAAAATAAGCGG CCGCtXTAXGXAGGCXGGAGCXGCXXCGAAGXXCCXAXACXTXCXAGAGAAXAGGAACXX CGGAAXAGGAACXTCAAGAXCCCCXXATXAGAAGAACXCGXCAAGAAGGCGATAGAAGGC GAXGCGCXGCGAAXCGGGAGCGGCGAXACCGXAAAGCACGAGGAAGCGGXCAGCCCAXXC GCCGCCAAGCTCTTCAGCAATATCACGGGTAGCCAACGCTATGTCCTGATAGCGGTCCGC CACACCCAGCCGGCCACAGTCGATGAATCCtGAAAAGCGGCCATTTTCCACCATGATATT CGGCAAGCAGGCAT CGCCAT GGGT CACGAC GAGAT CCTCGCCG TCGGGCAT GCGCG CCTT GAGCCTGGCGAACAGTTCGGCTGGCGCGAGCCCCTGATGCTCTTCGTCCAGATCATCCTG ATCGACAAGACCGGCTTCCATCCGAGTACGTGCTCGCTCGATGCGATGTTTCGCTTGGTG GTCGAATGGGCAGGTAGCCGGATCAAGCGTATGCAGCCGCCGCATTGCATCAGCCATGAT GGATACTTICTCGGCAGGAGCAAGGTGAGATGACAGGAGATCCTGCCCCGGCACTTCGCC CAATAGCAGCCAGTCCCTTCCCGCTTCAGTGACAACGTCGAGCACAGCTGCGCAAGGAAC GCCCGTCGTGGCCAGCCACGATAGCCGCGCTGCCTCGTCCTGCAGTTCATTCAGGGCACC GGACAGGTCGGTCTTGACAAAAAGAACCGGGCGCCCCTGCGCTGACAGCCGGAACACGGC GGCATCAGAGCAGCCGATTGTCTGTTGTGCCCAGTCATAGCCGAATAGCCTCTCCACCCA AGCGGCCGGAGAACCTGCGTGCAATCCATCTTGTTCAATCATGCGAAACGATCCTCATCC TGTCTCTTGATCAGATCTTGATCCCCTGCGCCATCAGATCCTTGGCGGCAAGAAAGCCAT CCAGTTTACTTTGCAGGGCTTCCCAACCTTACCAGAGGGCGCCCCAGCTGGCAATTCCGG TTCGCTTGCTGTCCATAAAACCGCCCAGTCTAGCTATCGCCATGTAAGCCCACTGCAAGC TACCTGCTTTCTCTTTGCGCTTGCGTTTTCCCTTGTCCAGATAGCCCAGTAGCTGACATT CATCCGGGGTCAGCACCGTTTCTGCGGACTGGCTTTCTACGTGTTCCGCTTCCTTTAGCA GCCCTTGCGCCCTGAGTGCTTGCGGCAGCGTGAGCTTCAAAAGCGCTCTGAAGTTCCTAT ACTTTCTAGAGAATAGGAACTTCGAACTGCAGGTCGACGGATCCCCGGAATCATGGTTCC TCAGGAAACGTGTTGCTGTGGGCTGCGACGATATGCCCAGACCATCATGATCACACCCGC GACAATCAICGGGATGGAAAGAATTTGCCCCATGCTGATGTACTGCACCCAGGCACCGGT AAACTGCGCGTCGGGCTGGCGGAAAAACTCAACAATGATGCGAAACGCGCCGTAACCAAT CAGGAACAAACCTGAGACAGCTCCCATTGGGCGTGGTTTACGAATATACAGGTTGAGGAT AATAAACAGCACCACACCTTCCAGCAGCAGCTCGTAAAGCTGTGATGGGTGGCGCGGCAG CACACCGTAAGTGTCGAAAATGGATTGCCACTGCGGGTTGGTTTGCAGCAGCAAAATATC TTCTGTACGGGAGCCAGGGAACAGCATGGCAAACGGGAAGTTCGGGTCAACGCGGCCCCA CAAT TCACCG TTAATAAAG TTGCCCAGACGC CCGGCAC CAAGAC CAAAC GGAAT GAGTGG TGCGATAAAATCAGAGACCTGGAAGAAGGAACGTTTAGTACGGCGGGCGAAGATAATCAT CACCACGATAACGCCAATCAGGCCGCCGTGGAAAGACATGCCGCCGTCCCAGACACGGAA CAGATACAGCGGATCGGCCATAAACTGCGGGAAATTGTAGAACAGAACATAACCAATACG TCCCCCGAGGAAGACGCCGAGGAAGCCCGCATAGAGTAAGTTTTCAACTTCATTTTTGGT CCAGCCGCTGCCCGGACGATTCGCCCGTCGTGTTGCCAGCCACATTGCAAAAATGAAACC CACCAGATACATCAGGCCGTACCAGTGAAGCGCCACGGGTCCTATTGAGAAAATGACCGG ATCAAACTCCGGAAAATGCAGATAGCTACTGGTCATCTGTCACCACAAGTTCTTGTTATT TCGCTGAAAGAGAACAGCGATTGAAATGCGCGCCGCAGGTTTCAGGCGCTCCAAAGGTGC GAATAATAGCACAAGGGGACCTGGCTGGTTGCCGGATACCGTTAAAAGATATGTATA

SEQ ID NO: 2

>pG292, secuencia completa.

TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGrCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCG GGGC TGGC TTAACTATGCGGCATCAGAGCAGAT TG TAC TGAGAG TGC ACCATATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAggcg CCTCCTCAACCTGTATATTCGTAAACCACGCCCAATGGGAGCTGTCTCAGGTTTGTTCCT GATTGGTTACGGCGCGTTTCGCATCATTGTTGAGTTTTTCCGCCAGCCCGACGCGCAGTT TACCGGTGCCTGGGTGCAGTACATCAGCATGGGGCAAATTCTTTCCATCCCGATGATTGT CGCGGGTGTGATCATGATGGTCTGGGCATATCGTCGCAGCCCACAGCAACACGTTTCCTG AGGAACCATGAAACAGTATTTAGAACTGATGCAAAAAGTGCTCGACGAAGGCACACAGAA AAACGACCGTACCGGAACCGGAACGCTTTCCATTTTTGGTCATCAGATGCGTTTTAACCT GCAAGATGGATTCCCGCTGGTGACAACTAAACGTTGCCACCTGCGTTCCATCATCCATGA ACTGCTGTGGTTrCTGCAGGGCGACACTAACATTGCTTATCTACACGAAAACAATGTCAC CATCTGGGACGAATGGGCCGATGAAAACGGCGACCTCGGGCCAGTGTATGGTAAACAGTG GCGCGCCTGGCCAACGCCAGATGGTCGTCATATTGACCAGATCACTACGGTACTGAACCA GCTGAAAAACGACCCGGATTCGCGCCGCATTATTGTTTCAGCGTGGAACGTAGGCGAACT GGATAAAATGGCGCTGGCACCGTGCCATGCATTCTTCCAGTTCTATGTGGCAGACGGCAA ACTCTCTrGCCAGCTTTATCAGCGCTCCTGTGACGTCTTCCTCGGCCTGCCGTTCAACAT TGCCAGCrACGCGTTATTGGTGCATATGATGGCGCAGCAGTGCGATCTGGAAGTGGGTGA TTTTGTCrGGACCGGTGGCGACACGCATCTGTACAGCAACCATATGGATCAAACTCATCT GCAATTAAGCCGCGAACCGCGTCCGCTGCCGAAGTTGATTATCAAACGTAAACCCGAATC CATCTTCGACTACCGTTTCGAAGACTTTGAGATTGAAGGCTACGATCCGCATCCGGGCAT TAAAGCGCCGGTGGCTATCTAATTACGAAACATCCTGCCAGAGCCGACGCCAGTGTGCGT CGGXXXXITXACCCTCCGXXAAATXCXTCGAGACGCCXXCCCGAAggcgccAXTCGCCAI TCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGC TGGCGAAAGGGGGATGTGCXGCAAGGCGAXXAAGXXGGGXAACGCCAGGGXX XXCCCAGX CACGACGTTGTAAAACGACGGCCAGTGCCAAGCTTACTGCTCACAAGAAAAAAGGCACGT CATCTGACGTGCCTTTTTTATTTGTACTACCCTGTACGATTACTGCAGGTCGACTCTAGA TGCATGCTCGAGTCAACGGTTTTTCAGCAATCGGTGCAAAATGCCGAAGTATTGCCTCAA GGTAAACAGCCGCCGCATCCTGCCGTCTGCCGCAAAATCCAGCCACGCGCCGGCGGGCAG CGTGTCCGTCCGTTTGAAGCATTGGTACAAAAACCGGCGGGCGCGrTCAAAArCTTCTTC CGGCAAATGTTTCTCCAGCAATTCATACGCTACTGCTTTTATTTGGCGGTATrCAAGGCT GTCGAACCGGGTTTTAAAACCCAIAGACTGCAAAAAATCGTTICTGGCGGTTrTTTGGAT GCCTTGCGCGATTTCGrGTTGGCGGArGCTGTATTXGGATGAAACCTGATTGGCGTGAAG GCGGTATTTGACCAAGGCTTCGGGATAATAAGCCAGCCTGCCCAATTTGCTGACATCGTA CCAAAATTGGTAATCTTCCGCCCAATCCCGCTCGGTGTTGTAACGCAAACCGCCGTCAAT GACGCXGCGCCTCATAAXCAXCGXGTXGXTGXGXAXGGGGTTGCCGAAAGGGAAAAAGXC GGCAATGTCTTCGTGTCGGGTCGGTTrTTTCCAAATTTTGCCGTGTTCGTGGrGCCGCGC CAGCCGGTTGCCGTCCTTTTCTTCCGACAAAACTTCCAGCCACGCACCCATCGCGATGAT GCTGCGGTCTTTTTCCATCTCACCCACGATTTTCTCAATCCAGTCGGGGGCGGCAATATC GTCTGCATCGGIGCGCGCAATATATTCCCCCCCCCCCCCCGACTTTGCCAATTCATCCAG CCCGAXGXXXAAAGAGGGAAXCAGACCGGAAXXGCGCGGCXGCGCGAGGAXGCGGAXGCG GCCGTCCTGTTCTTGGAAACGCTGGGCAATGGCAAGCGTACCGTCCGTCGAGCCGTCATC GACAArCAAAATATCCAAGrTGCGCCAAGTTrGATTCACGACGGCGGCTAATGATTGGGC GAAATATTTTTCTACGTTGTAGGCGCAAATCAATACGCrGACTAAAGGCTGCAATTTATT CTCCCGATAGGCACGATGCCGTCTGAAGGCTTCAGACGGCATATGtatatCtCCttCttg aaTTCTAACAATTGATTGAATGTATGCAAATAAATGCATACACCATAGGTGTGGTTTAAT TTGATGCCCTTTTTCAGGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGrTGTTTTT XXGITACICGGGAAGGGCIXXACCXCXXCCGCAXAAACGCXTCCAXCAGCGXXTAXAGXX AAAAAAATCTTTCGGAACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCTGCTTT CCATTGAGCCTGTTTCTCTGCGCGACGTTCGCGGCGGCGTGTTTGTGCATCCATCTGGAT TCTCCTGTCAGTTAGCTTTGGTGGTGrGTGGCAGTTGTAGTCCTGAACGAAAACCCCCCG CGATTGGCACATTGGCAGCTAATCCGGAATCGCACTXACGGCCAArGCTTCGTTTCGTAT CACACACCCCAAAGCCTTCTGCTXTGAATGCTGCCCTTCTTCAGGGCTTAATrTXTAAGA GCGXCACCXXCAXGGXGGXCAGXGCGXCCXGCXGAXGXGCXCAGXAXCACCGCCAGXGGX AXXXAXGICAACACCGCCAGAGAXAAXXXAXCACCGCAGAXGGXXAXCXGXAXGXXXXXX AXAXGAAXXXAXXXXXXGCAGGGGGGCAXXGXXXGGXAGGXGAGAGAXCAAXXCXGCAXX AAXGAAXCGGCCAACGCGCGGGGAGAGGCGGXXXGCGXAXXGGGCGCXCXXCCGCXXCCX CGCXCACXGACXCGCTGCGCXCGGXCGXXCGGCXGCGGCGAGCGGXAXCAGCXCACXCAA AGGCGGXAAXACGGXXAXCCACAGAAXCAGGGGAXAACGCAGGAAAGAACAXGXGAGCAA AAGGCCAGCAAAAGGCCAGGAACCGXAAAAAGGCCGCGXXGCXGGCGXTXTXCCAXAGGC XCCGCCCCCCXGACGAGCAXCACAAAAAXCGACGCXCAAGXCAGAGGXGGCGAAACCCGA CAGGACXAXAAAGAIACCAGGCGXXXCCCCCXGGAAGCXCCCXCGXGCGCXCXCCXGXXC CGACCCXGCCGCXXACCGGAXACCXGXCCGCCXXXCXCCCXXCGGGAAGCGXGGCGCXXX CXCAXAGCTCACGCIGTAGGXAXCXCAGXXCGGXGXAGGTCGTTCGCICCAAGCIGGGCI GXGXGCACGAACCCCCCGXXCAGCCCGACCGCXGCGCCXXAXCCGGXAACXAXCGXCXXG AGXCCAACCCGGXAAGACACGACXIAXCGCCACXGGCAGCAGCCACXGGXAACAGGAXXA GCAGAGCGAGGXAXGXAGGCGGXGCXACAGAGXXCXXGAAGXGGXGGCCXAACXACGGCX ACACTAGAAGGACAGTAXTXGGTAXCXGCGCXCXGCTGAAGCCAGXTACCXTCGGAAAAA GAGXXGGXAGCXCXXGAXCCGGCAAACAAACCACCGCXGGXAGCGGXGGXXXXXXXGXXX GCAAGCAGCAGAXXACGCGCAGAAAAAAAGGAXCXCAAGAAGAXCCXXXGAXCXXXXCXA CGGGGXCXGACGCXCAGXGGAACGAAAACXCACGXXAAGGGAXXXXGGXCAXGAGAXXAX CAAAAAGGAXCT XCACCXAGATCCXT XXAAAXTAAAAAXGAAGXXXTAAAXCAATCXAAA GXAXAXAXGAGXAAACXXGGXCXGACAGXXACCAAXGCXXAAXCAGXGAGGCACCXAXCX CAGCGAXCXGXCXAXXXCGXXCAXCCAXAGXXGCCXGACXCCCCGXCGXGXAGAXAACXA CGAXACGGGAGGGCXXACCAXCXGGCCCCAGXGCXGCAAXGAXACCGCGAGACCCACGCX CACCGGCICCAGAXIXATCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXG GICCXGCAACIXXAICCGCCICCAICCAGXCXAXIAAXXGXXGCCGGGAAGCXAGAGXAA GXAGXXCGCCAGXXAAXAGXXXGCGCAACGXXGXXGCCAXXGCXACAGGCAXCGTGGXGX CACGCXCGTCGXXXGGTAXGGCXXCAXXCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXA CAXGAXCCCCCAXGXTGXGCAAAAAAGCGGXXAGCXCCXXCGGXCCTCCGAXCGTXGXCA GAAGXAAGXXGGCCGCAGXGXXAXCACXCAXGGXXAXGGCAGCACXGCAXAAXXCXCXXA CXGXCAXGCCAXCCGXAAGAXGCXXXXCXGXGACXGGXGAGXACXCAACCAAGXCAXXCX GAGAAXAGXGXAXGCGGCGACCGAGXXGCXC XXGCCCGGCGXCAAXACGGGAXAAXACCG

CGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAAC

TCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACT

GATCT T CAGCAT CTTTTACTTT CAC CAGCGT TTCTGGGT GAGCAAAAACAG GAAGG CAAA

ATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTT

TTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAAT

GTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTG

ACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGC

CCTTTCGTC

SEQ ID NO: 3

>pG221, secuencia completa.

TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGC ACCATATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAggcg CCTCCTCAACCTGTATATTCGTAAACCACGCCCAATGGGAGCTGTCTCAGGTTTGTTCCT GATTGGTTACGGCGCGTTTCGCATCATTGTTGAGTTTTTCCGCCAGCCCGACGCGCAGTT TACCGGTGCCTGGGTGCAGTACATCAGCATGGGGCAAATTCTTTCCATCCCGATGATTGT CGCGGGTGTGATCATGATGGTCTGGGCATATCGTCGCAGCCCACAGCAACACGTTTCCTG AGGAACCATGAAACAGTATTTAGAACTGATGCAAAAAGTGCTCGACGAAGGCACACAGAA AAACGACCGTACCGGAACCGGAACGCTTTCCATTTTTGGTCATCAGATGCGTrTTAACCT GCAAGATGGATTCCCGCTGGTGACAACIAAACGTTGCCACCTGCGTTCCATCATCCATGA ACTGCTGTGGTTTCTGCAGGGCGACACTAACATTGCTTATCTACACGAAAACAATGTCAC CATCTGGGACGAATGGGCCGATGAAAACGGCGACCTCGGGCCAGTGTATGGTAAACAGTG GCGCGCCTGGCCAACGCCAGATGGTCGTCATATTGACCAGATCACTACGGTACTGAACCA GCTGAAAAACGACCCGGATTCGCGCCGCATTATTGTTTCAGCGTGGAACGTAGGCGAACT GGATAAAATGGCGCTGGCACCGTGCCATGCATTCTTCCAGTTCTATGTGGCAGACGGCAA ACTCTCTTGCCAGCTTTATCAGCGCTCCTGTGACGTCTTCCTCGGCCTGCCGTTCAACAT TGCCAGCTACGCGTTATTGGTGCATATGATGGCGCAGCAGTGCGATCTGGAAGTGGGTGA TTTTGTCTGGACCGGTGGCGACACGCATCTGTACAGCAACCATATGGATCAAACTCATCT GCAATTAAGCCGCGAACCGCGTCCGCTGCCGAAGTTGATTATCAAACGTAAACCCGAATC CATCTTCGACTACCGTTTCGAAGACTTTGAGATTGAAGGCTACGATCCGCATCCGGGCAT TAAAGCGCCGGTGGCTATCTAATTACGAAACATCCTGCCAGAGCCGACGCCAGTGTGCGT CGGTTTTTTTACCCTCCGTTAAATTCTTCGAGACGCCTTCCCGAAggcgccArTCGCCAT TCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGC TGGCGAAAGGGGGATGTGCrGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTrTCCCAGT CACGACGTTGTAAAACGACGGCCAGTGCCAAGCTTACTGCTCACAAGAAAAAAGGCACGT CATCTGACGTGCCTTTTTTATTTGTACTACCCTGTACGATTACTGCAGGTCGACTCTAGA TGCATGCTCGAGTTATTATTTAATATATTTACAATAGATGAAGGACGCAATCGTACGGAT ACCGCCGAACAGGTAGTTAATGTTACCGGTCAGGAAGAAGCACTTCATTTTGATAACCAG GTCGTTAACCATCACCATGrACAGGTTTTTTTTTGCGGrAGACTGACCTTCGrGCAGGCG GTAGTAGAACAGGTATTCCGGCAGGTTTTGGAACTTGATTTTTGCCAGGCTCAGACGGTT CCACAGCTCGTAATCTTCGGAGTAGTTAGAAAACATATAACCACCGATGCTCGCGATGAC TTTTTTACGAAACATTACGCTCGGGTGAACAATACAACACTTATACGGCAGGrTTTTAAC GATGTCCAGGTTCTCTTCCGGCAGTTTGGTCTTGTTGATTTCACGACCTTTGrCGTCAAT AAAGATTGCGTTGGTACCCACAACATCTACGTACGGATTGTTCTTCAGGAAGrCAACCTG TTTAGTAAAACGGTCCGGGTGAGAGATGTCGTCAGAGTCCATACGGGCAATAAATTCGCC GTTGCTCAGGTCGATCGCTTTGTTCAGGGAGTACGGCAGGTAAGCGATGTTAGTGCGGAT CAGTTTGATTTTGTCGTTAACTTTGTGTTTCAGTTCGTTATAGAAGTCGTCAGTGCAGCA GTTCGCAACGATGATGATTTCGAAGCTGCTGAAGGTCTGAGACAGGATGCTGTTGATCGC TTCGTCCAGAAAAGGGTTTTTCTTGTTAACAGGCAGGATAACGCTCACAACCGGGTGGGT AGATTCCGCGGATTCCGCT TCATCGATGATCATATGTATATCTCC TTCTTCTCGAGTCAA CGGTTTTTCAGCAATCGGTGCAAAATGCCGAAGTATTGCCTCAAGGTAAACAGCCGCCGC ATCCTGCCGTCTGCCGCAAAATCCAGCCACGCGCCGGCGGGCAGCGTGTCCGrCCGTTTG AAGCATTGGTACAAAAACCGGCGGGCGCGTTCAAAATCTTCTTCCGGCAAATGTTTCTCC AGCAAITCATACGCTACTGCTTTTATTIGGCGGTATTCAAGGCTGrCGAACCGGGTTTTA AAACCCATAGACTGCAAAAAATCGTTTCTGGCGGTTTTTTGGATGCCTTGCGCGATTTCG TGTTGGCGGATGCTGTATTTGGATGAAACCTGATTGGCGTGAAGGCGGTATTrGACCAAG GCTTCGGGATAATAAGCCAGCCTGCCCAATTTGCTGACATCGTACCAAAATTGGTAATCT TCCGCCCAATCCCGCTCGGTGTTGTAACGCAAACCGCCGTCAATGACGCTGCGCCTCATA ATCATCGTGTTGTTGTGTATGGGGTTGCCGAAAGGGAAAAAGTCGGCAATGTCTTCGTGT CGGGTCGGTTTTTTCCAAATTTTGCCGTGTTCGTGGTGCCGCGCCAGCCGGTTGCCGTCC TTTTCTTCCGACAAAACTTCCAGCCACGCACCCATCGCGATGATGCTGCGGTCTTTTTCC ATCTCACCCACGATTTTCTCAATCCAGTCGGGGGCGGCAATATCGTCTGCATCGGTGCGC GCAATATATTCCCCCCCCCCCCCCGACTTTGCCAATTCATCCAGCCCGATGTTTAAAGAG GGAATCAGACCGGAATTGCGCGGCTGCGCGAGGATGCGGATGCGGCCGTCCTGTTCTTGG AAACGCTGGGCAATGGCAAGCGTACCGTCCGTCGAGCCGTCATCGACAATCAAAATATCC AAGTTGCGCCAAGTTTGATTCACGACGGCGGCTAATGATTGGGCGAAATATTTTTCTACG TTGTAGGCGCAAATCAATACGCTGACTAAAGGCTGCAATTTATTCTCCCGATAGGCACGA IG C C G IC IG A A G G C IIC A G A C G G C A IA IG ta ta tC tC C ttc ttg a a lIC IA A C A A IIG A I TGAAIGTATGCAAAIAAAIGCAIACACCATAGGIGTGGTTTAATTTGATGCCCTTIITCA GGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGTTGTTTTTTTGTTACTCGGGAAGG GCTTTACCTCTTCCGCATAAACGCTTCCATCAGCGTTTATAGTTAAAAAAATCTTTCGGA ACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCTGCTTTCCATTGAGCCTGTTTC TCTGCGCGACGTTCGCGGCGGCGTGTTTGTGCATCCATCTGGATTCTCCTGTCAGTTAGC TTTGGTGGTGTGTGGCAGTTGTAGTCCTGAACGAAAACCCCCCGCGATTGGCACATTGGC AGCTAATCCGGAATCGCACTTACGGCCAATGCTTCGTTTCGTATCACACACCCCAAAGCC TTCTGCTTTGAATGCTGCCCTTCTTCAGGGCTTAATTTTTAAGAGCGTCACCTTCATGGT GGTCAGIGCGTCCTGCTGATGTGCTCAGXATCACCGCCAGTGGTATTXATGTCAACACCG CCAGAGAIAAXXXAICACCGCAGAIGGXXAXCIGTAXGTTXIXTAIAIGAAITTAXXTTX XGCAGGGGGGCAXXGXXXGGXAGGXGAGAGAXCAAXXCXGCAXXAAXGAAXCGGCCAACG CGCGGGGAGAGGCGGXXXGCGXAIIGGGCGCXCIXCCGCXXCCICGCICACIGACXCGCX GCGCXCGGXCGXXCGGCXGCGGCGAGCGGXAXCAGCXCACXCAAAGGCGGXAAXACGGXX AXCCACAGAAXCAGGGGATAACGCAGGAAAGAACAXGTGAGCAAAAGGCCAGCAAAAGGC CAGGAACCGXAAAAAGGCCGCGTXGCXGGCGXTXTTCCAXAGGCTCCGCCCCCCTGACGA GCATCACAAAAATCGACGCTCAAGTCAGAGGXGGCGAAACCCGACAGGACXATAAAGATA CCAGGCGXXXCCCCCXGGAAGCXCCCXCGXGCGCXCXCCXGXXCCGACCCXGCCGCTXAC CGGAXACCTGXCCGCCXXTCXCCCIXCGGGAAGCGXGGCGCXXICXCAIAGCICACGCXG IAGGXAXCTCAGXTCGGTGIAGGXCGXTCGCTCCAAGCIGGGCIGXGXGCACGAACCCCC CGXXCAGCCCGACCGCXGCGCCXXAXCCGGXAACXAXCGXCXXGAGXCCAACCCGGXAAG ACACGACXXAXCGCCACXGGCAGCAGCCACXGGXAACAGGAIXAGCAGAGCGAGGXATGX AGGCGGXGCXACAGAGXXCXXGAAGXGGXGGCCTAACXACGGCXACACXAGAAGGACAGX AXXXGGXAXCXGCGCXCXGCXGAAGCCAGXXACCXXCGGAAAAAGAGXXGGXAGCXCXXG AXCCGGCAAACAAACCACCGCXGGTAGCGGXGGITXXIIXGTXTGCAAGCAGCAGAIXAC GCGCAGAAAAAAAGGAXCTCAAGAAGAXCCXXXGAXCTXXXCXACGGGGXCXGACGCXCA GXGGAACGAAAACICACGIIAAGGGAXXXXGGICAXGAGAXXAXCAAAAAGGAXCXICAC CTAGATCCXXXTAAATTAAAAATGAAGXXTXAAATCAATCXAAAGTAXATAXGAGXAAAC XXGGXCXGACAGXXACCAAXGCXXAAXCAGXGAGGCACCXAXCXCAGCGAXCXGXCXAXX XCGXXCAXCCAXAGTXGCCXGACXCCCCGXCGXGXAGAXAACXACGAXACGGGAGGGCXX ACCAXCXGGCCCCAGXGCXGCAAXGAXACCGCGAGACCCACGCTCACCGGCXCCAGATTX AXCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXGGXCCXGCAACXXXAXC CGCCXCCATCCAGXCIATTAAXTGIXGCCGGGAAGCTAGAGTAAGXAGXXCGCCAGXTAA XAGXXIGCGCAACGIXGXXGCCAXIGCXACAGGCAXCGIGGXGICACGCXCGICGXXXGG XAXGGCXICAXXCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXACAIGAXCCCCCAXGXX GXGCAAAAAAGCGGIXAGCICCXXCGGXCCXCCGAXCGIXGXCAGAAGXAAGIXGGCCGC AGXGXXAXCACXCATGGXXAXGGCAGCACXGCATAAXXCXCXXACXGXCAXGCCAXCCGX AAGAXGCXXXXCXGIGACTGGXGAGXACXCAACCAAGTCAXXCXGAGAAXAGIGXATGCG GCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAAC TTTAAAAGXGCXCATCAXTGGAAAACGXXCXXCGGGGCGAAAACXCTCAAGGATCXTACC GCXGXXGAGAXCCAGXXCGAXGXAACCCACXCGTGCACCCAACXGAXCXXCAGCAXCXXX TACXXTCACCAGCGTXXCXGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGG AAXAAGGGCGACACGGAAAXGXXGAAXACXCAXACXCXXCCXXTXXCAAXAXTAXXGAAG CAXI XAXCAGGGXXAXXGI CXCAXGAGCGGAIACAXAXIX G A A IGIA IX X AGAAAAATAA ACAAAIAGGGGIICCGCGCACAIIICCCCGAAAAGIGCCACCIGACGICIAAGAAACCAI IA IIA IC A IG A C A IIA A C C IA IA A A A A IA G G C G IA IC A C G A G G C C C IIIC G IC SEQ ID NO: 4

>pG222, secuencia completa.

XCGCGCGXTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGrCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCGGGGCTGGCTTAACrATGCGGCATCAGAGCAGATTGTACTGAGAGTGC ACCATAXAXGCGGXGXGAAAXACCGCACAGAXGCGTAAGGAGAAAAXACCGCAICAggcg ccTCCTCAACCTGTATATTCGTAAACCACGCCCAATGGGAGCTGTCTCAGGTrTGTTCCT GATTGGTrACGGCGCGTTTCGCATCArTGTTGAGTTTTTCCGCCAGCCCGACGCGCAGTT TACCGGTGCCTGGGrGCAGTACATCAGCATGGGGCAAATTCTTTCCATCCCGATGATTGT CGCGGGXGXGAXCAXGAXGGXCTGGGCAXAXCGXCGCAGCCCACAGCAACACGXTXCCXG AGGAACCATGAAACAGTATTrAGAACrGATGCAAAAAGTGCTCGACGAAGGCACACAGAA AAACGACCGTACCGGAACCGGAACGCrTTCCATrTTTGGTCATCAGATGCGTrTTAACCT GCAAGATGGATTCCCGCTGGTGACAACTAAACGrTGCCACCTGCGTTCCATCATCCATGA ACXGCTGXGGTTXCXGCAGGGCGACACTAACATXGCTXATCTACACGAAAACAATGXCAC CATCTGGGACGAATGGGCCGATGAAAACGGCGACCTCGGGCCAGTGTATGGTAAACAGTG GCGCGCCrGGCCAACGCCAGATGGTCGTCATATrGACCAGATCACTACGGTACTGAACCA GCTGAAAAACGACCCGGATTCGCGCCGCATTATTGTTTCAGCGTGGAACGTAGGCGAACT GGATAAAATGGCGCrGGCACCGTGCCATGCATTCTTCCAGTTCTArGTGGCAGACGGCAA ACTCTCTrGCCAGCrTTATCAGCGCTCCTGTGACGTCTTCCTCGGCCTGCCGrTCAACAT TGCCAGCIACGCGTIATTGGTGCATAIGATGGCGCAGCAGIGCGArCTGGAAGTGGGTGA XIXTGXCXGGACCGGXGGCGACACGCAXCTGXACAGCAACCATAXGGATCAAACTCAICX GCAATXAAGCCGCGAACCGCGTCCGCXGCCGAAGTTGATTATCAAACGTAAACCCGAATC CATCTTCGACTACCGTTTCGAAGACTrTGAGATrGAAGGCTACGATCCGCATCCGGGCAT TAAAGCGCCGGTGGCTATCTAATTACGAAACATCCTGCCAGAGCCGACGCCAGTGTGCGT CGGTTTTTTTACCC_1-CCGTTAAATTCTTCGAGACGCCTTCCCGAAggcgccATTCGCCAT TCAGGCTGCGCAACIGTTGGGAAGGGCGATCGGXGCGGGCCTCXXCGCTAXXACGCCAGC TGGCGAAAGGGGGArGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTrTCCCAGT CACGACGrTGTAAAACGACGGCCAGTGCCAAGCrTACTGCTCACAAGAAAAAAGGCACGT CATCTGACGTGCCTrTTTTATTTGTACTACCCTGTACGATTACTGCAGGTCGACTCTAGA XGCATGctcgaglXAXACAAACTGCCAAXATXXCAAAXAXXTAAAATGGAGXXCTCXCAX XAAGGCGAXXXXAGGGCXAXAAGGXXCXXCXXXXCGXGCXATCGXAGAGAXXXGCXCAXC AICAGCGAXCACAAAAGGXXGXAACACCAGAXXXXTCACGCCAXGGAXAAAAGXAGCGXC CAXTAXCGXAXCCACAGGAACAACCCATXTXCGGCTGCATXTCAAAAAAACTXTGGCAAX CXXAGGCGXGAXCACATAGCCXTGAGXCCCCACCCCXXCGCTAXAAGCTXXAAXGAXCCC CACACGCXCXXGXAXCTCGXGGTTXXIAXGGCXCAAXGGCXCACXXXXTACACXGGCAXC ATACAATAAATGCAXCAAGCGGATATAGCCTAACXCTXGGATGXGTTTTTCTAAAAAATC CAAGCCCXCXTXAAAATCCXCXTTCAAGGTXAXAXCGXCXXCTAAAAXACAGAXCGCXXC ATIGAGTXCTATGCATTTTTCCCACAAGGAAIAATGACICGCATAGCACCCAAGCTCCCC CAAGCXCAXAAACX XCGCAXGGTAXX XXAAAGCGXAAXAAAACXXAGAAACC XCACXGAX GAGATXGGXXGXAAXCCCCAXGTCXXXGATGXTXXGCGXGATGAAATAAGGGXGTAAAXG CTXTTXCACTAAGGGGTGCAACCCGCCITCAAAAGTTTTAGAAXAAATCGCAICAAAAAX XXGCGCXXGGXGGXGGGXGGCATTGAXGCTAXXGAGXAAAGTTGXGGXGXCXCXAAAAAC XAAACCAAAXGXAXCGCACACXTTXXGAXTXAAAGAAAXGGCAAAAACACGCAtAXGtat atCtCCttCttCXCGAGXCAACGGXXXXXCAGCAATCGGXGCAAAAXGCCGAAGTAXXGC CXCAAGGXAAACAGCCGCCGCATCCXGCCGXCXGCCGCAAAATCCAGCCACGCGCCGGCG GGCAGCGXGXCCGXCCGTXXGAAGCAXXGGTACAAAAACCGGCGGGCGCGXTCAAAAXCX TCXTCCGGCAAAXGXXTCXCCAGCAAXTCATACGCTACTGCTTXTATTTGGCGGTAITCA AGGCTGXCGAACCGGGTTXXAAAACCCAXAGACXGCAAAAAATCGXXXCXGGCGGTXXXX TGGATGCCTTGCGCGATTTCGXGTTGGCGGAXGCTGTATTXGGATGAAACCTGATTGGCG XGAAGGCGGXAXXXGACCAAGGCTXCGGGAXAAXAAGCCAGCCXGCCCAAXXXGCXGACA XCGTACCAAAAXXGGXAAXCXTCCGCCCAAXCCCGCXCGGXGTXGXAACGCAAACCGCCG TCAATGACGCTGCGCCTCATAATCAXCGTGXXGXXGTGXAXGGGGXTGCCGAAAGGGAAA AAGTCGGCAAXGXCXXCGXGXCGGGXCGGTXXXXXCCAAATTTXGCCGTGXXCGTGGXGC CGCGCCAGCCGGTTGCCGTCCXTTXCXTCCGACAAAACXXCCAGCCACGCACCCATCGCG AXGATGCXGCGGXCXXTXXCCATCXCACCCACGAXTXXCXCAAXCCAGTCGGGGGCGGCA AXATCGXCXGCAXCGGTGCGCGCAAXAXATXCCCCCCCCCCCCCCGACTXXGCCAAXXCA XCCAGCCCGAXGXTXAAAGAGGGAAXCAGACCGGAATXGCGCGGCXGCGCGAGGAXGCGG ATGCGGCCGTCCXGXXCTIGGAAACGCXGGGCAATGGCAAGCGXACCGTCCGXCGAGCCG XCATCGACAATCAAAATAXCCAAGIIGCGCCAAGXTIGAXICACGACGGCGGCXAAXGAX XGGGCGAAAXATIT XXCTACGXTGXAGGCGCAAAXCAATACGCXGACTAAAGGCTGCAAX TXATTCXCCCGAXAGGCACGAXGCCGXCTGAAGGCTTCAGACGGCAXATGtatatctcct tCttgaaTTCTAACAATTGATTGAATGTATGCAAATAAATGCATACACCATAGGTGTGGT TTAATTTGATGCCCTTTTTCAGGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGTTG TTTTTTTGTTACTCGGG^aaGGGCTTTACCTCTTCCGCATAAACGCTTCCATCAGCGTTTA TAGTTAAAAAAATCTTTCGGAACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCT GCTTTCCATTGAGCCTGTTTCTCTGCGCGACGTTCGCGGCGGCGTGTTTGrGCATCCATC TGGATTCTCCTGTCAGTTAGCTTTGGTGGTGTGTGGCAGTTGTAGTCCTGAACGAAAACC CCCCGCGATTGGCACATTGGCAGCTAATCCGGAATCGCACTTACGGCCAATGCTTCGTTT CGTATCACACACCCCAAAGCCTTCTGCTTTGAATGCTGCCCTTCTrCAGGGCTTAATTTT TAAGAGCGTCACCTTCATGGTGGTCAGTGCGTCCTGCTGATGTGCTCAGTATCACCGCCA GTGGTATrTATGTCAACACCGCCAGAGATAATTrATCACCGCAGArGGTTATCTGTATGT TTTTTATATGAATTTATTTTTTGCAGGGGGGCATTGTTTGGTAGGTGAGAGATCAATTCT GCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGC TTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCA CTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTG AGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCA TAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAA CCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCC TGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGC GCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCT GGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCG TCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAG GATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTA CGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGG AAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTT T GTTTGCAAGCAG CAGAT TACGCGCAGAAAAAAAGGAT CTCAAGAAGAT CCTTTGAT CTT TTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAG ATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAAT CTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACC TATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGAT AACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCC ACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAG AAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAG AGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGT GGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCG AGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGT TGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTC TCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTC ATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAA TACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCG AAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACC CAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAG GCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTT CCTTTTTCAATATTATTGAAGCATTTATCAGGGrTATTGTCTCATGAGCGGATACATATT TGAATGTATTTAGAAAAATAAACAAATAGGGGTrCCGCGCACATTTCCCCGAAAAGTGCC ACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCAC GAGGCCCTTTCGTC

SEQ ID NO: 5

>pG317, secuencia completa.

GTACCCAGCTTTTGrTCCCTTTAGTGAGGGTTAATTGCGCGCTTGGCGTAATCATGGTCA TAGCTGTTTCCTGTGTGAAATTGTTArCCGCTCACAATTCCACACAACATACGAGCCGGA AGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTG CGCTCACTGCCCGCITTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGC CAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCATGCATAAAAACTGTTGTAATTCA TTAAGCATTCTGCCGACATGGAAGCCATCACAAACGGCATGATGAACCTGAATCGCCAGC GGCATCAGCACCTTGTCGCCTTGCGTATAATATTTGCCCATGGTGAAAACGGGGGCGAAG AAGTTGTCCATATTGGCCACGTTTAAATCAAAACTGGTGAAACTCACCCAGGGATTGGCT GAGACGAAAAACATATTCTCAATAAACCCTTTAGGGAAATAGGCCAGGTTTTCACCGTAA CACGCCACATCTTGCGAATATATGTGTAGAAACTGCCGGAAATCGTCGTGGTATTCACTC CAGAGCGATGAAAACGTTTCAGTTTGCTCATGGAAAACGGTGTAACAAGGGTGAACACTA TCCCATATCACCAGCTCACCGTCTTTCATTGCCATACGGAATTCCGGATGAGCATTCATC AGGCGGGCAAGAATGTGAATAAAGGCCGGATAAAACTTGTGCTTATTTTTCTTTACGGTC XXXAAAAAGGCCGXAAXAXCCAGCXGAACGGXCXGGXXAXAGGXACAXXGAGCAACXGAC XGAAAXGCCXCAAAAXGXXCXIXACGAXGCCAXXGGGAXAXAXCAACGGXGGXAXAXCCA GTGATTTrTTTCTCCATTTTAGCTTCCTTAGCTCCTGAAAATCTCGATAACTCAAAAAAT ACGCCCGGTAGTGATCTTATTTCATTATGGTGAAAGTTGGAACCTCTTACGTGCCGATCA ACGTCTCATTTTCGCCAAAAGTTGGCCCAGGGCrTCCCGGTATCAACAGGGACACCAGGA XXXAXXXAXXCXGCGAAGXGAXCXXCCGXCACAGGXAXIXAXXCGAAGACGAAAGGGCCX CGTGATACGCCTATXTTTATAGGTrAATGTCATGATAATAATGGTTTCTTAGACGTCAGG TGGCACTrTTCGGGGAAATGTGCGCGCCCGCGTrCCTGCTGGCGCTGGGCCTGTTTCTGG CGCTGGACTTCCCGCTGTTCCGTCAGCAGCTTTrCGCCCACGGCCTTGATGATCGCGGCG GCCTTGGCCTGCATATCCCGATTCAACGGCCCCAGGGCGTCCAGAACGGGCTTCAGGCGC TCCCGAAGGTCTCGGGCCGTCTCTTGGGCTTGArCGGCCTTCTTGCGCATCTCACGCGCT CCTGCGGCGGCCTGTAGGGCAGGCTCATACCCCrGCCGAACCGCTTTTGTCAGCCGGTCG GCCACGGCTTCCGGCGTCTCAACGCGCTTTGAGATTCCCAGCTTTTCGGCCAATCCCTGC GGTGCATAGGCGCGTGGCTCGACCGCrTGCGGGCTGATGGTGACGTGGCCCACTGGTGGC CGCTCCAGGGCCTCGTAGAACGCCTGAATGCGCGTGTGACGTGCCTTGCTGCCCTCGATG CCCCGTTGCAGCCCTAGATCGGCCACAGCGGCCGCAAACGTGGTCTGGTCGCGGGTCATC TGCGCTTTGTTGCCGATGAACTCCTTGGCCGACAGCCTGCCGTCCTGCGTCAGCGGCACC ACGAACGCGGTCATGTGCGGGCTGGTrTCGTCACGGTGGATGCrGGCCGTCACGATGCGA TCCGCCCCGTACTTGTCCGCCAGCCACTTGTGCGCCTTCTCGAAGAACGCCGCCXGCTGX XCXXGGCXGGCCGACXXCCACCAXXCCGGGCXGGCCGXCAXGACGXACXCGACCGCCAAC ACAGCGXCCXXGCGCCGCXXCXCXGGCAGCAACXCGCGCAGXCGGCCCAXCGCXXCAXCG GXGCXGCXGGCCGCCCAGXGCXCGXXCXCXGGCGXCCXGCXGGCGXCAGCGXXGGGCGXC XCGCGCXCGCGGXAGGCGXGCIXGAGACXGGCCGCCACGXXGCCCAXXXXCGCCAGCXIC XXGCAXCGCAXGAXCGCGXAXGCCGCCAXGCCXGCCCCXCCCXXXXGGXGXCCAACCGGC XCGACGGGGGCAGCGCAAGGCGGXGCCXCCGGCGGGCCACXCAAXGCXXGAGTAXACXCA CXAGACXXXGCXXCGCAAAGXCGXGACCGCCXACGGCGGCXGCGGCGCCCXACGGGCXXG CXCICCGGGCXXCGCCCXGCGCGGXCGCXGCGCICCCXIGCCAGCCCGIGGAXAXGXGGA CGAXGGCCGCGAGCGGCCACCGGCXGGCXCGCXXCGCXCGGCCCGXGGACAACCCXGCXG GACAAGCXGAXGGACAGGCXGCGCCXGCCCACGAGCXXGACCACAGGGAXXGCCCACCGG CXACCCAGCCXXCGACCACAXACCCACCGGCXCCAACXGCGCGGCCXGCGGCCXXGCCCC AXCAAXXXXXXIAAIXXXCXCXGGGGAAAAGCCXCCGGCCXGCGGCCXGCGCGCXXCGCX XGCCGGXXGGACACCAAGXGGAAGGCGGGXCAAGGCXCGCGCAGCGACCGCGCAGCGGCX XGGCCXXGACGCGCCXGGAACGACCCAAGCCXAXGCGAGXGGGGGCAGXCGAAGGCGAAG CCCGCCCGCCXGCCCCCCGAGCCXCACGGCGGCGAGXGCGGGGGXXCCAAGGGGGCAGCG CCACCXXGGGCAAGGCCGAAGGCCGCGCAGXCGAXCAACAAGCCCCGGAGGGGCCACXXX XXGCCGGAGGGGGAGCCGCGCCGAAGGCGXGGGGGAACCCCGCAGGGGXGCCCXXCXXXG

ggcaccaaagaacxagaxaxagggcgaaaxgcgaaagacxxaaaaaxcaacaacxxaaaa AAGGGGGGXACGCAACAGCXCAXXGCGGCACCCCCCGCAAXAGCXCAXXGCGXAGGXXAA AGAAAAXCXGXAAXIGACXGCCACXXXXACGCAACGCAXAAXXGXXGXCGCGCXGCCGAA AAGXXGCAGCXGAXIGCGCAXGGXGCCGCAACCGXGCGGCACCCXACCGCAXGGAGAXAA GCAXGGCCACGCAGICCAGAGAAAXCGGCAXXCAAGCCAAGAACAAGCCCGGXCACXGGG XGCAAACGGAACGCAAAGCGCAXGAGGCGXGGGCCGGGCXXAXXGCGAGGAAACCCACGG CGGCAAXGCXGCXGCAXCACCXCGTGGCGCAGAXGGGCCACCAGAACGCCGTGGXGGXCA GCCAGAAGACACXXXCCAAGCXCAXCGGACGXXCXXXGCGGACGGXCCAAXACGCAGXCA AGGACXXGGXGGCCGAGCGCXGGAXCXCCGXCGXGAAGCXCAACGGCCCCGGCACCGXGX CGGCCXACGXGGXCAAXGACCGCGXGGCGXGGGGCCAGCCCCGCGACCAGXXGCGCCXGX CGGXGXXCAGXGCCGCCGXGGXGGXXGAXCACGACGACCAGGACGAAXCGCXGXXGGGGC AXGGCGACCXGCGCCGCAXCCCGACCCXGXAICCGGGCGAGCAGCAACXACCGACCGGCC CCGGCGAGGAGCCGCCCAGCCAGCCCGGCAXXCCGGGCAXGGAACCAGACCXGCCAGCCX XGACCGAAACGGAGGAAIGGGAACGGCGCGGGCAGCAGCGCCXGCCGAXGCCCGAXGAGC CGXGXXXXCXGGACGAXGGCGAGCCGXXGGAGCCGCCGACACGGGXCACGCXGCCGCGCC GGXAGCACIXGGGXIGCGCAGCAACCCGXAAGXGCGCXGXXCCAGACXAXCGGCIGXAGC CGCCXCGCCGCCCXAXACCXXGXCXGCCXCCCCGCGXXGCGXCGCGGXGCAXGGAGCCGG GCCACCXCGACCIGAATGGAAGCCGGCGGCACCXCGCTAACGGAXICACCGTITTIAXCA GGCXCXGGGAGGCAGAAXAAAXGAXCAXAXCGXCAAXXAXXACCXCCACGGGGAGAGCCX GAGCAAACTGGCCXCAGGCAXTTGAGAAGCACACGGXCACACTGCXXCCGGXAGTCAATA AACCGGXAAACCAGCAAXAGACAXAAGCGGCXAXXXAACGACCCXGCCCXGAACCGACGA CCGGGXCGAAXXXGCXXXCGAAXXXCXGCCAXXCAXCCGCXXAXXAXCACXXAXXCAGGC GXAGCACCAGGCGXXXAAGGGCACCAAXAACXGCCXXAAAAAAAXXACGCCCCGCCCXGC CACXCAXCGCAGXCGGCCXAXXGGXXAAAAAAXGAGCXGAXXXAACAAAAAXXXAACGCG AATTTTAACAAAATATTAACGCTTACAATTTCCATTCGCCATTCAGGCTGCGCAACTGTT GGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTG CTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGA CGGCCAGTGAGCGCGCGTAATACGACTCACTATAGGGCGAATTGGAGCTCCACCGCGGTG GCGGCCGCTCTAGAACTAGTGGATCCCCCGGGCTGCAGGAATTCGATATCAAGCTTATCG ATACCGTCGACCTCGAGTTAAGTCTCIAATCGATTGTTTTCCAATGGAATGGTTATAAAA TCTTTGGTTTTTAGTCTTGAAAATCTTCTAGGATTTTCTATGTAAGTTTTTGTATAAATA TTATATTGCTTTAATAAATTTAATATATTTTTATTGCATTTTAAGGTTATTTTTTCCATA TCTGTTCAACCTTTTTTAAATCCTCCAAACAGTCAATATCTAAACTTGAGCTTTCGTCCA TTAAAAAATGCTTGGTTTTGCTTTGTAAAAAGCTAGGATTGTTTAAAAATTCTTTTATCT TTAAAATATAAATTGCACCATTGCTCATATAAGTTTTAGGCAATTTTTGCCTTGGCATAA AAGGATATTCATCATTACAAATCCCTGCTAAATCGCCACAATCATTACAAACAAAGGCTT TTAGAATTTTATTATCACATTCGCTTACGCTAATTAGGGCATTTGCATTGCTATTTTTAT AAAGATTAAAAGCTTCATTAATATGAATATTTGTTCTTAGCGGTGAAGTGGGTTGTAAAA AAACTACATCTTCATAATCTTTATAAAATTTTAGAGCATGTAACAGCACTTTATCGCTTG TGGTATCATCTTGTGCAAGGCTAATTGGGCGTTTTAAAATATCAACATTTTGACTTTTTG CATAATT TAAAATT TCATCAC TATCACTGCT TACAACAAC TTTAC TAATGCTITTAGCAT TTAGTGCAGCTTTGATCGTGTAGTAAATTAAAGGTTTATTGTTTAATAAAACCAAATTTT TATTTTTAATACCCTTTGAGCCACCACGAGCAGGGATTATTGCTAAGCTCATTTTATATC CTTAAAAACTTTTTGTGTGCTGAGTTTAAAAAAATCTCCGCTTTGTAAATATTCAAAAAA TAATTTTGAGCTATCTAAAATCTCTAACTIAGCGCTAAATAAATCTTGTTITTTATGAAT AGTGTTAATAGCTTTTAGTATTTCATCACTATTTGCATTAACTTTTAGTGTATTTTCATT GCCAAGTCTTCCATTTTGTCTTGAGCCAACTAAAATCCCTGCTGTTTTTAAGTATAAGGC CTCTTTTAAAATACAACTTGAATTACCTATTATAAAATCAGCATTTTTTAACAAAGTTAT AAAATACTCAAATCTAAGCGATGGAAAAAGCTTAAATCTAGGGTTATTTTTAAACTCTTC ATAGCTTTGCAAGATTAATTCAAAACCTAAATCATTATTTGGATAAATAACAATATAATT TTTATTACTTTGTATCAGTGCTTTTACTAAATTGTCTGCTTGATTTTTAATGCTAGTAAT TTCAGTTGTAACAGGATGAAACATAAGCAAAGCGTAGTTTTCATAATTTATATCATAATA TTTTTTTGCTTCGCTAAGTGAAATTTTATTATCGTTTAAAAGTTCTAAATCAGGCGAACC TATGATAAAAATAGATTTTTCATCTTCTCCAAGCTGCATTAAACGCCTTTTTGCAAACTC ATCATTTACTAAATGAATATGAGCTAGTTTTGATATAGCGTGGCGTAAGCTATCGTCAAT AGTTCCTGAAATCTCTCCGCCTTCAATATGCGCTACTAAGATATTATTTAATGCTCCAAC AATAGCTGCTGCTAAAGGCTCAATTCTATCTCCATGTACTACGATTAAATCAGGTTTTAG CTCATTTGCATACCTTGAAAATCCATCAATTGTAGTAGCTAAAGCCTTATCAGTTTGATA ATATTTATCATAATTTATAAATTCATAAATATTTTTAAAGCCATTTTTATAAAGTTCTTT AACTGTATAGCCAAAATTTTTACTTAAGTGCATTCCTGTTGCAAAGATGTAAAGTTCAAA TTCGCTTGAGTTTTGCACCCTGTACATTAAAGATTTAATCTTAGAATAATCAGCCCTAGA GCCTGTTATAAAAAGGATTTTTTTCACGCAAAATCCTCATAGCTTAACTGAGCATCATTT TCTATATCTCTTAATGCTTTTTTGCCTAAAATATTTTCAAATTCAGCCGCACTAATTCCA CCAAGTCCAGGTCTTTTAACCCAAATATTATCCATAGATAAAACTTCGCCTTTTTTAATA TCTTTAATGCTAACTACACTTGCAAAGGCAAAATCAATTGTAACTTGTTCTTGTTTAGCC GCTTTTTTACTTTCATTATTTCCTCTTATTATAGCCATTTGCTCACTTTGTATAATTAGC TCTTTTAAAGCCTTTGTATCCATAGAACAAACTATATCAGGGCCACTTCTATGCATACTA TCAGTAAAATGICTTTCAAGCACACAAGCTCCAAGTACAACTGCACCTAAACACGCAAGA TTATCTGTTGTGTGGTCGCTTAAGCCTACCATACAAGAAAATTCTTTTTTTAACTCAAGC ATAGCGTTTAATCTTACAAGATTATGCGGGGTTGGGTAAAGATTGGTCGTGTGCATTAAA ACAAAAGGAATTTCATTGTCTAATAAGATTTTTACAGTTGGTTTTATACTTTCAATACTA TTCATTCCTGTGCTAACTATCATAGGCTTTTTAAAGGCTGCTATGTGTTTAATAAGCGGA TAATTATTACACTCACCTGAACCAATCTTAAAAGCACTAACTCCCATATCTTCTAAGCGG TTCGCACCTGCACGAGAAAAAGGTGTGCTAAGATAAACAAGACCTAATTTTTCTGTGTAT TCTTTAAGTGCTAGCTCATCTTTATAATCCAAAGCACATTTTTGCATAATCTCATAAATG CTTATTTTTGCATTACCAGGAATTACTTTTTTAGCGGCCTTACTCATCTCATCTTCAACA ATATGAGTTTGATGCTTTATAATCTTAGCACCTGCGCTAAAGGCTGCATCTACCATAATT TTAGCTAGTTCTAAACTGCCATTATGATTAATGCCTATTTCAGGTACGACTAAGGGTGCT TTTTCTTCACTTATGATTATATTTTGTATTTTTATTTCTTTCATTTATTTTCCTCCTTAG SEQ ID NO: 6

>pG315, secuencia completa

CTAAATTGTAAGCGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTC

AT T T T T T AACCAATAGGCCGAAATCGGCAAAATCCCTTATAAA TCAAAAGAATAGACCGA

GATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTC CAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACC CTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAG CCCCCGAIIXAGAGCXXGACGGGGAAAGCCGGCGAACGXGGCGAGAAAGGAAGGGAAGAA AGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCAC CACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCCCATTCGCCAXXCAGGCTGCG CAACTGXTGGGAAGGGCGAXCGGXGCGGGCCXCXXCGCXAXXACGCCAGCXGGCGAAAGG GGGATGXGCXGCAAGGCGAXXAAGXXGGGXAACGCCAGGGXXTXCCCAGXCACGACGXXG IAAAACGACGGCCAGIGAGCGCGCGXAAXACGACXCACIAXAGGGCGAAXIGGAGCXCCA CCGCGGXGGCGGCCGCXCXAGAACXAGXGGAXCCCTAGACXGCAAXACAAACACCXGXXX CACAAIXIGGCAGAXCAGCCCAAAAAAGXACAXXCTCXXCXITIACAAIACCXAGXXXXA XCATTACTXGAACXAAAGGACXTCXCAAAGCAGXXTCACGATCAGXXATAGXTXCXGXCG ATGXAAAAACTAIAAATXXAAXXXIXICAGCXGGTATCGTGAAATATAAAGAGCTCGCXA XACCAGCAACXGCAXCAGGAAGCAXAXCXGXCAXCAXCAAAACXXCAAAXGAXAXXXXXG AXGGAAXAXCAACCAXTGAAGGATAGXXXXGCAXXAXTAAXGTATXAATGAXACCGCCAC CAGGGXGACCXXXGAAGAACAAAXCAXAACXAXXGCCXAAAXAAXGXGGGCXCGAXXCAX XAAXTGCAXXAXXAAXGACAXXAAXXXGXXGXXXCGCAXAAXACXCXCXXXCAXGGXXAC CAGCCCAIACAGXCGXACCXGXAAACACAAAGXXXGGTAAAXTAGAXGAAXXAXAXXCAX XXXGTAAIXXXIGXTXGTCAAAATXAACAATCGAXAAGAAXAATXCXXGIXGTXTGCXAX XGAATXXXXXGAAACCAXCCCAXXGCAXXXGCXXXAAACXAXCACCAAXAXAGXCXCGXA ACXCAXGIAAXGAXGGXXCXAAAGXTAAAXAAXCXTXXCXXAAAAAAXGGXAGXXAGCXG GAXATAGIXXXXGCCAGXXAXAAACAGAXGAXGXXCCXGXAXTXGAAGXGXCXXCAXXGA XACCATTAAXGACATCCTCAAGATAAICXTXACCAATTXTXAAATXAXCTGXTTTAXXXA AXGXAXCXCXCCAGXXAXAXAAAXXXACAXAXXCXGCXGAACCAXCAXCAXAXAAAXCXA XAXTTGXXACCGXAACGXXAXXAAACGAATXXAAXTCXXXXAGTAXXGGCACXAAAXXAX CAAATGAAXGAGCAGXGXXAGAGCXAAGXXXAACATXCAAXCTAXGCXXXGXXXGXGCXX GCXXAACAAXXXCXXGXACXAAGXCAGCXGGXGXATGGXXAXTXAXCAAXGCAAACGAXG XAATAXTXAACXCXIXCAXXXGCTCAICAGXCGGAACIAXXCTCCCCCAAGCXATAXAXC XXXGTGCXGXAGGAXXXXCXXCTXCCGAXXXAAXAAXAXCCATXAGCXGCXGAAGAGXXG GAAGAGATGCAXGAXCAACAXAAACCXCXAAAGAXGGAGCCACXACGXXXAAXGXXACXX XXGXTAXAXAXXXXXCACCXXXAXXACXAACACCATXAAAAXCAAAGCAGXACXXXXCAX CGXCAXCIAAXCGXGGCGCCACXACAGAXAAXGAXAXXGACXCXXXAXXXXGXXCXGXXA AXAGTXGTXGCGXACCACAAGXXXGXACCCAAGAGTGIXXXGTAAAAGAGAXGXXXGAXX GAXTAAXXGGCXCIAAATXAACATACXCCTCAXCAATAAXAGTTXXAXTAAIAXCAXXXX XAAXAAXAGAXXGXGXAXXXXCXTCXGACAXggtCtgtttCCteCXCGAGGGGGGGCCCG GXACCCAGCXXXXGXXCCCXXXAGXGAGGGXXAAXTGCGCGCTXGGCGTAAXCATGGXCA XAGCTGXXXCCXGXGXGAAAXXGXXAXCCGCXCACAAXXCCACACAACAXACGAGCCGGA

agcataaagxgxaaagccxggggxgccxaaxgagxgagcxaacxcacaxxaaxxgcgxxg CGCXCACXGCCCGCXXXCCAGXCGGGAAACCXGXCGXGCCAGCXGCAXXAAXGAAXCGGC CAACGCGCGGGGAGAGGCGGXXXGCGXAXXGGGCGCXCXXCCGCXXCCXCGCXCACXGAC XCGCTGCGCXCGGXCGXXCGGCXGCGGCGAGCGGXAXCAGCXCACXCAAAGGCGGXAAXA CGGTTAXCCACAGAAICAGGGGAXAACGCAGGAAAGAACAXGTGAGCAAAAGGCCAGCAA AAGGCCAGGAACCGXAAAAAGGCCGCGXXGCXGGCGXXXXXCCAXAGGCXCCGCCCCCCX GACGAGCAXCACAAAAAXCGACGCXCAAGXCAGAGGXGGCGAAACCCGACAGGACXAXAA AGATACCAGGCGIIXCCCCCXGGAAGCXCCCXCGXGCGCICTCCTGTXCCGACCCTGCCG CXXACCGGAXACCXGXCCGCCXXTCXCCCXXCGGGAAGCGXGGCGCXXXCXCAXAGCXCA CGCXGXAGGXAXCXCAGXXCGGXGXAGGXCGXXCGCXCCAAGCXGGGCXGXGXGCACGAA CCCCCCGXXCAGCCCGACCGCXGCGCCXXATCCGGTAACXATCGXCXXGAGXCCAACCCG GXAAGACACGACXXAXCGCCACXGGCAGCAGCCACTGGXAACAGGAXXAGCAGAGCGAGG XAXGTAGGCGGXGCXACAGAGXXCXXGAAGXGGXGGCCXAACTACGGCXACACXAGAAGG ACAGTAXXXGGXAXCXGCGCXCXGCXGAAGCCAGXTACCXXCGGAAAAAGAGXXGGXAGC XCXTGAXCCGGCAAACAAACCACCGCTGGXAGCGGTGGXXXTTIXGXXTGCAAGCAGCAG AXXACGCGCAGAAAAAAAGGAXCXCAAGAAGAXCCrXXGAXCTXTXCXACGGGGXCXGAC GCXCAGXGGAACGAAAACXCACGXXAAGGGAXXXXGGXCAXGAGATXAXCAAAAAGGAXC XXCACCXAGAXCCXTXTAAATXAAAAATGAAGXXXTAAATCAAXCXAAAGXATATAXGAG XAAACrTGGXCIGACAGTXACCAAIGCIIAAXCAGrGAGGCACCTATCTCAGCGATCXGX CXAXTXCGXXCAXCCAXAGXXGCCXGACXCCCCGXCGXGXAGAXAACXACGAXACGGGAG GGCTTACCAXCXGGCCCCAGXGCTGCAAXGAXACCGCGAGACCCACGCTCACCGGCXCCA GAXXTAXCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXGGXCCXGCAACX XXAXCCGCCXCCAXCCAGXCXAXXAAXXGXXGCCGGGAAGCXAGAGXAAGXAGXXCGCCA GXXAATAGXXXGCGCAACGXXGXXGCCAXXGCXACAGGCAXCGXGGXGXCACGCXCGXCG XTXGGXAXGGCXXCAXTCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXACAXGATCCCCC

ATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTG

GCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCA

TCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT

ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGC

AGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATC

TTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCA

TCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAA

AAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTAT

TGAAGCArTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTAITTAGAAA AATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCAC

SEQ ID NO: 7

CTCGAGgaggaaacagaccATG

SEQ ID NO: 8

CTCGAGgaaagaggggacaaactagATG

SEQ ID NO: 9

>pG345, secuencia completa CTAAATTGTAAGCGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTC ATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAArAGACCGA GATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTC CAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACC CTAATCAAGTTTTTTGGGGrCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAG CCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAA AGCGAAAGGAGCGGGCGCTAGGGCGCrGGCAAGrGTAGCGGTCACGCTGCGCGTAACCAC CACACCCGCCGCGCTTAATGCGCCGCrACAGGGCGCGTCCCATTCGCCATTCAGGCTGCG CAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCrTCGCTATTACGCCAGCTGGCGAAAGG GGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTG TAAAACGACGGCCAGTGAGCGCGCGTAATACGACTCACTATAGGGCGAATTGGAGCTCCA CCGCGGTGGCGGCCGCTCTAGAACTAGTGGATCCCTAGACTGCAATACAAACACCTGTTT CACAATTTGGCAGATCAGCCCAAAAAAGTACATTCTCTTCTTTTACAATACCTAGTTTTA TCATTACTTGAACTAAAGGACTTCTCAAAGCAGTTTCACGATCAGTTATAGTTTCTGTCG ATGTAAAAACTATAAATTTAATTTTTTCAGCTGGTATCGTGAAATATAAAGAGCTCGCTA TACCAGCAACTGCATCAGGAAGCATArCTGTCArCATCAAAACTTCAAATGATATTTTTG ATGGAATATCAACCATTGAAGGATAGTTTTGCATTATTAATGTATTAATGATACCGCCAC CAGGGTGACCTT TGAAGAACAAATCATAACTATTGCCTAAATAATGTGGGCTCGATTCAT TAATTGCATTATTAATGACATTAATTTGTTGTTTCGCATAATACTCTCTTTCATGGTTAC CAGCCCATACAGTCGTACCTGTAAACACAAAGTrTGGTAAATTAGATGAATTATATTCAT TTTGTAATTTTTGTTTGTCAAAATTAACAATCGATAAGAATAATTCTTGTTGrTTGCTAT TGAATITTITGAAACCATCCCATTGCATTTGCTrTAAACTATCACCAATATAGTCICGTA ACTCATGTAATGATGGTTCTAAAGTTAAATAATCTTTTCTTAAAAAATGGTAGTTAGCTG GATATAGTTTTTGCCAGTTATAAACAGATGATGTTCCTGTATTTGAAGTGTCTTCATTGA TACCATTAATGACATCCTCAAGATAArCTTTACCAATTTTTAAATTATCTGTTTTATTTA ATGTATCTCTCCAGTTATATAAATTTACATATTCTGCTGAACCATCATCATATAAATCTA TATTTGTTACCGTAACGTTATTAAACGAATTTAATTCTTTTAGTATTGGCACTAAATTAT CAAATGAATGAGCAGTGTTAGAGCTAAGTTTAACATTCAATCTATGCTTTGTTTGTGCTT GCTTAACAATTTCTTGTACrAAGTCAGCTGGTGrATGGTTATTTArCAATGCAAACGATG TAATATTTAACTCTTTCATTTGCTCArCAGTCGGAACTATTCTCCCCCAAGCrATATATC TTTGTGCTGTAGGATTTTCTTCTTCCGATTTAATAATATCCATTAGCTGCTGAAGAGTTG GAAGAGATGCATGATCAACATAAACC_1-CTAAAGATGGAGCCACTACGTTTAArGTTACTT TTGTTATAIATirTTCACCrTTATTACTAACACCATTAAAATCAAAGCAGTACTTTTCAT CGTCATCTAATCGTGGCGCCACTACAGATAATGATATTGACTCTTTATTTTGrTCTGTTA ATAGTTGTTGCGTACCACAAGTTTGTACCCAAGAGTGTTTTGTAAAAGAGATGTTTGATT GATTAATTGGCTCTAAATTAACATAC_1-CCTCATCAATAATAGTTTTATTAATATCATTTT T A A T A A T A G A T T G T G T A T T T T C T T C T G A C A T c ta g tttg tcccc tc tttcC T C G A G G G G G GGCCCGGTACCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGCTTGGCGTAATCA TGGTCATAGCTGTTTCCTGrGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGA GCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATT GCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGA ATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTC ACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCG GTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC CAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGC CCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGA CTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACC CTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAT AGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTG CACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCC AACCCGGrAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGA GCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACT AGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTT GGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAG CAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGG TCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGrCATGAGATTATCAAAA AGGATCTTCACCTAGATCCTTTTAAArTAAAAArGAAGTTTTAAATCAATCTAAAGTATA TATGAGTAAACTTGGTCTGACAGTTACCAATGCrTAATCAGTGAGGCACCTAlCTCAGCG ATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGrGTAGATAACTACGATA CGGGAGGGCTTACCATCTGGCCCCAGrGCTGCAATGATACCGCGAGACCCACGCTCACCG GCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCT GCAACTTTATCCGCCTCCATCCAGTCrATTAATrGTTGCCGGGAAGCTAGAGTAAGTAGT TCGCCAGTTAATAGTTTGCGCAACGTrGTTGCCATTGCTACAGGCATCGTGGrGTCACGC TCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGA TCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCrTCGGTCCTCCGATCGTTGrCAGAAGT AAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTC ATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAA

rAGTGrATGCGGCGACCGAGTTGC_1-CTTGCCCGGCGTCAATACGGGATAATACCGCGCCA CATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCA AGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCT TCAGCATCTTTTACTTTCACCAGCGTITCTGGGrGAGCAAAAACAGGAAGGCAAAATGCC GCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCArACTCTTCCrTTTTCAA TATTArTGAAGCATTTAICAGGGTIArTGTC_1-CATGAGCGGATACATATTrGAATGTATT TAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCAC

SEQ ID NO: 10

CTTT attaaacctact ATG

SEQ ID NO: 11

CTTT cttcaacctact ATG

SEQ ID NO: 12

>pEC3'-(T7)GlmS-(T7)NagC-purA_(pG356) TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGC ACCATATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCG CCactagtGTTGAGGAAAACGATTGGCTGAACAAAAAACAGACTGATCGAGGTCATTTTT GAGTGCAAAAAGTGCTGTAACTCTGAAAAAGCGATGGTAGAATCCATTTTTAAGCAAACG GTGATTTTGAAAAATGGGTAACAACGTCGTCGTACTGGGCACCCAATGGGGTGACGAAGG TAAAGGTAAGATCGTCGATCTTCTGACTGAACGGGCTAAATATGTTGTACGCTACCAGGG CGGTCACAACGCAGGCCATACTCTCGTAATCAACGGTGAAAAAACCGTTCTCCATCTTAT TCCATCAGGTATTCTCCGCGAGAATGTAACCAGCATCATCGGTAACGGTGTTGTGCTGTC TCCGGCCGCGCTGATGAAAGAGATGAAAGAACTGGAAGACCGTGGCATCCCCGTTCGTGA GCGTCTGCTGCTGTCTGAAGCATGTCCGCTGATCCTTGATTATCACGTTGCGCTGGATAA CGCGCGTGAGAAAGCGCGTGGCGCGAAAGCGATCGGCACCACCGGTCGTGGTATCGGGCC TGCTTATGAAGATAAAGTAGCACGTCGCGGTCTGCGTGTTGGCGACCTTTTCGACAAAGA AACCTTCGCTGAAAAACTGAAAGAAGTGATGGAATATCACAACTTCCAGTTGGTTAACTA CTACAAAGCTGAAGCGGTTGATTACCAGAAAGTTCTGGATGATACGATGGCTGTTGCCGA CATCCTGACTTCTArGGTGGTTGACGTTTCTGACCTGCTCGACCAGGCGCGTCAGCGTGG CGAXXXCGXCAXGX XXGAAGGXGCGCAGGGXACGCXGC TGGATATCGACCACGGTAC TTA TCCGTACGTAACTTCTTCCAACACCACTGCTGGTGGCGTGGCGACCGGTTCCGGCCTGGG CCCGCGTTATGTTGATTACGTTCTGGGTATCCTCAAAGCTTACTCCACTCGTGTAGGTGC AGGTCCGTTCCCGACCGAACTGTTTGATGAAACTGGCGAGTTCCTCTGCAAGCAGGGTAA CGAATTCGGCGCAACTACGGGGCGTCGTCGTCGTACCGGCTGGCTGGACACCGTTGCCGT TCGTCGTGCGGTACAGCTGAACTCCCTGTCTGGCTTCTGCCTGACTAAACTGGACGTrCT GGATGGCCTGAAAGAGGTIAAACTCTGCGTGGCTTACCGTATGCCGGATGGTCGCGAAGT GACTACCACTCCGCrGGCAGCTGACGACTGGAAAGGTGrAGAGCCGATTTACGAAACCAT GCCGGGCXGGTCTGAATCCACCTrCGGCGTGAAAGATCGTAGCGGCCTGCCGCAGGCGGC GCTGAACTATATCAAGCGTATTGAAGAGCTGACTGGTGTGCCGATCGATATCATCTCTAC CGGTCCGGATCGTACTGAAACCATGATTCTGCGCGACCCGTTCGACGCGTAATTCTGGTA CGCCXGGCAGAXAXXXXGCCXGCCGGGCGAACAGXGXGAXACAXXGCXGXGXCGGGXAAG CCATTACGCTATCCGACACAGTGTTAAATCCTCGCTTTTTTCCTTCCCCagatctGGCGC CATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTA TTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGG TTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGCCAAGCTTACTGCTCACAAGAAA AAAGGCACGTCATCrGACGTGCCTTTTTTATTXGTACTACCCTGTACGATTACTGCAGGT CGACTTAATTTTCCAGCAAATGCTGGAGCAAAATACCGTTGAGCATGGCGCGTTTTACCA GCGCAAAAGCGCCGATTGCCGAGCGGTGATCCAGCTCAGAACGTACCACCGGCAGATXAG TGCGAAACGCCTTCAGCGCCTGGGTATTAATGCAGCTTTCAATAGCAGGGAGCAGCACTT TATCGGCTTCGGTGATTTCACCGGCAATAACAATTTTTTGCGGATTAAATAAGTTGATAG CAATGGCGATGGTTTTACCCAGATGACGACCGACATACTCAATTACTTCCGACGCCAGAC TATCGCCTTTGTTCGCGGCTTTGCAGATAGTTTTGATGGTGCAGTCGTCCAGCGGCACGC GGCTCTGGTAGCCCrGCTTTAACAGATTCAACACCCGTTGTTCAATGGCAGCGTTGGCAG CGATAGTTTCCAGGCAGCCAAAGTTGCCGCAGTGGCAGCGTTCACCCAGCGGTTCGACCT GAATATGGCCAATTrCACCGACGTTGCCGTTGCGGCCAATAAAAATGCGCCCGTTAGAGA TAATCCCGGCCCCGGTTCCGCGATGGACACGCACCAGAATGGAGTCTTCGCAATCCTGAC TTGCACCGAAGTAGrGCTCCGCCAGCGCCAGACXACGGATATCGTGACCAACGAAACAGG TCACXXTAAAACGXXCXXCCAGAGCXTCXACCAGCCCCCAGXXTXCXACCXGAAXATGCG GCAXGXAAXGAAXXXXGCCGCXGXCCGGGXCAACAAGCCCXGGCAGGAXCACCGAAAXCG CGATCAGCTCGCGCAGXTXGCGCXGGIAGCTATCAAXAAACTGAGCAATGGCATXCAACA GGGCAXGXXCCAGCGXXXGCXGGGXACGXXCCGGCAGCGGGXAAXGXXCXXCXGCCAGCA CXXXGCXGCXGAGAXCAAACAGAGXGAXGGXGGCGXCAXGACGACCAAGCCGTACGCCGA XXGCGXGGAAAXXGCGGGX XXCGGXGACGAXGGAGAXAGCGCGGCGGCCCCCGGXGGAGG CCXGCXGAXCAACXXCXXXGAXCAGCCCGCGXXCGAXAAGCXGACGCGXAAXXXXGGXXA CGCXGGCGGGGGCAAGCXGGCXXXGCTCGGCAAXCXGAAXCCGCGAGAXXGGCCCGXACX GGXCAAXCAGGCGAXAAACCGCCGCGCXGXXAAGCXGXXXXACGAGAXCAACAXXACCXA ICIGAGCIXGXCCGCCXGGXGXCAXAIGXAIAXCXCCXXCXXgtcgacXCXAGAXGCAXG CXCGAGAXXACXCAACCGXAACCGAXTXXGCCAGGXXACGCGGCXGGXCAACGXCGGXGC CXXXGAXCAGCGCGACAXGGXAAGCCAGCAGCXGCAGCGGAACGGXGXAGAAGAXCGGXG CAATCACCTCTTCCACATGCGGCATCTCGATGATGTGCATGTTATCGCTACTTACAAAAC CCGCAXCCTGAXCGGCGAAGACAXACAACTGACCGCCACGCGCGCGAACXTCTTCAAXGX XGGAXXXCAGXXXXXCCAGCAAXXCGXXGXXCGGXGCAACAACAAXAACCGGCAXAXCGG CAXCAAXXAGCGCCAGCGGACCGXGXXXCAGXXCGCCAGCAGCGXAGGCXXCAGCGXGAA XGXAAGAGAXCXCXXXCAACXXCAAXGCGCCXXCCAGCGCGAXXGGGXACXGAXCGCCAC GGCCCAGGAACAGCGCGXGAXGXXXGICAGAGAAAXCXXCXGCCAGCGCXXCAAXGCGXX TGXCCXGAGACAGCAXCXGCXCAAXACGGCXCGGCAGCGCCXGCAGACCAXGCACGAXGX CAXGXXCAAXGGAGGCAXCCAGACCXXXCAGGCGAGACAGCXXCGCCACCAGCAXCAACA GCACAGXTAACXGAGXGGXGAAXGCXTXAGTGGAXGCCACGCCGAXXXCXGXACCCGCGX XGGXCAXXAGCGCCAGAXCGGAXXCGCGCACCAGAGAAGAACCCGGAACGXXACAGAXXG CCAGIGAACCAAGGXAACCCAGCICIITCGACAGACGCAGGCCAGCCAGGGTATCCGCGG TTTCGCCAGACTGTGACAAGGTGATCATCAGGCTGTTACGACGCACGGCAGATTTGCGAT AGCGGAATTCAGAGGCGAXXXCGACGTCGCACGGAAXACCXGCTAGCGAITCAAACCAGX AGCGGGAAACCAXACCGGAGXXAXAAGAAGXACCACAGGCGAGGAXCXGAAXAXGCXCAA CCXXCGACAGCAGXXCGXCGGCGXXCGGXCCCAGCXCGCXXAAAXCAACCXGACCGXGGC IGAXGCGTCCGGXAAGGGXGXXXXXGAXCGCGXXCGGCXGXXCGXAGAXCXCTXXCXGCA XGXAGXGACGGXAAAXGCCXXXAXCGCCCGCGXCAXAXXGCAGAXXGGAXXCGAXAXCCX

gacgxxxiacxxccgcgccagxxxxatcgaagaxgxxxaccgaacggcgagxgaxxxccg CAAXAXCGCCCXCXXCAAGGAAGAXAAAGCGACGGGXCACCGGCAACAGCGCCAGCXGGX

CAGAAGCGAXAAAGIIXICGCCCATCCCCAGGCCAAICACCAGCGGACTACCAGAACGIG

CCGCCAGCAGGGTATCCGGGTGACGGGAGTCCATGATCACTGTACCGTACGCACCACGCA

GCTGCGGGATAGCACGCAGAACGGCCTCACGCAGAGTCCCGCCTTGTTTCAGCTCCCAGT

TCACCAGATGGGCAATCACTTCGGTGTCGGTTTCAGAAACGAAGGTATAGCCACGCGCTT

TTAGCTCTTCACGCAGCGGTTCATGGTTTTCGATGATGCCGTTATGCACCACCACAATGT

GTTCAGAAACATGCGGATGCGCATTCACTTCTGAAGGTTCACCGTGGGTCGCCCAGCGAG

TGTGAGCAATACCAGTGCCGCCATGCAGAGGATGTTCTTCCGCTGCCTGTGCCAGCATCT

GGACTTTACCGAGGCGACGCAGGCGGGTCATATGACCTTCTGCATCAACAACGGCCAGAC

CGGCAGAGTCATATCCGCGGTATTCCAGACGACGTAAACCTTCAAGAAGGATTTCTGCTA

CATCACGITGCGCGATCGCGCCAACAATTCCACACAIATGtatatctccttcttgaaTTC

TAACAATTGATTGAATGTATGCAAATAAATGCATACACCATAGGTGTGGTTTAATTTGAT

GCCCTTTTTCAGGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGTTGTTTTTTTGTT

ACTCGGGAAGGGCTTTACCTCTTCCGCATAAACGCTTCCATCAGCGTTTATAGTTAAAAA

AATCTTTCGGAACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCTGCTTTCCATT

GAGCCTGTTTCTCTGCGCGACGTTCGCGGCGGCGTGTTTGTGCATCCATCTGGATTCTCC

TGTCAGTTAGCTTTGGTGGTGTGTGGCAGTTGTAGTCCTGAACGAAAACCCCCCGCGATT

GGCACATTGGCAGCTAATCCGGAATCGCACTTACGGCCAATGCTTCGTTTCGTATCACAC

ACCCCAAAGCCTTCTGCTTTGAATGCTGCCCTTCTTCAGGGCTTAATTTTTAAGAGCGTC

ACCIXCAIGGXGGXCAGXGCGXCCIGCXGAXGXGCXCAGXAICACCGCCAGXGGXAIIIA

TGTCAACACCGCCAGAGATAATTTATCACCGCAGATGGTTATCTGTATGTTTTTTATATG

AATTTATTTTTTGCAGGGGGGCATTGTTTGGTAGGTGAGAGATCAATTCTGCATTAATGA

ATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTGCTAGCGGA

GTGTATACTGGCTTACTATGTTGGCACTGATGAGGGTGTCAGTGAAGTGCTTCATGTGGC

AGGAGAAAAAAGGCTGCACCGGTGCGTCAGCAGAATATGTGATACAGGATATATTCCGCT

TCCTCGCTCACTGACTCGCTACGCTCGGTCGTTCGACTGCGGCGAGCGGAAATGGCTTAC

GAACGGGGCGGAGATTTCCTGGAAGATGCCAGGAAGATACTTAACAGGGAAGTGAGAGGG

CCGCGGCAAAGCCGTTTTTCCATAGGCTCCGCCCCCCTGACAAGCATCACGAAATCTGAC

GCTCAAATCAGTGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTG

GCGGCTCCCTCGTGCGCTCTCCTGTTCCTGCCTTTCGGTTTACCGGTGTCATTCCGCTGT

TATGGCCGCGTTTGTCTCATTCCACGCCTGACACTCAGTTCCGGGTAGGCAGTTCGCTCC

AAGCTGGACXGTATGCACGAACCCCCCGTTCAGTCCGACCGCXGCGCCTTATCCGGIAAC

IAXCGXCIXGAGXCCAACCCGGAAAGACAXGCAAAAGCACCACXGGCAGCAGCCACXGGX

AAXIGAXIXAGAGGAGXXAGXCXXGAAGXCAXGCGCCGGXXAAGGCXAAACIGAAAGGAC

AAGXXXXGGXGACXGCGCXCCXCCAAGCCAGXXACCXCGGXTCAAAGAGXXGGXAGCXCA

GAGAACCXTCGAAAAACCGCCCTGCAAGGCGGXXTTXXCGXTTTCAGAGCAAGAGATTAC

GCGCAGACCAAAACGATCTCAAGAAGAXCAXCXTATXAAXCAGATAAAATATTTCXAGGC

ggccgcGAACGAAAACXCACGXXAAGGGAXXXXGGXCAXGAGAXXAXCAAAAAGGAXCXX

CACCXAGAXCCXXXIAAAXXAAAAAXGAAGXXXXAAAXCAAICXAAAGXAXAXAXGAGXA

AACXXGGXCXGACAGXXACCAATGCXTAAXCAGXGAGGCACCXAXCXCAGCGAXCXGTCT

AXXXCGXICAXCCAIAGXXGCCXGACXCCCCGXCGXGXAGAXAACXACGAXACGGGAGGG

CTXACCAXCXGGCCCCAGXGCXGCAAXGAXACCGCGAGACCCACGCXCACCGGCXCCAGA

XXXAXCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXGGXCCXGCAACXXI

AXCCGCCICCAXCCAGXCXAXXAAXXGTXGCCGGGAAGCXAGAGXAAGXAGXXCGCCAGI

XAATAGXIXGCGCAACGXXGXXGCCAXXGCXACAGGCAXCGTGGXGXCACGCXCGXCGXT

XGGXAXGGCXXCAXXCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXACAXGAXCCCCCAX

GXXGXGCAAAAAAGCGGIXAGCXCCXICGGXCCICCGAICGXXGXCAGAAGIAAGXXGGC

CGCAGXGIXAXCACTCAXGGXXAXGGCAGCACXGCAXAAXXCXCXXACXGXCAXGCCAXC

CGXAAGAIGCXXXXCXGXGACXGGXGAGXACXCAACCAAGXCAXXCXGAGAATAGXGTAT

GCGGCGACCGAGXXGCXCXXGCCCGGCGXCAAXACGGGAXAAXACCGCGCCACAXAGCAG

AACIXIAAAAGXGCXCAICAXXGGAAAACGXICXICGGGGCGAAAACXCICAAGGAICIX

ACCGCXGIXGAGAXCCAGXXCGAXGXAACCCACXCGXGCACCCAACIGAXCXXCAGCAXC

IXXXACXIXCACCAGCGXXXCXGGGXGAGCAAAAACAGGAAGGCAAAAXGCCGCAAAAAA

GGGAAXAAGGGCGACACGGAAAXGXXGAAXACXCAXACXCXXCCXXXXXCAAXAXXAXXG

AAGCAXXIAXCAGGGXXAXIGXCXCAIGAGCGGAXACAXAXXXGAAIGXAXXXAGAAAAA

IAAACAAAXAGGGGXTCCGCGCACAXXICCCCGAAAAGIGCCACCIGACGXCIAAGAAAC

CAXXAXXAXCAXGACAXXAACCXAIAAAAAXAGGCGXAXCACGAGGCCCXXXCGXC

SEQ ID NO: 13

>neuC_N-acetylglucosam¡ne-6-phosphate-2-ep¡merase_GI_15193223_in_pG317

MKKILFITGSRADYSKIKSLMYRVQNSSEFELYIFATGMHLSKNFGYTVKELYKNGFKNI

YEFINYDKYYQTDKALATTIDGFSRYANELKPDLIWHGDRIEPLAAAIVGALNNILVAH

IEGGEISGTIDDSLRHAISKLAH1HLVNDEFAKRRLMQLGEDEKSIFIIGSPDLELLNDN

KISLSEAKKYYDINYENYALLMFHPVTTEITSIKNQADNLVKALIQSNKNYIVIYPNNDL

GFELILQSYEEFKNNPRFKLFPSLRFEYFITLLKNADFIIGNSSCILKEALYLKTAGILV

GSRQNGRLGNENTLKVNANSDEILKAINT1HKKQDLFSAKLEILDSSKLFFEYLQSGDFF

KLSTQKVFKDIK SEQ ID NO: 14

>neuB_sial¡c_acid_synthase_GI_15193222_¡n_pG317

MKEIKIQNIIISEEKAPLVVPEIGINHNGSLELAKIMVDAAFSAGAKIIKHQTHIVEDEM

SKAAKKVIPGNAKISIYEIMQKCALDYKDELALKEYTEKLGLVYLSTPFSRAGANRLEDM

GVSAFKIGSGECNNYPLIKHIAAFKKPMIVSTGMNSIESIKPTVKILLDNEIPFVLMHTT

NLYPTPHNL\^RLNAMLELKKEFSCMVGLSDHTTDNLACLGAWLGACVLERHFTDSMHRS

GPDIVCSMDTKALKELIIQSEQMAIIRGNNESKKAAKQEQVTIDFAFASWSIKDIKKGE

VLSMDNIWKRPGLGGISAAEFENILGKKALRDIENDAQLSYEDFA SEQ ID NO: 15

>neuA_CMP-Neu5Ac_synthase_GI_15193224_¡n_pG317

MSLAIIPARGGSKGIKNKNLVLLNNKPLIYYTIKAALNAKSISKVWSSDSDEILNYAKS

QNVDILKRPISLAQDDTTSDKVLLHALKFYKDYEDWFLQPTSPLRTN1HINEAFNLYKN

SNANALISVSECDNKILKAFVCNDCGDLAGICNDEYPFMPRQKLPKTYMSNGAIYILKIK

EFLNNPSFLQSKTKHFLMDESSSLDIDCLEDLKKVEQIWKK SEQ ID NO: 16

>AAF42258 lacto-N-neotetraosa biosíntesis de glucisil transferasa LgtA

[Neisseria meningitidis MC58],

MP SEAFRRHRAYRE NKLQP LVSVLICAYNVEKYFAQ SL A A W N Q TWRN LDILIVDDG STD GTLAIAQRFQEQDGRIRILAQPRNSGLIPSLNIGLDELAKSGGGGEYIARTDADDIAAPD WIEKIVGEMEKDRSIIAMGAWLEVLSEEKDGNRLARHHEHGKIWKKPTRHEDIADFFPFG NPIHNNTMIMRRSVIDGGLRYNTERDWAEDYQFWYDVSKLGRLAYYPEALVKYRLHANQV SSKYSIRQHEIAQGIQKTARNDFLQSMGFKTRFDSLEYRQIKAVAYELLEKHLPEEDFER ARRFLYQCFKRTDT LPAGAWLDFAADGRMRRLF TLRQYFGILHRL LKNR SEQ ID NO: 17

>NP_207619 epítopo lipopoligosacárido 5G8 proteína asociada a la biosíntesis Lex2B [Helicobacter pylori 26695],

MRVFAISLNQKVCDTFGLVFRDTTTLLNSINATHHQAQIFDAIYSKTFEGGLHPLVKKHL

HPYFITQNIKDMGITTNLISEVSKFYYALKYHAKFMSLGELGCYASHYSLWEKCIELNEA

ICILEDDITLKEDFKEGLDFLEKHIQELGYIRLMHLLYDASVKSEPLSHKNHEIQERVGI

IKAYSEGVGTQGYVITPKIAKVFLKCSRKWWPVDTIMDATF1HGVKNLVLQPFVIADDE

QISTIARKEEPYSPKIALMRELHFKYLKYWQFV SEQ ID NO: 18

> E.coli_WbgO_YP_003500090 supuesta glucosil transferasa WbgO [cepa de Escherichia coli 055: H7 CB9615], MIIDEAESAESTHPWSVILPVNKKNPFLDEAINSILSQTFSSFEIIIVANCCTDDFYNE LKHKVNDKIKLIRTNIAYLPYSLNKAIDLSNGEFIARMDSDDISHPDRFTKQVDFLKNNP YVDWGTNAIFIDDKGREINKTKLPEENLDIVKNLPYKCCIVHPSVMFRKKVIASIGGYM

FSNYSEDYELWNRLSLAKIKFQNLPEYLFYYRLHEGQSTAKKNLYMVMVNDLVIKMKCFF

LTGNINYLFGGIRTIASFIYCKYIK

SEQ ID NO: 19

>BAA35319 regulador doble transcripcional de unión al ADN nagC [cepa de Escherichia coli K-12 sustr. W3110],

MTPGGQAQIGNVDLVKQLNSAAVYRLIDQYGPISRIQIAEQSQLAPASVTKITRQLIERG

LIKEVDQQASTGGRRAISIVTETRNFHAIGVRLGRHDATITLFDLSSKVLAEEHYPLPER

TQQTLEHALLNAIAQFIDSYQRKLRELIAISVILPGLVDPDSGK1HYMPHIQVENWGLVE

ALEERFKVXCFVGHDIRSLALAEHYFGASQDCEDSILVRVHRGTGAGIISNGRIFIGRNG

NVGEIGHIQVEPLGERCHCGNFGCLETIAANAAIEQRVLNLLKQGYQSRVPLDDCTIKTI

CKAANKGDSLASEVIEYVGRHLGKTIAIAINLFNPQKIVIAGEITEADKVLLPAIESCIN

TQ ALKAFRTNLPW RSELDHRSAIG AFALVKRAM LNG ILLQ HLLEN

SEQ ID NO: 20

>NP_418185 L-glutamina: D-fructosa-6-fosfato aminotransferasa glmS [cepa de Escherichia coli K-12 sustr. ^MG1655],

MCGIVGAIAQRDVAEILLEGLRRLEYRGYDSAGLAWDAEGHMTRLRRLGKVQMLAQAAE

EHPLHGGTGIAHTRWATHGEPSEVNAHPHVSEHIVWHNGI IENHEPLREELKARGYTFV

SETDTEVIAHLVNWELKQGGTLREAVLRAIPQLRGAYGTVIMDSRHPDTLLAARSGSPLV

IGLGMGENFIASDQLALLPVTRRFIFLEEGDIAEITRRSVNIFDKTGAEVKRQDrESNLQ

YDAGDKGIYRHYMQKEIYEQPNAIKNTLTGRISHGQVDLSELGPNADELLSKVEHIQILA

CGTSYNSGMVSRYWFESLAGIPCDVEIASEFRYRKSAVRRNSLMITLSQSGEIADTLAGL

RLSKELGYLGSLAICNVPGSSLVRESDLALMTNAGTEIGVASTKAFTTQLTVLLMLVAKL

SRLKGLDASIEHDIVHGLQALPSRIEQMLSQDKRIEALAEDFSDKHHALFLGRGDQYPIA

LEGALKLKEISY1HAEAYAAGELKHGPLALIDADMPVIVVAPNNELLEKLKSNIEEVRAR

GGQLYVFADQDAGFVS SDNMHIIEMPHVEEVIAPIFYTVPLQLLAYHVALIKGTDVDQPR

NLAKSVTVE

SEQ ID NO: 21

> BAF92026 beta-galactósido alfa-2,6-sialiltransferasa [Photobacterium sp. JT-ISH-224],

MKNFLLLTLILLTACNNSEENTQSIIKNDINKTIIDEEYVNLEPINQSNISFTKHSWVQT

CGTQQLLTEQNKESISLSWAPRLDDDEKYCFDFNGVSNKGEKYITKVTLNWAPSLEVY

VDHASLPTLQQLMDIIKSEEENPTAQRYIAWGRIVPTDEQMKELNITSFALINNHTPADL

VQEIVKQAQTKHRLNVKLSSNTAHSFDNLVPILKELNSFNNVTVTNIDLYDDGSAEYVm

YNWRDTLNKTDNLKIGKDYLEDVINGINEDTSNTGTSSVYNWQKLYPANYHFLRKDYLTL

EPSLHELRDYIGDSLKQMQWDGFKKFNSKQQELFLSIVNFDKQKLQNEYNSSNLPNFVFT

GTTVWAGNHEREYYAKQQINVINNAINESSPHYLGNSYDLFFKGHPGGGIINILIMQNYP

SMVDIPSKISFEVLMMTDMLPDAVAGIASSLYFTIPAEKIKFIVFTSTETITDRETALRS

PLVQVMIKLGIVKEENVLFWADLPNCETGVCIAV

A continuación, se proporciona la secuencia de ADN en formato Genbank de la nueva configuración de genes diseñados en el locus thyA de Escherichia coli en cepas utilizadas para producir oligosacáridos que contienen N-acetilglucosamina.

LOCUS E680_thyA::2.8RBS_lacZ 5877 bp ADN lineal BCT 04 MAR. 2013 DEFINICIÓN cepa de Escherichia coli K-12 sustr. MG1655, genoma completo.

REGISTRO NC_000913

VERSIÓN NC_000913.2 GI: 49175990

PALABRAS CLAVE FUENTE cepa de Escherichia coli K-12 sustr. MG1655 (desconocido)

ORGANISMO cepa de Escherichia coli K-12 sustr. MG1655

Bacterias; Proteobacterias; Gammaproteobacterias; Enterobacteriales; Enterobacteriaceae; Escherichia.

REFERENCIA 1 (bases 1 a 4639675)

AUTORES Riley, M., Abe, T., Arnaud, MB, Berlyn, MK, Blattner, FR, Chaudhuri, RR,

Glasner, JD, Horiuchi, T., Keseler, IM, Kosuge, T., Mori, H., Perna, NT, Plunkett, G. III, Rudd, K.E., Serres, M.H., Thomas, G.H., Thomson, N.R., Wishart, D. y Wanner, B.L.

TITULO Escherichia coli K-12: a cooperatively developed annotation snapshot--2005 REVISTA Nucleic Acids Res. 34 (1), 1-9 (2006)

PUBMED 16397293

OBSERVACIÓN Estado de la publicación: solo en línea

REFERENCIA 2 (bases 1 a 4639675)

AUTORES Blattner, FR, Plunkett, G. III, Bloch, CA, Perna, NT, Burland, V., Riley, M.,

Collado-Vides, J., Glasner, JD, Rode, CK, Mayhew, GF, Gregor, J., Davis, NW, Kirkpatrick, HA, Goeden, MA, Rose, DJ, Mau, B. y Shao, Y.

TITULO The complete genome sequence of Escherichia coli K-12

REVISTA Science 277 (5331), 1453-1474 (1997)

PUBMED 9278503

REFERENCIA 3 (bases 1 a 4639675)

AUTORES Arnaud, M., Berlyn, MKB, Blattner, FR, Galperin, MY, Glasner, JD, Horiuchi, T.,

Kosuge, T., Mori, H., Perna, NT, Plunkett, G. III, Riley, M., Rudd, K.E., Serres, M.H., Thomas, G.H. y Wanner, B.L.

TITULO Workshop on Annotation of Escherichia coli K-12

REVISTA Sin publicar

OBSERVACIÓN Woods Hole, Massachusetts, el 14-18 Noviembre de 2003 (correcciones de secuencia)

REFERENCIA 4 (bases 1 a 4639675)

AUTORES Glasner, JD, Perna, NT, Plunkett, G. III, Anderson, B.D., Bockhorst, J., Hu, J.C.,

Riley, M., Rudd, K.E. y Serres, M.H.

TITULO ASAP: Escherichia coli K-12 strain MG1655 version m56

REVISTA Sin publicar

OBSERVACIÓN ASAP: Escherichia coli K-12 strain MG1655 version m56

REFERENCIA 5 (bases 1 a 4639675)

AUTORES Hayashi, K., Morooka, N., Mori, H. y Horiuchi, T.

TITULO A more accurate sequence comparison between genomes of Escherichia coli K12 W3110 and MG1655 strains

REVISTA Sin publicar

OBSERVACIÓN accesiones GenBank AG613214 a AG613378 (correcciones de secuencia) REFERENCIA 6 (bases 1 a 4639675)

AUTORES Perna, N. T.

TITULO Escherichia coli K-12 MG1655 yqiK-rfaE intergenic region, genomic sequence correction

REVISIÓN Sin publicar

OBSERVACIÓN accesión GenBank AY605712 (correcciones de secuencia)

REFERENCIA 7 (bases 1 a 4639675)

AUTORES Rudd, KE

TITULO A manual approach to accurate translation start site annotation: ab E. coli K-12 case study

REVISTA Sin publicar

REFERENCIA 8 (bases 1 a 4639675)

CONSORCIO Proyecto de genoma NCBI

TITULO Presentación directa

REVISTA Enviado (04-MAR-2013) National Center for Biotechnology Information, NIH,

Bethesda, MD 20894, EE.UU.

REFERENCIA 9 (bases 1 a 4639675)

AUTORES Rudd, K.E.

TITULO Presentación directa

REVISTA Enviado (06-FEB-2013) Departamento de Bioquímica y Biología Molecular,

Universidad de Miami Miller School of Medicine, 118 Gautier Bldg., Miami, FL 33136, EE.UU.

OBSERVACIÓN Actualización de la secuencia por el remitente

REFERENCIA 10 (bases 1 a 4639675)

AUTORES Rudd, KE

TITULO Presentación directa

REVISTA Enviado (24-ABR-2007) Departamento de Bioquímica y Biología Molecular,

(continuación)

OBSERVACIÓN Actualización de anotación de ecogene.org como una colaboración de base de datos múltiple

REFERENCIA 11 (bases 1 a 4639675)

AUTORES Plunkett, G. III.

TÍTULO Presentación directa

REVISTA Presentado (07-FEB-2006) Laboratorio de Genética, Universidad de Wisconsin,

425G Henry Mall, Madison, WI 53706-1580, EE.UU.

OBSERVACIÓN Actualizaciones de proteínas por el remitente

REFERENCIA 12 (bases 1 a 4639675)

AUTORES Plunkett, G. III.

TÍTULO Presentación directa

REVISTA Presentado (10-JUN-2004) Laboratorio de Genética, Universidad de Wisconsin,

425G Henry Mall, Madison, WI 53706-1580, EE.UU.

OBSERVACIÓN Actualización de secuencia por el remitente

REFERENCIA 13 (bases 1 a 4639675)

AUTORES Plunkett, G. III.

TÍTULO Presentación directa

REVISTA Presentado (13-OCT-1998) Laboratorio de Genética, Universidad de Wisconsin,

425G Henry Mall, Madison, WI 53706-1580, EE. UU.

REFERENCIA 14 (bases 1 a 4639675)

AUTORES Blattner, F.R. y Plunkett, G. III.

TÍTULO Presentación directa

REVISTA Presentado (02-SEP-1997) Laboratorio de Genética, Universidad de Wisconsin,

425G Henry Mall, Madison, WI 53706-1580, EE. UU.

REFERENCIA 15 (bases 1 a 4639675)

AUTORES Blattner, FR y Plunkett, G. III.

TÍTULO Presentación directa

REVISTA Presentado (16-JAN-1997) Laboratorio de Genética, Universidad de Wisconsin,

425G Henry Mall, Madison, WI 53706-1580, EE. UU.

COMENTARIO REFSEQ PROVISIONAL: Este registro aún no ha sido objeto de revisión final del NCBI. La secuencia de referencia es idéntica a U00096. El 24 de junio de 2004, esta versión de secuencia reemplazó gi: 16127994. Las actualizaciones de anotación actuales de U00096 proceden de EcoGene http://ecogene.org. Las sugerencias de las actualizaciones se pueden enviar al Dr. Kenneth Rudd (krudd@miami.edu). Estas actualizaciones se están generando a partir de una colaboración que también incluye ASAP/ERIC, el Coli Genetic Stock Center, EcoliHub, EcoCyc, RegulonDB y UniProtKB/Swiss-Prot.

COMPLETO: longitud completa.

CARACTERISTICAS Ubicación/Calificadores

Gen complemento (<1..245)

/gen = "ppdA"

/locus_tag = "b2826"

/gene_synonym = "ECK2822; JW2794"

/db_xref = "EcoGene: EG12081"

/db_xref = "GeneID: 945393"

CDS complemento (<1..245)

/gen = "ppdA"

/locus_tag = "b2826"

/gene_synonym = "ECK2822; JW2794"

/function = "enzima putativa; No clasificado"

/GO_component = "GO: 0009289 - pilus"

/GO_process = "GO: 0009101 - proceso biosintético de glicoproteína" /nota= "proteína A dependiente de la peptidasa prepilina"

/codon_start = 1

/transl_table = 11

/product = "proteína hipotética"

/protein_id = "NP 417303.1"

/db_xref = "GI: 16130730"

/db_xref = "ASAP: ABE-0009266"

/db_xref = "UniProtKB/Swiss: P33554"

/db_xref = "EcoGene: EG12081"

/db_xref = "GeneID: 945393"

fuente enlace (<1..449,4852.. >5877)

/organismo= "cepa de Escherichia coli K-12 sustr. MG1655"

/mol_type = "ADN genómico"

/cepa = "K-12 "

/sub_strain = "MG1655"

/db_xref = "taxón: 511145"

cebador 346.. 366

/nota = cagtcagtcaggcgccTTCGGGAAGGCGTCTCGAAGA (SEQ ID NO: 23) /marcador = 0268-THYA-R

característica mixta complemento (388..394)

/feature_type = "Bucle de horquilla"

/marcador = Terminador

cebador 400.. 449

/nota =GGCGTCGGCTCrGGCAGGATGTTTCGTAATTAGATAGCCACCGGCGCTTTag GaaacctactATGACCATGATTACGGATTCAC (SEQ IDNO: 24) /marcador="homología del cebador 50 pb thyA 3"

cebador 400..483

/nota -GGCGTCGGC_1-CTGGCAGGATGTITCGTAATTAGATAGCCACCGGCGCTTrat taaacctactATGACCATGATTACGGATTCAC (SEQ ID NO: 25) /marcador=1389-thtAKANlacZ-R-2-8

cebador 400..483

/marcador=1516-thyAKANlacZ-R-0-8

cebador 400..483

/ nota=GGCGTCGGCTCTGGCAGGATGTITCGTAATTAGATAGCCACCGGCGCTTTag GaaacctactATGACCATGATTACGGAirCAC (SEQ IDNO: 27)

/marcador="1041-thyAKANlacZ-R (4-8)"

característica mixta complemento(401..407)

/feature_type="Bucle de horquilla "

/marcador=Terminador

Cebador 405..472

/nota =CGGCTCTGGCAGGATGTTTCGTAATTAGATAGCCACCGGCGCTTTaTTaaac (SEQ IDNO: 28)

ctactAIGACCATGAI

/marcador = 1394-2/8-F

gen complemento (unión (429..449,4852..4854))

/gen = "ThyA"

CDS complemento (unión (429..449,4852..4854))

/gen = "thyA"

/nota = "ECK2823: JW2795: b2827"

/codon_start = 1

/transl_table = 11

/product = "timidilato sintetasa"

/protein_id = "BAE76896.1"

/db xref = "GI: 85675643"

/ traducción ="mkqylelmqkvldegtqkn dr tgtgt ls ifg hqmrfnlqdgfp l

VTTKRCHLRSI1HELLWFLQGDTHIAYLHENNVTIWDEWADEHGDLGPVYGKQWRAWP

TPDGRHIDQITTVLNQLKNDPDSRRIIV.SAWNVGELDKMALAPCHAFFQFYVADGKLS

CQLYQRSCDVFLGLPFNIASYALLVHMMAQQCDLEVGDFVWTGGDTHLYSNHMDQTHL QLSREPRPLPKLIIKRKPESIFDYRFEDFEIEGYDPHPGIKAPVAI" (SEQ ID NOr 43)

RBS 450.. 461

/marcador ="2.8 RBS"

fuente 450.. 3536

/organismo =" Escherichia coli W3110"

"/mol_type = "ADN genómico"

/cepa = "K-12"

/sub_strain = "W3110"

/db_xref = "taxón: 316407"

/nota= "sinónimo: cepa de Escherichia coli K12 substr. W3110" misc_feature 450.. 4851

/feature_type = Inserción

/nota = "se origina a partir de KanR-lacZRBS (E403)" /marcador = Insertar

misc_feature 449M50

/feature type = "sitio de variación de RBS"

/marcador = "C en 0/8"

misc_feature 450.. 453

/feature_type = "sitio de variación de RBS"

/marcador = "CTTC en 0/8"

misc_feature 451.. 452

/feature_type = "sitio de variación de RBS"

/marcador = "GG en 4/8"

misc_feature 451.. 452

/feature_type = "sitio de variación de RBS"

/marcador = "TT en 2/8"

CDS 462.. 3536

/gen = "lacZ"

/nota = "ECK0341: JW0335: b0344"

/codon_start = 1

/transl_table = 11

/producto = "beta-D-galactosidasa"

/protein_id= "BAE76126.1"

/db xref = "GI: 85674486"





/ traducción ="^{mieqdgl hagspaawverl fgydwaqqtigc sdaavfr ls aqgr}

PVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDWTEAGRDWLLLGEVPGQDL

LSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDE

EHQGLAPAELFARLKARMPDGEDLWTHGDACGPNIMVENGRFSGFIDCGRLGVADRY QDTALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF" {SEQ ID NO: 30)

cebador complemento (3677..3696)

/marcador = "0389 KD13 K4"

unión de cebador 3791.. 3810

/marcador = "sitio de cebado común kt"

cebador 3791.. 3810

/marcador = "cebador 0344 Wanner Kt"

mutación 3811

/marcador = "A en wt (cambio silencioso)"

cebador complemento (4242..4261)

/marcador = "cebador 0343 Wanner K2"

unión de cebador 4261.. 4280

/marcador = "sitio de cebado común k2"

unión de cebador 4352.. 4371

/marcador = "sitio de cebado común k1"

cebador 4352.. 4371

/marcador = "cebador 0342 Wanner K1"

unidad de repetición 4790.. 4801

/marcador = "sitio FLP"

marca complemento (4790..4851)

/marcador = "marca ascendente KD13"

misc_feature complemento (4790..4823)

/feature type = "sitio FRT"

/marcador = "sitio FRT de 34 pb"

unidad de repetición complemento (4812..4823)

/marcador = "sitio Flp"

cebador complemento (4832..4851)

/marcador = "0338 P4w-P1 b"

cebador complemento (4832..4901)

/marcador=1040-thyAKANlacZ-F

sitio complemento (4858..4863)

/site_type = "sitio de enlace"

/marcador = "thyA RBS"

gen complemento (4861..5736)

/gen = "lgt"

CDS complemento (4861..5736)

/gen = "lgt"

/nota= "ECK2824: JW2796: b2828"

/codon_start = 1

/transl_table = 11

/product = "fosfatidilglicerol-prolipoproteína diacilgliceril transferasa" /protein_id="BAE76897.1"

/db xref = "GI: 85675644"

/ traducción^ ''missylhfpefdpv if sig pval hwyglmylvgfif amwlatr r

ANRPGSGWTKNEVENLLYAGFLGVFLGGRIGYVLFYNFPQFMADPLYLFRVWDGGMSF

HGGLIGVIWMIIFARRTKRSFFQVSDFIAPLIPFGLGAGRLGNFIMGELWGRVDPNF

PFAÍ-ILFPGSRTEDILLLQTNPQWQSIFDrYGVLPRHPSQLYELLLEGVVLFIILNLYI

RKPRPMGAVSGLFLIGYSAFR11VEFFRQPDAQFTGAWVQYISMGQILSIPMIVAGVI

MMVWAYRRSPQQHVS" (SEQ ID NO; 32)

promotor complemento (4957..4962)

/marcador = "thyA WEAK -10"

promotor complemento (4978..4983)

/marcador = "thyA -35"

cebador complemento (5076..5099)

/nota =cagtcagtcaggcgccTCCTCAACCTGTATATTCGTAYAC (SEQ

ID NO: 33)

/marcador = 0267-THYA-F

Sitio complemento (5739..5744)

/site type = "sitio de enlace"

/marcador = "Igt RBS"

promotor complemento (5823..5828)

/marcador = "Igt -10 (fuerte)"

ORIGEN

1 GCAGCGGAAC TCACAAGGCA CCATAACGTC CCCTCCCTGA TAACGCTGAT ACTGTGGXCG 61 CGGTTATGCC AGTTGGCATC TTCACGTAAA TAGAGCAAAT AGTCCCGCGC CTGGCTGGCG 121 GTITGCCATA GCCGTTGCGA CTGCTGCCAG TATTGCCAGC CATAGAGTCC ACTTGCGCTT 181 AGCATGACCA AAATCAGCAT CGCGACCAGC GTTICAATCA GCGTATAACC ACGTTGIGTT 241 TTCATGCCGG CAGTATGGAG CGAGGAGAAA AAAAGACGAG GGCCAGXTTC IA X IX C IIC G 301 GCGCAICXXC CGGACXAIIX ACGCCGXXGC AGGACGXXGC AAAAIXICGG GAAGGCGICX 361 CGAAGAAXIX AACGGAGGGT AAAAAAACCG ACGCACACIG GCGXCGGCXC IGGCAGGAIG 421 XXXCGTAAXX AGAXAGCCAC CGGCGCXXXa t t a a a c c ta c tAXGACCAXG AXXACGGAXX 481 CACTGGCCGT CGTTTTACAA CGTCGTGACT GGGAAAACCC TGGCGTIACC CAACTTAATC 41 GCCIXGCAGC ACAXCCCCCX IXCGCCAGCX GGCGXAAXAG CGAAGAGGCC CGCACCGAXC 601 GCCCXXCCCA ACAGXTGCGC AGCCTGAAXG GCGAAXGGCG CTXXGCCXGG XXXCCGGCAC 661 CAGAAGCGGX GCCGGAAAGC XGGCXGGAGX GCGAXCXXCC XGAGGCCGAX ACXGXCGICG 721 ICCCCXCAAA CXGGCAGAXG CACGGXXACG AIGCGCCCAX CTACACCAAC GTGACCXAIC

781 CCATTACGGT CAATCCGCCG TTTGTTCCCA CGGAGAATCC GACGGGTTGT TACTCGCTCA

841 CATTTAATGT TGATGAAAGC TGGCTACAGG AAGGCCAGAC GCGAATTATT TTTGATGGCG

901 TTAACTCGGC GTTTCATCTG TGGTGCAACG GGCGCTGGGT CGGTTACGGC CAGGACAGTC

961 GTTTGCCGTC TGAATTTGAC CTGAGCGCAT TTTTACGCGC CGGAGAAAAC CGCCTCGCGG

1021 TGATGGTGCT GCGCTGGAGT GACGGCAGTT ATCTGGAAGA TCAGGATATG TGGCGGATGA

1081 GCGGCATTTT CCGTGACGTC TCGTTGCTGC ATAAACCGAC TACACAAATC AGCGATTTCC

1141 ATGTTGCCAC TCGCTTTAAT GATGATTTCA GCCGCGCTGT ACTGGAGGCT GAAGTTCAGA

1201 TGTGCGGCGA GTTGCGTGAC TACCTACGGG TAACAGTTXC TTTATGGCAG GGTGAAACGC

1261 AGGTCGCCAG CGGCACCGCG CCTTTCGGCG GTGAAATTAT CGAIGAGCGT GGTGGTTATG

1321 CCGATCGCGT CACACTACGT CXGAACGXCG AAAACCCGAA ACTGTGGAGC GCCGAAATCC

1381 CGAATCTCTA XCGTGCGGTG GTTGAACTGC ACACCGCCGA CGGCACGCXG AXTGAAGCAG

1441 AAGCCTGCGA TGTCGGTTTC CGCGAGGTGC GGATTGAAAA TGGTCTGCTG CTGCTGAACG

1501 GCAAGCCGXX GCTGAXXCGA GGCGXXAACC GXCACGAGCA TCAXCCXCXG CAXGGTCAGG

1561 XCAXGGAXGA GCAGACGAXG GXGCAGGAXA XCCXGCXGAX GAAGCAGAAC AACXXXAACG

1621 CCGXGCGCTG XXCGCAITAT CCGAACCATC CGCTGXGGXA CACGCXGTGC GACCGCXACG

1681 GCCXGXAXGT GGXGGAXGAA GCCAAXAXXG AAACCCACGG CAXGGXGCCA ATGAAXCGXC

1741 XGACCGAXGA XCCGCGCXGG CXACCGGCGA XGAGCGAACG CGXAACGCGA ATGGXGCAGC

1801 GCGAXCGXAA XCACCCGAGX GXGAXCATCX GGXCGCXGGG GAAXGAAXCA GGCCACGGCG

1861 CXAAXCACGA CGCGCXGIAX CGCTGGAXCA AAXCTGICGA XCCXXCCCGC CCGGXGCAGX

1921 AXGAAGGCGG CGGAGCCGAC ACCACGGCCA CCGAXAXTAX TXGCCCGAXG XACGCGCGCG 1981 XGGAXGAAGA CCAGCCCXXC CCGGCXGTGC CGAAAXGGTC CAXCAAAAAA XGGCTTXCGC 2041 TACCXGGAGA GACGCGCCCG CTGATCCTXX GCGAAXACGC CCACGCGAXG GGTAACAGXC 2101 XXGGCGGXXX CGCTAAAXAC XGGCAGGCGX XXCGXCAGTA TCCCCGXXXA CAGGGCGGCX 2161 XCGXCXGGGA CXGGGXGGAX CAGXCGCTGA XXAAAXAXGA TGAAAACGGC AACCCGXGGX 2221 CGGCXXACGG CGGTGAXXXT GGCGATACGC CGAACGATCG CCAGTTCTGX AXGAACGGXC 2281 XGGXCXXXGC CGACCGCACG CCGCAXCCAG CGCXGACGGA AGCAAAACAC CAGCAGCAGX 2341 XXXXCCAGXX CCGTXXAXCC GGGCAAACCA XCGAAGXGAC CAGCGAAXAC CXGXTCCGXC 2401 AXAGCGAXAA CGAGCXCCXG CACXGGATGG XGGCGCXGGA TGGXAAGCCG CXGGCAAGCG 2461 GXGAAGXGCC XCTGGAXGXC GCTCCACAAG GXAAACAGTX GAXIGAACXG CCXGAACXAC 2521 CGCAGCCGGA GAGCGCCGGG CAACXCTGGC XCACAGXACG CGXAGXGCAA CCGAACGCGA 2581 CCGCAXGGXC AGAAGCCGGG CACAXCAGCG CCXGGCAGCA GXGGCGXCXG GCGGAAAACC 2641 XCAGXGXGAC GCTCCCCGCC GCGXCCCACG CCAXCCCGCA TCXGACCACC AGCGAAAXGG 2701 ATITXXGCAI CGAGCXGGGX AATAAGCGTT GGCAATXXAA CCGCCAGXCA GGCTTXCTXX 2761 CACAGAXGXG GATTGGCGAX AAAAAACAAC XGtXGACGCC GCXGCGCGAX CAGXTCACCC 2821 GTGCACCGCT GGATAACGAC AXTGGCGTAA GTGAAGCGAC CCGCATXGAC CCTAACGCCT 2881 GGGXCGAACG CXGGAAGGCG GCGGGCCAXX ACCAGGCCGA AGCAGCGXXG XXGCAGXGCA 2941 CGGCAGAXAC ACTTGCXGAX GCGGXGCTGA XXACGACCGC TCACGCGXGG CAGCATCAGG 3001 GGAAAACCXX AXXTATCAGC CGGAAAACCX ACCGGAXXGA TGGXAGIGGX CAAATGGCGA 3061 XXACCGXXGA XGXTGAAGXG GCGAGCGAXA CACCGCATCC GGCGCGGATX GGCCTGAACT 3121 GCCAGCXGGC GCAGGXAGCA GAGCGGGTAA ACXGGCXCGG AXXAGGGCCG CAAGAAAACX 3181 AXCCCGACCG CCXTACXGCC GCCXGITTXG ACCGCXGGGA TCXGCCAXXG XCAGACAXGX 3241 AXACCCCGXA CGTCXXCCCG AGCGAAAACG GXCXGCGCXG CGGGACGCGC GAAXTGAAXX 3301 AXGGCCCACA CCAGXGGCGC GGCGACXXCC AGXXCAACAX CAGCCGCXAC AGXCAACAGC 3361 AACXGAXGGA AACCAGCCAX CGCCAXCXGC XGCACGCGGA AGAAGGCACA TGGCXGAAXA 3421 XCGACGGXXX CCAXAXGGGG AXXGGXGGCG ACGACXCCXG GAGCCCGXCA GXAXCGGCGG 3481 AAXXCCAGCX GAGCGCCGGX CGCXACCAXX ACCAGXXGGX CXGGXGXCAA AAAXAAGCGG 3541 CCGCtXXAXG XAGGCXGGAG CXGCXXCGAA GXXCCXAXAC XXXCXAGAGA AXAGGAACXX 3601 CGGAAXAGGA ACTTCAAGAI CCCCXXATXA GAAGAACICG TCAAGAAGGC GAXAGAAGGC 3661 GAIGCGCXGC GAAXCGGGAG CGGCGAIACC GXAAAGCACG AGGAAGCGGX CAGCCCAXXC 3721 GCCGCCAAGC XCXXCAGCAA XAXCACGGGX AGCCAACGCX AXGXCCXGAX AGCGGXCCGC 3781 CACACCCAGC CGGCCACAGX CGAXGAAXCC tGAAAAGCGG CCAXXXXCCA CCAXGAXAXX 3841 CGGCAAGCAG GCATCGCCAX GGGXCACGAC GAGAXCCXCG CCGICGGGCA XGCGCGCCXX 3901 GAGCCXGGCG AACAGXXCGG CXGGCGCGAG CCCCXGAXGC XCXXCGXCCA GAXCAXCCXG 3961 AXCGACAAGA CCGGCXXCCA XCCGAGIACG XGCXCGCXCG AXGCGAXGXX XCGCXXGGIG 4021 GXCGAAXGGG CAGGXAGCCG GAXCAAGCGX AXGCAGCCGC CGCAXXGCAX CAGCCAXGAX 4081 GGAXACXXXC XCGGCAGGAG CAAGGXGAGA XGACAGGAGA XCCXGCCCCG GCACXXCGCC 4141 CAAXAGCAGC CAGICCCXXC CCGCXXCAGX GACAACGXCG AGCACAGCXG CGCAAGGAAC 4201 GCCCGXCGXG GCCAGCCACG AXAGCCGCGC XGCCXCGXCC TGCAGXXCAX TCAGGGCACC 4261 GGACAGGXCG GXCXXGACAA AAAGAACCGG GCGCCCCXGC GCXGACAGCC GGAACACGGC

4321 GGCAXCAGAG CAGCCGAXXG XCIGXXGXGC CCAGXCAXAG CCGAAXAGCC XCXCCACCCA

4381 AGCGGCCGGA GAACCXGCGX GCAAXCCAXC XXGXXCAAXC AXGCGAAACG AXCCXCAXCC 4441 TGTCTCTTGA TCAGATCTTG ATCCCCTGCG CCATCAGATC CTTGGCGGCA AGAAAGCCAT 4501 CCAGTTTACT TTGCAGGGCT TCCCAACCTT ACCAGAGGGC GCCCCAGCTG GCAATTCCGG 4561 TTCGCTTGCT GTCCATAAAA CCGCCCAGTC TAGCTATCGC CATGTAAGCC CACTGCAAGC 4621 TACCTGCTTT CTCTTTGCGC TTGCGTTTTC CCTTGTCCAG ATAGCCCAGT AGCTGACATT 4681 CATCCGGGGT CAGCACCGTT TCTGCGGACT GGCTTTCTAC GTGTTCCGCT TCCTTTAGCA 4741 GCCCTTGCGC CCTGAGTGCT TGCGGCAGCG TGAGCTTCAA AAGCGCTCTG AAGTTCCTAT 4801 ACTTTCTAGA GAATAGGAAC TTCGAACTGC AGGTCGACGG ATCCCCGGAA TCATGGTTCC 4861 TCAGGAAACG TGTTGCTGTG GGCTGCGACG ATATGCCCAG ACCATCATGA TCACACCCGC 4921 GACAATCATC GGGATGGAAA GAATTTGCCC CATGCTGATG TACTGCACCC AGGCACCGGT 4981 AAACTGCGCG TCGGGCTGGC GGAAAAACTC AACAATGATG CGAAACGCGC CGTAACCAAT 5041 CAGGAACAAA CCTGAGACAG CTCCCATTGG GCGTGGTTTA CGAATATACA GGTTGAGGAT 5101 AATAAACAGC ACCACACCTT CCAGCAGCAG CTCGTAAAGC TGTGATGGGT GGCGCGGCAG 5161 CACACCGTAA GTGTCGAAAA TGGATTGCCA CTGCGGGTTG GTTTGCAGCA GCAAAATATC 5221 TTCTGTACGG GAGCCAGGGA ACAGCATGGC AAACGGGAAG TTCGGGTCAA CGCGGCCCCA 5281 CAATTCACCG TTAATAAAGT TGCCCAGACG CCCGGCACCA AGACCAAACG GAATGAGTGG 5341 TGCGATAAAA TCAGAGACCT GGAAGAAGGA ACGTTTAGTA CGGCGGGCGA AGATAATCAT 5401 CACCACGATA ACGCCAAXCA GGCCGCCGTG GAAAGACATG CCGCCGTCCC AGACACGGAA 5461 CAGATACAGC GGATCGGCCA TAAACTGCGG GAAATTGTAG AACAGAACAT AACCAATACG 5521 TCCCCCGAGG AAGACGCCGA GGAAGCCCGC ATAGAGTAAG ITTTCAACTT CATTTTTGGT 5581 CCAGCCGCTG CCCGGACGAT TCGCCCGTCG TGTTGCCAGC CACATTGCAA AAATGAAACC 5641 CACCAGATAC ATCAGGCCGT ACCAGTGAAG CGCCACGGGT CCTATTGAGA AAATGACCGG 5701 ATCAAACTCC GGAAAATGCA GATAGCTACT GGTCATCTGT CACCACAAGT TCTTGTTATT 5761 TCGCTGAAAG AGAACAGCGA TTGAAATGCG CGCCGCAGGT TTCAGGCGCT CCAAAGGTGC 5821 GAATAATAGC ACAAGGGGAC CTGGCTGGTT GCCGGATACC GTTAAAAGAT ATGTATA

(SEQ ID NO: 34)

A continuación se proporciona la secuencia de ADN en formato Genbank de la configuración de genes en el locus nan de Escherichia coli, y los detalles de los criterios de valoración de la deleción encontrados en las cepas diseñadas por ingeniería genética E1017 y E1018.

LOCUS W3110_nanRATEKyhcH_región 5861 pb ADN lineal BCT 19FEB. 2009 DEFINICIÓN cepa de Escherichia coli K-12 sustr. W3110 cepa K-12.

REGISTRO AC 000091

VERSIÓN AC_000091.1 GI: 89106884

PALABRAS CLAVE FUENTE cepa de Escherichia coli K-12 sustr. W3110 (desconocido)

ORGANISMO cepa de Escherichia coli K-12 sustr. W3110

REFERENCIA 1

TÍTULO Escherichia coli K-12: a cooperatively developed annotation snapshot--2005

REVISTA Nucleic Acids Res. 34 (1), 1-9 (2006)

PUBMED 16397293

OBSERVACIÓN Estado de la publicación: solo en línea

REFERENCIA 2 (bases 1 a 4646332)

AUTORES Hayashi, K., Morooka, N., Yamamoto, Y., Fujita, K., Isono, K., Choi, S., Ohtsubo,

E., Baba, T., Wanner, BL, Mori, H. y Horiuchi, T.

TÍTULO Highly accurate genome sequences of Escherichia coli K-12 strains MG1655 and W3110

REVISTA Mol. Syst. Biol. 2, 2006 (2006)

PUBMED 16738553

REFERENCIA 3

(continuación)

AUTORES Yamamoto, Y., Aiba, H., Baba, T., Hayashi, K., Inada, T., Isono, K., Itoh, T.,

Kimura, S., Kitagawa, M., Makino, K., Miki, T., Mitsuhashi, N., Mizobuchi, K., Mori, H., Nakade, S., Nakamura, Y., Nashimoto, H., Oshima, T., Oyama, S., Saito, N., Sampei, G., Satoh, Y., Sivasundaram, S., Tagami, H., Takahashi, H., Takeda, J., Takemoto, K., Uehara, K., Wada, C., Yamagata, S. y Horiuchi, T. TITULO Construction of a contiguous 874-kb sequence of the Escherichia coli -K12 genome corresponding to 50.0-68.8 min on the linkage map and analysis of its sequence features

REVISTA DNA Res. 4 (2), 91-113 (1997)

PUBMED 9205837

REFERENCIA 4

AUTORES Itoh, T., Aiba, H., Baba, T., Hayashi, K., Inada, T., Isono, K., Kasai, H., Kimura,

S. , Kitakawa, M., Kitagawa, M., Makino, K., Miki, T., Mizobuchi, K., Mori, H., Mori, T. , Motomura, K., Nakade, S., Nakamura, Y., Nashimoto, H., Nishio, Y., Oshima, T., Saito, N., Sampei, G., Seki, Y., Sivasundaram, S., Tagami, H., Takeda, J., Takemoto, K., Wada, C., Yamamoto, Y. y Horiuchi, T.

TITULO A 460-kb DNA sequence of the Escherichia coli K-12 genome corresponding to the 40.1-50.0 min region on the linkage map

REVISTA DNA Res. 3 (6), 379-392 (1996)

PUBMED 9097040

REFERENCIA 5

AUTORES Aiba, H., Baba, T., Hayashi, K., Inada, T., Isono, K., Itoh, T., Kasai, H.,

Kashimoto, K., Kimura, S., Kitakawa, M., Kitagawa, M., Makino, K., Miki, T., Mizobuchi, K., Mori, H., Mori, T., Motomura, K., Nakade, S., Nakamura, Y., Nashimoto, H., Nishio, Y., Oshima, T., Saito, N., Sampei, G., Seki, Y., Sivasundaram, S., Tagami, H., Takeda, J., Takemoto, K., Takeuchi, Y., Wada, C., Yamamoto, Y. y Horiuchi, T.

TITULO A 570-kb DNA sequence of the Escherichia coli K-12 genome corresponding to the 28.0-40.1 min region on the linkage map

REVISTA DNA Res. 3 (6), 363-377 (1996)

PUBMED 9097039

REFERENCIA 6

AUTORES Arn, E.A. y Abelson, J.N.

TITULO The 2'-5' RNA ligase of Escherichia coli. Purification, cloning, and genomic disruption

REVISTA J. Biol. Chem. 271 (49), 31145-31153 (1996)

PUBMED 8940112

REFERENCIA 7

AUTORES Oshima, T., Aiba, H., Baba, T., Fujita, K., Hayashi, K., Honjo, A., Ikemoto, K.,

Inada, T., Itoh, T., Kajihara, M., Kanai, K., Kashimoto, K., Kimura, S., Kitagawa, M., Makino, K., Masuda, S., Miki, T., Mizobuchi, K., Mori, H., Motomura, K., Nakamura, Y., Nashimoto, H., Nishio, Y., Saito, N., Sampei, G, Seki, Y., Tagami, H., Takemoto, K., Wada, C., Yamamoto, Y., Yano, M. y Horiuchi, T.

TITULO A 718-kb DNA sequence of the Escherichia coli K-12 genome corresponding to the 12.7-28.0 min region on the linkage map

REVISTA DNA Res. 3 (3), 137-155 (1996)

PUBMED 8905232

REFERENCIA 8

AUTORES Fujita, N., Mori, H., Yura, T. e Ishihama, A.

TITULO Systematic sequencing of the Escherichia coli genome: analysis of the 2.4-4.1 min (110,917-193,643 bp) region)

REVISTA Nucleic Acids Res. 22 (9), 1637-1639 (1994)

PUBMED 8202364

REFERENCIA 9

AUTORES Janosi, L., Shimizu, I. y Kaji, A.

TITULO Ribosome recycling factor (ribosome releasing factor) is essential for bacterial growth

REVISTA Proc. Natl Acad Sci. USA 91 (10), 4249-4253 (1994)

PUBMED 8183897

REFERENCIA 10

AUTORES Allikmets, R., Gerrard, B., Court, D. y Dean, M.

TITULO Cloning and organization of the abc and mdl genes of Escherichia coli:

relationship to eukaryotic multidrug resistance

(continuación)

REVISTA Gene 136 (1-2), 231-236 (1993)

PUBMED 7904973

REFERENCIA 11

AUTORES van Heeswijk, WC, Rabenberg, M., Westerhoff, HV y Kahn, D.

TÍTULO The genes of the glutamine synthetase adenylylation cascade are not regulated by nitrogen in Escherichia coli

REVISTA Mol. Microbiol. 9 (3), 443-457 (1993)

PUBMED 8412694

REFERENCIA 12

AUTORES Zhao, S., Sandt, CH, Feulner, G., Vlazny, DA, Gray, JA y Hill, C.W.

TÍTULO Rhs elements of Escherichia coli K-12: complex composites of shared and unique components that have different evolutionary histories

REVISTA J. Bacteriol. 175 (10), 2799-2808 (1993)

PUBMED 8387990

REFERENCIA 13

AUTORES Yamada, M., Asaoka, S., Saier, MH Jr. y Yamada, Y.

TITULO Characterization of the gcd gene from Escherichia coli K-12 W3110 and regulation of its expression

REVISTA J. Bacteriol. 175 (2), 568-571 (1993)

PUBMED 8419307

REFERENCIA 14

AUTORES Cormack, R.S. y Mackie, G.A.

TÍTULO Structural requirements for the processing of Escherichia coli 5 S ribosomal RNA by RNase E in vitro

REVISTA J. Mol. Biol. 228 (4), 1078-1090 (1992)

PUBMED 1474579

REFERENCIA 15

AUTORES Gervais, F.G. y Drapeau, G.R.

TÍTULO Identification, cloning, and characterization of rcsF, a new regulator gene for exopolysaccharide synthesis that suppresses the division mutation ftsZ84 in Escherichia coli K-12

REVISTA J. Bacteriol. 174 (24), 8016-8022 (1992)

PUBMED 1459951

REFERENCIA 16

AUTORES Yamanaka, K., Ogura, T., Niki, H. y Hiraga, S.

TÍTULO Identification and characterization of the smbA gene, a suppressor of the mukB null mutant of Escherichia coli

REVISTA J. Bacteriol. 174 (23), 7517-7526 (1992)

PUBMED 1447125

REFERENCIA 17

AUTORES Condon, C., Philips, J., Fu, ZY, Squires, C. y Squires, C.L.

TÍTULO Comparison of the expression of the seven ribosomal RNA operons in Escherichia coli

REVISTA EMBO J. 11 (11), 4175-4185 (1992)

PUBMED 1396599

REFERENCIA 18

AUTORES Arnqvist, A., Olsen, A., Pfeifer, J., Russell, DG y Normark, s.

TÍTULO The Crl protein activates cryptic genes for curli formation and fibronectin binding in Escherichia coli HB101

REVISTA Mol. Microbiol. 6 (17), 2443-2452 (1992)

PUBMED 1357528

REFERENCIA 19

AUTORES Talarico, TL, Ray, PH, Dev, IK, Merrill, BM y Dallas, W.S.

TÍTULO Cloning, sequence analysis, and overexpression of Escherichia coli folK, the gene coding for 7,8-dihydro-6-hydroxymethylpterin-pyrophosphokinase REVISTA J. Bacteriol. 174 (18), 5971-5977 (1992)

PUBMED 1325970

REFERENCIA 20

AUTORES Li, S.J. y Cronan, J.E. Jr.

TÍTULO The genes encoding the two carboxyltransferase subunits of Escherichia coli acetyl-CoA carboxylase

R E V IS T A J. Biol. Chem. 267 (24), 16841-16847 (1992)

P U B M E D 1355089

(continuación)

REFERENCIA 21

AUTORES Yura, T., Mori, H., Nagai, H., Nagata, T., Ishihama, A., Fujita, N., Isono, K.,

Mizobuchi, K. y Nakata, A.

TÍTULO Systematic sequencing of the Escherichia coli genome: analysis of the 0-2.4 min region.

REVISTA Nucleic Acids Res. 20 (13), 3305-3308 (1992)

PUBMED 1630901

REFERENCIA 22

AUTORES Ghosh, SK, Biswas, SK Paul K. y Das, J.

TÍTULO Nucleotide and deduced amino acid sequence of the recA gene of Vibrio cholerae REVISTA Nucleic Acids Res. 20 (2), 372 (1992)

PUBMED 1741267

REFERENCIA 23

AUTORES Smallshaw, J.E. y Kelln, R.A.

TÍTULO Cloning, nucleotide sequence and expression of the Escherichia coli K-12 pyrH gene encoding UMP kinase

REVISTA Genetics (Life Sci. Adv.) 11, 59-65 (1992)

REFERENCIA 24

AUTORES O'Neill, G.P., Grygorczyk, R., Adam, M. y Ford-Hutchinson, A.W.

TÍTULO The nucleotide sequence of a voltage-gated chloride channel from the electric organ of Torpedo californica

REVISTA Biochim. Biofis Acta 1129 (1), 131-134 (1991)

PUBMED 1721838

REFERENCIA 25

AUTORES Kajie, S., Ideta, R., Yamato, I. y Anraku, Y.

TÍTULO Molecular cloning and DNA sequence of dniR, a gene affecting anaerobic expression of the Escherichia coli hexaheme nitrite reductase

REVISTA FEMS Microbiol. Lett. 67 (2), 205-211 (1991)

PUBMED 1663890

REFERENCIA 26

AUTORES Hershfield, MS, Chaffee, S., Koro-Johnson, L., Mary, A., Smith, AA y Short, S.A. TÍTULO Use of site-directed mutagenesis to enhance the epitopeshielding effect of covalent modification of proteins with polyethylene glycol

REVISTA Proc. Natl Acad Sci. U.S.A. 88 (16), 7185-7189 (1991)

PUBMED 1714590

REFERENCIA 27

AUTORES Shimizu, I. y Kaji, A.

TÍTULO Identification of the promoter region of the ribosome releasing factor cistron (frr) REVISTA J. Bacteriol. 173 (16), 5181-5187 (1991)

PUBMED 1860827

REFERENCIA 28

AUTORES Poulsen, LK, Refn, A., Molin, S. y Andersson, P.

TÍTULO The gef gene from Escherichia coli is regulated at the level of translation REVISTA Mol. Microbiol. 5 (7), 1639-1648 (1991)

PUBMED 1943701

REFERENCIA 29

AUTORES Poulsen, LK, Refn, A., Molin, S. y Andersson, P.

TÍTULO Topographic analysis of the toxic Gef protein from Escherichia coli REVISTA Mol. Microbiol. 5 (7), 1627-1637 (1991)

PUBMED 1943700

REFERENCIA 30

AUTORES Kawamukai, M., Utsumi, R., Takeda, K., Higashi, A., Matsuda, H., Choi, YL y Komano, T.

TÍTULO Nucleotide sequence and characterization of the sfs1 gene: sfs1 is involved in CRP*-dependent mal gene expression in Escherichia coli

REVISTA J. Bacteriol. 173 (8), 2644-2648 (1991)

PUBMED 2013578

REFERENCIA 31

AUTORES Hulton, C.S., Higgins, C.F. y Sharp, P.M.

TÍTULO ERIC sequences: a novel family of repetitive elements in the genomes of Escherichia coli, Salmonella typhimurium and other enterobacteria REVISTA Mol. Microbiol. 5 (4), 825-834 (1991)

(continuación)

PUBMED 1713281

REFERENCIA 32

AUTORES Munro, AW, Ritchie, GY, Lamb, AJ, Douglas, RM y Booth, I.R.

TÍTULO The cloning and DNA sequence of the gene for the glutathione-regulated potassium-efflux system KefC of Escherichia coli

REVISTA Mol. Microbiol. 5 (3), 607-616 (1991)

PUBMED 2046548

REFERENCIA 33

AUTORES Arigoni, F., Kaminski, PA, Hennecke, H. y Elmerich, C.

TÍTULO Nucleotide sequence of the fixABC region of Azorhizobium caulinodans ORS571:

similarity of the fixB product with eukaryotic flavoproteins, characterization of fixX, and identification of nifW

REVISTA Mol. Gen. Genet. 225 (3), 514-520 (1991)

PUBMED 1850088

REFERENCIA 34

AUTORES Mattick, JS, Anderson, BJ, Cox, PT, Dalrymple, BP, Bills, MM, Hobbs, M. y Egerton, J.R.

TÍTULO Gene sequences and comparison of the fimbrial subunits representative of Bacteroides nodosus serotypes A to I: class I and class II strains

REVISTA Mol. Microbiol. 5 (3), 561-573 (1991)

PUBMED 1675419

REFERENCIA 35

AUTORES Company, M., Arenas, J. y Abelson, J.

TÍTULO Requirement of the RNA helicase-like protein PRP22 for release of messenger RNA from spliceosomes

REVISTA Nature 349 (6309), 487-493 (1991)

PUBMED 1992352

REFERENCIA 36

AUTORES Umeda, M. y Ohtsubo, E.

TÍTULO Four types of IS1 with differences in nucleotide sequence reside in the Escherichia coli K-12 chromosome

REVISTA Gene 98 (1), 1-5 (1991)

PUBMED 1849492

REFERENCIA 37

AUTORES Hirvas, L., Koski,PAG. y Vaara, M.

TÍTULO The ompH gene of Yersinia enterocolitica: cloning, sequencing, expression, and comparison with known enterobacterial ompH sequences

REVISTA J. Bacteriol. 173 (3), 1223-1229 (1991)

PUBMED 1991717

REFERENCIA 38

AUTORES Bouvier, J. y Stragier, P.

TÍTULO Nucleotide sequence of the lsp-dapB interval in Escherichia coli

REVISTA Nucleic Acids Res. 19 (1), 180 (1991)

PUBMED 2011499

REFERENCIA 39

AUTORES Dicker, I.B. y Seetharam, S.

TÍTULO Cloning and nucleotide sequence of the firA gene and the firA200(Ts) allele from Escherichia coli

REVISTA J. Bacteriol. 173 (1), 334-344 (1991)

PUBMED 1987124

REFERENCIA 40

AUTORES Grimm, B., Bull, A. y Breu, V.

TÍTULO Structural genes of glutamate 1-semialdehyde aminotransferase for porphyrin synthesis in a cyanobacterium and Escherichia coli

REVISTA Mol. Gen. Genet. 225 (1), 1-10 (1991)

PUBMED 1900346

REFERENCIA 41

AUTORES Allen, B.L., Gerlach, G.F. y Clegg, S.

TÍTULO Nucleotide sequence and functions of mrk determinants necessary for expression of type 3 fimbriae in Klebsiella pneumoniae

R E V IS T A J. Bacteriol. 173 (2), 916-920 (1991)

P U B M E D 1670938

(continuación)

REFERENCIA 42

AUTORES Chen, H., Lawrence, CB, Bryan, SK y Moses, R.E.

TÍTULO Aphidicolin inhibits DNA polymerase II of Escherichia coli, an alpha-like DNA polymerase

REVISTA Nucleic Acids Res. 18 (23), 7185-7186 (1990)

PUBMED 2124684

REFERENCIA 43

AUTORES Mallonee, D.H., White, W.B. y Hylemon, P.B.

TÍTULO Cloning and sequencing of a bile acid-inducible operon from Eubacterium sp.

strain VPI 12708

REVISTA J. Bacteriol. 172 (12), 7011-7019 (1990)

PUBMED 2254270

REFERENCIA 44

AUTORES Young, C., Collins- Emerson, JM, Terzaghi, EA y Scott, D.B.

TÍTULO Nucleotide sequence of Rhizobium loti nodI

REVISTA Nucleic Acids Res. 18 (22), 6691 (1990)

PUBMED 2251131

REFERENCIA 45

AUTORES Chen, H., Sun, Y., Stark, T., Beattie, W. y Moses, R.E.

TITULO Nucleotide sequence and deletion analysis of the polB gene of Escherichia coli REVISTA DNA Cell Biol. 9 (9), 631-635 (1990)

PUBMED 2261080

REFERENCIA 46

AUTORES Eriani, G., Delarue, M., Poch, O., Gangloff, J. y Moras, D.

TÍTULO Partition of tRNA synthetases into two classes based on mutually exclusive sets of sequence motifs

REVISTA Nature 347 (6289), 203-206 (1990)

PUBMED 2203971

REFERENCIA 47

AUTORES Showalter, RE y Silverman, M.R.

TÍTULO Nucleotide sequence of a gene, hpt, for hypoxanthine phosphoribosyltransferase from Vibrio harveyi

REVISTA Nucleic Acids Res. 18 (15), 4621 (1990)

PUBMED 2388850

REFERENCIA 48

AUTORES Martin-Verstraete, I., Debarbouille, M., Klier, A. y Rapoport, G.

TÍTULO Levanase operon of Bacillus subtilis includes a fructose-specific phosphotransferase system regulating the expression of the operon REVISTA J. Mol. Biol. 214 (3), 657-671 (1990)

PUBMED 2117666

REFERENCIA 49

AUTORES Henrich, B., Monnerjahn, U. y Plapp, R.

TITULO Peptidase D gene (pepD) of Escherichia coli K-12: nucleotide sequence, transcript mapping, and comparison with other peptidase genes

REVISTA J. Bacteriol. 172 (8), 4641-4651 (1990)

PUBMED 1695895

REFERENCIA 50

AUTORES Nunn, D., Bergman, S. y Lory, S.

TÍTULO Products of three accessory genes, pilB, pilC, and pilD, are required for biogenesis of Pseudomonas aeruginosa pili

REVISTA J. Bacteriol. 172 (6), 2911-2919 (1990)

PUBMED 1971619

REFERENCIA 51

AUTORES Rosenthal, E.R. y Calvo, J.M.

TÍTULO The nucleotide sequence of leuC from Salmonella typhimurium

REVISTA Nucleic Acids Res. 18 (10), 3072 (1990)

PUBMED 2190189

REFERENCIA 52

AUTORES Kang, P.J. y Craig, E.A.

TÍTULO Identification and characterization of a new Escherichia coli gene that is a dosage-dependent suppressor of a dnaK deletion mutation

R E V IS T A J. Bacteriol. 172 (4), 2055-2064 (1990)

P U B M E D 2180916

(continuación)

REFERENCIA 53

AUTORES Wurgler, S.M. y Richardson, C.C.

TÍTULO Structure and regulation of the gene for dGTP triphosphohydrolase from Escherichia coli

REVISTA Proc. Natl Acad Sci. USA 87 (7), 2740-2744 (1990)

PUBMED 2157212

REFERENCIA 54

AUTORES Schaaff, I., Hohmann, S. y Zimmermann, F.K.

TÍTULO Molecular analysis of the structural gene for yeast transaldolase

REVISTA Eur. J. Biochem. 188 (3), 597-603 (1990)

PUBMED 2185015

REFERENCIA 55

AUTORES Ricca, E. y Calvo, J.M.

TÍTULO The nucleotide sequence of leuA from Salmonella typhimurium

REVISTA Nucleic Acids Res. 18 (5), 1290 (1990)

PUBMED 2181403

REFERENCIA 56

AUTORES Honore, N. y Cole, S.T.

TÍTULO Nucleotide sequence of the aroP gene encoding the general aromatic amino acid transport protein of Escherichia coli K-12: homology with yeast transport proteins REVISTA Nucleic Acids Res. 18 (3), 653 (1990)

PUBMED 2408019

REFERENCIA 57

AUTORES Angerer, A., Gaisser, S. y Braun, V.

TÍTULO Nucleotide sequences of the sfuA, sfuB, and sfuC genes of Serratia marcescens suggest a periplasmic-binding-protein-dependent iron transport mechanism REVISTA J. Bacteriol. 172 (2), 572-578 (1990)

PUBMED 2404942

REFERENCIA 58

AUTORES Surin, BP, Watson, JM, Hamilton, WD, Economou, A. y Downie, J.A.

TÍTULO Molecular characterization of the nodulation gene, nodT, from two biovars of Rhizobium leguminosarum

REVISTA Mol. Microbiol. 4 (2), 245-252 (1990)

PUBMED 2338917

REFERENCIA 59

AUTORES Zhou, Z. y Syvanen, M.

TÍTULO Identification and sequence of the drpA gene from Escherichia coli REVISTA J. Bacteriol. 172 (1), 281-286 (1990)

PUBMED 1688424

REFERENCIA 60

AUTORES Roncero, MI, Jepsen, LP, Stroman, P. y van Heeswijck, R.

TÍTULO Characterization of a leuA gene and an ARS element from Mucor circinelloides REVISTA Gene 84 (2), 335-343 (1989)

PUBMED 2693214

REFERENCIA 61

AUTORES Ichikawa, S. y Kaji, A.

TÍTULO Molecular cloning and expression of ribosome releasing factor

REVISTA J. Biol. Chem. 264 (33), 20054-20059 (1989)

PUBMED 2684966

REFERENCIA 62

AUTORES Minami-Ishii, N., Taketani, S., Osumi, T. y Hashimoto, T.

TÍTULO Molecular cloning and sequence analysis of the cDNA for rat mitochondrial enoyl-CoA hydratase. Structural and evolutionary relationships linked to the bifunctional enzyme of the peroxisomal beta-oxidation system

REVISTA Eur. J. Biochem. 185 (1), 73-78 (1989)

PUBMED 2806264

REFERENCIA 63

AUTORES Matsubara, Y., Indo, Y., Naito, E., Ozasa, H., Glassberg, R., Vockley, J., Ikeda,

Y., Kraus, J. Tanaka, K.

TÍTULO Molecular cloning and nucleotide sequence of cDNAs encoding the precursors of rat long chain acyl-coenzyme A, short chain acyl-coenzyme A, and isovalerylcoenzyme A dehydrogenases. Sequence homology of four enzymes of the acyl-CoA dehydrogenase family

(continuación)

REVISTA J. Biol. Chem. 264 (27), 16321-16331 (1989)

PUBMED 2777793

REFERENCIA 64

AUTORES Roa, B.B., Connolly, D.M. y Winkler, M.E.

TÍTULO Overlap between pdxA and ksgA in the complex pdxA-ksgA-apaG-apaH operon of Escherichia coli K-12

REVISTA J. Bacteriol. 171 (9), 4767-4777 (1989)

PUBMED 2670894

REFERENCIA 65

AUTORES Lindquist, S., Galleni, M., Lindberg, F. y Normark, s.

TÍTULO Signalling proteins in enterobacterial AmpC beta-lactamase regulation REVISTA Mol. Microbiol. 3 (8), 1091-1102 (1989)

REFERENCIA 2691840

REFERENCIA 66

AUTORES Xie, Q.W., Tabor, C.W. y Tabor, H.

TÍTULO Spermidine biosynthesis in Escherichia coli: promoter and termination regions of the speED operon

REVISTA J. Bacteriol. 171 (8), 4457-4465 (1989)

PUBMED 2666401

REFERENCIA 67

AUTORES Sato, S., Nakada, Y. y Shiratsuchi, A.

TÍTULO IS421, a new insertion sequence in Escherichia coli

REVISTA FEBS Lett. 249 (1), 21-26 (1989)

PUBMED 2542093

REFERENCIA 68

AUTORES Liu, J.D. y Parkinson, J.S.

TÍTULO Genetics and sequence analysis of the pcnB locus, an Escherichia coli gene involved in plasmid copy number control

REVISTA J. Bacteriol. 171 (3), 1254-1261 (1989)

PUBMED 2537812

REFERENCIA 69

AUTORES Henrich, B., Schroeder, U., Frank, RW y Plapp, R.

TÍTULO Accurate mapping of the Escherichia coli pepD gene by sequence analysis of its 5' flanking region

REVISTA Mol. Gen. Genet. 215 (3), 369-373 (1989)

PUBMED 2651887

REFERENCIA 70

AUTORES Lipinska, B., Sharma, S. y Georgopoulos, C.

TÍTULO Sequence analysis and regulation of the htrA gene of Escherichia coli: a sigma 32-independent mechanism of heat-inducible transcription

REVISTA Nucleic Acids Res. 16 (21), 10053-10067 (1988)

PUBMED 3057437

REFERENCIA 71

AUTORES Sung, Y.C. y Fuchs, J.A.

TITULO Characterization of the cyn operon in Escherichia coli K12

REVISTA J. Biol. Chem. 263 (29), 14769-14775 (1988)

PUBMED 3049588

REFERENCIA 72

AUTORES Lozoya, E., Hoffmann, H., Douglas, C., Schulz, W., Scheel, D. y Hahlbrock, K. TÍTULO Primary structures and catalytic properties of isoenzymes encoded by the two 4-coumarate: CoA ligase genes in parsley

REVISTA Eur. J. Biochem. 176 (3), 661-667 (1988)

PUBMED 3169018

REFERENCIA 73

AUTORES Andrews, S.C. y Guest, J.R.

TÍTULO Nucleotide sequence of the gene encoding the GMP reductase of Escherichia coli K12

REVISTA Biochem. J. 255 (1), 35-43 (1988)

PUBMED 2904262

REFERENCIA 74

AUTORES Jaiswal, AK, McBride, OW, Adesnik, M. y Nebert, D.W.

TÍTULO Human dioxin-inducible cytosolic NAD(P)H:menadione oxidoreductase. cDNA sequence and localization of gene to chromosome 16

(continuación)

REVISTA J. Biol. Chem. 263 (27), 13572-13578 (1988)

PUBMED 2843525

REFERENCIA 75

AUTORES Karpel, R., Olami, Y., Taglicht, D., Schuldiner, S. y Padan, E.

TÍTULO Sequencing of the gene ant which affects the Na+/H+ antiporter activity in Escherichia coli

REVISTA J. Biol. Chem. 263 (21), 10408-10414 (1988)

PUBMED 2839489

REFERENCIA 76

AUTORES Mellano, M.A. y Cooksey, D.A.

TÍTULO Nucleotide sequence and organization of copper resistance genes from Pseudomonas syringae pv. tomato

REVISTA J. Bacteriol. 170 (6), 2879-2883 (1988)

PUBMED 3372485

REFERENCIA 77

AUTORES Coleman, J. y Raetz, C.R.

TÍTULO First committed step of lipid A biosynthesis in Escherichia coli: sequence of the lpxA gene

REVISTA J. Bacteriol. 170 (3), 1268-1274 (1988)

PUBMED 3277952

REFERENCIA 78

AUTORES Gebhard, W., Schreitmuller, T., Hochstrasser, K. y Wachter, E.

TÍTULO Complementary DNA and derived amino acid sequence of the precursor of one of the three protein components of the inter-alpha-trypsin inhibitor complex REVISTA FEBS Lett. 229 (1), 63-67 (1988)

PUBMED 2450046

REFERENCIA 79

AUTORES Tomasiewicz, H.G. y McHenry, C.S.

TÍTULO Sequence analysis of the Escherichia coli dnaE gene

REVISTA J. Bacteriol. 169 (12), 5735-5744 (1987)

PUBMED 3316192

REFERENCIA 80

AUTORES Crowell, D.N., Reznikoff, W.S. y Raetz, C.R.

TÍTULO Nucleotide sequence of the Escherichia coli gene for lipid A disaccharide synthase

REVISTA J. Bacteriol. 169 (12), 5727-5734 (1987)

PUBMED 2824445

REFERENCIA 81

AUTORES Tabor, C.W. y Tabor, H.

TÍTULO The speEspeD operon of Escherichia coli. Formation and processing of a proenzyme form of S-adenosylmethionine decarboxylase

REVISTA J. Biol. Chem. 262 (33), 16037-16040 (1987)

PUBMED 3316212

REFERENCIA 82

AUTORES Nonet, M.L., Marvel, C.C. y Tolan, D.R.

TITULO The hisT-purF region of the Escherichia coli K-12 chromosome. Identification of additional genes of the hisT and purF operons

REVISTA J. Biol. Chem. 262 (25), 12209-12217 (1987)

PUBMED 3040734

REFERENCIA 83

AUTORES Coulton, JW, Mason, P. y Allatt, D.D.

TITULO fhuC and fhuD genes for iron (III)-ferrichrome transport into Escherichia coli K-12 REVISTA J. Bacteriol. 169 (8), 3844-3849 (1987)

PUBMED 3301821

REFERENCIA 84

AUTORES Horiuchi, T., Nagasawa, T., Takano, K. y Sekiguchi, M.

TÍTULO A newly discovered tRNA(lAsp) gene (aspV) of Escherichia coli K12 REVISTA Mol. Gen. Genet. 206 (2), 356-357 (1987)

PUBMED 3295485

REFERENCIA 85

AUTORES Ben-Bassat, A. Bauer, K., Chang, SY, Myambo, K., Boosman, A. y Chang, S. TÍTULO Processing of the initiation methionine from proteins: properties of the Escherichia coli methionine aminopeptidase and its gene structure

REVISTA J. Bacteriol. 169 (2), 751-757 (1987)

(continuación)

PUBMED 3027045

REFERENCIA 86

AUTORES Gronger, P., Manían, SS, Reilander, H., O'Connell, M., Priefer, UB y Puhler, A. TÍTULO Organization and partial sequence of a DNA region of the Rhizobium leguminosarum symbiotic plasmid pRL6JI containing the genes fixABC, nifA, nifB and a novel open reading frame

REVISTA Nucleic Acids Res. 15 (1), 31-49 (1987)

PUBMED 3029674

REFERENCIA 87

AUTORES Richardson, KK, Richardson, FC, Crosby, RM, Swenberg, JA y Skopek, T.R. TITULO DNA base changes and alkylation following in vivo exposure of Escherichia coli to N-methyl-N-nitrosourea or N-ethyl-N-nitrosourea

REVISTA Proc. Natl Acad Sci. U.S.A. 84 (2), 344-348 (1987)

PUBMED 3540961

REFERENCIA 88

AUTORES Chye, M.L. y Pittard, J.

TÍTULO Transcription control of the aroP gene in Escherichia coli K-12 : analysis of operator mutants

REVISTA J. Bacteriol. 169 (1), 386-393 (1987)

PUBMED 3025182

REFERENCIA 89

AUTORES Blanchin-Roland, S., Blanquet, S., Schmitter, JM y Fayat, G.

TÍTULO The gene for Escherichia coli diadenosine tetraphosphatase is located immediately clockwise to folA and forms an operon with ksgA

REVISTA Mol. Gen. Genet. 205 (3), 515-522 (1986)

PUBMED 3031429

REFERENCIA 90

AUTORES Takano, K., Nakabeppu, Y., Maki, H., Horiuchi, T. y Sekiguchi, M.

TÍTULO Structure and function of dnaQ and mutD mutators of Escherichia coli REVISTA Mol. Gen. Genet. 205 (1), 9-13 (1986)

PUBMED 3540531

REFERENCIA 91

AUTORES Mackie, G.A.

TÍTULO Structure of the DNA distal to the gene for ribosomal protein S20 in Escherichia coli K12: presence of a strong terminator and an IS1 element

REVISTA Nucleic Acids Res. 14 (17), 6965-6981 (1986)

PUBMED 2429258

REFERENCIA 92

AUTORES Koster, W. y Braun, V.

TÍTULO Iron hydroxamate transport of Escherichia coli: nucleotide sequence of the fhuB gene and identification of the protein

REVISTA Mol. Gen. Genet. 204 (3), 435-442 (1986)

PUBMED 3020380

REFERENCIA 93

AUTORES Breton, R., Sanfacon, H., Papayannopoulos, I., Biemann, K. y Lapointe, J.

TÍTULO Glutamyl-tRNA synthetase of Escherichia coli. Isolation and primary structure of the gltX gene and homology with other aminoacyl-tRNA synthetases REVISTA J. Biol. Chem. 261 (23), 10610-10617 (1986)

PUBMED 3015933

REFERENCIA 94

AUTORES Birnbaum, M.J., Haspel, H.C. y Rosen, O.M.

TÍTULO Cloning and characterization of a cDNA encoding the rat brain glucosetransporter protein

REVISTA Proc. Natl Acad Sol. U.S.A. 83 (16), 5784-5788 (1986)

PUBMED 3016720

REFERENCIA 95

AUTORES Cox, E.C. y Horner, D.L.

TÍTULO DNA sequence and coding properties of mutD(dnaQ) a dominant Escherichia coli mutator gene

REVISTA J. J. Mol. Biol. 190 (1), 113-117 (1986)

PUBMED 3023634

REFERENCIA 96

AUTORES Ohki, M., Tamura, F., Nishimura, S. y Uchida, H.

(continuación)

TÍTULO Nucleotide sequence of the Escherichia coli dnaJ gene and purification of the gene product

REVISTA J. Biol. Chem. 261 (4), 1778-1781 (1986)

PUBMED 3003084

REFERENCIA 97

AUTORES Coulton, JW, Mason, P., Cameron, DR, Carmel, G., Jean, R. y Rode, HN TÍTULO Protein fusions of beta-galactosidase to the ferrichrome-iron receptor of Escherichia coli K-12

REVISTA J. Bacteriol. 165 (1), 181-192 (1986)

PUBMED 3079747

REFERENCIA 98

AUTORES Lee, N., Gielow, W., Martin, R., Hamilton, E. y Fowler, A.

TÍTULO The organization of the araBAD operon of Escherichia coli

REVISTA Gene 47 (2-3), 231-244 (1986)

PUBMED 3549454

REFERENCIA 99

AUTORES Sekiguchi, T., Ortega-Cesena, J., Nosoh, Y., Ohashi, S., Tsuda, K. y Kanaya, S. TITULO DNA and amino-acid sequences of 3-isopropylmalate dehydrogenase of Bacillus coagulans. Comparison with the enzymes of Saccharomyces cerevisiae and Thermus thermophilus

REVISTA Biochim. Biophys. Acta 867, 36-44 (1986)

REFERENCIA 100

AUTORES Chong, P., Hui, I., Loo, T. y Gillam, S.

TÍTULO Structural analysis of a new GC-specific insertion element IS186

REVISTA FEBS Lett. 192 (1), 47-52 (1985)

PUBMED 2996940

REFERENCIA 101

AUTORES Icho, T., Sparrow, CP y Raetz, C.R.

TÍTULO Molecular cloning and sequencing of the gene for CDP-diglyceride synthetase of Escherichia coli

REVISTA J. Biol. Chem. 260 (22), 12078-12083 (1985)

PUBMED 2995358

REFERENCIA 102

AUTORES Nomura, T., Aiba, H. e Ishihama, A.

TÍTULO Transcriptional organization of the convergent overlapping dnaQ-rnh genes of Escherichia coli

REVISTA J. Biol. Chem. 260 (11), 7122-7125 (1985)

PUBMED 2987244

REFERENCIA 103

AUTORES Kamio, Y., Lin, CK, Regue, M. y Wu, H.C.

TÍTULO Characterization of the ileS-lsp operon in Escherichia coli. Identification of an open reading frame upstream of the ileS gene and potential promoter(s) for the ileS-lsp operon

REVISTA J. Biol. Chem. 260 (9), 5616-5620 (1985)

PUBMED 2985604

REFERENCIA 104

AUTORES Cowing, DW, Bardwell, JC, Craig, EA, Woolford, C., Hendrix, RW y Gross, CA TÍTULO Consensus sequence for Escherichia coli heat shock gene promoters REVISTA Proc. Natl Acad Sol. USA 82 (9), 2679-2683 (1985)

PUBMED 3887408

REFERENCIA 105

AUTORES Broome-Smith, JK, Edelman, A., Yousif, S. y Spratt, B.G.

TÍTULO The nucleotide sequences of the ponA and ponB genes encoding penicillinbinding protein 1A and 1B of Escherichia coli K12

REVISTA Eur. J. Biochem. 147 (2), 437-446 (1985)

PUBMED 3882429

REFERENCIA 106

AUTORES Becerril, B., Valle, F., Merino, E., Riba, L. y Bolívar, F.

TITULO Repetitive extragenic palindromic (REP) sequences in the Escherichia coli gdhA gene

REVISTA Gene 37 (1-3), 53-62 (1985)

PUBMED 3902576

REFERENCIA 107

AUTORES Friedberg, D., Rosenthal, ER, Jones, JW y Calvo, J.M.

(continuación)

TÍTULO Characterization of the 3' end of the leucine operon of Salmonella typhimurium REVISTA Mol. Gen. Genet. 199 (3), 486-494 (1985)

PUBMED 2993799

REFERENCIA 108

AUTORES Bouvier, J., Richaud, C., Richaud, F., Patte, JC y Stragier, p.

TÍTULO Nucleotide sequence and expression of the Escherichia coli dapB gene REVISTA J. Biol. Chem. 259 (23), 14829-14834 (1984)

PUBMED 6094578

REFERENCIA 109

AUTORES Richaud, C., Richaud, F., Martin, C., Haziza, C. y Patte, J.C.

TÍTULO Regulation of expression and nucleotide sequence of the Escherichia coli dapD gene

REVISTA J. Biol. Chem. 259 (23), 14824-14828 (1984)

PUBMED 6094577

REFERENCIA 110

AUTORES Nuesch, J. y Schumperli, D.

TÍTULO Structural and functional organization of the gpt gene region of Escherichia coli REVISTA Gene 32 (1-2), 243-249 (1984)

PUBMED 6397401

REFERENCIA 111

AUTORES Jagadeeswaran, P., Ashman, CR, Roberts, S. y Langenberg, J.

TÍTULO Nucleotide sequence and analysis of deletion mutants of the Escherichia coli gpt gene in plasmid pSV2 gpt

REVISTA Gene 31 (1-3), 309-313 (1984)

PUBMED 6396164

REFERENCIA 112

AUTORES Deutch, AH, Rushlow, KE y Smith, C.J.

TÍTULO Analysis of the Escherichia coli proBA locus by DNA and protein sequencing REVISTA Nucleic Acids Res. 12 (15), 6337-6355 (1984)

PUBMED 6089111

REFERENCIA 113

AUTORES Bouvier, J., Patte, JC y Stragier, p.

TÍTULO Multiple regulatory signals in the control region of the Escherichia coli carAB operon

REVISTA Proc. Natl Acad Sci. USA 81 (13), 4139-4143 (1984)

PUBMED 6377309

REFERENCIA 114

AUTORES Innis, MA, Tokunaga, M., Williams, ME, Loranger, JM, Chang, SY, Chang, S. y Wu, H.C.

TÍTULO Nucleotide sequence of the Escherichia coli prolipoprotein signal peptidase (lsp) gene

REVISTA Proc. Natl. Acad. Sci. U.S.A. 81 (12), 3708-3712 (1984)

PUBMED 6374664

REFERENCIA 115

AUTORES Bardwell, J.C. y Craig, E.A.

TÍTULO Major heat shock gene of Drosophila and the Escherichia coli heat-inducible dnaK gene are homologous

REVISTA Proc. Natl. Acad. Sci. U.S.A. 81 (3), 848-852 (1984)

PUBMED 6322174

REFERENCIA 116

AUTORES Pratt, D. y Subramani, S.

TÍTULO Nucleotide sequence of the Escherichia coli xanthine-guanine phosphoribosyl transferase gene

REVISTA Nucleic Acids Res. 11 (24), 8817-8823 (1983)

PUBMED 6324103

REFERENCIA 117

AUTORES Richardson, KK, Fostel, J. y Skopek, T.R.

TÍTULO Nucleotide sequence of the xanthine guanine phosphoribosyl transferase gene of E. coli

REVISTA Nucleic Acids Res. 11 (24), 8809-8816 (1983)

PUBMED 6324102

REFERENCIA 118

AUTORES Parsot, C., Cossart, P., Saint-Girons, I. y Cohen, G.N.

TÍTULO Nucleotide sequence of thrC and of the transcription termination región of the threonine operon in Escherichia coli K12

(continuación)

REVISTA Nucleic Acids Res. 11 (21), 7331-7345 (1983)

PUBMED 6316258

REFERENCIA 119

AUTORES Stephens, PE, Lewis, HM, Darlison, MG y Guest, J.R.

TÍTULO Nucleotide sequence of the lipoamide dehydrogenase gene of Escherichia coli K12

REVISTA Eur. J. Biochem. 135 (3), 519-527 (1983)

PUBMED 6352260

REFERENCIA 120

AUTORES Stephens, PE, Darlison, MG, Lewis, HM y Guest, J.R.

TÍTULO The pyruvate dehydrogenase complex of Escherichia coli K12. Nucleotide sequence encoding the dihydrolipoamide acetyltransferase component REVISTA Eur. J. Biochem. 133 (3), 481-489 (1983)

PUBMED 6345153

REFERENCIA 121

AUTORES Stephens, PE, Darlison, MG, Lewis, HM y Guest, J.R.

TÍTULO The pyruvate dehydrogenase complex of Escherichia coli K12. Nucleotide sequence encoding the pyruvate dehydrogenase component

REVISTA Eur. J. Biochem. 133 (1), 155-162 (1983)

PUBMED 6343085

REFERENCIA 122

AUTORES Kanaya, S. y Crouch, R.J.

TÍTULO Low levels of RNase H activity in Escherichia coli FB2 rnh result from a singlebase change in the structural gene of RNase H

REVISTA J. Bacteriol. 154 (2), 1021-1026 (1983)

PUBMED 6302075

REFERENCIA 123

AUTORES Overbeeke, N., Bergmans, H., van Mansfeld, F. y Lugtenberg, B.

TÍTULO Complete nucleotide sequence of phoE, the structural gene for the phosphate limitation inducible outer membrane pore protein of Escherichia coli K12 REVISTA J. Mol. Biol. 163 (4), 513-532 (1983)

PUBMED 6341601

REFERENCIA 124

AUTORES Gilson, E., Nikaido, H. y Hofnung, M.

TÍTULO Sequence of the malK gene in E.coli K12

REVISTA Nucleic Acids Res. 10 (22), 7449-7458 (1982)

PUBMED 6296778

REFERENCIA 125

AUTORES Stoner, C.M. y Schleif, R.

TÍTULO Is the amino acid but not the nucleotide sequence of the Escherichia coli araC gene conserved?

REVISTA J. Mol. Biol. 154 (4), 649-652 (1982)

PUBMED 6283093

REFERENCIA 126

AUTORES An, G., Bendiak, DS, Mamelak, LA y Friesen, J.D.

TÍTULO Organization and nucleotide sequence of a new ribosomal operon in Escherichia coli containing the genes for ribosomal protein S2 and elongation factor Ts REVISTA Nucleic Acids Res. 9 (16), 4163-4172 (1981)

PUBMED 6272196

REFERENCIA 127

AUTORES Mackie, G.A.

TÍTULO Nucleotide sequence of the gene for ribosomal protein S20 and its flanking regions

REVISTA J. Biol. Chem. 256 (15), 8177-8182 (1981)

PUBMED 6267039

REFERENCIA 128

AUTORES Little, J.W., Mount, D.W. y Yanisch-Perron, C.R.

TÍTULO Purified lexA protein is a repressor of the recA and lexA genes

REVISTA Proc. Natl. Acad. Sci. U.S.A. 78 (7), 4199-4203 (1981)

PUBMED 7027255

REFERENCIA 129

AUTORES Mulligan, R.C. y Berg, p.

TÍTULO Factors governing the expression of a bacterial gene in mammalian cells REVISTA Mol. Cell. Biol. 1 (5), 449-459 (1981)

(continuación)

PUBMED 6100966

REFERENCIA 130

AUTORES Lee, N.L., Gielow, W.O. y Wallace, R.G.

TÍTULO Mechanism of araC autoregulation and the domains of two overlapping promoters, Pc and PBAD, in the L-arabinose regulatory region of Escherichia coli REVISTA Proc. Natl. Acad. Sci. USA 78 (2), 752-756 (1981)

PUBMED 6262769

REFERENCIA 131

AUTORES Cossart, P., Katinka, M. y Yaniv, M.

TITULO Nucleotide sequence of the thrB gene of E. coli, and its two adjacent regions; the thrAB and thrBC junctions

REVISTA Nucleic Acids Res. 9 (2), 339-347 (1981)

PUBMED 6259626

REFERENCIA 132

AUTORES Miyada, CG, Horwitz, AH, Cass, LG, Timko, J. y Wilcox, G.

TÍTULO ^dN^asequence of the araC regulatory gene from Escherichia coli B/r REVISTA Nucleic Acids Res. 8 (22), 5267-5274 (1980)

PUBMED 7008027

REFERENCIA 133

AUTORES Katinka, M., Cossart, P., Sibilli, L., Saint-Girons, I., Chalvignac, MA, Le Bras, G.,

Cohen, GN y Yaniv, M.

TÍTULO Nucleotide sequence of the thrA gene of Escherichia coli

REVISTA Proc. Natl. Acad. Sci. USA 77 (10), 5730-5733 (1980)

PUBMED 7003595

REFERENCIA 134

AUTORES Ogden, S., Haggerty, D., Stoner, CM, Kolodrubetz, D. y Schleif, R.

TÍTULO The Escherichia coli L-arabinose operon: binding sites of the regulatory proteins and a mechanism of positive and negative regulation

REVISTA Proc. Natl. Acad. Sci. U.S.A. 77 (6), 3346-3350 (1980)

PUBMED 6251457

REFERENCIA 135

AUTORES Smith, D.R. y Calvo, J.M.

TÍTULO Nucleotide sequence of the E coli gene coding for dihydrofolate reductase REVISTA Nucleic Acids Res. 8 (10), 2255-2274 (1980)

PUBMED 6159575

REFERENCIA 136

AUTORES Johnsrud, L.

TÍTULO DNA sequence of the transposable element IS1

REVISTA Mol. Gen. Genet. 169 (2), 213-218 (1979)

PUBMED 375010

REFERENCIA 137

AUTORES Smith, B.R. y Schleif, R.

TÍTULO Nucleotide sequence of the L-arabinose regulatory region of Escherichia coli K12 REVISTA J. Biol. Chem. 253 (19), 6931-6933 (1978)

PUBMED 357433

REFERENCIA 138

AUTORES Greenfield, L., Boone, T. y Wilcox, G.

TITULO DNA sequence of the araBAD promoter in Escherichia coli B/r

REVISTA Proc. Natl. Acad. Sci. U.S.A. 75 (10), 4724-4728 (1978)

PUBMED 368797

REFERENCIA 139

AUTORES Young, R.A. y Steitz, J.A.

TÍTULO Complementary sequences 1700 nucleotides apart form a ribonuclease III cleavage site in Escherichia coli ribosomal precursor RNA

REVISTA Proc. Natl. Acad. Sci. U.S.A. 75 (8), 3593-3597 (1978)

PUBMED 358189

REFERENCIA 140

AUTORES Ohtsubo, H. y Ohtsubo, E.

TÍTULO Nucleotide sequence of an insertion element, IS1

REVISTA Proc. Natl. Acad. Sci. USA 75 (2), 615-619 (1978)

PUBMED 273224

REFERENCIA 141

AUTORES Musso, R., Di Lauro, R., Rosenberg, M. y de Crombrugghe, B.

(continuación)

TÍTULO Nucleotide sequence of the operator-promoter region of the galactose operon of Escherichia coli

REVISTA Proc. Natl. Acad. Sci. USA 74 (1), 106-110 (1977)

PUBMED 319453

REFERENCIA 142 (bases 1 a 4646332)

CONSORCIO NCBI Genome Project

TÍTULO Envío directo

REVISTA Enviado (10-NOV-2005) National Center for Biotechnology Information, NIH,

Bethesda, MD 20894, EE.UU.

REFERENCIA 143 (bases 1 a 4646332)

AUTORES Mori, H., Horiuchi, T. y Hirai, A.

TÍTULO Presentación directa

REVISTA Enviado (22-AUG-2005) Hirotada Mori, Graduate School of Biological Sciences,

Nara Institute of Science and Technology; 8916-5 Takayama, Ikoma, Nara 630 0101, Japón (Correo electrónico: hmori@gtc.naist.jp, Tel: 81-743-72-5660, Fax: 81-743-72- 5669)

COMENTARIO REFSEQ PROVISIONAL: Este registro aún no ha sido sometido a revisión final del NCBI. La secuencia de referencia se derivó de partir de AP009048. COMPLETO: longitud completa.

CARACTERISTICAS Ubicación/Calificadores

fuente complemento (<1..> 5861)

/organismo= "cepa de Escherichia coli K-12 sustr. W3110" /mol_type = "ADN genómico"

/strain = "K-12 "

/sub_strain = "W3110"

/db_xref = "Taxón: 316407"

gen complemento (<1..6)

/gen = "dcuD"

CDS complemento (<1..6)

/gen = "dcuD"

/nota= "ECK3216: JW3196: b3227"

/codon_start = 1

/transl_table = 11

/producto = "transportador predicho"

/protein_id = "AP 003769.1"

/db xref = "GI: 89109989"

/ tradvicción —MMFG111SViyfkJTMGYL,ILKNYKPQyVLJU^GIFEMMCGVÍJI^jGF

GGVLDPTKSSGYLIVDIYNEILRMLSNRIAGLGLSIMAVGGYARYMERIGASRAMVSL

LSRPLKLIRSPYirLSATYVIGQIMAQFIXSASGLGMLLMVTLFPXLVSLGVSRLSAV

avi at t msiewgil et nsi faaqvagmkiat yf fhyql pvascvi isv ai shffv qr a

FDKKDKKrNHEQAEQKALDNVPPLYYAILPVMPLILMLGSLFLAHVGLMQSELHLVVV

MLLSLTVTMFVEFFRKHNLRETMDDVQAFFDGMGTQFANWXLWAGEIFAKGLTTIG

TVDAVIRGAEKSGLGGIGVMIIMALVIAICAIVMGSGNAPFMSFASLIPNIAAGLHVP

AWMIMPMHFATTLARAVSPITAVWVXSGIAGVSPFAWKRTAIPMAVGFWNMIAX IXLFY" (SEQ IDNO: 35)

cebador 330.. 348

/marcador="cebador de control ck nanR3"

gen 386.. 1177

/gene="nanR"

CDS 386.. 1177

/gene="nanR"

/note="ECK3215:JW3195:b3226"

/codon_start=1

/transl table=11

/product="regulador doble transcripcional de enlace de ADN"

/proteinJd="AP_003768.1"

/db xref="GI:89109988"

/ traducción =mmglmnafdsqtedsspaigrnlr srpla rkk ls emveeeleqmi

RRREFGEGEQLPSERELMAFFNVGRPSVREALAALKRKGLVQINNGERARVSRPSADT

IIGELSGMAKDFLSHPGGIAHFEQLRLFFESSLVRYAAEHATDEQIDLLAKALEIKSQ

SLDNHAAFIRSDVDFHRVLAEIPGNPIFMA1HVALLDWLIAARPTVTDQALHEHWKVS

YQOEIAIVDAIRRHDPDEADRALQSHLNSVSA.TWHAFGQTTNKKK" (SEQ ID NO: 36)

cebador 1005..1025

/marcador = "cebador de control nanR ck2"

cebador 1126..1146

/marcador = "cebador de control nanAFck"

promotor 1178..1278

/marcador = "región promotora del operón nan'

Sitio 1187..1191

/site_type = "sitio de enlace"

/marcador = "enlace CAP"

Sitio 1198.. 1202

/site_type = "sitio de enlace"

/marcador = "enlace de CAP"

promotor 1241..1246

/marcador = -10

primer_bind 1252..1301

/nota= "para eliminaciones de dnanA:: o dnanATE::marca" /marcador = "cebador H1-dnanA lambda rojo"

ARNm 1255

/marcador = 1

ARNm 1267

/marcador = 13

ARNm 1279

/marcador = 25

gen 1299.. 2192

/gen = "nanA"

CDS 1299.. 2192

/gen = "nanA"

/nota= "ECK3214: JW3194: b3225"

/codon_start = 1

/transl_table = 11

/product = "N-acetilneuraminato liasa"

/protein_id = "AP 003767.1"

/d b xref = "GI: 89109987"

/ traducción ="matnlrc-vmaallt pf dqqqaldkaslr rl vqfni qqgid gly v

GGSTGEAFVQSLSEREQVLEIVAEEAKGKIKLIAHVGCVSTAESQQLAASAKRYGFDA

VSAVTPFYYPF3FEEHCDHYRAIIDSADGIiPMWYNIPALSGVKLTLDQINTLVTLPG

VGALKQTSGDLYQMEQIRREHPDLVLYNGY3EIFASGLLAGADGGIGSTYNIMGWRYQ

GIVKALKEGDIQTAQKLQTECNKVIDLLIKTGVFRGLKTVLHYMDWSVPLCRKPFGP VDEKYLPELKALAQQLMQERG" (SEQ IDNO: 3") Región 1302.. 4424

/marcador ="DELECIÓN nanATE"

primer_bind complemento (2175..2224)

/marcador = "H2-dnanA lambda rojo cebador

gen 2301.. 3791

/gen = "nanT"

CDS 2301.. 3791

/gen = "nanT"

/nota= "ECK3213: JW3193: b3224"

/codon_start = 1

/transl_table = 11

/product = "transportador de ácido siálico"

/protein_id = "AP 003766.1"

/db xref = "GI: 89109986"

/ traducción =''mstttqnipwyrhlnraqwrafsaawlgylldgfdfvlialvlt

evqgefg lttvqaaslieaafis rhfgglmlgamgdryg rrlamvtsIVLFSAGTLAC GFAPGYITMFIARLVIGMGMAGEYG5SATYVIESWPKHLRNKASGFLISGFSVGAWA

AQVY SLWPVWGWRALFFIGILPIIFALWL RKNIPEAEDWKE KHAGKAPVRTMVDILY RGEHRIANIVMTLAAATALWFCFAGNLQNAAIVAVLGLLCAAIFIGFMVQSAGKRWPT GVMLIWWLFAFLYSWPIQALLPTYLKTDLAYNPHTVAMVLFFSGFGAAVGCCVGGFL GDWLGTRKAYVCSLLASQLLIIPVFAIGGANVWVLGLLLFFQQMLGQGIAGILPKLIG GY'FDTDQRAAGLGFTYNVGALGGAL AP11GALIAQRLDLGTALASLSFSLTFWILLI GLDMPSRVQRWLRPEALRTHDAIDGKPFSGAVPFGSAKNDLVKTKSn (SEQ ID NO: 38)

cebador complemento (2329..2350)

/marcador = "cebador de control nanARck"

primer_bind 3792..3841

/marcador = "cebador H1-dnanE lambda rojo"

gen 3839..4528

/gen = "nanE"

CDS 3839..4528

/gen = "nanE"

/nota= "ECK3212: JW3192: b3223"

/codon_start = 1

/transl_table = 11

/product = "N-acetilmannosamina-6-P epimerasa predicha" /protein_id = "AP 003765.1"

/db xref = "GI: 89109985"

/ traducción ="^{msllaqldqkiaangglivscqpvpdspldkpeiva}_^amalaaeq

AGAVAIRIEG VAHLQATRAWSVP11GIVKRDLE DSPVRITñYIE DVDALAQAGADJI AIDGTDRPRPVPVETLLAR1HHHGLLAMIDCSTPEDGLACQKLGAEIIGTTLSGYTTP ETPEEPDLALVKTLSDAGCRVIAEGRYNXPAQAADAMRHGAWAVTVGSAITRLEHICQ WYNTAMKKAVL" (SEQ ID NO: 39) primer_bind complemento (4425..4474)

/nota=" para la eliminación de dnanato:: marca"

/marcador = "cebador H2-dnanE lambda rojo"

RBS 4425.. 4448

/marcador = "péptido incomprensible C-terminal fusionado al péptido de marca KD13"

RBS 4449.. 4451

/marcador = "péptido incomprensible NEW STOP péptido después de la resolución del casete"

primer_bind 4486..4530

/marcador = "cebador nanK-H1 lambda rojo"

RBS 4515..4520

/marcador = "nanK RBS"

gen 4525..5400

/gen = "nanK"

CDS 4525.. 5400

/gen = "nanK"

/nota= "ECK3211: JW5538: b3222"

/codon_start = 1

/transl_table = 11

/product = "N-acetilmannosamina quinasa predicha"

/protein_id = "AP 003764.1"

/db xref = "GI: 89109984"

/ traducción =’'mttl ai di ggx kla aalig adgqird rr elp ip asqxpealrd a

LSALVSPLQAHAQRVAIASrGIIRDGSLLALWPHNLGGLLHFPLVKTLEQLXNLPTIA

INDAQAAAWAEFQALDGDirDMVFITVSTGVGGGWSGCKLLTGPGGLAGBIGHTLAD

PHGPVCGCGRTGCVEAIASGRGIAAAAQGELAGADAKTIFTRAGQGDEQAQQL1HRSA

RTLARLIADIKATTDCQCVWGGSVGLAEGYLALVETYLAQEPAAFHVDLLAAHYRHD AGLLGAALLAQGEKL" (GEQ IDNO: 40

RBS 4526..4528

/marcador = "Parada natural de NanE"

cebador complemento (5065..5083)

/marcador = "cebador de control nanKck1"

primer_bind complemento (5380..5424)

/marcador = "cebador nanK-H2 lambda rojo"

gen 5397..5861

/gen = "yhcH"

CDS 5397..5861

/gen = "yhcH"

/nota= "ECK3210: JW3190: b3221"

/codon_start = 1

/transl_table = 11

/product = "proteína hipotética"

/protein_id = "AP 003763.1"

/db xref = "GI: 89109983"

/ traducción =”mmmgevqslpsaglhpalgdalt lal aarpqekapgry el qgdn

IFMNVMTFHTQSPVEKKAELHEQYIDIQLLLNGEERILFGMAGTARQCEEFHHEDDYQ LCSTIDNEQAIILKPGMFAVFMPGEPHKPGCVVGEPGEIKKVVVKVKADLMA'1

(SEQ IDNO: 41)

ORIGEN

1 GAACATTGTT GAACTCCGTG TCAAAAGAAA ACGGTCAATC CCATAAACGG CAGATTGAAA 61 ACAACGATGT TATATTTTTT GCAAGGCTAT TTATGGTGCG GATGTCGTGT TTTTAATTGT 121 AGGTGAGGTG ATTTTTCATT AAAAAATATG CGCTTATGAT TATTTTGTAA GAACACATTC 181 ATAATATTCA TAATGCTCGT GAATAGTCTT ATAAATAATT CAAACGGGAT GTTTTTATCT 241 GCGXTACATT AAXTTTTCGC AAXAGXXAAT XAXXCCGXXA AXXAIGGXAA XGAXGAGGCA 301 CAAAGAGAAA ACCCIGCCAX IIXCCCCXAC TXXCAAXCCI GXGAXAGGAX GXCACXGAXG 361 ATGXTAATCA CACTGACCXX ACAGAATGGG CCTTATGAAC GCAXTTGATT CGCAAACCGA 421 AGATXCXXCA CCXGCAAXXG GXCGCAACXT GCGXAGCCGC CCGCIGGCGC GXAAAAAACX 481 CXCCGAAAXG GTGGAAGAAG AGCTGGAACA GAXGATCCGC CGXCGXGAAX XTGGCGAAGG 541 TGAACAATXA CCGTCTGAAC GCGAACTGAT GGCGTTCTTT AACGTCGGGC GTCCTTCGGT 601 GCGIGAAGCG CXGGCAGCGX XAAAACGCAA AGGXCXGGXG CAAAXAAACA ACGGCGAACG 661 CGCTCGCGXC XCGCGXCCXX CXGCGGACAC XAXCATCGGX GAGCXXTCCG GCAXGGCGAA 721 AGAXTTCCTX XCXCAXCCCG GTGGGAXXGC CCAXIXCGAA CAAXXACGXC XGXICXIXGA 781 AXCCAGXCXG GXGCGCXAXG CGGCXGAACA XGCCACCGAX GAGCAAAXCG AXXXGCXGGC 841 AAAAGCACXG GAAATCAACA GXCAGXCGCT GGAXAACAAC GCGGCATXCA XXCGXXCAGA 901 CGXIGAXXXC CACCGCGXGC IGGCGGAGAT CCCCGGIAAC CCAAICXXCA XGGCGAXCCA 961 CGXTGCCCXG CXCGACXGGC IIAIXGCCGC ACGCCCAACG GXXACCGAXC AGGCACTGCA 1021 CGAACAIAAC AACGXIAGIX AICAACAGCA XAXTGCGAIC GTIGATGCGA ICCGCCGXCA 1081 XGAXCCXGAC GAAGCCGAXC GXGCGXXGCA AXCGCAXCXC AACAGCGXCX CXGCXACCXG 1141 GCACGCXXXC GGXCAGACCA CCAACAAAAA GAAATAAXGC CACITTAGXG AAGCAGATCG 1201 CAXXAXAAGC XXXCXGXAXG GGGXGXXGCX XAAXXGAXCX GGXAXAACAG GXAXAAAGGX 1261 AXAXCGXXXA TCAGACAAGC AXCACXXCAG AGGTAXXXAX GGCAACGAAX XXACGXGGCG 1321 XAATGGCXGC ACXCCXGACX CCTXXXGACC AACAACAAGC ACXGGAXAAA GCGAGXCXGC 1381 GXCGCCXGGT XCAGXXCAAX AXTCAGCAGG GCATCGACGG TXTATACGXG GGXGGXXCGA 1441 CCGGCGAGGC CXXXGXACAA AGCCXXXCCG AGCGXGAACA GGXACXGGAA AXCGXCGCCG 1501 AAGAGGCGAA AGGXAAGAXX AAACXCAXCG CCCACGXCGG TXGCGXCAGC ACCGCCGAAA 1561 GCCAACAACT XGCGGCAXCG GCXAAACGTX AXGGCXXCGA XGCCGXCXCC GCCGXCACGC 1621 CGXTCTACXA TCCXXXCAGC XXTGAAGAAC ACXGCGAXCA CXAXCGGGCA ATXAXXGAXX 1681 CGGCGGATGG TIXGCCGAIG GIGGIGIACA ACATTCCAGC CCIGAGTGGG GTAAAACXGA 1741 CCCXGGAXCA GAXCAACACA CXXGXXACAX XGCCXGGCGX AGGXGCGCXG AAACAGACCX 1801 CXGGCGAXCX CTAXCAGAXG GAGCAGATCC GXCGTGAACA XCCIGAXCXX GTGCXCXAXA 1861 ACGGXTACGA CGAAAXCTXC GCCXCXGGTC XGCTGGCGGG CGCXGAXGGX GGTAXCGGCA 1921 GTACCTACAA CAXCAXGGGC XGGCGCXATC AGGGGAXCGX XAAGGCGCXG AAAGAAGGCG 1981 AXAXCCAGAC CGCGCAGAAA CXGCAAACTG AAXGCAAXAA AGXCAXXGAX XXACXGAXCA 2041 AAACGGGCGT AXXCCGCGGC CXGAAAACTG XCCTCCAXXA XAXGGAXGXC GXXXCXGXGC 2101 CGCXGXGCCG CAAACCGXXX GGACCGGXAG ATGAAAAATA XCXGCCAGAA CXGAAGGCGC 2161 XGGCCCAGCA GTXGAXGCAA GAGCGCGGGX GAGIXGXXIC CCCICGCXCG CCCCXACCGG 2221 GXGAGGGGAA AXAAACGCAX CXGXACCCTA CAAXXXXCAX ACCAAAGCGX GXGGGCAXCG 2281 CCCACCGCGG GAGACXCACA AXGAGXACTA CAACCCAGAA XAXCCCGXGG XAXCGCCAXC 2341 XCAACCGTGC ACAAXGGCGC GCAXXIICCG CXGCCIGGIX GGGAXATCXG CTXGACGGXX 2401 XXGAXTXCGX TXXAAXCGCC CXGGXACXCA CCGAAGXACA AGGXGAAXXC GGGCXGACGA 2461 CGGXGCAGGC GGCAAGTCXG AXCXCXGCAG CCXTTAXCXC XCGCXGGXXC GGCGGCCTGA 2521 XGCXCGGCGC TATGGGTGAC CGCXACGGGC GXCGTCXGGC AAXGGTCACC AGCAXCGXXC 2581 XCXXCXCGGC CGGGACGCXG GCCXGCGGCX TXGCGCCAGG CTACATCACC ATGTXTATCG 2641 CXCGXCXGGT CAXCGGCAXG GGGAXGGCGG GTGAAIACGG TXCCAGCGCC ACCXAXGXCA 2701 XXGAAAGCXG GCCAAAACAX CXGCGXAACA AAGCCAGXGG TXTXXTGAXX XCAGGCXXCX 2761 CTGTGGGGGC CGTCGTTGCC GCTCAGGTCI ATAGCCTGGT GGTTCCGGTC TGGGGCTGGC 2821 GTGCGCTGTT CTTTATCGGC ATTTTGCCAA TCATCTTTGC TCTCTGGCTG CGTAAAAACA 2881 TCCCGGAAGC GGAAGACTGG AAAGAGAAAC ACGCAGGTAA AGCACCAGTA CGCACAATGG 294 I TGGATATTCT CTACCGTGGT GAACATCGCA TTGCCAATAT CGTAATGACA CTGGCGGCGG 3001 CTACTGCGCT GTGGTTCTGC TTCGCCGGTA ACCTGCAAAA TGCCGCGATC GTCGCTGTTC 3061 TTGGGCTGTT ATGCGCCGCA ATCTTTATCA GCTTTATGGT GCAGAGTGCA GGCAAACGCT 3121 GGCCAACGGG CGTAATGCTG ATGGTGGTCG TGTTGTTTGC TTTCCTCTAC TCATGGCCGA 3121 TTCAGGCGCT GCTGCCAACG TATCTGAAAA CCGATCTGGC TTATAACCCG CATACTGTAG 3241 CCAATGTGCT GTTCTTTAGT GGCTTIGGCG CGGCGGTGGG ATGCTGCGTA GGTGGCTTCC 3301 TCGGTGACTG GCTGGGAACC CGCAAAGCGT ACGTXTGTAG CCTGCTGGCC TCGCAGCTGC 336 L TGATTATTCC GGTATTTGCG ATTGGCGGCG CAAACGTCTG GGTGCTCGGT CTGTTACTGT 8421 TCTTCCAGCA AATGCTTGGA CAAGGGATCG CCGGGATCIT ACCAAAACTG ATTGGCGGTT .248 I ATTTCGATAC CGACCAGCGT GCAGCGGGCC TGGGCTTTAC CTACAACGTT GGCGCATTGG 3541 GCGGTGCACT GGCCCCAATC ATCGGCGCGT TGATCGCTCA ACGTCTGGAT CTGGGTACTG .2601 CGCTGGCATC GCTCTCGTTC AGTCTGACGT TCGTGGTGAT CCTGCTGATT GGGCTGGATA 3661 TGCCTTCTCG CGTTCAGCGT TGGTTGCGCC CGGAAGCGTT GCGTACTCAT GACGCTATCG 3721 ACGGTAAACC ATTCAGCGGT GCCGTGCCGT TTGGCAGCGC CAAAAACGAT TTAGTCAAAA 3781 CCAAAAGTTA ATCCTGTTGC CCGGTCTATG TACCGGGCCT TTCGCTAAGG GAAGATGTAT 3841 GTCGTTACTT GCACAACTGG ATCAAAAAAT CGCTGCTAAC GGTGGCCTGA TTGTCTCCTG 8901 CCAGCCGGTT CCGGACAGCC CGCTCGATAA ACCCGAAATC GTCGCCGCCA TGGCATTAGC 3961 GGCAGAACAG GCGGGCGCGG TTGCCATTCG CATTGAAGGT GTGGCAAATC TGCAAGCCAC 402 L GCGTGCGGTG GTGAGCGTGC CGATTATTGG AATTGTGAAA CGCGATCTGG AGGATTCTCC 408 I GGTACGCATC ACGGCCTATA TTGAAGATGT TGATGCGCTG GCGCAGGCGG GCGCGGACAT 4141 TATCGCCATT GACGGCACCG ACCGCCCGCG TCCGGTGCCT GTTGAAACGC TGCTGGCACG 4201 TATTCACCAT CACGGTTTAC TGGCGATGAC CGACTGCTCA ACGCCGGAAG ACGGCCTGGC 4261 ATGCCAAAAG CTGGGAGCCG AAATTATTGG CACTACGCTT TCTGGCTATA CCACGCCTGA 4321 AACGCCAGAA GAGCCGGATC TGGCGCTGGT GAAAACGTTG AGCGACGCCG GATGTCGGGT 4381 GATTGCCGAA GGGCGTTACA ACACGCCTGC TCAGGCGGCG GATGCGATGC GCCACGGCGC 4441 GTGGGCGGTG ACGGTCGGTT CTGCAATCAC GCGTCTTGAG CACATTTGTC AGTGGTACAA 4501 CACAGCGATG AAAAAGGCGG TGCTATGACC ACACTGGCGA TTGATATCGG CGGTACTAAA 4561 CTTGCCGCCG CGCIGATTGG CGCTGACGGG CAGATCCGCG A 7CGTCGTGA ACTTCC7ACG ■1621 CCAGCCAGCC AGACACCAGA AGCCTTGCGT GATGCCTTAT CCGCATTAGT CTCTCCGTTG 4681 CAAGCTCATG CGCAGCGGGT TGCCATCGCT TCGACCGGGA TAATCCGTGA CGGCAGCTTG 4741 CTGGCGCTTA ATCCGCATAA TCTTGGTGGA TTGCTACACT TTCCGTTAGT CAAAACGCTG 4801 GAACAACTTA CCAATTTGCC GACCATTGCC ATTAACGACG CGCAGGCCGC AGCATGGGCG 4861 GAGTTTCAGG CGCTGGATGG CGATATAACC GATATGGTCT TTATCACCGT TTCCACCGGC 4921 GTTGGCGGCG GTGTAGTGAG CGGCTGCAAA CTGCTTACCG GCCCTGGCGG TCTGGCGGGG 4981 CATATCGGGC ATACGCTTGC CGATCCACAC GGCCCAGTCT GCGGCTGTGG ACGCACAGGT 5041 TGCGTGGAAG CGATTGCTTC TGGTCGCGGC ATTGCAGCGG CAGCGCAGGG GGAGTTGGCT 5101 GGCGCGGATG CGAAAACTAT TTTCACGCGC GCCGGGCAGG GTGACGAGCA GGCGCAGCAG 5161 CTGATTCACC GCTCCGCACG TACGCTTGCA AGGCTGATCG CTGATATTAA AGCCACAACT 5221 GATTGCCAGT GCGTGGTGGT CGGTGGCAGC GTTGGTCTGG CAGAAGGGTA TCTGGCGCTG 5281 GTGGAAACGT ATCIGGCGCA GGAGCCAGCG GCATTICATG TTGATTTACT GGCGGCGCAT 5341 TACCGCCATG ATGCAGGTTT ACTTGGGGCT GCGCTGTTGG CCCAGGGAGA AAAATIATGA 5401 TGATGGGTGA AGTACAGTCA TTACCGTCTG CTGGGTTACA TCCTGCG1'7A CAGGACGCGT 5 161 TAACGCTGGC ATTAGCTGCC AGACCGCAAG AAAAAGCGCC GGGTCGTTAC GAATTACAGG 5521 GCGACAATAT CTTTATGAAT GTCATGACGT TTAACACICA ATCGCCCGTC GAGAAAAAAG 5581 CGGAATTGCA CGAGCAATAC ATTGATATCC AGCTGTTATT AAACGGTGAG GAACGGATTC 5641 TGTTTGGCAT GGCAGGCACT GCGCGTCAGT GTGAAGAGTT CCACCATGAG GATGATTATC 5701 AGCTTTGCAG CACCATTGAT AACGAGCAAG CCATCATCTT AAAACCGGGA ATGTTCGCCG 5761 TGTTTATGCC AGGTGAACCG CATAAACCAG GATGCGTTGT CGGCGAGCCT GGAGAGATTA 5821 AAAAGGTTGT GGTGAAGGTT AAGGCTGATT TAATGGCTTA A (SEQ ID NO: 42) U

Claims

REIVINDICACIONES

1. Un método para producir un oligosacárido sialilado en una bacteria que comprende:

proporcionar una bacteria, comprendiendo dicha bacteria, una sialil-transferasa exógena, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de lactosa permeasa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE), que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, y cultivar dicha bacteria en presencia de lactosa.

2. El método de la reivindicación 1, en donde dicha ruta catabólica deficiente en ácido siálico comprende además una mutación en el gen endógeno de transportador de ácido W-acetilneuramínico (nanT).

3. El método de una cualquiera de las reivindicaciones anteriores, en donde la mutación comprende una mutación nula.

4. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha capacidad sintética de ácido siálico comprende un gen exógeno de CMP-Neu5Ac sintetasa (neuA), un gen exógeno de ácido siálico sintasa (neuB) y un gen exógeno de UDP-GlcNac 2-epimerasa (neuC).

5. El método de una cualquiera de las reivindicaciones anteriores, en donde dicho gen exógeno de sialil-transferasa es a(2,3) sialil-transferasa, a(2,6) sialil-transferasa o a(2,8) sialil-transferasa.

6. El método de una cualquiera de las reivindicaciones anteriores, en donde dicho oligosacárido sialilado comprende 3'-sialillactosa (3'-SL) o 6'-sialillactosa (6'-SL).

7. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha bacteria comprende un gen endógeno de p-galactosidasa delecionado o inactivado, en particular, en donde dicho gen de p-galactosidasa delecionado o inactivado comprende el gen de lacZ de E. coli.

8. El método de la reivindicación 1, en donde dicha bacteria comprende un gen de p-galactosidasa recombinante que proporciona un nivel bajo, pero detectable, de actividad p-galactosidasa.

9. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha bacteria comprende además un gen lacA delecionado, inactivado o mutado.

10. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha bacteria comprende una mayor capacidad de producción de UDP-GlcNAc, en particular

(a) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;

(b) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión del gen nagC de E. coli;

(c) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de nagC y glmS;

(d) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de nagC y glmY; o

(e) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de nagC y glmZ.

11. Un método para producir, en una bacteria, un oligosacárido que contenga N-acetilglucosamina, que comprende:

proporcionar una bacteria, comprendiendo dicha bacteria un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa, un gen funcional de lactosa permeasa; y cultivar dicha bacteria en presencia de lactosa, en donde dicha bacteria comprende la sobreexpresión de

(a) un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;

(b) el gen nagC de E. coli;

(c) el gen nagC y el gen glmS;

(d) el gen nagC y el gen glmY; o

(e) el gen nagC y el gen glmZ.

12. El método de la reivindicación 11, en donde dicha bacteria comprende una mayor capacidad de producción de UDP-GlcNAc.

13. El método de la reivindicación 11 o 12, en donde dicho oligosacárido que contiene N-acetilglucosamina comprende una cualquiera seleccionada de Lacto-N-triosa 2 (LNT2), Lacto-N-tetraosa (LNT), Lacto-N-neotetraosa (LNnT), Lacto-N-fucopentaosa I (LNF I), Lacto-N-fucopentaosa II (LNF II), Lacto-N-fucopentaosa III (LNF III), Lacto-N-fucopentaosa V (Ln F V), Lacto-N-difucohexaosa I (LDFH I), Lacto-N-difucohexaosa II (LDFH II) y Lacto-N-neodifucohexaosa II (LFNnDFH II).

14. El método de una cualquiera de las reivindicaciones 1-13, en donde dicha bacteria es E. coli.

15. Un método de purificación de un oligosacárido sialilado producido mediante el método de una cualquiera de las reivindicaciones 1-10, que comprende unir dicho oligosacárido sialilado procedente de un lisado de células bacterianas o de un sobrenadante de cultivo de células bacterianas de dicha bacteria, a una columna de carbono, y eluir dicho oligosacárido sialilado de dicha columna.

16. Un método de purificación de un oligosacárido que contiene N-acetilglucosamina producido mediante el método de una cualquiera de las reivindicaciones 11-14, que comprende unir dicho oligosacárido que contiene N-acetilglucosamina procedente de un lisado de células bacterianas o de un sobrenadante de cultivo de células bacterianas de dicha bacteria, a una columna de carbono, y eluir dicho oligosacárido que contiene N-acetilglucosamina de dicha columna.

17. Un bacteria de E. coli aislada que comprende un gen endógeno de p-galactosidasa delecionado o inactivado, un gen exógeno de sialil-transferasa, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de lactosa permeasa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE) que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, en particular

(a) en donde dicha bacteria comprende además un gen de p-galactosidasa recombinante que proporciona un nivel bajo, pero detectable, de actividad p-galactosidasa; o

(b) un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un gen funcional de lactosa permeasa.

18. Una cepa hospedadora bacteriana aislada que comprende una construcción de ácido nucleico que comprende un gen exógeno de sialil-transferasa, un gen endógeno de p-galactosidasa delecionado o inactivado, una ruta de síntesis de ácido siálico, un gen funcional de lactosa permeasa y un gen delecionado de lactosa acetiltransferasa, en donde la cepa hospedadora bacteriana comprende además un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE) que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, en particular en donde dicho gen exógeno de sialiltransferasa codifica una a(2,3) sialil-transferasa o una a(2,6) sialil-transferasa.

19. Una cepa hospedadora bacteriana aislada que comprende una construcción de ácido nucleico que comprende un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa, un gen funcional de lactosa permeasa y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, y en donde la cepa hospedadora bacteriana comprende la sobreexpresión de

(b) el gen nagC de E. coli;

(c) el gen nagC y el gen glmS;

(d) el gen nagC y el gen glmY; o

(e) el gen nagC y el gen glmZ.

20. El método de una cualquiera de las reivindicaciones 1-10, que comprende además recuperar dicho oligosacárido sialilado de dicha bacteria o de un sobrenadante de cultivo de dicha bacteria; o el método de una cualquiera de las reivindicaciones 11-13, que comprende además recuperar dicho oligosacárido que contiene N-acetilglucosamina de dicha bacteria o de un sobrenadante de cultivo de dicha bacteria.

21. El método de una cualquiera de las reivindicaciones 1-10, en donde dicha bacteria comprende una mayor capacidad de producción de UDP-GlcNac que comprende uno o más genes glm seleccionados del grupo que consiste en: glmS, glmY y glmZ.

22. Un método de producción de un oligosacárido sialilado de leche humana en una bacteria, que comprende: proporcionar una bacteria, comprendiendo dicha bacteria una mutación en el gen endógeno de N-acetilneuraminato liasa (nanA), una mutación en el gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE), una mutación en el gen endógeno de transportador de ácido N-acetilneuramínico (nanT) y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no esté mutado, y cultivar dicha bacteria en presencia de lactosa.