ES2930286T3 - Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina - Google Patents

Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina Download PDF

Info

Publication number
ES2930286T3
ES2930286T3 ES18192520T ES18192520T ES2930286T3 ES 2930286 T3 ES2930286 T3 ES 2930286T3 ES 18192520 T ES18192520 T ES 18192520T ES 18192520 T ES18192520 T ES 18192520T ES 2930286 T3 ES2930286 T3 ES 2930286T3
Authority
ES
Spain
Prior art keywords
gene
bacterium
endogenous
coli
nagc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18192520T
Other languages
English (en)
Inventor
Massimo Merighi
Ian Matthew Heidtman
John M Mccoy
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glycosyn LLC
Original Assignee
Glycosyn LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=51581464&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2930286(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Glycosyn LLC filed Critical Glycosyn LLC
Application granted granted Critical
Publication of ES2930286T3 publication Critical patent/ES2930286T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H1/00Processes for the preparation of sugar derivatives
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H13/00Compounds containing saccharide radicals esterified by carbonic acid or derivatives thereof, or by organic acids, e.g. phosphonic acids
    • C07H13/02Compounds containing saccharide radicals esterified by carbonic acid or derivatives thereof, or by organic acids, e.g. phosphonic acids by carboxylic acids
    • C07H13/04Compounds containing saccharide radicals esterified by carbonic acid or derivatives thereof, or by organic acids, e.g. phosphonic acids by carboxylic acids having the esterifying carboxyl radicals attached to acyclic carbon atoms
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H5/00Compounds containing saccharide radicals in which the hetero bonds to oxygen have been replaced by the same number of hetero bonds to halogen, nitrogen, sulfur, selenium, or tellurium
    • C07H5/04Compounds containing saccharide radicals in which the hetero bonds to oxygen have been replaced by the same number of hetero bonds to halogen, nitrogen, sulfur, selenium, or tellurium to nitrogen
    • C07H5/06Aminosugars
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1081Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La invención proporciona composiciones y métodos para diseñar bacterias para producir oligosacáridos sialilados y que contienen N-acetilglucosamina, y el uso de los mismos en la prevención o tratamiento de infecciones. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina Campo de la invención
La invención proporciona composiciones y métodos para producir oligosacáridos purificados; en particular, ciertos oligosacáridos que contienen N-acetilglucosamina y/o sialilados, que normalmente se encuentran en la leche humana.
Antecedentes de la invención
La leche humana contiene un conjunto diverso y abundante de oligosacáridos neutros y ácidos (oligosacáridos de la leche humana, hMOS). Muchas de estas moléculas no son utilizadas directamente por los bebés en su nutrición, pero, sin embargo, tienen un papel fundamental en el establecimiento de un microbioma intestinal sano, en la prevención de enfermedades y en la función inmunológica. Antes de la invención, la capacidad de producir hMOS de forma económica a gran escala, era problemática. Por ejemplo, la producción de hMOS a través de la síntesis química se ha visto limitada por problemas estéreo-específicos, disponibilidad de precursores, impurezas del producto y alto coste general. Como tal, existe una necesidad apremiante de nuevas estrategias para fabricar grandes cantidades de hMOS a bajo coste para una variedad de aplicaciones comerciales.
Sumario de la invención
La invención presenta métodos eficientes y económicos para producir oligosacáridos que contienen N-acetilglucosamina y/o sialilados. La invención se expone en el conjunto de reivindicaciones que se adjunta.
La invención proporciona un método para producir un oligosacárido que contiene N-acetilglucosamina en una bacteria que comprende las siguientes etapas: proporcionar una bacteria que comprenda un gen de UDP-GlcNA:Gala/p-R p 3-N-acetilglucosaminiltransferasa exógeno y una permeasa de lactosa funcional; y cultivar la bacteria en presencia de lactosa, en donde dicha bacteria comprende la sobreexpresión de
(a) un gen nagC, uno o más genes glm, o cualquier combinación de los mismos;
(b) un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;
(c) el gen nagC de E. coli;
(d) el gen nagC y el gen glmS;
(e) el gen nagC y el gen glmY; o
(f) el gen nagC y el gen glmZ. Después, el oligosacárido que contiene N-acetilglucosamina se obtiene de la bacteria o de un sobrenadante de cultivo de la misma.
La invención proporciona además un método para producir un oligosacárido sialilado en una bacteria, que comprende las siguientes etapas: proporcionar una bacteria que comprenda un gen exógeno de sialil-transferasa, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de permeasa lactosa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE), que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, y cultivar dicha bacteria en presencia de lactosa. Después, el oligosacárido sialilado se recupera de la bacteria o de un sobrenadante de cultivo de la misma. Específicamente, una capacidad sintética de ácido siálico comprende la expresión de CMP-Neu5Ac sintetasa exógena, una sintasa de ácido siálico exógena y una UDP-GlcNAc-2-epimerasa exógena, o una variante funcional o su fragmento.
En el método para producir oligosacáridos sialilados se prefiere que la bacteria comprenda además la capacidad de aumentar la producción de UDP-GlcNAc. Por "capacidad de aumentar la producción" se entiende que la bacteria hospedadora produce más del 10 %, 20 %, 50 %, 100 %, 2 veces, 5 veces, 10 veces o más, de un producto que la bacteria nativa, endógena. Preferentemente, la bacteria sobreexpresa un regulador endógeno positivo de la síntesis de UDP-GlcNAc. En ambos métodos de producción de oligosacáridos sialilados y/o que contengan N-acetilglucosamina, la bacteria sobreexpresa, por ejemplo, el gen nagC de Escherichia coli. Alternativamente, la bacteria sobreexpresa el gen glmS (L-glutamina:D-fructosa-6-fosfato aminotransferasa) de Escherichia coli, o alternativamente, sobreexpresa el gen glmY de Escherichia coli (un regulador positivo de la traducción de glmS), o alternativamente, sobreexpresa el gen glmZ de Escherichia coli (otro regulador positivo de la traducción de glmS, glmY y glmZ que se describen en Reichenbach et al., Nucleic Acids Res 36, 2570-80 (2008)). Alternativamente, en ambos métodos de producción de oligosacáridos sialilados y/o que contengan N-acetilglucosamina, la bacteria sobreexpresa cualquier combinación de tales enfoques. Por ejemplo, la bacteria sobreexpresa nagC y glmS. Alternativamente, la bacteria sobreexpresa nagC y glmY. Alternativamente, en ambos métodos de producción de oligosacáridos sialilados y/o que contengan N-acetilglucosamina, la bacteria sobreexpresa nagC y glmZ. Los métodos también incluyen la sobreexpresión de cualquier variante o fragmento funcional de nagC, glmS, glmY y glmZ y cualquier combinación de los mismos. Por "sobreexpresión" se entiende que la transcripción del gen o del producto genético codificado es un 10 %, 20 %, 50 %, 2 veces, 5 veces, 10 veces o más, que el nivel expresado o producido por el gen nativo, natural o endógeno correspondiente.
La descripción detalla la manipulación de genes y rutas en bacterias tales como la enterobacteria Escherichia coli K12 (E. coli), que conduce a un alto nivel de síntesis de hMOS. Otras cepas de E. coli adecuadas para su uso en la presente invención incluyen, E. coli MG1655, E. coli W3110, E. coli DHSaE, E. coli B, E. coli C y E. coli W. Varias especies bacterianas son adecuadas para su uso en los métodos de biosíntesis de oligosacáridos, por ejemplo, Erwinia herbicola (Pantoea agglomerans), Citrobacter freundii, Pantoea citrea, Pectobacterium carotovorum o Xanthomonas campestris. Las bacterias del género Bacillus son adecuadas para su uso, incluyendo Bacillus subtilis, Bacillus licheniformis, Bacillus coagulans, Bacillus thermophilus, Bacillus laterosporus, Bacillus megaterium, Bacillus mycoides, Bacillus pumilus, Bacillus lentus, Bacillus cereus y Bacillus circulans. De manera similar, las bacterias de los géneros, Lactobacillus y Lactococcus se modifican utilizando los métodos descritos, incluidos, entre otros, Lactobacillus acidophilus, Lactobacillus salivarius, Lactobacillus plantarum, Lactobacillus helveticus, Lactobacillus delbrueckii, Lactobacillus rhamnosus, Lactobacillus bulgaricus, Lactobacillus crispatus, Lactobacillus gasseri, Lactobacillus casei, Lactobacillus reuteri, Lactobacillus jensenii y Lactococcus lactis. Streptococcus thermophiles y Proprionibacterium freudenreichii también son especies bacterianas adecuadas para la invención. También se incluyen cepas, modificadas como se describe, de los géneros Enterococcus (p. ej., Enterococcus faecium y Enterococcus thermophiles), Bacteroides (p. ej., Bacteroides caccae, Bacteroides cellulosilyticus, Bacteroides dorei, Bacteroides eggerthii, Bacteroides finegoldii, Bacteroides fragilis, Bacteroides nordii, Bacteroides ovatus, Bacteroides salyersiae, Bacteroides thetaiotaomicron, Bacteroides uniformis, Bacteroides vulgatus y Bacteroides xylanisolvens), Bifidobacterium (p. ej., Bifidobacterium longum, Bifidobacterium infantis y Bifidobacterium bifidum), Parabacteroides (p. ej., Parabacteroides distasonis, Parabacteroides goldsteinii, Parabacteroides johnsonii y Parabacteroides merdae), Prevotella (p. ej., Prevotella copri), Sporolactobacillus spp., Micromomospora spp., Micrococcus spp., Rhodococcus spp. y Pseudomonas (p. ej., Pseudomonas fluorescens y Pseudomonas aeruginosa). Las bacterias que comprenden las características descritas en el presente documento se cultivan en presencia de lactosa, y se recupera un oligosacárido sialilado, o que contiene N-acetilglucosamina, ya sea de la propia bacteria o de un sobrenadante de cultivo de la misma. El oligosacárido sialilado, o que contiene N-acetilglucosamina, se purifica para su uso en productos terapéuticos o nutricionales, o las bacterias se utilizan directamente en dichos productos.
La bacteria comprende un gen endógeno de p-galactosidasa delecionado o inactivado (es decir, no funcional). Por ejemplo, el gen de la p-galactosidasa comprende un gen lacZ de E. coli (por ejemplo, con el número de registro del GenBank V00296.1 (Gl: 41901)). El gen lacZ endógeno de la E. coli se deleciona o se inactiva funcionalmente, pero de tal manera que la expresión del gen de la lactosa permeasa (lacY) en dirección 3' permanece intacta, es decir, en la bacteria también está presente un gen funcional de la lactosa permeasa. Por delecionado se entiende que falta una parte de la secuencia codificante o que falta toda la secuencia codificante, de manera que no se produce ningún producto génico. Un gen "inactivado" no produce ningún producto génico que funcione como el gen nativo, natural o endógeno. Por ejemplo, la actividad funcional de un producto génico de p-galactosidasa inactivado se reduce al 10 %, 20 %, 50 % o 100 %, 1 vez, 2 veces, 5 veces o 10 veces menos, que la actividad funcional del producto génico nativo, natural o endógeno.
El gen de la lactosa permeasa es un gen endógeno de la lactosa permeasa o un gen exógeno de la lactosa permeasa. Por ejemplo, el gen de la lactosa permeasa comprende un gen lacY de E. coli (por ejemplo, con el número de registro del GenBank V00295.1 (Gl:41897)). Muchas bacterias poseen la capacidad intrínseca de transportar lactosa desde el medio de crecimiento a la célula, utilizando una proteína transportadora que es un homólogo de la lactosa permeasa de E. coli (por ejemplo, como se encuentra en Bacillus licheniformis), o un transportador que es un miembro de la ubicua familia de transportadores de azúcar PTS (por ejemplo, como se encuentra en Lactobacillus casei y Lactobacillus rhamnosus). Para bacterias que carezcan de una capacidad intrínseca de transportar lactosa extracelular al citoplasma celular, esta capacidad la confiere un gen transportador de lactosa exógeno (por ejemplo, lacY de E. coli) proporcionado en construcciones de ADN recombinante, y se suministra en un vector de expresión plasmídico o como genes exógenos integrados en el cromosoma hospedador.
Para la producción de oligosacáridos que contengan N-acetilglucosamina, la bacteria comprende, además de la sobreexpresión de
(a) un gen nagC, uno o más genes glm, o cualquier combinación de los mismos;
(b) un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;
(c) el gen nagC de E. coli;
(d) el gen nagC y el gen glmS;
(e) el gen nagC y el gen glmY; o
(f) el gen nagC y el gen glmZ, un gen de UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa exógeno o una variante funcional o su fragmento. Este gen exógeno de UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa se obtiene de una cualquiera de diversas fuentes, por ejemplo, el gen LgtA descrito de N. meningitides (SEQ ID NO: 16, registro de proteína del Genbank AAF42258.1) o de N. gonorrhoeae (registro de proteína del Genbank ACF31229.1). Además, comprende un gen de lactosa permeasa funcional. Opcionalmente, un gen adicional de glucosiltransferasa exógeno se coexpresa en la bacteria que comprende una UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa exógena. Por ejemplo, un gen de la p-1,4galactosiltransferasa se coexpresa con el gen de UDP-GlcNAc:Gala/p-R p p 3-N-acetilglucosaminiltransferasa. Este gen exógeno de p-1,4-galactosiltransferasa se obtiene de una cualquiera de diversas fuentes, por ejemplo, la descrita de N. meningitidis, el gen LgtB (registro de proteína del Genbank AAF42257.1), o de H. pylori, el gen Lex2B (SEQ ID NO: 17 registro de proteína del Genbank NP_207619.1). Opcionalmente, el gen exógeno adicional de glucosiltransferasa coexpresado en la bacteria que comprende un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa es un gen de p-1,3-galactosiltransferasa, por ejemplo, que se describe de E. coli O55:H7, el gen WbgO (SEQ ID NO: 18 registro de proteína del Genbank YP_003500090.1), o de H. pylori, el gen jhp0563 (registro de proteína del Genbank AEZ55696.1). En la presente invención también se incluyen variantes y fragmentos funcionales de cualquiera de las enzimas descritas anteriormente.
En una realización, los oligosacáridos que contienen N-acteilglucosamina, producidos por los métodos descritos en el presente documento, incluyen Lacto-N-triosa 2 (LNT2), Lacto-N-tetraosa (LNT), Lacto-N-neotetraosa (LNnT), Lacto-N- fucopentaosa I (Ln F I), Lacto-N-fucopentaosa II (LNF II), Lacto-N-fucopentaosa III (LNF III), Lacto-N-fucopentaosa V (LNF V), Lacto-N-difucohexaosa I (LDFH I), Lacto-N-difucohexaosa II (LDFH II) y Lacto-N-neodifucohexaosa II (LFNnDFH II).
Para la producción de sialil-oligosacáridos, la bacteria comprende un gen exógeno de sialil-transferasa, además de una ruta catabólica deficiente en ácido siálico y una capacidad sintética de ácido siálico. Por ejemplo, el gen de sialiltransferasa exógeno codifica a(2,3) sialil-transferasa o el gen de sialil-transferasa exógeno codifica a(2,6) sialiltransferasa o el gen de sialil-transferasa exógeno codifica a(2,8) sialiltransferasa. Adicionalmente, se incluye un gen funcional de lactosa permeasa. Los genes exógenos de sialil-transferasa se obtienen de una cualquiera de varias fuentes, por ejemplo, las descritas de N. meningitidis, N. gonorrhoeae, y de varios organismos del género Photobacterium. Ejemplos de a(2,8) sialiltransferasas, útiles para la producción de ácido polisialico, se encuentran, por ejemplo, en Campylobacter jejuni (CstII: ADN52706) y en Neisseria meningitides (o siaD: AAA20478).
Las bacterias utilizadas en el presente documento para producir hMOS, están modificadas por ingeniería genética para que comprendan un aumento de la reserva de lactosa intracelular (en comparación con el tipo natural) y para que comprendan la actividad de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y/o sialil-transferasa. Opcionalmente, también comprenden la actividad de p-1,4-galactosiltransferasa o p-1,3-galactosiltransferasa, y/o la actividad de a-1,2-, a-1,3- y/o a-1,4-fucosiltransferasa. En algunos casos, la bacteria comprende además un gen funcional de E. coli lacZ+ natural, insertado en un gen endógeno, por ejemplo, el gen lon en E. coli o el gen thyA en E. coli. De esta manera, la bacteria comprende además una mutación en un gen lon o una mutación en el gen thyA. En estos casos, el gen lacZ endógeno de la E. coli se elimina o se desactiva funcionalmente, pero de tal manera que la expresión del gen de la lactosa permeasa (lacY) en dirección 3' permanece intacta. El organismo manipulado de esta manera conserva la capacidad de transportar la lactosa desde el medio de crecimiento y de desarrollar una acumulación de lactosa intracelular para utilizar como un aceptor de azúcar en la síntesis de oligosacáridos, al tiempo que mantiene un bajo nivel de actividad de beta-galactosidasa intracelular útil para una variedad de fines. Por ejemplo, la invención también incluye: a) métodos para el marcado fenotípico de un locus genético en una célula hospedadora con p-galactosidasa negativa utilizando un inserto del gen de p-galactosidasa (p. ej., LacZ) diseñado para producir un nivel bajo, pero fácilmente detectable, de la actividad de la p-galactosidasa, b) métodos para detectar fácilmente la contaminación por bacteriófagos líticos en las series de fermentación mediante la liberación y detección de p-galactosidasa citoplásmica en el medio de cultivo celular y c) métodos para agotar un cultivo bacteriano de lactosa residual al final de las series de producción. a), b) y c) se logran utilizando un inserto génico de p-galactosidasa funcional (por ejemplo, lacZ) cuidadosamente diseñado para dirigir la expresión de un nivel bajo, pero detectable, de la actividad de p-galactosidasa en una célula hospedadora con p-galactosidasa negativa. Opcionalmente, la bacteria comprende además una mutación en un gen lacA. Preferentemente, la bacteria acumula un aumento de la acumulación de lactosa intracelular y produce un bajo nivel de beta-galactosidasa. Un aumento de la acumulación intracelular es cuando la concentración de lactosa en la bacteria hospedadora es al menos un 10 %, 20 %, 50 %, 2 veces, 5 veces o 10 veces más alta, que la de la bacteria nativa o natural.
En un aspecto, el oligosacárido de la leche humana producido por bacterias modificadas genéticamente comprende una molécula de ácido nucleico exógena que codifica una UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un ácido nucleico exógeno que codifica la p-1,4-galactosiltransferasa es la lacto-N-neotetraosa (LNnT). En otro aspecto, el oligosacárido de la leche humana producido por bacterias modificadas genéticamente comprende una molécula de ácido nucleico exógena que codifica una UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un ácido nucleico exógeno que codifica la p-1,3-galactosiltransferasa es la lacto-N-tetraosa (LNT).
En el presente documento se describen composiciones que comprenden una célula bacteriana que produce el oligosacárido de la leche humana LNnT (lacto-N-neotetraosa), en donde la célula bacteriana comprende una UDP-GlcNAc exógena:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un ácido nucleico exógeno que codifica una p-1,4-galactosiltransferasa. La célula bacteriana puede ser E. coli. El gen UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa exógeno se obtiene de una cualquiera de varias fuentes, por ejemplo, el gen LgtA descrito de N. meningitides. El gen de la p-1,4-galactosiltransferasa exógeno se obtiene de una cualquiera de varias fuentes, por ejemplo, la descrita de N. meningitidis, el gen LgtB, o de H. pylori, el gen jhp0765.
La bacteria comprende un aumento de la producción de UDP-GIcNAc. El medio para lograr esto es mediante la sobreexpresión de un regulador endógeno positivo de la síntesis de UDP-GlcNAc; es decir, la sobreexpresión del gen nagC de Escherichia coli.
En un aspecto, esta sobreexpresión de nagC se logra proporcionando copias adicionales del gen nagC en un vector plasmídico o integrando copias adicionales del gen nagC en el cromosoma de la célula hospedadora. Alternativamente, la sobreexpresión se logra modulando la fuerza de la secuencia de unión al ribosoma que dirige la traducción de nagC o modulando la fuerza de la transcripción de nagC que dirige el promotor. Además, la acumulación intracelular de UDP-GlcNAc puede mejorarse por otros medios, por ejemplo, por la sobreexpresión del gen glmS de Escherichia coli (L-glutamina:D-fructosa-6-fosfato aminotransferasa), o alternativamente por la sobreexpresión del gen glmY de Escherichia coli (un regulador de traducción positivo de glmS), o alternativamente mediante la sobreexpresión del gen glmZ de Escherichia coli (otro regulador de traducción positivo de glmS), o alternativamente utilizando simultáneamente una combinación de enfoques. En una realización preferida, por ejemplo, los genes nagC (SEQ ID NO: 19 registro de proteína del Genbank BAA35319.1) y glmS (s Eq ID NO: 20 registro de proteína del Genbank NP_418185.1) que codifican las secuencias proporcionadas en el presente documento, se sobreexpresan simultáneamente en la misma célula hospedadora para aumentar la acumulación intracelular de UDP-GlcNAc. Otros componentes del metabolismo de UDP-GlcNAc incluyen: (GlcNAc-1-P) N-acetilglucosamina-1-fosfato; (GlcN-1-P) glucosamina-1-fosfato; (GlcN-6-P) glucosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; y (Fruc-6-p) fructosa-6-fosfato. Las bacterias que comprenden las características descritas en el presente documento se cultivan en presencia de lactosa, y se recupera la lacto-N-neotetraosa, ya sea de la propia bacteria (es decir, mediante lisis) o de un sobrenadante de cultivo de la misma.
También se encuentra dentro de la invención una bacteria aislada de E. coli, como se describe anteriormente, y se caracteriza por que comprende un gen de p-galactosidasa endógeno delecionado o inactivado, un gen lacA inactivado o delecionado y un gen funcional de lactosa permeasa (lacY).
En el presente documento también se describen composiciones que comprenden una célula bacteriana que produce el oligosacárido de la leche humana 6'-SL (6'-sialil-lactosa), en donde la célula bacteriana comprende un gen de sialil-transferasa exógeno que codifica la a(2,6) sialil-transferasa. La célula bacteriana puede ser E. coli. El gen de sialil-transferasa exógeno utilizado para la producción de 6'-SL se obtiene de una cualquiera de varias fuentes, por ejemplo, las descritas de diversos organismos del género Photobacterium. En otro aspecto más, el oligosacárido de la leche humana producido por bacterias modificadas genéticamente que comprende una molécula de ácido nucleico exógena que codifica una a(2,3) sialiltransferasa es 3'-SL (3'-sialil-lactosa). El gen de la sialiltransferasa exógeno utilizado para la producción de 3'-SL se obtiene de una cualquiera de varias fuentes, por ejemplo, las descritas de N. meningitidis y N. gonorrhoeae.
Además, la bacteria contiene una ruta catabólica deficiente en ácido siálico. Por "ruta catabólica del ácido siálico" se entiende una secuencia de reacciones, generalmente controlada y catalizada por enzimas, que da como resultado la degradación del ácido siálico. En el presente documento se describe una ruta catabólica del ácido siálico ilustrativa en Escherichia coli. En la ruta catabólica del ácido siálico descrita en el presente documento, el ácido siálico (Neu5Ac; ácido N-acetilneuramínico) se degrada con las enzimas NanA (ácido N-acetilneuramínico liasa), NanK (N-acetilmanosamina quinasa) y NanE (N-acetilmanosamina-6-fosfato epimerasa), todas ellas codificadas en el operón nanATEKyhcH, y reprimidas por NanR (http://ecocyc.org/ECOLI). Una ruta catabólica deficiente en ácido siálico se diseña en Escherichia coli por medio de una mutación en los genes endógenos nanA (N-acetilneuraminato liasa) (por ejemplo, número de registro del GenBank D00067.1 (GI:216588)) y/o nanK (N-acetilmanosamina quinasa) (por ejemplo, número de registro del GenBank (aminoácido) BAE77265.1 (GI:85676015), y/o nanE (N-acetilmanosamina-6-fosfato epimerasa, GI: 947745). Opcionalmente, el gen nanT (transportador de N-acetilneuraminato) también está inactivado o mutado. Otros intermedios del metabolismo del ácido siálico incluyen: (ManNAc-6-P) N-acetilmanosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; (GlcN-6-P) glucosamina-6-fosfato; y (Fruc-6-p) fructosa-6-fosfato. En algunas realizaciones preferidas, nanA está mutado. En otras realizaciones preferidas, nanA y nanK están mutados, mientras que nanE sigue siendo funcional. En otra realización preferida, nanA y nanE están mutados, mientras que nanK no está mutado, inactivado o eliminado. Una mutación es uno o más cambios en la secuencia de ácido nucleico que codifica el producto génico de nanA, nanK, nanE y/o nanT. Por ejemplo, la mutación puede suponer 1, 2, 5, 10, 25, 50 o l0o cambios en la secuencia de ácido nucleico. Por ejemplo, nanA, nanK, nanE y/o nanT están mutados por una mutación nula. Las mutaciones nulas, como se describen en el presente documento, abarcan sustituciones, adiciones, eliminaciones o inserciones de aminoácidos que causan una pérdida de la función de la enzima (es decir, una actividad reducida o nula) o una pérdida de la enzima (es decir, ningún producto génico). Por delecionado se entiende que la región codificante se elimina en su totalidad o en parte, de manera que no se produce ningún producto génico. Por inactivado se entiende que la secuencia codificante se ha alterado de tal manera que el producto génico resultante es funcionalmente inactivo o codifica un producto génico con menos del 100 %, 80 %, 50 % o 20 % de la actividad del producto génico endógeno nativo o natural. Un gen o una proteína "no mutado(a)" no difiere de una secuencia codificante nativa, natural o endógena en 1, 2, 5, 10, 20, 50, 100, 200 o 500 codones más, o con respecto a la secuencia de aminoácidos codificada correspondiente.
Además, la bacteria (por ejemplo, E. coli) también comprende una capacidad sintética de ácido siálico. Por ejemplo, la bacteria comprende una capacidad sintética de ácido siálico a través de la provisión de una 2-epimerasa UDP GIcNAc exógena (por ejemplo, neuC de Campylobacter jejuni (SEQ ID NO: 13, GenBank AAK91727.1; GI:15193223) o equivalente (por ejemplo, neuC de E. coli S88 GenBank YP_002392936.1; GI:218560023), una Neu5Ac sintasa (por ejemplo, neuB de C. jejuni (SEQ ID NO: 14 AAK91726.1GenBank GI:15193222) o equivalente, (por ejemplo, sintasa del ácido siálico de Flavobacterium limnosediminis, GenBank GI:559220424), y/o una CMP-Neu5Ac sintetasa (por ejemplo, neuA de C. jejuni (SEQ ID NO: 15 GenBank AAK91728.1; GI:15193224) o equivalente, (p. ej., CMP-ácido siálico sintasa de Vibrio brasiliensis, GenBank GI:493937153). También se describen variantes funcionales y fragmentos.
La bacteria de la presente invención, que comprende una capacidad sintética de ácido siálico, tiene una producción mayor de UDP-GlcNAc por la sobrexpresión del regulador endógeno positivo de la síntesis de UDP-GlcNAc, nagC. Un medio ilustrativo para lograr esto es, p. ej., mediante la sobreexpresión simultánea de los genes nagC y glmS de Escherichia coli. Esta sobreexpresión de nagC y glmS se logra proporcionando copias adicionales de los genes nagC y glmS en un vector plasmídico, o integrando copias adicionales de los genes nagC y glmS en el cromosoma de la célula hospedadora. Alternativamente, la sobreexpresión se logra mediante la modulación de la fuerza de la secuencia de unión al ribosoma que dirige nagC (descrito por Sleight et al, Nucleic Acids Res. Mayo de 2010; 38 (8): 2624-2636) y/o la traducción de nagC y glmS, o mediante la modulación de la fuerza del promotor, o promotores, que dirige(n) la transcripción de nagC y glmS (Sleight et al, Nucleic Acids Res. Mayo de 2010; 38 (8): 2624-2636). Las bacterias que comprenden las características descritas en el presente documento se cultivan en presencia de lactosa y, en el caso en que las células comprendan una a(2,6) sialiltransferasa (por ejemplo, Photobacterium spp JT-ISH-224 (SEQ ID NO: 21 registro de proteína del Genbank BAF92026.1), se recupera 6'-sialil-lactosa, ya sea de la propia bacteria o de un sobrenadante de cultivo de la misma. En el caso en que las células comprendan una a(2,3) sialiltransferasa, (por ejemplo, Neisseria meningitidis 1 st (registro de proteína del Genbank NP273962.1) se recupera 3'-sialilactosa de la propia bacteria (por ejemplo, por lisis de la bacteria) o de un sobrenadante de cultivo de la misma.
También dentro de la invención se encuentra una bacteria aislada de E. coli que comprende un gen de pgalactosidasa endógeno delecionado o inactivado, un gen exógeno de sialil-transferasa, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de lactosa permeasa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuramina liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE) que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, en particular
(a) en donde dicha bacteria comprende además un gen de p-galactosidasa recombinante que proporciona un nivel bajo, pero detectable, de actividad de p-galactosidasa; o
(b) un gen exógeno de UDP-GlcNAc: Gala/p-R p 3-N-acetilglucosaminiltransferasa y un gen funcional de lactosa permeasa.
Se describe un oligosacárido purificado que contiene N-acetilglucosamina o sialilado producido por los métodos descritos anteriormente. Un oligosacárido purificado, por ejemplo, 6'-SL, es uno que es al menos 90 %, 95 %, 98 %, 99 % o 100 % (p/p) en peso del oligosacárido deseado. La pureza se evalúa mediante cualquier método conocido, por ejemplo, cromatografía de capa fina u otras técnicas electroforéticas o cromatográficas conocidas en la técnica. Se describe un método para purificar un oligosacárido que contiene N-acetilglucosamina o sialilado producido por la bacteria modificada genéticamente descrita con anterioridad, cuto método consiste en separar el oligosacárido sialilado o que contiene N-acetilglucosamina deseado (por ejemplo, 6'-SL) de contaminantes en un extracto o lisado de células bacterianas, o de un sobrenadante de cultivo de células bacterianas. Los contaminantes incluyen ADN bacteriano, proteínas y componentes de la pared celular, y productos glucídicos de color amarillo/pardo que algunas veces se forman en el medio de cultivo procedentes de reacciones químicas espontáneas.
Los oligosacáridos se purifican y se utilizan en diversos productos para el consumo humano y animal, como los animales de compañía (perros, gatos) y el ganado (bovino, equino, ovino, caprino o porcino, así como las aves de corral). Por ejemplo, una composición farmacéutica que comprende 6'-sialil-lactosa (6'-SL) purificada y un excipiente es adecuada para la administración oral. Se producen grandes cantidades de 6'-SL en hospedadores bacterianos, por ejemplo, una bacteria de E. coli que comprende una sialiltransferasa heteróloga, por ejemplo, una a(2,6) sialiltransferasa heteróloga. Una bacteria de E. coli que comprende una acumulación citoplásmica mejorada de cada uno de los siguientes: lactosa y CMP-Neu5Ac, es útil en tales sistemas de producción. En el caso de la lactosa, las rutas metabólicas y los genes endógenos de E. coli se manipulan de manera que se genere un aumento de las concentraciones citoplásmicas de lactosa, en comparación con los niveles encontrados en E. coli natural. Por ejemplo, las bacterias contienen al menos un 10 %, 20 %, 50 %, 2 veces, 5 veces, 10 veces o más, de los niveles en una bacteria natural correspondiente que carece de las modificaciones genéticas descritas anteriormente. En el caso de CMP-Neu5Ac, los genes endógenos del catabolismo de Neu5Ac están inactivados y los genes exógenos de la biosíntesis de CMP-Neu5Ac, introducidos en E. coli, dan como resultado la generación de una reserva citoplásmica de CMP-Neu5Ac que no se encuentra en la bacteria natural.
Un método para producir una composición farmacéutica que comprende una hMOS purificada se lleva a cabo cultivando la bacteria descrita anteriormente, purificando la hMOS producida por la bacteria y combinando la hMOS con un excipiente o vehículo para producir un suplemento dietético para administración oral. Estas composiciones son útiles en métodos para prevenir o tratar enfermedades entéricas y/o respiratorias en bebés y adultos. Por consiguiente, las composiciones se administran a un sujeto que padece o está en riesgo de desarrollar una enfermedad de este tipo utilizando métodos conocidos de terapia clínica.
La invención proporciona aumentar, en E. coli, la concentración intracelular del nucleótido azúcar uridina difosfato N-acetilglucosamina (UDP-GlcNAc). Esto se logra mediante la sobreexpresión del regulador positivo endógeno bifuncional de la síntesis de UDP-GlcNac y del represor del catabolismo de glucosamina y N-acetilglucosamina, nagC, opcionalmente, de forma simultánea con el gen que codifica la L-glutamina:D-fructosa-6-fosfato aminotransferasa, glmS.
La invención también proporciona aumentar, en E. coli, la concentración intracelular de lactosa, en células cultivadas en presencia de lactosa, mediante el uso de manipulaciones de genes endógenos de E. coli implicados en la importación, exportación y catabolismo de la lactosa. En particular, en el presente documento se describen métodos para aumentar los niveles de lactosa intracelular en E. coli genéticamente diseñados para producir un oligosacárido de la leche humana mediante la incorporación de una mutación lacA en la E. coli modificada genéticamente. La mutación lacA impide la formación de acetil-lactosa intracelular, que no solo elimina esta molécula como contaminante de las purificaciones posteriores, sino que también elimina la capacidad de E. coli para exportar el exceso de lactosa de su citoplasma, lo que facilita enormemente las manipulaciones intencionadas de la reserva de lactosa intracelular de E. coli.
También se describen células hospedadoras bacterianas con la capacidad de acumular un depósito de lactosa intracelular mientras que simultáneamente poseen niveles bajos y funcionales de actividad citoplásmica de pgalactosidasa, por ejemplo, como lo proporciona la introducción de un gen recombinante funcional de E. coli lacZ, o de un gen de la p-galactosidasa de cualquiera de una serie de otros organismos (por ejemplo, el gen lac4 de Kluyveromyces lactis (por ejemplo, número de registro del GenBank M84410.1 (GI:173304)). Los niveles bajos y funcionales de p-galactosidasa citoplásmica incluyen niveles de actividad de p-galactosidasa de entre 0,05 y 200 unidades, por ejemplo, entre 0,05 y 5 unidades, entre 0,05 y 4 unidades, entre 0,05 y 3 unidades, o entre 0,05 y 2 unidades (para una definición estándar véase: Miller JH, laboratorio CSH. Experiments in molecular genetics. Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.; 1972). Sin embargo, este bajo nivel de actividad de pgalactosidasa citoplasmática, aunque no es lo suficientemente alto como para disminuir significativamente la acumulación de lactosa intracelular, es muy útil para tareas tales como el marcado fenotípico de locus genéticos deseables durante la construcción de reservas de células hospedadoras, para la detección de la lisis celular debida a contaminaciones de bacteriófagos no deseados en los procesos de fermentación, para facilitar la eliminación de la lactosa residual no deseada al final de las fermentaciones, o para fines de CC (control de calidad) de la fermentación durante el proceso (es decir, como un fenotipo no estándar, la provisión de un fenotipo débil lacz ayuda en las evaluaciones de pureza del cultivo).
Los métodos para purificar un oligosacárido sialilado, o que contiene N-acetilglucosamina, producido mediante los métodos de la invención o descrito en la misma, se llevan a cabo uniendo el oligosacárido procedente de un lisado de células bacterianas o de un sobrenadante de cultivo de células bacterianas de la bacteria, a una columna de carbono, y posteriormente eluyéndolo de la columna. Los oligosacáridos purificados que contienen N-acetilglucosamina o sialilados, se producen mediante los métodos de la invención o descritos en la misma.
Se describe un vector, por ejemplo, un vector que contiene un ácido nucleico. El vector puede incluir además uno o más elementos reguladores, por ejemplo, un promotor heterólogo. Los elementos reguladores pueden unirse operativamente a un gen de proteína, a un gen de proteína de fusión o a una serie de genes unidos a un operón para expresar la proteína de fusión. Para conservar de manera estable el vector plasmídico dentro de la célula, se incluye un marcador de selección dentro de su secuencia, tal como un gen de resistencia a antibióticos o un gen que complemente una auxotrofía nutricional de la bacteria hospedadora. Por ejemplo, en E. coli, una deficiencia de timidina causada por un defecto cromosómico en el gen de la timidilato sintasa (thyA) puede complementarse con una copia natural transmitida por el plásmido del gen thyA (M. Belfort, GF Maley, F. Maley, Proceedings of the National Academy of Sciences 80, 1858 (1983)). Alternativamente, una deficiencia de adenina causada por una deficiencia cromosómica en el gen de la adenilosuccinato sintetasa (purA) (S.A. Wolfe, J. M. Smith, J. Biol Chem 263, 19147-53 (1988)) puede complementarse con una copia natural transmitida por el plásmido del gen purA. Se pueden utilizar dos vectores de plásmidos simultáneamente dentro de la misma célula bacteriana empleando distintos marcadores de selección, por ejemplo, un plásmido que utilice la selección de thyA y otro que utilice la selección de purA, y utilizando dos replicones de plásmidos compatibles, por ejemplo, en E. coli, dos de estos replicones compatibles comprenden el replicón ColE1 (pUC) y el replicón p15A (pACYC) (R.E. Bird, J Bacteriol 145, 1305-9 (1981)). En otro aspecto más, la invención comprende una célula recombinante aislada, por ejemplo, una célula bacteriana que contiene la molécula o moléculas de ácido nucleico o el vector o vectores mencionados anteriormente. Las secuencias de ácido nucleico pueden integrarse opcionalmente en el genoma.
Se describe un método para tratar, prevenir o reducir el riesgo de infección en un sujeto, que comprende, administrar a dicho sujeto, una composición que comprende un oligosacárido de leche humana, purificado a partir de un cultivo de una cepa recombinante de la presente invención, en donde el hMOS se une a un patógeno y en el que el sujeto está infectado o en riesgo de infección con el patógeno. La infección puede estar causada por un virus tipo Norwalk o Campylobacter jejuni. El sujeto puede ser un mamífero que necesite tal tratamiento. El mamífero es, por ejemplo, cualquier mamífero, por ejemplo, un ser humano, un primate, un ratón, una rata, un perro, un gato, una vaca, un caballo o un cerdo. Por ejemplo, las composiciones se formulan en piensos para animales (por ejemplo, peletes, croquetas, puré) o complementos alimenticios para animales de compañía, por ejemplo, perros o gatos, así como ganado o animales criados para el consumo de alimentos, por ejemplo, ganado vacuno, ovejas, cerdos, gallinas y cabras. El hMOS purificado puede formularse en un polvo (por ejemplo, polvo de fórmula infantil o polvo de suplemento nutricional para adultos, cada uno de los cuales se mezcla con un líquido como agua o zumo antes del consumo) o en forma de comprimidos, cápsulas o pastas o se incorpora como componente en productos lácteos como la leche, cremas, quesos, yogures o kéfir, o como componente en cualquier bebida, o se combina en una preparación que contiene cultivos microbianos vivos destinados a servir como probióticos, o en preparaciones prebióticas destinadas a mejorar el crecimiento de microorganismos beneficiosos ya sea in vitro o in vivo. Por ejemplo, el azúcar purificado (por ejemplo, LNnT o 6'-SL) se puede mezclar con una bacteria de los géneros Bifidobacterium o Lactobacillus en una composición nutricional probiótica (es decir, las bifidobacterias son componentes beneficiosos de una flora intestinal normal y también se sabe que utilizan hMOS para el crecimiento).
Todos los genes descritos en el presente documento, también incluyen una descripción de los productos génicos codificados correspondientes. Como tales, los usos de genes exógenos como se describen en el presente documento abarcan ácidos nucleicos que codifican las secuencias de productos génicos descritos en el presente documento. El experto en la materia podría generar fácilmente secuencias de ácido nucleico que codifiquen las secuencias de proteínas descritas en el presente documento e introducir dichas secuencias en vectores de expresión para llevar a cabo la presente invención.
La expresión "sustancialmente puro", en referencia a un polipéptido, polinucleótido u oligosacárido dado, significa que el polipéptido, polinucleótido u oligosacárido carece sustancialmente de otras macromoléculas biológicas. El polipéptido, polinucleótido u oligosacárido sustancialmente puro es al menos un 75 % (por ejemplo, al menos 80, 85, 95 o 99 %) puro en peso seco. La pureza se puede medir mediante cualquier método estándar calibrado apropiado, por ejemplo, mediante cromatografía en columna, electroforesis en gel de poliacrilamida, cromatografía en capa fina (TLC) o análisis por HPLC.
Se describen polinucleótidos, polipéptidos y oligosacáridos que se purifican y/o se aíslan. Purificado define un grado de esterilidad que es seguro para la administración a un sujeto humano, por ejemplo, que carece de agentes infecciosos o tóxicos. Específicamente, como se utiliza en el presente documento, una molécula de ácido nucleico, polinucleótido, polipéptido, proteína u oligosacárido "aislada" o "purificada", carece sustancialmente de cualquier otro material o medio de cultivo celular cuando se produce mediante técnicas recombinantes, o de precursores químicos u otros productos químicos cuando se sintetizan químicamente. Por ejemplo, las composiciones de hMOS purificadas tienen al menos un 60 % en peso (peso seco) del compuesto de interés. La preparación puede tener al menos el 75 %, al menos el 90 % y al menos el 99 % en peso, del compuesto de interés. La pureza se mide mediante cualquier método estándar calibrado apropiado, por ejemplo, mediante cromatografía en columna, electroforesis en gel de poliacrilamida, cromatografía en capa fina (TLC) o análisis por HPLC. Por ejemplo, una "proteína purificada" se refiere a una proteína que se ha separado de otras proteínas, lípidos y ácidos nucleicos con los que está naturalmente asociada. La proteína puede constituir al menos un 10, 20, 5070, 80, 90, 95, 99-100 % en peso seco de la preparación purificada.
Por "ácido nucleico aislado" se entiende un ácido nucleico que carece de los genes que lo flanquean en el genoma natural del organismo del cual procede el ácido nucleico. La expresión, por ejemplo: (a) un ADN que forma parte de una molécula de ADN genómico natural, pero que no está flanqueado por las dos secuencias de ácido nucleico que flanquean esa parte de la molécula en el genoma del organismo en el que se produce de manera natural (b) un ácido nucleico incorporado en un vector o en el ADN genómico de un procariota o eucariota de tal manera que la molécula resultante no sea idéntica a ningún ADN genómico o vector natural; (c) una molécula distinta, tal como un ADNc, un fragmento genómico, un fragmento producido por la reacción en cadena de la polimerasa (PCR), o un fragmento de restricción; y (d) una secuencia de nucleótidos recombinante que forma parte de un gen híbrido, es decir, un gen que codifica una proteína de fusión. Las moléculas de ácido nucleico aisladas incluyen además moléculas producidas sintéticamente, así como cualquier ácido nucleico que se haya alterado químicamente y/o que tenga estructuras modificadas. Por ejemplo, el ácido nucleico aislado es un polinucleótido de ADNc o ARN purificado.
Un "promotor heterólogo", cuando está unido operativamente a una secuencia de ácido nucleico, se refiere a un promotor que no está asociado naturalmente con la secuencia de ácido nucleico.
El término "sobreexpresar", como se utiliza en el presente documento, se refiere a que la transcripción del gen o del producto génico codificado tiene un nivel que es un 10 %, 20 %, 50 %, 2 veces, 5 veces, 10 veces o mayor, en comparación con el nivel expresado o producido por un gen nativo, natural o endógeno en una bacteria en la que se produce de manera natural. Por ejemplo, la bacteria hospedadora descrita en el presente documento está diseñada para sobreexpresar una transcripción génica exógena o un producto génico codificado de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa, nagC, glmS, glmY, glmZ, una sialil-transferasa, una p-galactosiltransferasa, una afucosiltransferasa, CMP-Neu5Ac sintetasa, una ácido siálico sintasa o una UDP-GIcNAc 2-epimerasa, es decir, un gen o producto génico con una secuencia correspondiente a la de una bacteria distinta de la bacteria hospedadora.
Los términos "tratar" y "tratamiento", como se utilizan en el presente documento, se refieren a la administración de un agente o una formulación a un individuo clínicamente sintomático afectado por una afección, un trastorno o una enfermedad adversos, a fin de lograr una reducción en la gravedad y/o frecuencia de los síntomas, eliminar los síntomas y/o su causa subyacente, y/o facilitar la mejora o la reparación del daño. Los términos "prevenir" y "prevención" se refieren a la administración de un agente o una composición a un individuo clínicamente asintomático que es susceptible a una afección, un trastorno o una enfermedad adversa en particular y, por lo tanto, se relaciona con la prevención de la aparición de síntomas y/o su causa subyacente.
Por las expresiones "cantidad eficaz" y "cantidad terapéuticamente eficaz" de una formulación o componente de formulación, se entiende una cantidad no tóxica pero suficiente de la formulación o componente para proporcionar el efecto deseado.
La expresión de transición "que comprende", que es sinónimo de "que incluye", "que contiene" o "caracterizado por", es inclusiva o abierta y no excluye elementos o etapas de métodos no citados adicionales. Por el contrario, la frase de transición "que consiste en" excluye cualquier elemento, etapa o ingrediente no especificado en la reivindicación. La frase de transición "que consiste esencialmente en" limita el alcance de una reivindicación a los materiales o a las etapas especificados "y aquellos que no afectan materialmente a las características básicas y novedosas" de la invención reivindicada.
Otras características y ventajas de la invención serán evidentes a partir de la siguiente descripción y de las reivindicaciones. A menos que se defina lo contrario, todos los términos técnicos y científicos utilizados en el presente documento, tienen el mismo significado que entiende comúnmente cualquier experto en la técnica a la que pertenece la presente invención. Aunque pueden utilizarse métodos y materiales similares o equivalentes a los descritos en el presente documento en la práctica o en el ensayo de la presente invención, a continuación, se describen métodos y materiales adecuados. En caso de conflicto con cualquiera de las patentes extranjeras publicadas y solicitudes de patentes citadas en el presente documento, las presentaciones de Genbank y NCBI indicadas con el número de registro citado en el presente documento y en la bibliografía científica citada en el presente documento, prevalecerá la presente memoria descriptiva, incluidas las definiciones. Además, los materiales, métodos y ejemplos son solo ilustrativos y no pretenden ser limitativos.
Breve descripción de los dibujos
La Fig. 1 es un esquema que muestra las rutas metabólicas y los cambios introducidos en ellas para diseñar la síntesis de 2'-fucosillactosa (2'-FL) en Escherichia coli (E. coli). Específicamente, se ilustra la ruta de la síntesis de lactosa y la ruta de la síntesis de GDP-fucosa. En la ruta de la síntesis de GDP-fucosa: manA = fosfomanosa isomerasa (PMI), manB = fosfomanomutasa (PMM), manC = manosa-1-fosfato guanililtransferasa (GMP), gmd = GDP-manosa-4,6-deshidratasa, fcl = GDP-fucosa sintasa (GFS) y AwcaJ = UDP-glucosa transferasa transportadora de lípidos mutada.
La Fig. 2 es un esquema que muestra las rutas metabólicas implicadas en la síntesis de UDP-GlcNAc (uridín difosfato N-acetilglucosamina) y en el catabolismo de la glucosamina y N-acetilglucosamina en E. coli. En el esquema: (GlcNAc-1-P) N-acetilglucosamina-1-fosfato; (GlcN-1-P) glucosamina-1-fosfato; (GlcN-6-P) glucosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; y (fruc-6-P) fructosa-6-fosfato; glmS (L-glutamina: D-fructosa-6-fosfato aminotransferasa), glmM (fosfoglucosamina mutasa), glmU (N-acetil glucosamina-1-fosfato uridiltransferasa y glucosamina-1-fosfato acetiltransferasa fusionada), nagC (activador transcripcional bifuncional/proteína represora), nagA (N-acetilglucosamina-6-fosfato desacetilasa) y nagB (glucosamina-6-fosfato desaminasa), nagE (transportador de N-acetilglucosamina) y manXYZ (transportador de glucosamina).
La Fig. 3 es un esquema que muestra las rutas metabólicas y un ejemplo (que utiliza deleciones nanT, nanA y nanK) de los cambios introducidos en ellas para diseñar la síntesis de 6'-sialil-lactosa (6'-SL) en E. coli. Las abreviaturas son: (Neu5Ac) ácido N-acetilneuramínico, ácido siálico; (AnanT) transportador de ácido N-acetilneuramínico mutado; (AnanA) ácido N-acetilneuramínico liasa mutado; (ManNAc) N-acetilmanosamina; (AnanK) N-acetilmanosamina quinasa mutada; (nanE); N-acetilmanosamina-6-fosfato epimerasa de tipo natural; (ManNAc-6-P) N-acetilmanosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; (GlcN-6-P) Glucosamina-6-fosfato; (Fruc-6-P) Fructosa-6-fosfato; (neuA), ácido CMP-N-acetilneuramínico sintasa; (CMP-Neu5Ac) ácido CMP-N-acetilneuramínico; (neuB), ácido N-acetilneuramínico sintasa; (neuC) UDP-GlcNAc-2-epimerasa; y (UDP-GlcNAc) uridín difosfato N-acetilglucosamina.
La Fig. 4 es un esquema que ilustra la nueva configuración de genes diseñados en el locus thyA de Escherichia coli en cepas utilizadas para producir oligosacáridos que contienen N-acetilglucosamina.
La Fig. 5 es un mapa plasmídico de pG292, que expresa el gen lgtA de p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis.
La Fig. 6 es un mapa plasmídico de pG221, que expresa, como un operón, el gen lgtA de p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis y el gen wbgO de p(1,3)-galactosiltransferasa de E. coli 0SS:H7. La Fig. 7 es un mapa plasmídico de pG222, que expresa, como un operón, el gen lgtA de p (1,3)-Nacetilglucosaminiltransferasa de N. meningitidis y el gen 4GalT (jhp0765) de p (1,4)-galactosiltransferasa de H. pylori.
La Fig. 8 ilustra esquemáticamente las reacciones enzimáticas necesarias para producir, a partir de lactosa, a través del trisacárido intermedio lacto-N-triosa 2 (LNT2), los dos oligosacáridos de la leche humana: Lacto-N-tetraosa (LNT) y Lacto-N-neotetraosa (LNnT). Se presenta un cromatograma de capa fina (a la izquierda) de muestras de medio de cultivo tomadas de cultivos de E. coli a pequeña escala y que demuestran la síntesis de LNT2, LNT y LNnT. Se presenta un segundo cromatograma de capa fina (a la derecha) de muestras de medio de cultivo tomadas de un cultivo de E. coli en un biorreactor de 15 l, que demuestra la síntesis de LNnT.
La Fig. 9 es un mapa plasmídico de pG317, un vector de bajo número de copias, que expresa como un operón, bajo el control del promotor lac de E. coli, los genes neuB, neuC y neuA de Campylobacter jejuni ATCC43438, que codifican N-acetilneuraminato sintasa, UDP-N-acetilglucosamina 2-epimerasa y N-acetilneuraminato citidililtransferasa, respectivamente.
La Fig. 10 es un mapa plasmídico de pG315, un vector de copias múltiples, que expresa un gen que codifica una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224, bajo el control del promotor lac de E. coli.
La Fig. 11 es una fotografía de un cromatograma de capa fina que muestra 6'-SL en medio de cultivo producido por la cepa E547 de E. coli (AnanRATEK), que contiene plásmidos que expresan una a(2,3) sialiltransferasa y neuA, neuB y neuC de bacteria. La Fig. 11 también muestra un análisis de TLC de sobrenadantes de cultivos de dos fermentaciones que producen 6'-sialilactosa (6'-SL). Las muestras de la izquierda de la figura se toman de una fermentación de una cepa de E. coli que contiene pG315 (que lleva un RBS fuerte frente al gen de la a(2,6) sialiltransferasa en el vector). Las muestras de la derecha de la figura se toman de una fermentación de una cepa de E. coli que contiene una variante cercana de pG315 que lleva un RBS más débil frente al gen de la a(2,6) sialiltransferasa.
La Fig. 12 es un mapa plasmídico de pG345, un vector de copias múltiples, que expresa un gen que codifica una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224, bajo el control de un sitio de unión al ribosoma más débil (SEQ ID NO: 8) y el promotor lac de E. coli.
La Fig. 13 es un esquema que muestra las rutas metabólicas y un segundo ejemplo (que utiliza las deleciones nanT, nanA y nanE) de los cambios introducidos en ellas para diseñar la síntesis de 6'-sialil-lactosa (6'-SL) en E. coli. Las abreviaturas son: (Neu5Ac) ácido N-acetilneuramínico, ácido siálico; (AnanT) transportador de ácido N-acetilneuramínico mutado; (AnanA) ácido N-acetilneuramínico liasa mutado; (ManNAc) N-acetilmanosamina; (nanK) N-acetilmanosamina quinasa de tipo natural; (AnanE) N-acetilmanosamina-6-fosfato epimerasa mutada; (ManNAc-6-P) N-acetilmanosamina-6-fosfato; (GlcNAc-6-P) N-acetilglucosamina-6-fosfato; (GlcN-6-P) glucosamina-6-fosfato; (Fruc-6-P) Fructosa-6-fosfato; (neuA), sintetasa del ácido CMP-N-acetilneuramínico; (CMP-Neu5Ac) ácido CMP-N-acetilneuramínico; (neuB), ácido N-acetilneuramínico sintasa; (neuC) UDP-GlcNAc-2-epimerasa; y (UDP-GlcNAc) uridín difosfato N-acetilglucosamina.
La Fig. 14 ilustra el análisis de TLC de sedimentos y/o sobrenadantes celulares de tres experimentos de fermentación a escala piloto que utilizan tres cepas de E. coli que llevan varias combinaciones de mutaciones nan.
La Fig. 15 es un esquema que ilustra la ubicación de la deleción del gen realizada dentro del operón nan de E. coli para generar el locus mutante [nanA, nanT, nanE, nanK+] de las cepas E1017 y E1018.
La Fig. 16 es una gráfica de la curva de crecimiento de la densidad celular de cuatro cultivos de E680 transformados con pG292, inducidos o no inducidos por la adición de triptófano, y en presencia o ausencia de lactosa en el medio de crecimiento. Se observa abundante lisis celular en los cultivos que contienen lactosa. La Fig. 17 es un mapa plasmídico de pG356, que expresa, como un operón, los genes glmS y nagC de E. coli. pG356 lleva un origen de replicación p15A y dos marcadores de selección ampC y purA.
La Fig. 18 es una traza de parámetros de fermentación y un análisis del sobrenadante del cultivo de TLC (para la producción de LNnT) de un cultivo en biorreactor de 1,5 l de E796 transformado con pG222.
Fig. 19 es una traza de parámetros de fermentación y un análisis del sobrenadante del cultivo de TLC (para la producción de LNnT) de un cultivo en biorreactor de 1,5 l de E866 transformado con pG222 y pG356.
Descripción detallada de la invención
En el presente documento, se describen construcciones genéticas y métodos para la producción de oligosacáridos de leche humana (hMOS) que contienen N-acetilglucosamina y sialiloligosacáridos. Con el fin de producir hMOS que contengan tanto N-acetilglucosamina como sialilo, es necesario aprovechar la reserva celular de UDP-GlcNAc. Hacerlo puede ser difícil, ya que UDP-GlcNAc es un metabolito esencial para las bacterias (utilizado para fabricar la pared celular). Las construcciones, composiciones y métodos de la invención, o como se describen, superan las dificultades del pasado al mejorar la reserva de UDP-GlcNAc, una estrategia que representa una ventaja en la producción de ambas clases de hMOS. Otras distinciones sobre los enfoques anteriores representan mejoras y/o confieren ventajas sobre las estrategias anteriores.
hMOS
Los glucanos de la leche humana, que comprenden tanto oligosacáridos (hMOS) como sus glucoconjugados, desempeñan un papel importante en la protección y el desarrollo de los lactantes humanos y, en particular, en el tubo gastrointestinal (GI) infantil. Los oligosacáridos de la leche que se encuentran en varios mamíferos, difieren mucho, y su composición en seres humanos es única (Hamosh M., 2001 Pediatr Clin North Am, 48: 69-86; Newburg D. S., 2001 Adv Exp Med Biol, 501: 3-10). Además, los niveles de glucano en la leche materna cambian a lo largo de la lactancia y también varían mucho entre individuos (Morrow A. L. et al., 2004 J Pediatr, 145: 297-303; Chaturvedi P et al., 2001 Glycobiology, 11: 365-372). Anteriormente, una exploración completa de los roles de hMOS estaba limitada por la incapacidad de caracterizar y medir adecuadamente estos compuestos. En los últimos años se han desarrollado métodos cuantitativos sensibles y reproducibles para el análisis de hMOS neutros y ácidos (Erney, R., Hilty, M., Pickering, L., Ruiz-Palacios, G., y Prieto, P. (2001) Adv Exp Med Biol 501, 285-297. Bao, Y., y Newburg, D. S. (2008) Electrophoresis 29, 2508-2515). Se han identificado aproximadamente 200 oligosacáridos distintos en la leche humana, y las combinaciones de un pequeño número de epítopos simples son responsables de esta diversidad (Newburg DS, 1999 Curr_Med Chem, 6: 117-127; Ninonuevo M. et al., 2006 J Agric Food Chem, 54: 7471-74801). Los hMOS se componen de 5 monosacáridos: D-glucosa (Glc), D-galactosa (Gal), N-acetilglucosamina (GlcNAc), L-fucosa (Fuc) y ácido siálico (ácido N-acetil neuramínico, Neu5Ac, NANA). Los hMOS generalmente se dividen en dos grupos según sus estructuras químicas: compuestos neutros que contienen Glc, Gal, GlcNAc y Fuc, unidos a un núcleo de lactosa (Galp1-4Glc), y compuestos ácidos que incluyen los mismos azúcares y, a menudo, las mismas estructuras del núcleo, más NANA (Charlwood J. y otros, 1999 Anal_Biochem, 273: 261-277; Martin-Sosa y otros, 2003 J Dairy Sci, 86: 52-59; Parkkinen J. y Finne J., 1987 Methods Enzymol, 138: 289-300; Shen Z. et al., 2001 J Chromatogr A, 921: 315-321). Aproximadamente el 70-80 % de los oligosacáridos en la leche humana están fucosilados. Una proporción más pequeña de los oligosacáridos en la leche humana está sialilada, o está fucosilada y sialilada.
Curiosamente, los hMOS, como clase, sobreviven de manera muy eficiente a través del intestino de los bebés, en función de su transporte deficiente a través de la pared intestinal y de su resistencia a la digestión por las enzimas intestinales humanas (Chaturvedi, P., Warren, C.D., Buescher, C.R., Pickering, L.K. y Newburg, D.S. Adv Exp Med Biol 501, 315-323 (2001)). Una consecuencia de esta supervivencia en el intestino, es que los hMOS pueden funcionar como prebióticos, es decir, están disponibles para servir como una fuente de carbono abundante para el crecimiento de microorganismos comensales del intestino residentes (Ward, R.E., Niñonuevo, M., Mills, D.A., Lebrilla, C.B. y German, J.B. (2007) Mol Nutr Food Res 51, 1398-1405). Recientemente, hay un creciente interés en el papel de la dieta y los agentes prebióticos en la determinación de la composición de la microflora intestinal, y en la comprensión de la relación entre la microflora intestinal y la salud humana (Roberfroid, M., Gibson, G.R., Hoyles, L., McCartney, A.L., Rastall, R., Rowland, I., Wolvers, D., Watzl, B., Szajewska, H., Stahl, B., Guarner, F., Respondek, F., Whelan, K., Coxam, V., Davicco, M.J., Léotoing, L., Wittrant, Y., Delzenne, N.M, Cani, P.D., Neyrinck, A.M. y Meheust, A. (2010) Br J Nutr 104 Suppl 2, S1-63).
Diversos glucanos de la leche humana poseen homología estructural con los receptores celulares de enteropatógenos, y cumplen funciones en la defensa de los patógenos al actuar como "señuelos" de los receptores moleculares. Por ejemplo, las cepas patógenas de Campylobacter se unen específicamente a los glucanos en la leche humana que contiene el epítopo H-2, es decir, 2'-fucosil-W-acetillactosamina o 2'-fucosillactosa (2'-FL); la unión de Campylobacter y la infectividad son inhibidas por 2'-FL y otros glucanos que contienen este epítopo H-2 (Ruiz-Palacios, G.M., Cervantes, L.E., Ramos, P., Chavez-Munguia, B. y Newburg, D.S. (2003) J Biol Chem 278, 14112­ 14120). De manera similar, algunos patógenos diarreogénicos de E. coli son fuertemente inhibidos in vivo por hMOS que contiene restos de fucosa ligados en 2'. Varias cepas principales de calicivirus humanos, especialmente los norovirus, también se unen a glucanos fucosilados ligados en 2', y esta unión es inhibida por los glucanos fucosilados ligados en 2' de la leche humana. El consumo de leche humana con altos niveles de estos fucosiloligosacáridos ligados en 2' se ha asociado a un menor riesgo de norovirus, Campylobacter, ST de diarrea asociada a E. coli y diarrea de moderada a grave de todas las causas en una cohorte mexicana de niños lactantes (Newburg D.S. et al., 2004 Glycobiology, 14: 253-263; Newburg D.S. et al., 1998 Lancet, 351: 1160-1164). También se sabe que varios agentes patógenos utilizan glucanos sialilados como sus receptores hospedadores, tales como el virus de la gripe (Couceiro, J. N., Paulson, J.C. & Baum, L.G. Virus Res 29, 155-165 (1993)), de la paragripe (Amonsen, M., Smith, D.F., Cummings, R.D. y Air, G.M. J Virol 81, 8341-8345 (2007) y rotovirus (Kuhlenschmidt, T. B., Hanafin, W.P, Gelberg, H.B. y Kuhlenschmidt, M.S. Adv Exp Med Biol 473, 309-317 (1999)). El epítopo sialil-Lewis X lo utiliza Helicobacter pylori (Mandavi, J., Sondén, B., Hurtig, M., Olfat, F.O. et al.,. Science 297, 573-578 (2002)), Pseudomonas aeruginosa (Scharfman, A., Delmotte, P., Beau, J., Lamblin, G., et al., Glycoconj J 17, 735­ 740 (2000)), y algunas cepas de norovirus (Rydell, G.E., Nilsson, J., Rodriguez-Díaz, J., Ruvoen-Clouet, N., et al. Glycobiology 19, 309-320 (2009)).
El nucleótido azúcar uridina difosfato N-acetilglucosamina (UDP-GlcNAc) es un intermediario metabólico clave en las bacterias, donde participa en la síntesis y el mantenimiento de la envoltura celular. En todas las clases bacterianas conocidas, UDP-GlcNAc se usa para elaborar peptidoglucanos (mureína); un polímero que comprende la pared celular bacteriana cuya integridad estructural es absolutamente esencial para el crecimiento y la supervivencia. Además, las bacterias gramnegativas utilizan UDP-GlcNAc para la síntesis de lípido A, un componente importante de la membrana celular externa. Por lo tanto, para las bacterias, la capacidad de mantener una reserva intracelular adecuada de UDP-GlcNAc es crítica.
La biosíntesis de ciertos oligosacáridos de la leche humana (hMOS) se ha logrado en cepas modificadas por ingeniería genética de la bacteria Escherichia coli K12. Como se describe en el presente documento, los hMOS fucosilados simples, p. ej. 2'-fucosillactosa (2'-FL), 3-fucosillactosa (3-FL) y lactodifucotetraosa (LDFT), se producen de manera eficiente por la E. coli viva mediante la mejora artificial de las reservas intracelulares existentes de GDPfucosa (el nucleótido donador de azúcar) y la lactosa (el azúcar aceptor de azúcar), y para utilizar estas reservas mejoradas como sustratos para fucosiltransferasas recombinantes heterólogas (Figura 1). Dado que ni las reservas de lactosa ni de GDP-fucosa son esenciales para la supervivencia de E. coli, la biosíntesis de hMOS fucosilados simple se logra con buenos rendimientos sin consecuencias negativas sobre el crecimiento o la viabilidad de la bacteria hospedadora. Sin embargo, para sintetizar hMOS más complejos en E. coli, se requiere el uso de la reserva bacteriana crítica de UDP-GlcNAc, con los consiguientes posibles impactos en la viabilidad celular.
La reserva de UDP-GlcNAc en E. coli se produce a través de la acción combinada de tres genes glmS, glmS (L-glutamina:D-fructosa-6-fosfato aminotransferasa), glmM (fosfoglucosamina mutasa) y el gen glmU bifuncional (N-acetil glucosamina-1-fosfato uridiltransferasa y glucosamina-1-fosfato acetil transferasa fusionadas) (Figura 2). Estos tres genes dirigen un flujo constante de carbono a UDP-GlcNAc, un flujo que se origina con fructosa-6-fosfato (una molécula abundante del metabolismo central de energía). La expresión de los genes glm está bajo control positivo de la proteína activadora de la transcripción, NagC.
Cuando E. coli encuentra glucosamina o N-acetil-glucosamina en su entorno, cada una de estas moléculas se transporta a la célula a través de proteínas transportadoras específicas de membrana y se utilizan para complementar el flujo de carbono a la reserva de UDP-GlcNAc o, alternativamente, son consumidas para generar energía, bajo la acción de los productos génicos del operón nag (es decir, nagA [N-acetilglucosamina-6-fosfato desacetilasa] y nagB [glucosamina-6-fosfato desaminasa]). A diferencia de los genes glm, la expresión de nagA y nagB están bajo el control transcripcional negativo, pero por la misma proteína reguladora que la de los genes glm, es decir, NagC. NagC es, por tanto, bifuncional, capaz de activar la síntesis de UDP-GlcNAc, mientras que al mismo tiempo reprime la degradación de la glucosamina-6-fosfato y la N-acetilglucosamina-6-fosfato.
La unión de NagC a secuencias de ADN reguladoras específicas (operadores), tanto si dicha unión da lugar a la activación o represión génica, es sensible a las fluctuaciones a nivel citoplásmico del inductor y metabolito de molécula pequeña, GlcNAc-6-fosfato. Las concentraciones intracelulares de GlcNAc-6-fosfato aumentan cuando la N-acetilglucosamina está disponible como una fuente de carbono en el entorno y, por lo tanto, en estas condiciones, la expresión de los genes glm (esenciales para mantener la reserva vital de UDP-GlcNAc) disminuiría, a menos que se ponga en juego un mecanismo compensatorio. E. coli mantiene un nivel inicial de síntesis de UDP-GlcNAc a través de la expresión continua de nagC dirigida por dos promotores constitutivos, ubicados en el gen nagA en dirección 5'. Este nivel constitutivo de la expresión de nagC se complementa aproximadamente tres veces en condiciones en las que se induce el operón nag degradante y, de este modo, E. coli garantiza un nivel adecuado de expresión del gen glm en todas las condiciones, incluso cuando se utiliza N-acetilglucosamina como fuente de carbono.
Muchos hMOS incorporan GlcNAc en sus estructuras directamente, y muchos también incorporan ácido siálico, un azúcar cuya síntesis implica el consumo de UDP-GlcNAc (FIG. 3, FIG. 13). Por tanto, la síntesis de muchos tipos de hMOS en E. coli diseñada por ingeniería genética conlleva el riesgo significativo de una reducción del rendimiento del producto y de la viabilidad celular comprometida que da lugar al agotamiento de la reserva de UDP-GlcNAc de la bacteria. Una forma de abordar este problema durante la síntesis por ingeniería de hMOS que contiene GlcNAc o ácido siálico, es aumentar la reserva de UDP-GlcNAc mediante la sobreexpresión simultánea de nagC, o preferentemente, mediante la sobreexpresión simultánea de nagC y glmS.
Aunque los estudios sugieren que los glucanos de la leche humana podrían utilizarse como prebióticos y como agentes antimicrobianos antiadherentes, la dificultad y el coste de producir cantidades adecuadas de estos agentes de una calidad adecuada para el consumo humano, ha limitado sus pruebas a gran escala y su utilidad percibida. Lo que se ha necesitado es un método adecuado para producir los glucanos apropiados en cantidades suficientes a un coste razonable. Antes de la invención, hubo intentos de utilizar varios enfoques sintéticos distintos para la síntesis de glucanos. Los nuevos enfoques químicos pueden sintetizar oligosacáridos (Flowers, H.M. Methods Enzymol 50, 93-121 (1978); Seeberger, P.H. Chem Commun (Camb) 1115-1121 (2003)), pero los reactivos para estos métodos son costosos y posiblemente tóxicos (Koeller, K.M. & Wong, C.H. Chem Rev 100, 4465-4494 (2000)). Las enzimas expresadas a partir de organismos modificados (Albermann, C., Piepersberg, W. y Wehmeier, U.F. Carbohydr Res 334, 97-103 (2001); Bettler, E., Samain, E., Chazalet, V., Bosso, C., et al., Glycoconj J 16, 205-212 (1999); Johnson, KF Glycoconj J 16, 141-146 (1999); Palcic, M.M. Curr Opin Biotechnol 10, 616-624 (1999); Wymer, N. & Toone, E.J. Curr Opin Chem Biol 4, 110-119 (2000) proporcionan una síntesis precisa y eficaz (Palcic, M.M. Curr Opin Biotechnol 10, 616-624 (1999)); Crout, D. H. y Vic, G. Curr Opin Chem Biol 2, 98-111 (1998)), pero el alto coste de los reactivos, en especial el de los nucleótidos de azúcar, limita su utilidad para la producción a gran escala y bajo costo. Se han diseñado microbios mediante ingeniería genética para que expresen las glucosiltransferasas que son necesarias para sintetizar oligosacáridos de la reserva innata de bacterias de los azúcares de nucleótidos (Endo, T., Koizumi, S., Tabata, K., Kakita, S. y Ozaki, A. Carbohydr Res 330, 439-443 (2001); Endo, T., Koizumi, S., Tabata, K. y Ozaki, A. Appl Microbiol Biotechnol 53, 257-261 (2000); Endo, T. y Koizumi, S. Curr Opin Struct Biol 10, 536-541 (2000); Endo, T., Koizumi, S., Tabata, K., Kakita, S. y Ozaki, A. Carbohydr Res 316, 179-183 (1999); Koizumi, S., Endo, T., Tabata, K. y Ozaki, A. Nat Biotechnol 16, 847-850 (1998)). Sin embargo, los bajos rendimientos generales del producto y la alta complejidad del proceso, han limitado la utilidad comercial de estos enfoques.
Antes de la invención, que permite la producción asequible de grandes cantidades de hMOS neutros y ácidos, no había sido posible investigar completamente la capacidad de esta clase de molécula para inhibir la unión de patógenos, o incluso explorar su amplia gama de otras posibles funciones.
Antes de la invención, la síntesis química de hMOS era posible, pero estaba limitada por problemas de estéreoespecificidad, disponibilidad de precursores, impurezas del producto y alto coste general (Flowers, H.M. Methods Enzymol 50, 93-121 (1978); Seeberger, P.H. Chem Commun (Camb) 1115-1121 (2003); Koeller, K.M. & Wong, C.H. Chem Rev 100, 4465-4494 (2000)). Además, antes de la invención, también era posible la síntesis enzimática in vitro, pero estaba limitada por la necesidad de precursores costosos de nucleótido-azúcar. La invención supera los inconvenientes de estos intentos previos al proporcionar nuevas estrategias para fabricar grandes cantidades de oligosacáridos de la leche humana para su uso como suplementos dietéticos. La invención hace uso de una bacteria de E. coli (u otra bacteria) diseñada por ingeniería genética para producir oligosacáridos sialilados a niveles comercialmente viables, por ejemplo, los métodos de la invención, o como se describen, permiten la producción de 3'-SL a > 50 g/l en biorreactores.
Variantes y fragmentos funcionales
La presente invención presenta la introducción de genes exógenos en bacterias para manipular las rutas para aumentar las reservas de UDP-GlcNAc, para producir oligosacáridos sialilados y para producir oligosacáridos que contengan N-acetilglucosamina. En cualquiera de los métodos de la invención, o como se describen, los genes o productos génicos pueden ser variantes o fragmentos funcionales de los mismos.
Una variante de cualquiera de los genes, o productos génicos descritos en el presente documento, puede tener una identidad de secuencia del 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % con las secuencias de ácido nucleico o de aminoácidos descritas en el presente documento. La expresión "% de identidad", en el contexto de dos o más secuencias de ácido nucleico o polipéptido, se refiere a dos o más secuencias o subsecuencias que son iguales o que tienen un porcentaje específico de residuos de aminoácidos o nucleótidos que son iguales, cuando se comparan y alinean para obtener una máxima correspondencia, según lo medido utilizando uno de los siguientes algoritmos de comparación de secuencias o mediante inspección visual. Por ejemplo, el % de identidad es relativo a la longitud total de las regiones codificantes de las secuencias que se comparan, o a la longitud de un fragmento concreto o de un dominio funcional del mismo.
Las variantes, como se describen, también incluyen homólogos, ortólogos o parálogos de los genes o productos génicos, como se describen, que conservan la misma función biológica que la de los genes o productos génicos especificados en el presente documento. Estas variantes pueden utilizarse indistintamente con los genes enumerados en estos métodos. Dichas variantes pueden demostrar un porcentaje de homología o de identidad, por ejemplo, un 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de identidad en dominios conservados importantes para la función biológica, tal como en un dominio funcional, por ejemplo, un dominio catalítico.
Para la comparación de secuencias, una secuencia actúa como una secuencia de referencia, con la que se comparan las secuencias de prueba. Cuando se utiliza un algoritmo de comparación de secuencias, las secuencias de prueba y de referencia se introducen en un ordenador, se designan las coordenadas de la subsecuencia, si es necesario, y se designan los parámetros del programa del algoritmo de la secuencia. El algoritmo de comparación de secuencias calcula después el porcentaje de identidad de secuencia de la secuencia o secuencias de prueba en relación con la secuencia de referencia, en función de los parámetros del programa designados. El porcentaje de identidad se determina utilizando BLAST y PSI-BLAST (Altschul et al., 1990, J Mol Biol 215: 3, 403-410; Altschul et al., 1997, Nucleic Acids Res 25:17, 3389-402). Para la búsqueda de PSI-BLAST, se emplearon los siguientes parámetros ilustrativos: (1) un umbral esperado de 10; (2) un coste por hueco de Existencia: 11 y Extensión: 1; (3) la matriz empleada fue BLOSUM62; (4) el filtro para regiones de baja complejidad estaba "activado".
Los cambios pueden introducirse por mutación en la secuencia de ácido nucleico o secuencia de aminoácidos de cualquiera de los genes o productos genéticos descritos en el presente documento, lo que lleva a cambios en la secuencia de aminoácidos de la proteína o enzima codificada, sin alterar la capacidad funcional de la proteína o enzima. Por ejemplo, pueden realizarse sustituciones de nucleótidos que conducen a sustituciones de aminoácidos en residuos de aminoácidos "no esenciales" en la secuencia de cualquiera de las secuencias expresamente descritas en el presente documento. Un residuo de aminoácido "no esencial" es un residuo en una posición en la secuencia que se puede alterar de la secuencia de tipo natural del polipéptido sin alterar la actividad biológica, mientras que un residuo de aminoácido "esencial" es un residuo en una posición que se requiere para la actividad biológica. Por ejemplo, no es probable que los residuos de aminoácidos que se conservan entre los miembros de una familia de proteínas sean susceptibles de mutación. Sin embargo, otros residuos de aminoácidos (por ejemplo, aquellos que están mal conservados entre los miembros de la familia de proteínas) pueden no ser tan esenciales para la actividad y, por lo tanto, es más probable que sean susceptibles de alteración. Por lo tanto, se describen moléculas de ácido nucleico que codifican las proteínas o enzimas descritas en el presente documento que contienen cambios en los residuos de aminoácidos con respecto a las secuencias de aminoácidos descritas en el presente documento que no son esenciales para la actividad.
Puede crearse una molécula de ácido nucleico aislada que codifique una proteína homóloga a cualquiera de los genes descritos en el presente documento, introduciendo una o más sustituciones, adiciones o deleciones de nucleótidos en la secuencia de nucleótidos correspondiente, de manera que, en la proteína codificada, se introducen una o más sustituciones, adiciones o deleciones de aminoácidos.
En una secuencia de ácido nucleico, pueden introducirse mutaciones de modo que la secuencia de aminoácidos codificada se altere mediante técnicas estándar, tales como mutagénesis dirigida y mutagénesis mediada por PCR. Las sustituciones conservativas de aminoácidos se realizan en uno o más residuos de aminoácidos no esenciales predichos. Una "sustitución conservativa de aminoácido" es aquella en la que el residuo de aminoácido se reemplaza por un residuo de aminoácido que tiene una cadena lateral similar. En la técnica se han definido familias de residuos de aminoácidos que tienen cadenas laterales similares. Ciertos aminoácidos tienen cadenas laterales con más de una característica clasificable. Estas familias incluyen aminoácidos con cadenas laterales básicas (por ejemplo, lisina, arginina, histidina), cadenas laterales ácidas (por ejemplo, ácido aspártico, ácido glutámico), cadenas laterales polares sin carga (por ejemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, triptófano, cisteína), cadenas laterales no polares (por ejemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, tirosina, triptófano), cadenas laterales beta-ramificadas (por ejemplo, treonina, valina, isoleucina) y cadenas laterales aromáticas (por ejemplo, tirosina, fenilalanina, triptófano, histidina). Por lo tanto, un residuo de aminoácido no esencial predicho en un polipéptido dado se reemplaza por otro residuo de aminoácido de la misma familia de cadenas laterales. Alternativamente, en otra realización, pueden introducirse mutaciones aleatoriamente a lo largo de toda o parte de una secuencia codificante dada, tal como mediante mutagénesis de saturación, y los mutantes resultantes pueden seleccionarse para determinar la actividad biológica del polipéptido dado para identificar mutantes que conservan la actividad. A la inversa, la invención también proporciona variantes con mutaciones que mejoran o aumentan la actividad biológica endógena. Después de la mutagénesis de la secuencia de ácido nucleico, la proteína codificada puede expresarse mediante cualquier tecnología recombinante conocida en la técnica y puede determinarse la actividad de la proteína. El experto en la materia puede medir fácilmente un aumento, una disminución o eliminación de una actividad biológica determinada de las variantes como se describe, es decir, midiendo la capacidad para mediar en la modificación, síntesis o degradación de los oligosacáridos (a través de la detección de los productos).
También se desvelan fragmentos funcionales de los genes o productos génicos como se describen. Un fragmento, en el caso de estas secuencias, y en el de las restantes que se proporcionan en el presente documento, se define como una parte del todo que es menor que el todo. Además, el tamaño de un fragmento varía desde un solo nucleótido o aminoácido dentro de una secuencia de polinucleótidos o polipéptidos hasta unos pocos nucleótidos o aminoácidos que la secuencia completa de polinucleótidos o polipéptidos. Por último, un fragmento se define como cualquier parte de una secuencia completa de polinucleótidos o polipéptidos que es intermedia entre los extremos definidos anteriormente.
Por ejemplo, los fragmentos de cualquiera de las proteínas o enzimas como las descritas o codificadas por cualquiera de los genes como los que se desvelan, pueden tener de 10 a 20 aminoácidos, de 10 a 30 aminoácidos, de 10 a 40 aminoácidos, de 10 a 50 aminoácidos, de 10 a 60 aminoácidos, de 10 a 70 aminoácidos, 10 a 80 aminoácidos, 10 a 90 aminoácidos, 10 a 100 aminoácidos, 50 a 100 aminoácidos, 75 a 125 aminoácidos, 100 a 150 aminoácidos, 150 a 200 aminoácidos, 200 a 250 aminoácidos, 250 a 300 aminoácidos, 300 a 350 aminoácidos, 350 a 400 aminoácidos, 400 a 450 aminoácidos o de 450 a 500 aminoácidos. Los fragmentos incluidos en la presente invención comprenden fragmentos que conservan fragmentos funcionales. Como tales, los fragmentos pueden conservar los dominios catalíticos que se requieren o que son importantes para la actividad funcional. Los fragmentos pueden determinarse o generarse utilizando la información de secuencias del presente documento, y los fragmentos pueden probarse para determinar la actividad funcional utilizando métodos estándar conocidos en la técnica. Por ejemplo, la proteína codificada puede expresarse mediante cualquier tecnología recombinante conocida en la técnica y su actividad puede determinarse. La función biológica de dicho fragmento puede medirse midiendo la capacidad de sintetizar o modificar un sustrato oligosacarídico o, por el contrario, de catabolizar un sustrato oligosacarídico.
Ejemplo 1. Diseño de E. coli para generar cepas hospedadoras para la producción de oligosacáridos de leche humana que contengan N-acetilglucosamina
El protótrofo de E. coli K12, W3110, se eligió como acervo precursor para la biosíntesis de hMOS. Esta cepa se había modificado anteriormente en el locus ampC a través de la introducción de una construcción represora PtrpB-cI+ inducible por triptófano (McCoy, J. y Lavallie, E. Current protocols in molecular biology/edited by Frederick M. Ausubel et al., (2001)), que permite la producción económica de proteínas recombinantes del promotor Pl del fago A (Sanger, F., Coulson, A.R., Hong, G.F., Hill, D.F. y Petersen, G.B. J Mol Biol 162, 729-773 (1982)) mediante la inducción con concentraciones milimolares de triptófano (Mieschendahl, M., Petri, T. & Hanggi, U. Nature Biotechnology 4, 802-808 (1986)). La cepa G1724, un derivado de E. coli W3110 que contiene la construcción represora PtrpB-cI+ inducible por triptófano en ampC, se usó como base para posteriores manipulaciones de la cepa de E. coli.
La biosíntesis de hMOS requiere la generación de una reserva celular de lactosa mejorada. Esta mejora se logró en la cepa G1724 realizando diversas manipulaciones del cromosoma utilizando ingeniería genética mediada por recombinación (recombineering) de los genes red del bacteriófago A (A Red) (Court, D.L., Sawitzke, J.A. y Thomason, L.C. Annu Rev Genet 36, 361-388 (2002)) y transducción generalizada del fago P1 (Thomason, L.C., Costantino, N. & Court, D.L. Mol Biol, Capítulo 1, Unidad 1.17 (2007)). La capacidad de la cepa hospedadora de E. coli para acumular lactosa intracelular se diseñó por primera vez mediante la deleción simultánea del gen endógeno de p-galactosidasa (lacZ) y el gen represor del operón de lactosa (lacI). Durante la construcción de esta deleción, el promotor laclq se colocó inmediatamente en dirección 5' del gen de la lactosa permeasa, lacY. La cepa modificada mantiene así su capacidad para transportar lactosa desde el medio de cultivo (a través de LacY), pero se deleciona para la copia de tipo natural del gen lacZ (p-galactosidasa) responsable del catabolismo de la lactosa. Por lo tanto, cuando la cepa modificada se cultiva en presencia de lactosa exógena, se crea una reserva de lactosa intracelular. Una modificación adicional útil para aumentar la reserva de lactosa libre en el citoplasma (y, por lo tanto, para aumentar el rendimiento final de hMOS), es la incorporación de una mutación lacA. LacA es una lactosa acetiltransferasa que solo es activa cuando se acumulan altos niveles de lactosa en el citoplasma de E. coli. La alta osmolaridad intracelular (p. ej., causada por una alta reserva de lactosa intracelular) puede inhibir el crecimiento bacteriano, y la E. coli ha desarrollado un mecanismo para protegerse de la alta osmolaridad intracelular causada por la lactosa "marcando" el exceso de lactosa intracelular con un grupo acetilo utilizando LacA, y después expulsando activamente la acetil-lactosa de la célula (Danchin, A. Bioessays 31, 769-773 (2009)). Por lo tanto, la producción de acetil-lactosa en E. coli diseñada para producir oligosacáridos de la leche humana no es conveniente ya que reduce el rendimiento general. Además, la acetil-lactosa es un producto secundario que complica los esquemas de purificación de los oligosacáridos. La incorporación de una mutación lacA resuelve estos problemas, ya que llevar una deleción del gen lacA hace que la bacteria no sea capaz de sintetizar acetil-lactosa.
Se introdujo una mutación thyA (timidilato sintetasa) delecionando casi por completo el gen thyA y reemplazándolo por un gen de E. coli lacZ+ funcional insertado, de tipo natural, pero sin promotor, que llevaba el sitio de unión al ribosoma 2.8 (SEQ ID NO: 10) (AthyA::(2.8RBS lacZ+, kanr)). Para realizar la construcción, se utilizó ingeniería genética mediada por recombinación A Red. La Fig. 4 ilustra la nueva configuración de genes diseñados de este modo en el locus thyA. Se describe la secuencia completa de ADN de la región, con anotaciones en formato GenBank. La secuencia de ADN genómico que rodea la inserción lacZ+ en la región thyA se expone en la SEQ ID NO: 1.
El defecto thyA puede complementarse en trans suministrando un gen thyA de tipo natural en un plásmido de copias múltiples (Belfort, M., Maley, G. F. & Maley, F. Proceedings of the National Academy of Sciences, 80, 1858 (1983)). Esta complementación se utiliza en el presente documento como un medio de mantenimiento del plásmido (eliminando la necesidad de un esquema de selección de antibióticos más convencional para mantener el número de copias del plásmido).
Más adelante se muestra el genotipo de la cepa E680. La cepa E680 incorpora todos los cambios descritos anteriormente y es una cepa hospedadora adecuada para la producción de oligosacáridos que contienen N-acetilglucosamina.
F'402 proA+B+, Placlq-lacY, A(lacI-lacZ)158, AlacA398 / araC, Agpt-mhpC, AthyA::(2.8RBS lacZ+, KAN), rpoS+, rph+, ampC::(Ptrp T7g10 RBS-AcI+, CAT)
La cepa E796 es una cepa similar a la E680 y lleva una mutación thyA (timidilato sintetasa), introducida delecionando casi por completo el gen thyA y reemplazándolo por un gen de E. coli lacZ+ funcional insertado, de tipo natural, pero sin promotor, que lleva el sitio de unión al ribosoma 0.8 (SEQ ID NO: 11) (AthyA::(0.8RBS lacZ+, KAN). Más adelante se muestra el genotipo de la cepa E796. La cepa E796 incorpora todos los cambios descritos anteriormente y es una cepa hospedadora adecuada para la producción de oligosacáridos que contienen N-acetilglucosamina.
F'402 proA+B+, Placlq-lacY, A(lacI-lacZ)158, AlacA398 / araC, Agpt-mhpC, AthyA::(2.8RBS lacZ+, KAN), rpoS+, rph+, ampC::(Ptrp T7g10 RBS-AcI+, CAT)
La cepa E866 es una cepa similar a la E796 y es útil para la selección de plásmidos dobles. La cepa E866 también lleva una mutación thyA (timidilato sintetasa), introducida delecionando casi por completo el gen thyA y reemplazándolo por un gen de E. coli lacZ+ funcional insertado, de tipo natural, pero sin promotor, que lleva el sitio de unión al ribosoma 0.8 (SEQ ID NO: 11) (AthyA::(0.8RBS lacZ+, KAN).Además de la deleción de thyA, E866 también lleva una deleción del gen purA. Más adelante se muestra el genotipo de la cepa E866. La cepa E866 incorpora todos los cambios descritos anteriormente y es una cepa hospedadora adecuada para la producción de oligosacáridos que contienen N-acetilglucosamina.
F'402 proA+B+, Placlq-lacY, A(lacI-lacZ)158, AlacA398 / araC, Agpt-mhpC, AthyA::(0.8RBS lacZ+), rpoS+, rph+, ampC::(Ptrp T7g10 RBS-AcI+, CAT), ApurA727::KAN
Ejemplo 2. Producción de oligosacáridos de leche humana que contienen N-acetilglucosamina en E. coli: Lacto-N-tetraosa (LNT) y Lacto-N-neotetraosa (LNnT)
La primera etapa en la síntesis (a partir de un precursor de lactosa) tanto de Lacto-N-tetraosa (LNT) como de LactoN-neotetraosa (LNnT), es la adición de un residuo de p(1,3)N-acetilglucosamina a la lactosa, utilizando una p(1,3)-N-acetilglucosaminiltransferasa heteróloga para formar Lacto-N-triosa 2 (LNT2). El plásmido pG292 (ColEI, thyA+, bla+, PL-lgtA) (SEQ ID NO: 2, FIG. 5) lleva el gen IgtA p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis y puede dirigir la producción de LNT2 en la cepa de E. coli E680 en condiciones de cultivo apropiadas. pG221 (ColEI, thyA+, bla+, PL-lgtA-wbgO) (SEQ ID NO: 3, FIG. 6) es un derivado de pG292 que lleva (dispuesto como un operón) tanto el gen lgtA p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis como el gen wbgO p(1,3)-galactosiltransferasa de E. coli O55:H7. pG221 dirige la producción de LNT en la cepa de E. coli E680 en condiciones de cultivo apropiadas. pG222 (ColEI, thyA+, bla+, PL-IgtA-4GalT) (SEQ ID NO: 4, FIG. 7) es un derivado de pG292 que lleva (dispuesto como un operón) tanto el gen lgtA p(1,3)-N-acetilglucosaminiltransferasa de N. meningitidis como el gen 4GalT (jhp0765) p(1,4)-galactosiltransferasa de H. pylori. pG222 dirige la producción de LNnT en la cepa de E. coli E680 en condiciones de cultivo apropiadas.
La adición de triptófano al medio de crecimiento que contiene lactosa de cultivos de una cualquiera de las cepas derivadas de E680 transformadas con los plásmidos pG292, pG221 o pG222 conduce, para cada combinación particular de E680/plásmido, a la activación del triptófano del hospedador de E. coli, a la utilización del represor TrpR, a la subsiguiente represión de PtrpB y a la consiguiente disminución de los niveles citoplásmicos de cI, lo que produce una des-represión de Pl, una expresión de lgtA, lgtA+wbgO o IgtA+4GalT, respectivamente, y la producción de LNT2, LNT o LNnT, respectivamente.
Para la producción de LNT2, LNT o LNnT en cultivos de laboratorio a pequeña escala (<100 ml), las cepas se cultivaron a 30 °C en un medio selectivo que carecía tanto de timidina como de triptófano hasta la fase exponencial temprana (p. ej., sales M9, glucosa al 0,5 %, casaminoácidos al 0,4 %). Después se añadió lactosa a una concentración final de 0,5 o 1 %, junto con triptófano (200 pM final) para inducir la expresión de las respectivas glucosiltransferasas, impulsadas por el promotor Pl. Al final del período de inducción (~ 24 h), se realizó un análisis de TLC en partes alícuotas del medio de cultivo acelular. La Fig. 8 ilustra esquemáticamente las reacciones enzimáticas necesarias para producir, a partir de la lactosa, a través del trisacárido intermedio lacto-N-triosa 2 (LNT2), los dos oligosacáridos de la leche humana; Lacto-N-tetraosa (LNT) y Lacto-N-neotetraosa (LNnT). Se presenta un cromatograma de capa fina (a la izquierda) de muestras de medio de cultivo tomadas de cultivos de E. coli a pequeña escala y que demuestran la síntesis de LNT2, LNT y LNnT (utilizando cultivos de E680 inducidos que contienen lactosa transformados con pG292, pG221 o pG222, respectivamente). Se presenta un segundo cromatograma de capa fina (a la derecha) de muestras de medio de cultivo tomadas de un cultivo en biorreactor de 15 l de E. coli E680/pG222 y que demuestra la síntesis de LNnT (así como el hMOS, la Lacto-N-neohexaosa y LNnH de mayor peso molecular).
Aunque los resultados anteriores demuestran claramente cómo es posible sintetizar oligosacáridos que contienen GlcNAc (es decir, LNT2, LNT y LNnT) en E. coli modificada, la FIG. 14 ilustra un problema serio al tratar de utilizar la reserva de UDP-GlcNAc de E. coli durante dicha síntesis. En la Fig. 14 se cultivaron cuatro cultivos distintos de E680, transformados con pG292, en presencia y en ausencia de lactosa, y con la expresión de LgtA tanto inducida como no inducida mediante la adición de triptófano. Se puede ver claramente que se produce una lisis celular masiva en los cultivos donde está presente la lactosa, es decir, en aquellos cultivos en los que LgtA reduce la reserva celular de UDP-GlcNAc añadiendo GlcNAc a la lactosa (y fabricando LNT2). Al hacerlo, la UDP-GlcNAc se desvía de la biosíntesis de la pared celular hacia la biosíntesis de hMOS y se produce la lisis celular. Esta lisis puede controlarse fácilmente no solo por la caída precipitada en la densidad del cultivo como se aprecia en la figura, sino también por la aparición de ADN en el medio de cultivo.
Ejemplo 3. El aumento de la reserva de UDP-GlcNAc celular impide la lisis celular durante la biosíntesis de LNnT en E. coli diseñada
Para examinar el impacto de la mejora de la reserva celular de UDP-GlcNAc en E. coli durante la síntesis de hMOS que contiene N-acetilglucosamina, se construyó el plásmido pG356 que llevaba el replicón p15A (Figura 19 y SEQ ID NO: 12). El plásmido pG356 lleva un replicón p15A (compatible con los replicones ColE1), marcadores de selección purA y ampC, y un operón sintético (bajo el control del promotor pL) que lleva los genes glmS (que codifica L-glutamina:D-fructosa-6-fosfato aminotransferasa) y nagC (que codifica el activador/represor transcripcional bifuncional de los operones glm y nag) de E. coli. Cuando el promotor pL está activo en las cepas que llevan el plásmido pG356, aumenta la reserva de UDP-GlcNAc. La cepa E796 (véase el ejemplo 1) se transformó con pG222 (figura 7), y la cepa E866 (véase el ejemplo 1) se transformó con pG222 (FIG. 7) y pG356 (figura. 19). (Las cepas E796 y E866 son isogénicas excepto por la mutación purA encontrada en E866 que se utiliza para la retención del plásmido pG356). Se realizaron procesos de fermentación idénticos de 1,5 l en cada una de las cepas transformadas. Se siguió la densidad óptica de los cultivos y la biosíntesis de LNnT, junto con los parámetros de fermentación estándar. Como puede observarse en la fig. 18, el cultivo E796/pG222 produjo LNnT, pero se produjo lisis cuando la densidad celular DO600 alcanzó un valor de 75 y al final de la fermentación se obtuvo una densidad celular final que alcanzó un valor DO600 de solo 50. En cambio (figura 19) con el cultivo E866/pG222+pG356 (donde la expresión de los genes glmS y bagC mejora la reserva intracelular de UDP-GlcNAc), también se produjo LNnT, pero sin apreciarse lisis celular. En este cultivo, la densidad celular al final de la fermentación alcanzó una DO600 de 108, más del doble de la densidad alcanzada con E796/pG222.
Ejemplo 4. Producción de 6'-sialillactosa (6r-SL) mediante E. coli diseñada (AnanRATEK)
Para la producción de 6'-sialillactosa, se diseñó Escherichia coli GI724 (ATCC55151) con un conjunto de mutaciones que causaban la acumulación citoplásmica del precursor de lactosa no acetilado y que impedían la degradación del ácido N-acetil-5-neuramínico (Figura 3). En particular, se delecionaron los genes lacZ (p-galactosidasa) y lacA (lactosa acetil transferasa) del operón lac, dejando al represor Laclq y a la permeasa LacY completamente funcionales. La permeasa LacY puede activarse con promotores débiles (por ejemplo, lac8) o fuertes (por ejemplo, Ptac). En este ejemplo, todo el operón nan (nanRATEK; genes estructurales y reguladores implicados en la degradación del ácido neuramínico) se delecionó. Las manipulaciones del genoma de E. coli se lograron utilizando una combinación de técnicas genéticas moleculares estándar, específicamente ingeniería genética mediada por recombinación A Red, intercambios de alelos con vectores suicidas de selección positiva y transducciones P1 (Figura 3). A continuación se muestra el genotipo hospedador de la cepa E781, adecuado para la producción de hMOS sialilados:
ampC::( Ptrp-AcI+), laclq lacPL8, AnanRATEK471, AlacZ690, AlacA 745
Para producir 6'-sialil-lactosa, la reserva celular de UDP-GlcNAc debe convertirse en el precursor activado de azúcar-nucleótido, CMP-NeuAc, que, a su vez, puede funcionar como una molécula donadora para un aceptor de azúcar (es decir, lactosa) en una reacción catalizada por sialiltransferasa (figura 3). Para este propósito, se expresaron de forma constitutiva tres genes de Campylobacter jejuni ATCC43438, que codificaban i) UDP-N-acetilglucosamina 2-epimerasa (NeuC), ii) N-acetilneuraminato sintasa (NeuB) y iii) N-Acetilneuraminato citidliltransferasa (NeuA), en la cepa de E. coli diseñada anteriormente, junto con un gen que codificaba una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224 (SEQ ID NO: 21 registro de proteína del Genbank BAF92026). Los genes neu se expresaron a partir de un vector plasmídico de bajo número de copias (pG317, Figura 9, SEQ ID NO: 5) que llevaba un promotor lac constitutivo (pBBRI ori, cat+, Plac), mientras que el gen de la a(2,6)sialiltransferasa se expresó a partir de un vector plasmídico de alto número de copias (pG315, Figura 10, SEQ ID NO: 6) que llevaba un promotor lac constitutivo (ColE1 ori, bla+, Plac). Para impedir la síntesis de productos secundarios, la expresión relativa del gen de la a(2,6)sialiltransferasa en comparación con los genes neu se modula diseñando diferentes sitios de unión al ribosoma (RBS, ribosomal binding sites) que proporcionan diversos grados de eficiencia traduccional en dirección 5' del gen de la a(2,6)sialiltransferasa. Las cepas diseñadas se cultivaron a alta densidad en fermentadores a escala piloto utilizando una estrategia de cultivo discontinuo a semicontinuo. La figura 11 es un análisis de TLC de sobrenadantes de cultivos de dos fermentaciones de este tipo, siendo las muestras de la izquierda de la figura muestras tomadas de una fermentación de una cepa que contiene pG315 (y, por lo tanto, que lleva el RBS presentado en la SEQ ID NO: 7 frente al gen de a(2,6)sialiltransferasa en el vector). Las muestras de la derecha de la figura son muestras tomadas de una fermentación de una cepa que contiene una variante cercana de pG315 (pG345, FIG. 12, SEQ ID NO: 9, que lleva el RBS más débil presentado en la SEQ ID NO: 8 delante del gen de a(2,6)sialiltransferasa y reemplazando el RBS presentado en la SEQ ID NO: 7). En ambos casos, el precursor de lactosa se añadió a una densidad celular DO600 de 50 y la conversión eficiente a productos finales se logró en las 48 horas posteriores a la adición de lactosa. El rendimiento final de 6'SL se incrementó cuando se utilizó el plásmido con el RBS más débil en dirección 5' del gen de la a(2,6)sialiltransferasa y, además, el nivel del producto secundario KDO-lactosa se redujo significativamente al utilizar este RBS más débil. La identidad de la 6'-SL purificada mediante cromatografía en columna con carbón activo se confirmó mediante espectrometría de masas con IEE (ionización por electropulverización) y resonancia magnética nuclear (RMN).
Ejemplo 5. Producción de 6,-sialillactosa (6r-SL) mediante E. coli diseñada. (AnanA, AnanATE)
Para la producción de 6 'sialil-lactosa, se diseñó Escherichia coli GI724 (ATCC55151) con un conjunto de mutaciones que causaban la acumulación citoplásmica del precursor de lactosa no acetilada y que impedían la degradación del ácido N-acetil-5-neuramínico (Figura 13). En particular, se delecionaron los genes lacZ (pgalactosidasa) y lacA (lactosa acetil transferasa) del operón lac, dejando el represor Laclq y la permeasa LacY completamente funcionales. La permeasa LacY puede activarse con promotores débiles (por ejemplo, lac8) o fuertes (por ejemplo, Ptac). Aunque todo el operón nan (nanRATEK; genes estructurales y reguladores implicados en la degradación del ácido neuramínico) se puede delecionar para suprimir el catabolismo del ácido neuramínico como en el Ejemplo 4, también son adecuadas deleciones minoritarias que abarcan solo los genes nanA o nanA, nanT y nanE o nanA y nanE. En todos los casos en los que se mutó el gen nanE, los últimos 104 pb del gen nanE se dejaron intactos para permitir la transcripción/traducción no alterada de nanK en dirección 3', aunque son posibles otras longitudes de la secuencia nanE residual. Las manipulaciones del genoma de E. coli se lograron utilizando una combinación de técnicas genéticas moleculares estándar, específicamente ingeniería genética mediada por recombinación A Red, intercambios de alelos con vectores suicidas de selección positiva y transducciones P1 (Figura 13). A continuación se muestran los genotipos hospedadores de las cepas E971, E1017 y E1018, adecuados para la producción de hMOS sialilados con diversos rendimientos y purezas:
ampC::(Ptrp-Ad+), laclq lacPL8, AnanA::kanR, AlacZ690, AlacA::scar,
ampC::(Ptrp-Ad+), laclqlacPL8, AnanATE::kanR::nanK+, AlacZ690, AlacA::scary
ampC::(Ptrp-Ad+), laclqlacPL8, AnanATE::cicat::nanK+, lacz690 AlacA::scar, respectivamente.
Para producir 6'-sialil-lactosa, la reserva celular de UDP-GIcNAc se debe convertir en el precursor activado de azúcar-nucleótido, CMP-NeuAc, que, a su vez, puede funcionar como una molécula donadora para un aceptor de azúcar (es decir, lactosa) en una reacción catalizada por sialiltransferasa (figura 13). Para este propósito, se expresaron de forma constitutiva tres genes de Campylobacter jejuni ATCC43438, que codificaban i) UDP-N-acetilglucosamina 2-epimerasa (NeuC), ii) N-acetilneuraminato sintasa (NeuB) y iii) N-Acetilneuraminato citidililtransferasa (NeuA), en la cepa de E. coli diseñada anteriormente, junto con un gen que codificaba una a(2,6) sialiltransferasa de Photobacterium spp JT-ISH-224. Los genes neu se expresaron a partir de un vector plasmídico de bajo número de copias (pG317, Figura 9, SEQ ID NO: 5) que llevaba un promotor lac constitutivo (pBBRI ori, cat+, Plac), mientras que el gen de la a(2,6) sialiltransferasa se expresó desde el RBS débil de la SEQ iD NO: 8 en un vector plasmídico de alto número de copias (pG345, figura 12, SEQ ID NO: 9) que lleva un promotor lac constitutivo (ColEI ori, bla+, Plac). Las cepas diseñadas se cultivaron a alta densidad en fermentadores a escala piloto utilizando una estrategia discontinua a semicontinua. La figura 14 es un análisis de TLC de sedimentos o sobrenadantes de cultivo de tres de estas fermentaciones. El panel A muestra la producción y acumulación de 6'SL en las células de tres acervos genéticos (solo se muestran las mutaciones nan relevantes de las cepas E971, E1017 y E1018), el panel B y C muestran la producción y acumulación de 6'SL en el medio extracelular (sobrenadantes) en las cepas E971, E1017 y E1018 (solo se muestran las mutaciones nan relevantes) con rendimientos volumétricos máximos estimados de 15 g por litro de sobrenadante. En todos los casos, el precursor de lactosa se añadió a una densidad celular DO600 de 40 y la conversión en equilibrio a productos finales se logró en aproximadamente 90 horas a partir de la adición de lactosa (EFT, Elapsed Fermentation Time, es el tiempo de fermentación transcurrido).
A continuación, se enumeran las diversas secuencias mostradas en el presente documento.
SEQ ID NO: 1
>E680_thyA::2.8RBS_lacZ cepa de Escherichia coli
GCAGCGGAACTCACAAGGCACCATAACGTCCCCTCCCTGATAACGCTGATACrGTGGTCG CGGTTATGCCAGTTGGCATCTTCACGTAAATAGAGCAAATAGTCCCGCGCCTGGCTGGCG GTTTGCCATAGCCGrTGCGACTGCTGCCAGTATTGCCAGCCATAGAGTCCACTTGCGCTT AGCATGACCAAAATCAGCATCGCGACCAGCGTTTCAATCAGCGTATAACCACGTTGTGTT TTCATGCCGGCAGTATGGAGCGAGGAGAAAAAAAGACGAGGGCCAGTTTCTATTTCTTCG GCGCATCrTCCGGACTATTTACGCCGTTGCAGGACGTTGCAAAATTTCGGGAAGGCGTCT CGAAGAAXXXAACGGAGGGXAAAAAAACCGACGCACACXGGCGXCGGCXCXGGCAGGAXG TTTCGTAATTAGATAGCCACCGGCGCTTTattaaacctactATGACCATGATTACGGATT CACTGGCCGTCGTTrTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATC GCCTTGCAGCACATCCCCCXTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATC GCCCTTCCCAACAGrTGCGCAGCCTGAATGGCGAATGGCGCTTTGCCTGGTTTCCGGCAC CAGAAGCGGXGCCGGAAAGCXGGCXGGAGIGCGAXCXXCCXGAGGCCGAXACIGXCGXCG TCCCCTCAAACTGGCAGATGCACGGTTACGATGCGCCCATCTACACCAACGTGACCTATC CCATTACGGTCAATCCGCCGTTTGTTCCCACGGAGAATCCGACGGGTTGTTACTCGCTCA CAXTXAAIGXXGAXGAAAGCTGGCIACAGGAAGGCCAGACGCGAAXTATXXXXGAIGGCG TTAACTCGGCGTTTCATCTGTGGTGCAACGGGCGCTGGGTCGGTTACGGCCAGGACAGTC GTTTGCCGTCTGAAITTGACCTGAGCGCATTTTTACGCGCCGGAGAAAACCGCCTCGCGG
rGATGGTGCTGCGCXGGAGTGACGGCAGTTATCXGGAAGATCAGGATATGTGGCGGATGA GCGGCAXXXXCCGXGACGXCXCGTXGCXGCAXAAACCGACXACACAAATCAGCGAXXXCC AXGTTGCCACXCGCXXTAAXGATGAXXXCAGCCGCGCXGXACTGGAGGCXGAAGTXCAGA XGTGCGGCGAGXXGCGTGACXACCXACGGGTAACAGTTXCXTTAXGGCAGGGTGAAACGC AGGICGCCAGCGGCACCGCGCCITICGGCGGIGAAAIIAICGAIGAGCGIGGIGGIIAIG CCGATCGCGXCACACXACGXCXGAACGXCGAAAACCCGAAACTGXGGAGCGCCGAAAXCC CGAATCXCXAXCGXGCGGXGGXTGAACXGCACACCGCCGACGGCACGCTGAXXGAAGCAG AAGCCTGCGATGTCGGTTTCCGCGAGGTGCGGAITGAAAATGGTCTGCTGCTGCTGAACG GCAAGCCGXXGCXGAXTCGAGGCGXTAACCGXCACGAGCAXCAXCCTCTGCAXGGTCAGG XCATGGAXGAGCAGACGAXGGXGCAGGAXAXCCXGCXGAXGAAGCAGAACAACTTXAACG CCGTGCGCTGTTCGCATTAICCGAACCATCCGCIGTGGIACACGCIGTGCGACCGCTACG GCCTGXAXGXGGXGGATGAAGCCAATAXXGAAACCCACGGCATGGXGCCAAXGAAXCGXC XGACCGAXGAXCCGCGCXGGCXACCGGCGAXGAGCGAACGCGTAACGCGAAXGGTGCAGC GCGATCGXAATCACCCGAGXGTGAXCATCTGGTCGCTGGGGAATGAATCAGGCCACGGCG CTAATCACGACGCGCXGXAXCGCTGGAXCAAAXCXGTCGAXCCIXCCCGCCCGGXGCAGX AXGAAGGCGGCGGAGCCGACACCACGGCCACCGAXAXXAXXTGCCCGATGXACGCGCGCG XGGATGAAGACCAGCCCTXCCCGGCTGTGCCGAAATGGXCCATCAAAAAATGGCTTXCGC XACCTGGAGAGACGCGCCCGCXGAXCCXTTGCGAATACGCCCACGCGATGGGXAACAGXC XXGGCGGXTTCGCXAAAXACXGGCAGGCGTXXCGTCAGXAXCCCCGTXTACAGGGCGGCX XCGTCXGGGACXGGGXGGAXCAGTCGCXGATXAAATATGAXGAAAACGGCAACCCGXGGX CGGCTIACGGCGGTGATTTXGGCGATACGCCGAACGATCGCCAGTXCTGTATGAACGGTC XGGTCXXXGCCGACCGCACGCCGCAXCCAGCGCXGACGGAAGCAAAACACCAGCAGCAGX XXXTCCAGXXCCGXXXAXCCGGGCAAACCAXCGAAGXGACCAGCGAAXACCXGTTCCGXC ATAGCGAXAACGAGCTCCTGCACTGGATGGTGGCGCIGGAXGGXAAGCCGCTGGCAAGCG GXGAAGXGCCXCXGGATGXCGCTCCACAAGGXAAACAGXXGATXGAACTGCCXGAACXAC CGCAGCCGGAGAGCGCCGGGCAACXCTGGCXCACAGXACGCGTAGXGCAACCGAACGCGA CCGCAXGGXCAGAAGCCGGGCACAXCAGCGCCXGGCAGCAGTGGCGXCTGGCGGAAAACC TCAGTGTGACGCICCCCGCCGCGTCCCACGCCAICCCGCAICTGACCACCAGCGAAATGG ATTTTTGCATCGAGCTGGGT^ TAAGCGTTGGCAArTTAACCGCCAGTCAGGCTTTCTTT CACAGAXGTGGAXXGGCGAXAAAAAACAACXGtXGACGCCGCTGCGCGAXCAGTTCACCC GTGCACCGCTGGATAACGACATTGGCGTAAGTGAAGCGACCCGCATTGACCCXAACGCCT GGGTCGAACGCXGGAAGGCGGCGGGCCAXTACCAGGCCGAAGCAGCGXTGXXGCAGXGCA CGGCAGAXACACXXGCTGAXGCGGXGCXGAXXACGACCGCXCACGCGXGGCAGCAXCAGG GGAAAACCTTATXTATCAGCCGGAAAACCTACCGGATTGAXGGTAGTGGTCAAATGGCGA XXACCGXIGAXGXTGAAGXGGCGAGCGAIACACCGCAXCCGGCGCGGATXGGCCXGAACX GCCAGCXGGCGCAGGXAGCAGAGCGGGTAAACXGGCXCGGATTAGGGCCGCAAGAAAACX AXCCCGACCGCCXXACrGCCGCCTGXIXXGACCGCTGGGAXCTGCCAXTGXCAGACAXGX ATACCCCGXACGXCXTCCCGAGCGAAAACGGXCIGCGCXGCGGGACGCGCGAATXGAATX AIGGCCCACACCAGXGGCGCGGCGACITCCAGXICAACAXCAGCCGCXACAGICAACAGC AACXGAXGGAAACCAGCCAXCGCCAXCXGCXGCACGCGGAAGAAGGCACAXGGCXGAAXA TCGACGGXTTCCATATGGGGATTGGTGGCGACGACXCCTGGAGCCCGTCAGTATCGGCGG AAXXCCAGCXGAGCGCCGGXCGCXACCAXXACCAGXXGGXCXGGXGXCAAAAATAAGCGG CCGCtXTAXGXAGGCXGGAGCXGCXXCGAAGXXCCXAXACXTXCXAGAGAAXAGGAACXX CGGAAXAGGAACXTCAAGAXCCCCXXATXAGAAGAACXCGXCAAGAAGGCGATAGAAGGC GAXGCGCXGCGAAXCGGGAGCGGCGAXACCGXAAAGCACGAGGAAGCGGXCAGCCCAXXC GCCGCCAAGCTCTTCAGCAATATCACGGGTAGCCAACGCTATGTCCTGATAGCGGTCCGC CACACCCAGCCGGCCACAGTCGATGAATCCtGAAAAGCGGCCATTTTCCACCATGATATT CGGCAAGCAGGCAT CGCCAT GGGT CACGAC GAGAT CCTCGCCG TCGGGCAT GCGCG CCTT GAGCCTGGCGAACAGTTCGGCTGGCGCGAGCCCCTGATGCTCTTCGTCCAGATCATCCTG ATCGACAAGACCGGCTTCCATCCGAGTACGTGCTCGCTCGATGCGATGTTTCGCTTGGTG GTCGAATGGGCAGGTAGCCGGATCAAGCGTATGCAGCCGCCGCATTGCATCAGCCATGAT GGATACTTICTCGGCAGGAGCAAGGTGAGATGACAGGAGATCCTGCCCCGGCACTTCGCC CAATAGCAGCCAGTCCCTTCCCGCTTCAGTGACAACGTCGAGCACAGCTGCGCAAGGAAC GCCCGTCGTGGCCAGCCACGATAGCCGCGCTGCCTCGTCCTGCAGTTCATTCAGGGCACC GGACAGGTCGGTCTTGACAAAAAGAACCGGGCGCCCCTGCGCTGACAGCCGGAACACGGC GGCATCAGAGCAGCCGATTGTCTGTTGTGCCCAGTCATAGCCGAATAGCCTCTCCACCCA AGCGGCCGGAGAACCTGCGTGCAATCCATCTTGTTCAATCATGCGAAACGATCCTCATCC TGTCTCTTGATCAGATCTTGATCCCCTGCGCCATCAGATCCTTGGCGGCAAGAAAGCCAT CCAGTTTACTTTGCAGGGCTTCCCAACCTTACCAGAGGGCGCCCCAGCTGGCAATTCCGG TTCGCTTGCTGTCCATAAAACCGCCCAGTCTAGCTATCGCCATGTAAGCCCACTGCAAGC TACCTGCTTTCTCTTTGCGCTTGCGTTTTCCCTTGTCCAGATAGCCCAGTAGCTGACATT CATCCGGGGTCAGCACCGTTTCTGCGGACTGGCTTTCTACGTGTTCCGCTTCCTTTAGCA GCCCTTGCGCCCTGAGTGCTTGCGGCAGCGTGAGCTTCAAAAGCGCTCTGAAGTTCCTAT ACTTTCTAGAGAATAGGAACTTCGAACTGCAGGTCGACGGATCCCCGGAATCATGGTTCC TCAGGAAACGTGTTGCTGTGGGCTGCGACGATATGCCCAGACCATCATGATCACACCCGC GACAATCAICGGGATGGAAAGAATTTGCCCCATGCTGATGTACTGCACCCAGGCACCGGT AAACTGCGCGTCGGGCTGGCGGAAAAACTCAACAATGATGCGAAACGCGCCGTAACCAAT CAGGAACAAACCTGAGACAGCTCCCATTGGGCGTGGTTTACGAATATACAGGTTGAGGAT AATAAACAGCACCACACCTTCCAGCAGCAGCTCGTAAAGCTGTGATGGGTGGCGCGGCAG CACACCGTAAGTGTCGAAAATGGATTGCCACTGCGGGTTGGTTTGCAGCAGCAAAATATC TTCTGTACGGGAGCCAGGGAACAGCATGGCAAACGGGAAGTTCGGGTCAACGCGGCCCCA CAAT TCACCG TTAATAAAG TTGCCCAGACGC CCGGCAC CAAGAC CAAAC GGAAT GAGTGG TGCGATAAAATCAGAGACCTGGAAGAAGGAACGTTTAGTACGGCGGGCGAAGATAATCAT CACCACGATAACGCCAATCAGGCCGCCGTGGAAAGACATGCCGCCGTCCCAGACACGGAA CAGATACAGCGGATCGGCCATAAACTGCGGGAAATTGTAGAACAGAACATAACCAATACG TCCCCCGAGGAAGACGCCGAGGAAGCCCGCATAGAGTAAGTTTTCAACTTCATTTTTGGT CCAGCCGCTGCCCGGACGATTCGCCCGTCGTGTTGCCAGCCACATTGCAAAAATGAAACC CACCAGATACATCAGGCCGTACCAGTGAAGCGCCACGGGTCCTATTGAGAAAATGACCGG ATCAAACTCCGGAAAATGCAGATAGCTACTGGTCATCTGTCACCACAAGTTCTTGTTATT TCGCTGAAAGAGAACAGCGATTGAAATGCGCGCCGCAGGTTTCAGGCGCTCCAAAGGTGC GAATAATAGCACAAGGGGACCTGGCTGGTTGCCGGATACCGTTAAAAGATATGTATA
SEQ ID NO: 2
>pG292, secuencia completa.
TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGrCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCG GGGC TGGC TTAACTATGCGGCATCAGAGCAGAT TG TAC TGAGAG TGC ACCATATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAggcg CCTCCTCAACCTGTATATTCGTAAACCACGCCCAATGGGAGCTGTCTCAGGTTTGTTCCT GATTGGTTACGGCGCGTTTCGCATCATTGTTGAGTTTTTCCGCCAGCCCGACGCGCAGTT TACCGGTGCCTGGGTGCAGTACATCAGCATGGGGCAAATTCTTTCCATCCCGATGATTGT CGCGGGTGTGATCATGATGGTCTGGGCATATCGTCGCAGCCCACAGCAACACGTTTCCTG AGGAACCATGAAACAGTATTTAGAACTGATGCAAAAAGTGCTCGACGAAGGCACACAGAA AAACGACCGTACCGGAACCGGAACGCTTTCCATTTTTGGTCATCAGATGCGTTTTAACCT GCAAGATGGATTCCCGCTGGTGACAACTAAACGTTGCCACCTGCGTTCCATCATCCATGA ACTGCTGTGGTTrCTGCAGGGCGACACTAACATTGCTTATCTACACGAAAACAATGTCAC CATCTGGGACGAATGGGCCGATGAAAACGGCGACCTCGGGCCAGTGTATGGTAAACAGTG GCGCGCCTGGCCAACGCCAGATGGTCGTCATATTGACCAGATCACTACGGTACTGAACCA GCTGAAAAACGACCCGGATTCGCGCCGCATTATTGTTTCAGCGTGGAACGTAGGCGAACT GGATAAAATGGCGCTGGCACCGTGCCATGCATTCTTCCAGTTCTATGTGGCAGACGGCAA ACTCTCTrGCCAGCTTTATCAGCGCTCCTGTGACGTCTTCCTCGGCCTGCCGTTCAACAT TGCCAGCrACGCGTTATTGGTGCATATGATGGCGCAGCAGTGCGATCTGGAAGTGGGTGA TTTTGTCrGGACCGGTGGCGACACGCATCTGTACAGCAACCATATGGATCAAACTCATCT GCAATTAAGCCGCGAACCGCGTCCGCTGCCGAAGTTGATTATCAAACGTAAACCCGAATC CATCTTCGACTACCGTTTCGAAGACTTTGAGATTGAAGGCTACGATCCGCATCCGGGCAT TAAAGCGCCGGTGGCTATCTAATTACGAAACATCCTGCCAGAGCCGACGCCAGTGTGCGT CGGXXXXITXACCCTCCGXXAAATXCXTCGAGACGCCXXCCCGAAggcgccAXTCGCCAI TCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGC TGGCGAAAGGGGGATGTGCXGCAAGGCGAXXAAGXXGGGXAACGCCAGGGXX XXCCCAGX CACGACGTTGTAAAACGACGGCCAGTGCCAAGCTTACTGCTCACAAGAAAAAAGGCACGT CATCTGACGTGCCTTTTTTATTTGTACTACCCTGTACGATTACTGCAGGTCGACTCTAGA TGCATGCTCGAGTCAACGGTTTTTCAGCAATCGGTGCAAAATGCCGAAGTATTGCCTCAA GGTAAACAGCCGCCGCATCCTGCCGTCTGCCGCAAAATCCAGCCACGCGCCGGCGGGCAG CGTGTCCGTCCGTTTGAAGCATTGGTACAAAAACCGGCGGGCGCGrTCAAAArCTTCTTC CGGCAAATGTTTCTCCAGCAATTCATACGCTACTGCTTTTATTTGGCGGTATrCAAGGCT GTCGAACCGGGTTTTAAAACCCAIAGACTGCAAAAAATCGTTICTGGCGGTTrTTTGGAT GCCTTGCGCGATTTCGrGTTGGCGGArGCTGTATTXGGATGAAACCTGATTGGCGTGAAG GCGGTATTTGACCAAGGCTTCGGGATAATAAGCCAGCCTGCCCAATTTGCTGACATCGTA CCAAAATTGGTAATCTTCCGCCCAATCCCGCTCGGTGTTGTAACGCAAACCGCCGTCAAT GACGCXGCGCCTCATAAXCAXCGXGTXGXTGXGXAXGGGGTTGCCGAAAGGGAAAAAGXC GGCAATGTCTTCGTGTCGGGTCGGTTrTTTCCAAATTTTGCCGTGTTCGTGGrGCCGCGC CAGCCGGTTGCCGTCCTTTTCTTCCGACAAAACTTCCAGCCACGCACCCATCGCGATGAT GCTGCGGTCTTTTTCCATCTCACCCACGATTTTCTCAATCCAGTCGGGGGCGGCAATATC GTCTGCATCGGIGCGCGCAATATATTCCCCCCCCCCCCCCGACTTTGCCAATTCATCCAG CCCGAXGXXXAAAGAGGGAAXCAGACCGGAAXXGCGCGGCXGCGCGAGGAXGCGGAXGCG GCCGTCCTGTTCTTGGAAACGCTGGGCAATGGCAAGCGTACCGTCCGTCGAGCCGTCATC GACAArCAAAATATCCAAGrTGCGCCAAGTTrGATTCACGACGGCGGCTAATGATTGGGC GAAATATTTTTCTACGTTGTAGGCGCAAATCAATACGCrGACTAAAGGCTGCAATTTATT CTCCCGATAGGCACGATGCCGTCTGAAGGCTTCAGACGGCATATGtatatCtCCttCttg aaTTCTAACAATTGATTGAATGTATGCAAATAAATGCATACACCATAGGTGTGGTTTAAT TTGATGCCCTTTTTCAGGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGrTGTTTTT XXGITACICGGGAAGGGCIXXACCXCXXCCGCAXAAACGCXTCCAXCAGCGXXTAXAGXX AAAAAAATCTTTCGGAACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCTGCTTT CCATTGAGCCTGTTTCTCTGCGCGACGTTCGCGGCGGCGTGTTTGTGCATCCATCTGGAT TCTCCTGTCAGTTAGCTTTGGTGGTGrGTGGCAGTTGTAGTCCTGAACGAAAACCCCCCG CGATTGGCACATTGGCAGCTAATCCGGAATCGCACTXACGGCCAArGCTTCGTTTCGTAT CACACACCCCAAAGCCTTCTGCTXTGAATGCTGCCCTTCTTCAGGGCTTAATrTXTAAGA GCGXCACCXXCAXGGXGGXCAGXGCGXCCXGCXGAXGXGCXCAGXAXCACCGCCAGXGGX AXXXAXGICAACACCGCCAGAGAXAAXXXAXCACCGCAGAXGGXXAXCXGXAXGXXXXXX AXAXGAAXXXAXXXXXXGCAGGGGGGCAXXGXXXGGXAGGXGAGAGAXCAAXXCXGCAXX AAXGAAXCGGCCAACGCGCGGGGAGAGGCGGXXXGCGXAXXGGGCGCXCXXCCGCXXCCX CGCXCACXGACXCGCTGCGCXCGGXCGXXCGGCXGCGGCGAGCGGXAXCAGCXCACXCAA AGGCGGXAAXACGGXXAXCCACAGAAXCAGGGGAXAACGCAGGAAAGAACAXGXGAGCAA AAGGCCAGCAAAAGGCCAGGAACCGXAAAAAGGCCGCGXXGCXGGCGXTXTXCCAXAGGC XCCGCCCCCCXGACGAGCAXCACAAAAAXCGACGCXCAAGXCAGAGGXGGCGAAACCCGA CAGGACXAXAAAGAIACCAGGCGXXXCCCCCXGGAAGCXCCCXCGXGCGCXCXCCXGXXC CGACCCXGCCGCXXACCGGAXACCXGXCCGCCXXXCXCCCXXCGGGAAGCGXGGCGCXXX CXCAXAGCTCACGCIGTAGGXAXCXCAGXXCGGXGXAGGTCGTTCGCICCAAGCIGGGCI GXGXGCACGAACCCCCCGXXCAGCCCGACCGCXGCGCCXXAXCCGGXAACXAXCGXCXXG AGXCCAACCCGGXAAGACACGACXIAXCGCCACXGGCAGCAGCCACXGGXAACAGGAXXA GCAGAGCGAGGXAXGXAGGCGGXGCXACAGAGXXCXXGAAGXGGXGGCCXAACXACGGCX ACACTAGAAGGACAGTAXTXGGTAXCXGCGCXCXGCTGAAGCCAGXTACCXTCGGAAAAA GAGXXGGXAGCXCXXGAXCCGGCAAACAAACCACCGCXGGXAGCGGXGGXXXXXXXGXXX GCAAGCAGCAGAXXACGCGCAGAAAAAAAGGAXCXCAAGAAGAXCCXXXGAXCXXXXCXA CGGGGXCXGACGCXCAGXGGAACGAAAACXCACGXXAAGGGAXXXXGGXCAXGAGAXXAX CAAAAAGGAXCT XCACCXAGATCCXT XXAAAXTAAAAAXGAAGXXXTAAAXCAATCXAAA GXAXAXAXGAGXAAACXXGGXCXGACAGXXACCAAXGCXXAAXCAGXGAGGCACCXAXCX CAGCGAXCXGXCXAXXXCGXXCAXCCAXAGXXGCCXGACXCCCCGXCGXGXAGAXAACXA CGAXACGGGAGGGCXXACCAXCXGGCCCCAGXGCXGCAAXGAXACCGCGAGACCCACGCX CACCGGCICCAGAXIXATCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXG GICCXGCAACIXXAICCGCCICCAICCAGXCXAXIAAXXGXXGCCGGGAAGCXAGAGXAA GXAGXXCGCCAGXXAAXAGXXXGCGCAACGXXGXXGCCAXXGCXACAGGCAXCGTGGXGX CACGCXCGTCGXXXGGTAXGGCXXCAXXCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXA CAXGAXCCCCCAXGXTGXGCAAAAAAGCGGXXAGCXCCXXCGGXCCTCCGAXCGTXGXCA GAAGXAAGXXGGCCGCAGXGXXAXCACXCAXGGXXAXGGCAGCACXGCAXAAXXCXCXXA CXGXCAXGCCAXCCGXAAGAXGCXXXXCXGXGACXGGXGAGXACXCAACCAAGXCAXXCX GAGAAXAGXGXAXGCGGCGACCGAGXXGCXC XXGCCCGGCGXCAAXACGGGAXAAXACCG
CGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAAC
TCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACT
GATCT T CAGCAT CTTTTACTTT CAC CAGCGT TTCTGGGT GAGCAAAAACAG GAAGG CAAA
ATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTT
TTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAAT
GTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTG
ACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGC
CCTTTCGTC
SEQ ID NO: 3
>pG221, secuencia completa.
TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGC ACCATATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAggcg CCTCCTCAACCTGTATATTCGTAAACCACGCCCAATGGGAGCTGTCTCAGGTTTGTTCCT GATTGGTTACGGCGCGTTTCGCATCATTGTTGAGTTTTTCCGCCAGCCCGACGCGCAGTT TACCGGTGCCTGGGTGCAGTACATCAGCATGGGGCAAATTCTTTCCATCCCGATGATTGT CGCGGGTGTGATCATGATGGTCTGGGCATATCGTCGCAGCCCACAGCAACACGTTTCCTG AGGAACCATGAAACAGTATTTAGAACTGATGCAAAAAGTGCTCGACGAAGGCACACAGAA AAACGACCGTACCGGAACCGGAACGCTTTCCATTTTTGGTCATCAGATGCGTrTTAACCT GCAAGATGGATTCCCGCTGGTGACAACIAAACGTTGCCACCTGCGTTCCATCATCCATGA ACTGCTGTGGTTTCTGCAGGGCGACACTAACATTGCTTATCTACACGAAAACAATGTCAC CATCTGGGACGAATGGGCCGATGAAAACGGCGACCTCGGGCCAGTGTATGGTAAACAGTG GCGCGCCTGGCCAACGCCAGATGGTCGTCATATTGACCAGATCACTACGGTACTGAACCA GCTGAAAAACGACCCGGATTCGCGCCGCATTATTGTTTCAGCGTGGAACGTAGGCGAACT GGATAAAATGGCGCTGGCACCGTGCCATGCATTCTTCCAGTTCTATGTGGCAGACGGCAA ACTCTCTTGCCAGCTTTATCAGCGCTCCTGTGACGTCTTCCTCGGCCTGCCGTTCAACAT TGCCAGCTACGCGTTATTGGTGCATATGATGGCGCAGCAGTGCGATCTGGAAGTGGGTGA TTTTGTCTGGACCGGTGGCGACACGCATCTGTACAGCAACCATATGGATCAAACTCATCT GCAATTAAGCCGCGAACCGCGTCCGCTGCCGAAGTTGATTATCAAACGTAAACCCGAATC CATCTTCGACTACCGTTTCGAAGACTTTGAGATTGAAGGCTACGATCCGCATCCGGGCAT TAAAGCGCCGGTGGCTATCTAATTACGAAACATCCTGCCAGAGCCGACGCCAGTGTGCGT CGGTTTTTTTACCCTCCGTTAAATTCTTCGAGACGCCTTCCCGAAggcgccArTCGCCAT TCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGC TGGCGAAAGGGGGATGTGCrGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTrTCCCAGT CACGACGTTGTAAAACGACGGCCAGTGCCAAGCTTACTGCTCACAAGAAAAAAGGCACGT CATCTGACGTGCCTTTTTTATTTGTACTACCCTGTACGATTACTGCAGGTCGACTCTAGA TGCATGCTCGAGTTATTATTTAATATATTTACAATAGATGAAGGACGCAATCGTACGGAT ACCGCCGAACAGGTAGTTAATGTTACCGGTCAGGAAGAAGCACTTCATTTTGATAACCAG GTCGTTAACCATCACCATGrACAGGTTTTTTTTTGCGGrAGACTGACCTTCGrGCAGGCG GTAGTAGAACAGGTATTCCGGCAGGTTTTGGAACTTGATTTTTGCCAGGCTCAGACGGTT CCACAGCTCGTAATCTTCGGAGTAGTTAGAAAACATATAACCACCGATGCTCGCGATGAC TTTTTTACGAAACATTACGCTCGGGTGAACAATACAACACTTATACGGCAGGrTTTTAAC GATGTCCAGGTTCTCTTCCGGCAGTTTGGTCTTGTTGATTTCACGACCTTTGrCGTCAAT AAAGATTGCGTTGGTACCCACAACATCTACGTACGGATTGTTCTTCAGGAAGrCAACCTG TTTAGTAAAACGGTCCGGGTGAGAGATGTCGTCAGAGTCCATACGGGCAATAAATTCGCC GTTGCTCAGGTCGATCGCTTTGTTCAGGGAGTACGGCAGGTAAGCGATGTTAGTGCGGAT CAGTTTGATTTTGTCGTTAACTTTGTGTTTCAGTTCGTTATAGAAGTCGTCAGTGCAGCA GTTCGCAACGATGATGATTTCGAAGCTGCTGAAGGTCTGAGACAGGATGCTGTTGATCGC TTCGTCCAGAAAAGGGTTTTTCTTGTTAACAGGCAGGATAACGCTCACAACCGGGTGGGT AGATTCCGCGGATTCCGCT TCATCGATGATCATATGTATATCTCC TTCTTCTCGAGTCAA CGGTTTTTCAGCAATCGGTGCAAAATGCCGAAGTATTGCCTCAAGGTAAACAGCCGCCGC ATCCTGCCGTCTGCCGCAAAATCCAGCCACGCGCCGGCGGGCAGCGTGTCCGrCCGTTTG AAGCATTGGTACAAAAACCGGCGGGCGCGTTCAAAATCTTCTTCCGGCAAATGTTTCTCC AGCAAITCATACGCTACTGCTTTTATTIGGCGGTATTCAAGGCTGrCGAACCGGGTTTTA AAACCCATAGACTGCAAAAAATCGTTTCTGGCGGTTTTTTGGATGCCTTGCGCGATTTCG TGTTGGCGGATGCTGTATTTGGATGAAACCTGATTGGCGTGAAGGCGGTATTrGACCAAG GCTTCGGGATAATAAGCCAGCCTGCCCAATTTGCTGACATCGTACCAAAATTGGTAATCT TCCGCCCAATCCCGCTCGGTGTTGTAACGCAAACCGCCGTCAATGACGCTGCGCCTCATA ATCATCGTGTTGTTGTGTATGGGGTTGCCGAAAGGGAAAAAGTCGGCAATGTCTTCGTGT CGGGTCGGTTTTTTCCAAATTTTGCCGTGTTCGTGGTGCCGCGCCAGCCGGTTGCCGTCC TTTTCTTCCGACAAAACTTCCAGCCACGCACCCATCGCGATGATGCTGCGGTCTTTTTCC ATCTCACCCACGATTTTCTCAATCCAGTCGGGGGCGGCAATATCGTCTGCATCGGTGCGC GCAATATATTCCCCCCCCCCCCCCGACTTTGCCAATTCATCCAGCCCGATGTTTAAAGAG GGAATCAGACCGGAATTGCGCGGCTGCGCGAGGATGCGGATGCGGCCGTCCTGTTCTTGG AAACGCTGGGCAATGGCAAGCGTACCGTCCGTCGAGCCGTCATCGACAATCAAAATATCC AAGTTGCGCCAAGTTTGATTCACGACGGCGGCTAATGATTGGGCGAAATATTTTTCTACG TTGTAGGCGCAAATCAATACGCTGACTAAAGGCTGCAATTTATTCTCCCGATAGGCACGA IG C C G IC IG A A G G C IIC A G A C G G C A IA IG ta ta tC tC C ttc ttg a a lIC IA A C A A IIG A I TGAAIGTATGCAAAIAAAIGCAIACACCATAGGIGTGGTTTAATTTGATGCCCTTIITCA GGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGTTGTTTTTTTGTTACTCGGGAAGG GCTTTACCTCTTCCGCATAAACGCTTCCATCAGCGTTTATAGTTAAAAAAATCTTTCGGA ACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCTGCTTTCCATTGAGCCTGTTTC TCTGCGCGACGTTCGCGGCGGCGTGTTTGTGCATCCATCTGGATTCTCCTGTCAGTTAGC TTTGGTGGTGTGTGGCAGTTGTAGTCCTGAACGAAAACCCCCCGCGATTGGCACATTGGC AGCTAATCCGGAATCGCACTTACGGCCAATGCTTCGTTTCGTATCACACACCCCAAAGCC TTCTGCTTTGAATGCTGCCCTTCTTCAGGGCTTAATTTTTAAGAGCGTCACCTTCATGGT GGTCAGIGCGTCCTGCTGATGTGCTCAGXATCACCGCCAGTGGTATTXATGTCAACACCG CCAGAGAIAAXXXAICACCGCAGAIGGXXAXCIGTAXGTTXIXTAIAIGAAITTAXXTTX XGCAGGGGGGCAXXGXXXGGXAGGXGAGAGAXCAAXXCXGCAXXAAXGAAXCGGCCAACG CGCGGGGAGAGGCGGXXXGCGXAIIGGGCGCXCIXCCGCXXCCICGCICACIGACXCGCX GCGCXCGGXCGXXCGGCXGCGGCGAGCGGXAXCAGCXCACXCAAAGGCGGXAAXACGGXX AXCCACAGAAXCAGGGGATAACGCAGGAAAGAACAXGTGAGCAAAAGGCCAGCAAAAGGC CAGGAACCGXAAAAAGGCCGCGTXGCXGGCGXTXTTCCAXAGGCTCCGCCCCCCTGACGA GCATCACAAAAATCGACGCTCAAGTCAGAGGXGGCGAAACCCGACAGGACXATAAAGATA CCAGGCGXXXCCCCCXGGAAGCXCCCXCGXGCGCXCXCCXGXXCCGACCCXGCCGCTXAC CGGAXACCTGXCCGCCXXTCXCCCIXCGGGAAGCGXGGCGCXXICXCAIAGCICACGCXG IAGGXAXCTCAGXTCGGTGIAGGXCGXTCGCTCCAAGCIGGGCIGXGXGCACGAACCCCC CGXXCAGCCCGACCGCXGCGCCXXAXCCGGXAACXAXCGXCXXGAGXCCAACCCGGXAAG ACACGACXXAXCGCCACXGGCAGCAGCCACXGGXAACAGGAIXAGCAGAGCGAGGXATGX AGGCGGXGCXACAGAGXXCXXGAAGXGGXGGCCTAACXACGGCXACACXAGAAGGACAGX AXXXGGXAXCXGCGCXCXGCXGAAGCCAGXXACCXXCGGAAAAAGAGXXGGXAGCXCXXG AXCCGGCAAACAAACCACCGCXGGTAGCGGXGGITXXIIXGTXTGCAAGCAGCAGAIXAC GCGCAGAAAAAAAGGAXCTCAAGAAGAXCCXXXGAXCTXXXCXACGGGGXCXGACGCXCA GXGGAACGAAAACICACGIIAAGGGAXXXXGGICAXGAGAXXAXCAAAAAGGAXCXICAC CTAGATCCXXXTAAATTAAAAATGAAGXXTXAAATCAATCXAAAGTAXATAXGAGXAAAC XXGGXCXGACAGXXACCAAXGCXXAAXCAGXGAGGCACCXAXCXCAGCGAXCXGXCXAXX XCGXXCAXCCAXAGTXGCCXGACXCCCCGXCGXGXAGAXAACXACGAXACGGGAGGGCXX ACCAXCXGGCCCCAGXGCXGCAAXGAXACCGCGAGACCCACGCTCACCGGCXCCAGATTX AXCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXGGXCCXGCAACXXXAXC CGCCXCCATCCAGXCIATTAAXTGIXGCCGGGAAGCTAGAGTAAGXAGXXCGCCAGXTAA XAGXXIGCGCAACGIXGXXGCCAXIGCXACAGGCAXCGIGGXGICACGCXCGICGXXXGG XAXGGCXICAXXCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXACAIGAXCCCCCAXGXX GXGCAAAAAAGCGGIXAGCICCXXCGGXCCXCCGAXCGIXGXCAGAAGXAAGIXGGCCGC AGXGXXAXCACXCATGGXXAXGGCAGCACXGCATAAXXCXCXXACXGXCAXGCCAXCCGX AAGAXGCXXXXCXGIGACTGGXGAGXACXCAACCAAGTCAXXCXGAGAAXAGIGXATGCG GCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAAC TTTAAAAGXGCXCATCAXTGGAAAACGXXCXXCGGGGCGAAAACXCTCAAGGATCXTACC GCXGXXGAGAXCCAGXXCGAXGXAACCCACXCGTGCACCCAACXGAXCXXCAGCAXCXXX TACXXTCACCAGCGTXXCXGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGG AAXAAGGGCGACACGGAAAXGXXGAAXACXCAXACXCXXCCXXTXXCAAXAXTAXXGAAG CAXI XAXCAGGGXXAXXGI CXCAXGAGCGGAIACAXAXIX G A A IGIA IX X AGAAAAATAA ACAAAIAGGGGIICCGCGCACAIIICCCCGAAAAGIGCCACCIGACGICIAAGAAACCAI IA IIA IC A IG A C A IIA A C C IA IA A A A A IA G G C G IA IC A C G A G G C C C IIIC G IC SEQ ID NO: 4
>pG222, secuencia completa.
XCGCGCGXTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGrCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCGGGGCTGGCTTAACrATGCGGCATCAGAGCAGATTGTACTGAGAGTGC ACCATAXAXGCGGXGXGAAAXACCGCACAGAXGCGTAAGGAGAAAAXACCGCAICAggcg ccTCCTCAACCTGTATATTCGTAAACCACGCCCAATGGGAGCTGTCTCAGGTrTGTTCCT GATTGGTrACGGCGCGTTTCGCATCArTGTTGAGTTTTTCCGCCAGCCCGACGCGCAGTT TACCGGTGCCTGGGrGCAGTACATCAGCATGGGGCAAATTCTTTCCATCCCGATGATTGT CGCGGGXGXGAXCAXGAXGGXCTGGGCAXAXCGXCGCAGCCCACAGCAACACGXTXCCXG AGGAACCATGAAACAGTATTrAGAACrGATGCAAAAAGTGCTCGACGAAGGCACACAGAA AAACGACCGTACCGGAACCGGAACGCrTTCCATrTTTGGTCATCAGATGCGTrTTAACCT GCAAGATGGATTCCCGCTGGTGACAACTAAACGrTGCCACCTGCGTTCCATCATCCATGA ACXGCTGXGGTTXCXGCAGGGCGACACTAACATXGCTXATCTACACGAAAACAATGXCAC CATCTGGGACGAATGGGCCGATGAAAACGGCGACCTCGGGCCAGTGTATGGTAAACAGTG GCGCGCCrGGCCAACGCCAGATGGTCGTCATATrGACCAGATCACTACGGTACTGAACCA GCTGAAAAACGACCCGGATTCGCGCCGCATTATTGTTTCAGCGTGGAACGTAGGCGAACT GGATAAAATGGCGCrGGCACCGTGCCATGCATTCTTCCAGTTCTArGTGGCAGACGGCAA ACTCTCTrGCCAGCrTTATCAGCGCTCCTGTGACGTCTTCCTCGGCCTGCCGrTCAACAT TGCCAGCIACGCGTIATTGGTGCATAIGATGGCGCAGCAGIGCGArCTGGAAGTGGGTGA XIXTGXCXGGACCGGXGGCGACACGCAXCTGXACAGCAACCATAXGGATCAAACTCAICX GCAATXAAGCCGCGAACCGCGTCCGCXGCCGAAGTTGATTATCAAACGTAAACCCGAATC CATCTTCGACTACCGTTTCGAAGACTrTGAGATrGAAGGCTACGATCCGCATCCGGGCAT TAAAGCGCCGGTGGCTATCTAATTACGAAACATCCTGCCAGAGCCGACGCCAGTGTGCGT CGGTTTTTTTACCC1-CCGTTAAATTCTTCGAGACGCCTTCCCGAAggcgccATTCGCCAT TCAGGCTGCGCAACIGTTGGGAAGGGCGATCGGXGCGGGCCTCXXCGCTAXXACGCCAGC TGGCGAAAGGGGGArGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTrTCCCAGT CACGACGrTGTAAAACGACGGCCAGTGCCAAGCrTACTGCTCACAAGAAAAAAGGCACGT CATCTGACGTGCCTrTTTTATTTGTACTACCCTGTACGATTACTGCAGGTCGACTCTAGA XGCATGctcgaglXAXACAAACTGCCAAXATXXCAAAXAXXTAAAATGGAGXXCTCXCAX XAAGGCGAXXXXAGGGCXAXAAGGXXCXXCXXXXCGXGCXATCGXAGAGAXXXGCXCAXC AICAGCGAXCACAAAAGGXXGXAACACCAGAXXXXTCACGCCAXGGAXAAAAGXAGCGXC CAXTAXCGXAXCCACAGGAACAACCCATXTXCGGCTGCATXTCAAAAAAACTXTGGCAAX CXXAGGCGXGAXCACATAGCCXTGAGXCCCCACCCCXXCGCTAXAAGCTXXAAXGAXCCC CACACGCXCXXGXAXCTCGXGGTTXXIAXGGCXCAAXGGCXCACXXXXTACACXGGCAXC ATACAATAAATGCAXCAAGCGGATATAGCCTAACXCTXGGATGXGTTTTTCTAAAAAATC CAAGCCCXCXTXAAAATCCXCXTTCAAGGTXAXAXCGXCXXCTAAAAXACAGAXCGCXXC ATIGAGTXCTATGCATTTTTCCCACAAGGAAIAATGACICGCATAGCACCCAAGCTCCCC CAAGCXCAXAAACX XCGCAXGGTAXX XXAAAGCGXAAXAAAACXXAGAAACC XCACXGAX GAGATXGGXXGXAAXCCCCAXGTCXXXGATGXTXXGCGXGATGAAATAAGGGXGTAAAXG CTXTTXCACTAAGGGGTGCAACCCGCCITCAAAAGTTTTAGAAXAAATCGCAICAAAAAX XXGCGCXXGGXGGXGGGXGGCATTGAXGCTAXXGAGXAAAGTTGXGGXGXCXCXAAAAAC XAAACCAAAXGXAXCGCACACXTTXXGAXTXAAAGAAAXGGCAAAAACACGCAtAXGtat atCtCCttCttCXCGAGXCAACGGXXXXXCAGCAATCGGXGCAAAAXGCCGAAGTAXXGC CXCAAGGXAAACAGCCGCCGCATCCXGCCGXCXGCCGCAAAATCCAGCCACGCGCCGGCG GGCAGCGXGXCCGXCCGTXXGAAGCAXXGGTACAAAAACCGGCGGGCGCGXTCAAAAXCX TCXTCCGGCAAAXGXXTCXCCAGCAAXTCATACGCTACTGCTTXTATTTGGCGGTAITCA AGGCTGXCGAACCGGGTTXXAAAACCCAXAGACXGCAAAAAATCGXXXCXGGCGGTXXXX TGGATGCCTTGCGCGATTTCGXGTTGGCGGAXGCTGTATTXGGATGAAACCTGATTGGCG XGAAGGCGGXAXXXGACCAAGGCTXCGGGAXAAXAAGCCAGCCXGCCCAAXXXGCXGACA XCGTACCAAAAXXGGXAAXCXTCCGCCCAAXCCCGCXCGGXGTXGXAACGCAAACCGCCG TCAATGACGCTGCGCCTCATAATCAXCGTGXXGXXGTGXAXGGGGXTGCCGAAAGGGAAA AAGTCGGCAAXGXCXXCGXGXCGGGXCGGTXXXXXCCAAATTTXGCCGTGXXCGTGGXGC CGCGCCAGCCGGTTGCCGTCCXTTXCXTCCGACAAAACXXCCAGCCACGCACCCATCGCG AXGATGCXGCGGXCXXTXXCCATCXCACCCACGAXTXXCXCAAXCCAGTCGGGGGCGGCA AXATCGXCXGCAXCGGTGCGCGCAAXAXATXCCCCCCCCCCCCCCGACTXXGCCAAXXCA XCCAGCCCGAXGXTXAAAGAGGGAAXCAGACCGGAATXGCGCGGCXGCGCGAGGAXGCGG ATGCGGCCGTCCXGXXCTIGGAAACGCXGGGCAATGGCAAGCGXACCGTCCGXCGAGCCG XCATCGACAATCAAAATAXCCAAGIIGCGCCAAGXTIGAXICACGACGGCGGCXAAXGAX XGGGCGAAAXATIT XXCTACGXTGXAGGCGCAAAXCAATACGCXGACTAAAGGCTGCAAX TXATTCXCCCGAXAGGCACGAXGCCGXCTGAAGGCTTCAGACGGCAXATGtatatctcct tCttgaaTTCTAACAATTGATTGAATGTATGCAAATAAATGCATACACCATAGGTGTGGT TTAATTTGATGCCCTTTTTCAGGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGTTG TTTTTTTGTTACTCGGGaaGGGCTTTACCTCTTCCGCATAAACGCTTCCATCAGCGTTTA TAGTTAAAAAAATCTTTCGGAACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCT GCTTTCCATTGAGCCTGTTTCTCTGCGCGACGTTCGCGGCGGCGTGTTTGrGCATCCATC TGGATTCTCCTGTCAGTTAGCTTTGGTGGTGTGTGGCAGTTGTAGTCCTGAACGAAAACC CCCCGCGATTGGCACATTGGCAGCTAATCCGGAATCGCACTTACGGCCAATGCTTCGTTT CGTATCACACACCCCAAAGCCTTCTGCTTTGAATGCTGCCCTTCTrCAGGGCTTAATTTT TAAGAGCGTCACCTTCATGGTGGTCAGTGCGTCCTGCTGATGTGCTCAGTATCACCGCCA GTGGTATrTATGTCAACACCGCCAGAGATAATTrATCACCGCAGArGGTTATCTGTATGT TTTTTATATGAATTTATTTTTTGCAGGGGGGCATTGTTTGGTAGGTGAGAGATCAATTCT GCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGC TTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCA CTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTG AGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCA TAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAA CCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCC TGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGC GCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCT GGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCG TCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAG GATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTA CGGCTACACTAGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGG AAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTT T GTTTGCAAGCAG CAGAT TACGCGCAGAAAAAAAGGAT CTCAAGAAGAT CCTTTGAT CTT TTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAG ATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAAT CTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACC TATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGAT AACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCC ACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAG AAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAG AGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGT GGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCG AGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGT TGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTC TCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTC ATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAA TACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCG AAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACC CAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAG GCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTT CCTTTTTCAATATTATTGAAGCATTTATCAGGGrTATTGTCTCATGAGCGGATACATATT TGAATGTATTTAGAAAAATAAACAAATAGGGGTrCCGCGCACATTTCCCCGAAAAGTGCC ACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCAC GAGGCCCTTTCGTC
SEQ ID NO: 5
>pG317, secuencia completa.
GTACCCAGCTTTTGrTCCCTTTAGTGAGGGTTAATTGCGCGCTTGGCGTAATCATGGTCA TAGCTGTTTCCTGTGTGAAATTGTTArCCGCTCACAATTCCACACAACATACGAGCCGGA AGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTG CGCTCACTGCCCGCITTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGC CAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCATGCATAAAAACTGTTGTAATTCA TTAAGCATTCTGCCGACATGGAAGCCATCACAAACGGCATGATGAACCTGAATCGCCAGC GGCATCAGCACCTTGTCGCCTTGCGTATAATATTTGCCCATGGTGAAAACGGGGGCGAAG AAGTTGTCCATATTGGCCACGTTTAAATCAAAACTGGTGAAACTCACCCAGGGATTGGCT GAGACGAAAAACATATTCTCAATAAACCCTTTAGGGAAATAGGCCAGGTTTTCACCGTAA CACGCCACATCTTGCGAATATATGTGTAGAAACTGCCGGAAATCGTCGTGGTATTCACTC CAGAGCGATGAAAACGTTTCAGTTTGCTCATGGAAAACGGTGTAACAAGGGTGAACACTA TCCCATATCACCAGCTCACCGTCTTTCATTGCCATACGGAATTCCGGATGAGCATTCATC AGGCGGGCAAGAATGTGAATAAAGGCCGGATAAAACTTGTGCTTATTTTTCTTTACGGTC XXXAAAAAGGCCGXAAXAXCCAGCXGAACGGXCXGGXXAXAGGXACAXXGAGCAACXGAC XGAAAXGCCXCAAAAXGXXCXIXACGAXGCCAXXGGGAXAXAXCAACGGXGGXAXAXCCA GTGATTTrTTTCTCCATTTTAGCTTCCTTAGCTCCTGAAAATCTCGATAACTCAAAAAAT ACGCCCGGTAGTGATCTTATTTCATTATGGTGAAAGTTGGAACCTCTTACGTGCCGATCA ACGTCTCATTTTCGCCAAAAGTTGGCCCAGGGCrTCCCGGTATCAACAGGGACACCAGGA XXXAXXXAXXCXGCGAAGXGAXCXXCCGXCACAGGXAXIXAXXCGAAGACGAAAGGGCCX CGTGATACGCCTATXTTTATAGGTrAATGTCATGATAATAATGGTTTCTTAGACGTCAGG TGGCACTrTTCGGGGAAATGTGCGCGCCCGCGTrCCTGCTGGCGCTGGGCCTGTTTCTGG CGCTGGACTTCCCGCTGTTCCGTCAGCAGCTTTrCGCCCACGGCCTTGATGATCGCGGCG GCCTTGGCCTGCATATCCCGATTCAACGGCCCCAGGGCGTCCAGAACGGGCTTCAGGCGC TCCCGAAGGTCTCGGGCCGTCTCTTGGGCTTGArCGGCCTTCTTGCGCATCTCACGCGCT CCTGCGGCGGCCTGTAGGGCAGGCTCATACCCCrGCCGAACCGCTTTTGTCAGCCGGTCG GCCACGGCTTCCGGCGTCTCAACGCGCTTTGAGATTCCCAGCTTTTCGGCCAATCCCTGC GGTGCATAGGCGCGTGGCTCGACCGCrTGCGGGCTGATGGTGACGTGGCCCACTGGTGGC CGCTCCAGGGCCTCGTAGAACGCCTGAATGCGCGTGTGACGTGCCTTGCTGCCCTCGATG CCCCGTTGCAGCCCTAGATCGGCCACAGCGGCCGCAAACGTGGTCTGGTCGCGGGTCATC TGCGCTTTGTTGCCGATGAACTCCTTGGCCGACAGCCTGCCGTCCTGCGTCAGCGGCACC ACGAACGCGGTCATGTGCGGGCTGGTrTCGTCACGGTGGATGCrGGCCGTCACGATGCGA TCCGCCCCGTACTTGTCCGCCAGCCACTTGTGCGCCTTCTCGAAGAACGCCGCCXGCTGX XCXXGGCXGGCCGACXXCCACCAXXCCGGGCXGGCCGXCAXGACGXACXCGACCGCCAAC ACAGCGXCCXXGCGCCGCXXCXCXGGCAGCAACXCGCGCAGXCGGCCCAXCGCXXCAXCG GXGCXGCXGGCCGCCCAGXGCXCGXXCXCXGGCGXCCXGCXGGCGXCAGCGXXGGGCGXC XCGCGCXCGCGGXAGGCGXGCIXGAGACXGGCCGCCACGXXGCCCAXXXXCGCCAGCXIC XXGCAXCGCAXGAXCGCGXAXGCCGCCAXGCCXGCCCCXCCCXXXXGGXGXCCAACCGGC XCGACGGGGGCAGCGCAAGGCGGXGCCXCCGGCGGGCCACXCAAXGCXXGAGTAXACXCA CXAGACXXXGCXXCGCAAAGXCGXGACCGCCXACGGCGGCXGCGGCGCCCXACGGGCXXG CXCICCGGGCXXCGCCCXGCGCGGXCGCXGCGCICCCXIGCCAGCCCGIGGAXAXGXGGA CGAXGGCCGCGAGCGGCCACCGGCXGGCXCGCXXCGCXCGGCCCGXGGACAACCCXGCXG GACAAGCXGAXGGACAGGCXGCGCCXGCCCACGAGCXXGACCACAGGGAXXGCCCACCGG CXACCCAGCCXXCGACCACAXACCCACCGGCXCCAACXGCGCGGCCXGCGGCCXXGCCCC AXCAAXXXXXXIAAIXXXCXCXGGGGAAAAGCCXCCGGCCXGCGGCCXGCGCGCXXCGCX XGCCGGXXGGACACCAAGXGGAAGGCGGGXCAAGGCXCGCGCAGCGACCGCGCAGCGGCX XGGCCXXGACGCGCCXGGAACGACCCAAGCCXAXGCGAGXGGGGGCAGXCGAAGGCGAAG CCCGCCCGCCXGCCCCCCGAGCCXCACGGCGGCGAGXGCGGGGGXXCCAAGGGGGCAGCG CCACCXXGGGCAAGGCCGAAGGCCGCGCAGXCGAXCAACAAGCCCCGGAGGGGCCACXXX XXGCCGGAGGGGGAGCCGCGCCGAAGGCGXGGGGGAACCCCGCAGGGGXGCCCXXCXXXG
ggcaccaaagaacxagaxaxagggcgaaaxgcgaaagacxxaaaaaxcaacaacxxaaaa AAGGGGGGXACGCAACAGCXCAXXGCGGCACCCCCCGCAAXAGCXCAXXGCGXAGGXXAA AGAAAAXCXGXAAXIGACXGCCACXXXXACGCAACGCAXAAXXGXXGXCGCGCXGCCGAA AAGXXGCAGCXGAXIGCGCAXGGXGCCGCAACCGXGCGGCACCCXACCGCAXGGAGAXAA GCAXGGCCACGCAGICCAGAGAAAXCGGCAXXCAAGCCAAGAACAAGCCCGGXCACXGGG XGCAAACGGAACGCAAAGCGCAXGAGGCGXGGGCCGGGCXXAXXGCGAGGAAACCCACGG CGGCAAXGCXGCXGCAXCACCXCGTGGCGCAGAXGGGCCACCAGAACGCCGTGGXGGXCA GCCAGAAGACACXXXCCAAGCXCAXCGGACGXXCXXXGCGGACGGXCCAAXACGCAGXCA AGGACXXGGXGGCCGAGCGCXGGAXCXCCGXCGXGAAGCXCAACGGCCCCGGCACCGXGX CGGCCXACGXGGXCAAXGACCGCGXGGCGXGGGGCCAGCCCCGCGACCAGXXGCGCCXGX CGGXGXXCAGXGCCGCCGXGGXGGXXGAXCACGACGACCAGGACGAAXCGCXGXXGGGGC AXGGCGACCXGCGCCGCAXCCCGACCCXGXAICCGGGCGAGCAGCAACXACCGACCGGCC CCGGCGAGGAGCCGCCCAGCCAGCCCGGCAXXCCGGGCAXGGAACCAGACCXGCCAGCCX XGACCGAAACGGAGGAAIGGGAACGGCGCGGGCAGCAGCGCCXGCCGAXGCCCGAXGAGC CGXGXXXXCXGGACGAXGGCGAGCCGXXGGAGCCGCCGACACGGGXCACGCXGCCGCGCC GGXAGCACIXGGGXIGCGCAGCAACCCGXAAGXGCGCXGXXCCAGACXAXCGGCIGXAGC CGCCXCGCCGCCCXAXACCXXGXCXGCCXCCCCGCGXXGCGXCGCGGXGCAXGGAGCCGG GCCACCXCGACCIGAATGGAAGCCGGCGGCACCXCGCTAACGGAXICACCGTITTIAXCA GGCXCXGGGAGGCAGAAXAAAXGAXCAXAXCGXCAAXXAXXACCXCCACGGGGAGAGCCX GAGCAAACTGGCCXCAGGCAXTTGAGAAGCACACGGXCACACTGCXXCCGGXAGTCAATA AACCGGXAAACCAGCAAXAGACAXAAGCGGCXAXXXAACGACCCXGCCCXGAACCGACGA CCGGGXCGAAXXXGCXXXCGAAXXXCXGCCAXXCAXCCGCXXAXXAXCACXXAXXCAGGC GXAGCACCAGGCGXXXAAGGGCACCAAXAACXGCCXXAAAAAAAXXACGCCCCGCCCXGC CACXCAXCGCAGXCGGCCXAXXGGXXAAAAAAXGAGCXGAXXXAACAAAAAXXXAACGCG AATTTTAACAAAATATTAACGCTTACAATTTCCATTCGCCATTCAGGCTGCGCAACTGTT GGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTG CTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGA CGGCCAGTGAGCGCGCGTAATACGACTCACTATAGGGCGAATTGGAGCTCCACCGCGGTG GCGGCCGCTCTAGAACTAGTGGATCCCCCGGGCTGCAGGAATTCGATATCAAGCTTATCG ATACCGTCGACCTCGAGTTAAGTCTCIAATCGATTGTTTTCCAATGGAATGGTTATAAAA TCTTTGGTTTTTAGTCTTGAAAATCTTCTAGGATTTTCTATGTAAGTTTTTGTATAAATA TTATATTGCTTTAATAAATTTAATATATTTTTATTGCATTTTAAGGTTATTTTTTCCATA TCTGTTCAACCTTTTTTAAATCCTCCAAACAGTCAATATCTAAACTTGAGCTTTCGTCCA TTAAAAAATGCTTGGTTTTGCTTTGTAAAAAGCTAGGATTGTTTAAAAATTCTTTTATCT TTAAAATATAAATTGCACCATTGCTCATATAAGTTTTAGGCAATTTTTGCCTTGGCATAA AAGGATATTCATCATTACAAATCCCTGCTAAATCGCCACAATCATTACAAACAAAGGCTT TTAGAATTTTATTATCACATTCGCTTACGCTAATTAGGGCATTTGCATTGCTATTTTTAT AAAGATTAAAAGCTTCATTAATATGAATATTTGTTCTTAGCGGTGAAGTGGGTTGTAAAA AAACTACATCTTCATAATCTTTATAAAATTTTAGAGCATGTAACAGCACTTTATCGCTTG TGGTATCATCTTGTGCAAGGCTAATTGGGCGTTTTAAAATATCAACATTTTGACTTTTTG CATAATT TAAAATT TCATCAC TATCACTGCT TACAACAAC TTTAC TAATGCTITTAGCAT TTAGTGCAGCTTTGATCGTGTAGTAAATTAAAGGTTTATTGTTTAATAAAACCAAATTTT TATTTTTAATACCCTTTGAGCCACCACGAGCAGGGATTATTGCTAAGCTCATTTTATATC CTTAAAAACTTTTTGTGTGCTGAGTTTAAAAAAATCTCCGCTTTGTAAATATTCAAAAAA TAATTTTGAGCTATCTAAAATCTCTAACTIAGCGCTAAATAAATCTTGTTITTTATGAAT AGTGTTAATAGCTTTTAGTATTTCATCACTATTTGCATTAACTTTTAGTGTATTTTCATT GCCAAGTCTTCCATTTTGTCTTGAGCCAACTAAAATCCCTGCTGTTTTTAAGTATAAGGC CTCTTTTAAAATACAACTTGAATTACCTATTATAAAATCAGCATTTTTTAACAAAGTTAT AAAATACTCAAATCTAAGCGATGGAAAAAGCTTAAATCTAGGGTTATTTTTAAACTCTTC ATAGCTTTGCAAGATTAATTCAAAACCTAAATCATTATTTGGATAAATAACAATATAATT TTTATTACTTTGTATCAGTGCTTTTACTAAATTGTCTGCTTGATTTTTAATGCTAGTAAT TTCAGTTGTAACAGGATGAAACATAAGCAAAGCGTAGTTTTCATAATTTATATCATAATA TTTTTTTGCTTCGCTAAGTGAAATTTTATTATCGTTTAAAAGTTCTAAATCAGGCGAACC TATGATAAAAATAGATTTTTCATCTTCTCCAAGCTGCATTAAACGCCTTTTTGCAAACTC ATCATTTACTAAATGAATATGAGCTAGTTTTGATATAGCGTGGCGTAAGCTATCGTCAAT AGTTCCTGAAATCTCTCCGCCTTCAATATGCGCTACTAAGATATTATTTAATGCTCCAAC AATAGCTGCTGCTAAAGGCTCAATTCTATCTCCATGTACTACGATTAAATCAGGTTTTAG CTCATTTGCATACCTTGAAAATCCATCAATTGTAGTAGCTAAAGCCTTATCAGTTTGATA ATATTTATCATAATTTATAAATTCATAAATATTTTTAAAGCCATTTTTATAAAGTTCTTT AACTGTATAGCCAAAATTTTTACTTAAGTGCATTCCTGTTGCAAAGATGTAAAGTTCAAA TTCGCTTGAGTTTTGCACCCTGTACATTAAAGATTTAATCTTAGAATAATCAGCCCTAGA GCCTGTTATAAAAAGGATTTTTTTCACGCAAAATCCTCATAGCTTAACTGAGCATCATTT TCTATATCTCTTAATGCTTTTTTGCCTAAAATATTTTCAAATTCAGCCGCACTAATTCCA CCAAGTCCAGGTCTTTTAACCCAAATATTATCCATAGATAAAACTTCGCCTTTTTTAATA TCTTTAATGCTAACTACACTTGCAAAGGCAAAATCAATTGTAACTTGTTCTTGTTTAGCC GCTTTTTTACTTTCATTATTTCCTCTTATTATAGCCATTTGCTCACTTTGTATAATTAGC TCTTTTAAAGCCTTTGTATCCATAGAACAAACTATATCAGGGCCACTTCTATGCATACTA TCAGTAAAATGICTTTCAAGCACACAAGCTCCAAGTACAACTGCACCTAAACACGCAAGA TTATCTGTTGTGTGGTCGCTTAAGCCTACCATACAAGAAAATTCTTTTTTTAACTCAAGC ATAGCGTTTAATCTTACAAGATTATGCGGGGTTGGGTAAAGATTGGTCGTGTGCATTAAA ACAAAAGGAATTTCATTGTCTAATAAGATTTTTACAGTTGGTTTTATACTTTCAATACTA TTCATTCCTGTGCTAACTATCATAGGCTTTTTAAAGGCTGCTATGTGTTTAATAAGCGGA TAATTATTACACTCACCTGAACCAATCTTAAAAGCACTAACTCCCATATCTTCTAAGCGG TTCGCACCTGCACGAGAAAAAGGTGTGCTAAGATAAACAAGACCTAATTTTTCTGTGTAT TCTTTAAGTGCTAGCTCATCTTTATAATCCAAAGCACATTTTTGCATAATCTCATAAATG CTTATTTTTGCATTACCAGGAATTACTTTTTTAGCGGCCTTACTCATCTCATCTTCAACA ATATGAGTTTGATGCTTTATAATCTTAGCACCTGCGCTAAAGGCTGCATCTACCATAATT TTAGCTAGTTCTAAACTGCCATTATGATTAATGCCTATTTCAGGTACGACTAAGGGTGCT TTTTCTTCACTTATGATTATATTTTGTATTTTTATTTCTTTCATTTATTTTCCTCCTTAG SEQ ID NO: 6
>pG315, secuencia completa
CTAAATTGTAAGCGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTC
AT T T T T T AACCAATAGGCCGAAATCGGCAAAATCCCTTATAAA TCAAAAGAATAGACCGA
GATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTC CAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACC CTAATCAAGTTTTTTGGGGTCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAG CCCCCGAIIXAGAGCXXGACGGGGAAAGCCGGCGAACGXGGCGAGAAAGGAAGGGAAGAA AGCGAAAGGAGCGGGCGCTAGGGCGCTGGCAAGTGTAGCGGTCACGCTGCGCGTAACCAC CACACCCGCCGCGCTTAATGCGCCGCTACAGGGCGCGTCCCATTCGCCAXXCAGGCTGCG CAACTGXTGGGAAGGGCGAXCGGXGCGGGCCXCXXCGCXAXXACGCCAGCXGGCGAAAGG GGGATGXGCXGCAAGGCGAXXAAGXXGGGXAACGCCAGGGXXTXCCCAGXCACGACGXXG IAAAACGACGGCCAGIGAGCGCGCGXAAXACGACXCACIAXAGGGCGAAXIGGAGCXCCA CCGCGGXGGCGGCCGCXCXAGAACXAGXGGAXCCCTAGACXGCAAXACAAACACCXGXXX CACAAIXIGGCAGAXCAGCCCAAAAAAGXACAXXCTCXXCXITIACAAIACCXAGXXXXA XCATTACTXGAACXAAAGGACXTCXCAAAGCAGXXTCACGATCAGXXATAGXTXCXGXCG ATGXAAAAACTAIAAATXXAAXXXIXICAGCXGGTATCGTGAAATATAAAGAGCTCGCXA XACCAGCAACXGCAXCAGGAAGCAXAXCXGXCAXCAXCAAAACXXCAAAXGAXAXXXXXG AXGGAAXAXCAACCAXTGAAGGATAGXXXXGCAXXAXTAAXGTATXAATGAXACCGCCAC CAGGGXGACCXXXGAAGAACAAAXCAXAACXAXXGCCXAAAXAAXGXGGGCXCGAXXCAX XAAXTGCAXXAXXAAXGACAXXAAXXXGXXGXXXCGCAXAAXACXCXCXXXCAXGGXXAC CAGCCCAIACAGXCGXACCXGXAAACACAAAGXXXGGTAAAXTAGAXGAAXXAXAXXCAX XXXGTAAIXXXIGXTXGTCAAAATXAACAATCGAXAAGAAXAATXCXXGIXGTXTGCXAX XGAATXXXXXGAAACCAXCCCAXXGCAXXXGCXXXAAACXAXCACCAAXAXAGXCXCGXA ACXCAXGIAAXGAXGGXXCXAAAGXTAAAXAAXCXTXXCXXAAAAAAXGGXAGXXAGCXG GAXATAGIXXXXGCCAGXXAXAAACAGAXGAXGXXCCXGXAXTXGAAGXGXCXXCAXXGA XACCATTAAXGACATCCTCAAGATAAICXTXACCAATTXTXAAATXAXCTGXTTTAXXXA AXGXAXCXCXCCAGXXAXAXAAAXXXACAXAXXCXGCXGAACCAXCAXCAXAXAAAXCXA XAXTTGXXACCGXAACGXXAXXAAACGAATXXAAXTCXXXXAGTAXXGGCACXAAAXXAX CAAATGAAXGAGCAGXGXXAGAGCXAAGXXXAACATXCAAXCTAXGCXXXGXXXGXGCXX GCXXAACAAXXXCXXGXACXAAGXCAGCXGGXGXATGGXXAXTXAXCAAXGCAAACGAXG XAATAXTXAACXCXIXCAXXXGCTCAICAGXCGGAACIAXXCTCCCCCAAGCXATAXAXC XXXGTGCXGXAGGAXXXXCXXCTXCCGAXXXAAXAAXAXCCATXAGCXGCXGAAGAGXXG GAAGAGATGCAXGAXCAACAXAAACCXCXAAAGAXGGAGCCACXACGXXXAAXGXXACXX XXGXTAXAXAXXXXXCACCXXXAXXACXAACACCATXAAAAXCAAAGCAGXACXXXXCAX CGXCAXCIAAXCGXGGCGCCACXACAGAXAAXGAXAXXGACXCXXXAXXXXGXXCXGXXA AXAGTXGTXGCGXACCACAAGXXXGXACCCAAGAGTGIXXXGTAAAAGAGAXGXXXGAXX GAXTAAXXGGCXCIAAATXAACATACXCCTCAXCAATAAXAGTTXXAXTAAIAXCAXXXX XAAXAAXAGAXXGXGXAXXXXCXTCXGACAXggtCtgtttCCteCXCGAGGGGGGGCCCG GXACCCAGCXXXXGXXCCCXXXAGXGAGGGXXAAXTGCGCGCTXGGCGTAAXCATGGXCA XAGCTGXXXCCXGXGXGAAAXXGXXAXCCGCXCACAAXXCCACACAACAXACGAGCCGGA
agcataaagxgxaaagccxggggxgccxaaxgagxgagcxaacxcacaxxaaxxgcgxxg CGCXCACXGCCCGCXXXCCAGXCGGGAAACCXGXCGXGCCAGCXGCAXXAAXGAAXCGGC CAACGCGCGGGGAGAGGCGGXXXGCGXAXXGGGCGCXCXXCCGCXXCCXCGCXCACXGAC XCGCTGCGCXCGGXCGXXCGGCXGCGGCGAGCGGXAXCAGCXCACXCAAAGGCGGXAAXA CGGTTAXCCACAGAAICAGGGGAXAACGCAGGAAAGAACAXGTGAGCAAAAGGCCAGCAA AAGGCCAGGAACCGXAAAAAGGCCGCGXXGCXGGCGXXXXXCCAXAGGCXCCGCCCCCCX GACGAGCAXCACAAAAAXCGACGCXCAAGXCAGAGGXGGCGAAACCCGACAGGACXAXAA AGATACCAGGCGIIXCCCCCXGGAAGCXCCCXCGXGCGCICTCCTGTXCCGACCCTGCCG CXXACCGGAXACCXGXCCGCCXXTCXCCCXXCGGGAAGCGXGGCGCXXXCXCAXAGCXCA CGCXGXAGGXAXCXCAGXXCGGXGXAGGXCGXXCGCXCCAAGCXGGGCXGXGXGCACGAA CCCCCCGXXCAGCCCGACCGCXGCGCCXXATCCGGTAACXATCGXCXXGAGXCCAACCCG GXAAGACACGACXXAXCGCCACXGGCAGCAGCCACTGGXAACAGGAXXAGCAGAGCGAGG XAXGTAGGCGGXGCXACAGAGXXCXXGAAGXGGXGGCCXAACTACGGCXACACXAGAAGG ACAGTAXXXGGXAXCXGCGCXCXGCXGAAGCCAGXTACCXXCGGAAAAAGAGXXGGXAGC XCXTGAXCCGGCAAACAAACCACCGCTGGXAGCGGTGGXXXTTIXGXXTGCAAGCAGCAG AXXACGCGCAGAAAAAAAGGAXCXCAAGAAGAXCCrXXGAXCTXTXCXACGGGGXCXGAC GCXCAGXGGAACGAAAACXCACGXXAAGGGAXXXXGGXCAXGAGATXAXCAAAAAGGAXC XXCACCXAGAXCCXTXTAAATXAAAAATGAAGXXXTAAATCAAXCXAAAGXATATAXGAG XAAACrTGGXCIGACAGTXACCAAIGCIIAAXCAGrGAGGCACCTATCTCAGCGATCXGX CXAXTXCGXXCAXCCAXAGXXGCCXGACXCCCCGXCGXGXAGAXAACXACGAXACGGGAG GGCTTACCAXCXGGCCCCAGXGCTGCAAXGAXACCGCGAGACCCACGCTCACCGGCXCCA GAXXTAXCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXGGXCCXGCAACX XXAXCCGCCXCCAXCCAGXCXAXXAAXXGXXGCCGGGAAGCXAGAGXAAGXAGXXCGCCA GXXAATAGXXXGCGCAACGXXGXXGCCAXXGCXACAGGCAXCGXGGXGXCACGCXCGXCG XTXGGXAXGGCXXCAXTCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXACAXGATCCCCC
ATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTG
GCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCA
TCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGT
ATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGC
AGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATC
TTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCA
TCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAA
AAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTAT
TGAAGCArTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTAITTAGAAA AATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCAC
SEQ ID NO: 7
CTCGAGgaggaaacagaccATG
SEQ ID NO: 8
CTCGAGgaaagaggggacaaactagATG
SEQ ID NO: 9
>pG345, secuencia completa CTAAATTGTAAGCGTTAATATTTTGTTAAAATTCGCGTTAAATTTTTGTTAAATCAGCTC ATTTTTTAACCAATAGGCCGAAATCGGCAAAATCCCTTATAAATCAAAAGAArAGACCGA GATAGGGTTGAGTGTTGTTCCAGTTTGGAACAAGAGTCCACTATTAAAGAACGTGGACTC CAACGTCAAAGGGCGAAAAACCGTCTATCAGGGCGATGGCCCACTACGTGAACCATCACC CTAATCAAGTTTTTTGGGGrCGAGGTGCCGTAAAGCACTAAATCGGAACCCTAAAGGGAG CCCCCGATTTAGAGCTTGACGGGGAAAGCCGGCGAACGTGGCGAGAAAGGAAGGGAAGAA AGCGAAAGGAGCGGGCGCTAGGGCGCrGGCAAGrGTAGCGGTCACGCTGCGCGTAACCAC CACACCCGCCGCGCTTAATGCGCCGCrACAGGGCGCGTCCCATTCGCCATTCAGGCTGCG CAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCrTCGCTATTACGCCAGCTGGCGAAAGG GGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTG TAAAACGACGGCCAGTGAGCGCGCGTAATACGACTCACTATAGGGCGAATTGGAGCTCCA CCGCGGTGGCGGCCGCTCTAGAACTAGTGGATCCCTAGACTGCAATACAAACACCTGTTT CACAATTTGGCAGATCAGCCCAAAAAAGTACATTCTCTTCTTTTACAATACCTAGTTTTA TCATTACTTGAACTAAAGGACTTCTCAAAGCAGTTTCACGATCAGTTATAGTTTCTGTCG ATGTAAAAACTATAAATTTAATTTTTTCAGCTGGTATCGTGAAATATAAAGAGCTCGCTA TACCAGCAACTGCATCAGGAAGCATArCTGTCArCATCAAAACTTCAAATGATATTTTTG ATGGAATATCAACCATTGAAGGATAGTTTTGCATTATTAATGTATTAATGATACCGCCAC CAGGGTGACCTT TGAAGAACAAATCATAACTATTGCCTAAATAATGTGGGCTCGATTCAT TAATTGCATTATTAATGACATTAATTTGTTGTTTCGCATAATACTCTCTTTCATGGTTAC CAGCCCATACAGTCGTACCTGTAAACACAAAGTrTGGTAAATTAGATGAATTATATTCAT TTTGTAATTTTTGTTTGTCAAAATTAACAATCGATAAGAATAATTCTTGTTGrTTGCTAT TGAATITTITGAAACCATCCCATTGCATTTGCTrTAAACTATCACCAATATAGTCICGTA ACTCATGTAATGATGGTTCTAAAGTTAAATAATCTTTTCTTAAAAAATGGTAGTTAGCTG GATATAGTTTTTGCCAGTTATAAACAGATGATGTTCCTGTATTTGAAGTGTCTTCATTGA TACCATTAATGACATCCTCAAGATAArCTTTACCAATTTTTAAATTATCTGTTTTATTTA ATGTATCTCTCCAGTTATATAAATTTACATATTCTGCTGAACCATCATCATATAAATCTA TATTTGTTACCGTAACGTTATTAAACGAATTTAATTCTTTTAGTATTGGCACTAAATTAT CAAATGAATGAGCAGTGTTAGAGCTAAGTTTAACATTCAATCTATGCTTTGTTTGTGCTT GCTTAACAATTTCTTGTACrAAGTCAGCTGGTGrATGGTTATTTArCAATGCAAACGATG TAATATTTAACTCTTTCATTTGCTCArCAGTCGGAACTATTCTCCCCCAAGCrATATATC TTTGTGCTGTAGGATTTTCTTCTTCCGATTTAATAATATCCATTAGCTGCTGAAGAGTTG GAAGAGATGCATGATCAACATAAACC1-CTAAAGATGGAGCCACTACGTTTAArGTTACTT TTGTTATAIATirTTCACCrTTATTACTAACACCATTAAAATCAAAGCAGTACTTTTCAT CGTCATCTAATCGTGGCGCCACTACAGATAATGATATTGACTCTTTATTTTGrTCTGTTA ATAGTTGTTGCGTACCACAAGTTTGTACCCAAGAGTGTTTTGTAAAAGAGATGTTTGATT GATTAATTGGCTCTAAATTAACATAC1-CCTCATCAATAATAGTTTTATTAATATCATTTT T A A T A A T A G A T T G T G T A T T T T C T T C T G A C A T c ta g tttg tcccc tc tttcC T C G A G G G G G GGCCCGGTACCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTGCGCGCTTGGCGTAATCA TGGTCATAGCTGTTTCCTGrGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGA GCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATT GCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGA ATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTC ACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCG GTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGC CAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGC CCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGA CTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACC CTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCAT AGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTG CACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCC AACCCGGrAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGA GCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACT AGAAGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTT GGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAG CAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGG TCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGrCATGAGATTATCAAAA AGGATCTTCACCTAGATCCTTTTAAArTAAAAArGAAGTTTTAAATCAATCTAAAGTATA TATGAGTAAACTTGGTCTGACAGTTACCAATGCrTAATCAGTGAGGCACCTAlCTCAGCG ATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGrGTAGATAACTACGATA CGGGAGGGCTTACCATCTGGCCCCAGrGCTGCAATGATACCGCGAGACCCACGCTCACCG GCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCT GCAACTTTATCCGCCTCCATCCAGTCrATTAATrGTTGCCGGGAAGCTAGAGTAAGTAGT TCGCCAGTTAATAGTTTGCGCAACGTrGTTGCCATTGCTACAGGCATCGTGGrGTCACGC TCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGA TCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCrTCGGTCCTCCGATCGTTGrCAGAAGT AAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTC ATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAA
rAGTGrATGCGGCGACCGAGTTGC1-CTTGCCCGGCGTCAATACGGGATAATACCGCGCCA CATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCA AGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCT TCAGCATCTTTTACTTTCACCAGCGTITCTGGGrGAGCAAAAACAGGAAGGCAAAATGCC GCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCArACTCTTCCrTTTTCAA TATTArTGAAGCATTTAICAGGGTIArTGTC1-CATGAGCGGATACATATTrGAATGTATT TAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCAC
SEQ ID NO: 10
CTTT attaaacctact ATG
SEQ ID NO: 11
CTTT cttcaacctact ATG
SEQ ID NO: 12
>pEC3'-(T7)GlmS-(T7)NagC-purA_(pG356) TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA CAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTG TTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGC ACCATATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCG CCactagtGTTGAGGAAAACGATTGGCTGAACAAAAAACAGACTGATCGAGGTCATTTTT GAGTGCAAAAAGTGCTGTAACTCTGAAAAAGCGATGGTAGAATCCATTTTTAAGCAAACG GTGATTTTGAAAAATGGGTAACAACGTCGTCGTACTGGGCACCCAATGGGGTGACGAAGG TAAAGGTAAGATCGTCGATCTTCTGACTGAACGGGCTAAATATGTTGTACGCTACCAGGG CGGTCACAACGCAGGCCATACTCTCGTAATCAACGGTGAAAAAACCGTTCTCCATCTTAT TCCATCAGGTATTCTCCGCGAGAATGTAACCAGCATCATCGGTAACGGTGTTGTGCTGTC TCCGGCCGCGCTGATGAAAGAGATGAAAGAACTGGAAGACCGTGGCATCCCCGTTCGTGA GCGTCTGCTGCTGTCTGAAGCATGTCCGCTGATCCTTGATTATCACGTTGCGCTGGATAA CGCGCGTGAGAAAGCGCGTGGCGCGAAAGCGATCGGCACCACCGGTCGTGGTATCGGGCC TGCTTATGAAGATAAAGTAGCACGTCGCGGTCTGCGTGTTGGCGACCTTTTCGACAAAGA AACCTTCGCTGAAAAACTGAAAGAAGTGATGGAATATCACAACTTCCAGTTGGTTAACTA CTACAAAGCTGAAGCGGTTGATTACCAGAAAGTTCTGGATGATACGATGGCTGTTGCCGA CATCCTGACTTCTArGGTGGTTGACGTTTCTGACCTGCTCGACCAGGCGCGTCAGCGTGG CGAXXXCGXCAXGX XXGAAGGXGCGCAGGGXACGCXGC TGGATATCGACCACGGTAC TTA TCCGTACGTAACTTCTTCCAACACCACTGCTGGTGGCGTGGCGACCGGTTCCGGCCTGGG CCCGCGTTATGTTGATTACGTTCTGGGTATCCTCAAAGCTTACTCCACTCGTGTAGGTGC AGGTCCGTTCCCGACCGAACTGTTTGATGAAACTGGCGAGTTCCTCTGCAAGCAGGGTAA CGAATTCGGCGCAACTACGGGGCGTCGTCGTCGTACCGGCTGGCTGGACACCGTTGCCGT TCGTCGTGCGGTACAGCTGAACTCCCTGTCTGGCTTCTGCCTGACTAAACTGGACGTrCT GGATGGCCTGAAAGAGGTIAAACTCTGCGTGGCTTACCGTATGCCGGATGGTCGCGAAGT GACTACCACTCCGCrGGCAGCTGACGACTGGAAAGGTGrAGAGCCGATTTACGAAACCAT GCCGGGCXGGTCTGAATCCACCTrCGGCGTGAAAGATCGTAGCGGCCTGCCGCAGGCGGC GCTGAACTATATCAAGCGTATTGAAGAGCTGACTGGTGTGCCGATCGATATCATCTCTAC CGGTCCGGATCGTACTGAAACCATGATTCTGCGCGACCCGTTCGACGCGTAATTCTGGTA CGCCXGGCAGAXAXXXXGCCXGCCGGGCGAACAGXGXGAXACAXXGCXGXGXCGGGXAAG CCATTACGCTATCCGACACAGTGTTAAATCCTCGCTTTTTTCCTTCCCCagatctGGCGC CATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTA TTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGG TTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGCCAAGCTTACTGCTCACAAGAAA AAAGGCACGTCATCrGACGTGCCTTTTTTATTXGTACTACCCTGTACGATTACTGCAGGT CGACTTAATTTTCCAGCAAATGCTGGAGCAAAATACCGTTGAGCATGGCGCGTTTTACCA GCGCAAAAGCGCCGATTGCCGAGCGGTGATCCAGCTCAGAACGTACCACCGGCAGATXAG TGCGAAACGCCTTCAGCGCCTGGGTATTAATGCAGCTTTCAATAGCAGGGAGCAGCACTT TATCGGCTTCGGTGATTTCACCGGCAATAACAATTTTTTGCGGATTAAATAAGTTGATAG CAATGGCGATGGTTTTACCCAGATGACGACCGACATACTCAATTACTTCCGACGCCAGAC TATCGCCTTTGTTCGCGGCTTTGCAGATAGTTTTGATGGTGCAGTCGTCCAGCGGCACGC GGCTCTGGTAGCCCrGCTTTAACAGATTCAACACCCGTTGTTCAATGGCAGCGTTGGCAG CGATAGTTTCCAGGCAGCCAAAGTTGCCGCAGTGGCAGCGTTCACCCAGCGGTTCGACCT GAATATGGCCAATTrCACCGACGTTGCCGTTGCGGCCAATAAAAATGCGCCCGTTAGAGA TAATCCCGGCCCCGGTTCCGCGATGGACACGCACCAGAATGGAGTCTTCGCAATCCTGAC TTGCACCGAAGTAGrGCTCCGCCAGCGCCAGACXACGGATATCGTGACCAACGAAACAGG TCACXXTAAAACGXXCXXCCAGAGCXTCXACCAGCCCCCAGXXTXCXACCXGAAXATGCG GCAXGXAAXGAAXXXXGCCGCXGXCCGGGXCAACAAGCCCXGGCAGGAXCACCGAAAXCG CGATCAGCTCGCGCAGXTXGCGCXGGIAGCTATCAAXAAACTGAGCAATGGCATXCAACA GGGCAXGXXCCAGCGXXXGCXGGGXACGXXCCGGCAGCGGGXAAXGXXCXXCXGCCAGCA CXXXGCXGCXGAGAXCAAACAGAGXGAXGGXGGCGXCAXGACGACCAAGCCGTACGCCGA XXGCGXGGAAAXXGCGGGX XXCGGXGACGAXGGAGAXAGCGCGGCGGCCCCCGGXGGAGG CCXGCXGAXCAACXXCXXXGAXCAGCCCGCGXXCGAXAAGCXGACGCGXAAXXXXGGXXA CGCXGGCGGGGGCAAGCXGGCXXXGCTCGGCAAXCXGAAXCCGCGAGAXXGGCCCGXACX GGXCAAXCAGGCGAXAAACCGCCGCGCXGXXAAGCXGXXXXACGAGAXCAACAXXACCXA ICIGAGCIXGXCCGCCXGGXGXCAXAIGXAIAXCXCCXXCXXgtcgacXCXAGAXGCAXG CXCGAGAXXACXCAACCGXAACCGAXTXXGCCAGGXXACGCGGCXGGXCAACGXCGGXGC CXXXGAXCAGCGCGACAXGGXAAGCCAGCAGCXGCAGCGGAACGGXGXAGAAGAXCGGXG CAATCACCTCTTCCACATGCGGCATCTCGATGATGTGCATGTTATCGCTACTTACAAAAC CCGCAXCCTGAXCGGCGAAGACAXACAACTGACCGCCACGCGCGCGAACXTCTTCAAXGX XGGAXXXCAGXXXXXCCAGCAAXXCGXXGXXCGGXGCAACAACAAXAACCGGCAXAXCGG CAXCAAXXAGCGCCAGCGGACCGXGXXXCAGXXCGCCAGCAGCGXAGGCXXCAGCGXGAA XGXAAGAGAXCXCXXXCAACXXCAAXGCGCCXXCCAGCGCGAXXGGGXACXGAXCGCCAC GGCCCAGGAACAGCGCGXGAXGXXXGICAGAGAAAXCXXCXGCCAGCGCXXCAAXGCGXX TGXCCXGAGACAGCAXCXGCXCAAXACGGCXCGGCAGCGCCXGCAGACCAXGCACGAXGX CAXGXXCAAXGGAGGCAXCCAGACCXXXCAGGCGAGACAGCXXCGCCACCAGCAXCAACA GCACAGXTAACXGAGXGGXGAAXGCXTXAGTGGAXGCCACGCCGAXXXCXGXACCCGCGX XGGXCAXXAGCGCCAGAXCGGAXXCGCGCACCAGAGAAGAACCCGGAACGXXACAGAXXG CCAGIGAACCAAGGXAACCCAGCICIITCGACAGACGCAGGCCAGCCAGGGTATCCGCGG TTTCGCCAGACTGTGACAAGGTGATCATCAGGCTGTTACGACGCACGGCAGATTTGCGAT AGCGGAATTCAGAGGCGAXXXCGACGTCGCACGGAAXACCXGCTAGCGAITCAAACCAGX AGCGGGAAACCAXACCGGAGXXAXAAGAAGXACCACAGGCGAGGAXCXGAAXAXGCXCAA CCXXCGACAGCAGXXCGXCGGCGXXCGGXCCCAGCXCGCXXAAAXCAACCXGACCGXGGC IGAXGCGTCCGGXAAGGGXGXXXXXGAXCGCGXXCGGCXGXXCGXAGAXCXCTXXCXGCA XGXAGXGACGGXAAAXGCCXXXAXCGCCCGCGXCAXAXXGCAGAXXGGAXXCGAXAXCCX
gacgxxxiacxxccgcgccagxxxxatcgaagaxgxxxaccgaacggcgagxgaxxxccg CAAXAXCGCCCXCXXCAAGGAAGAXAAAGCGACGGGXCACCGGCAACAGCGCCAGCXGGX
CAGAAGCGAXAAAGIIXICGCCCATCCCCAGGCCAAICACCAGCGGACTACCAGAACGIG
CCGCCAGCAGGGTATCCGGGTGACGGGAGTCCATGATCACTGTACCGTACGCACCACGCA
GCTGCGGGATAGCACGCAGAACGGCCTCACGCAGAGTCCCGCCTTGTTTCAGCTCCCAGT
TCACCAGATGGGCAATCACTTCGGTGTCGGTTTCAGAAACGAAGGTATAGCCACGCGCTT
TTAGCTCTTCACGCAGCGGTTCATGGTTTTCGATGATGCCGTTATGCACCACCACAATGT
GTTCAGAAACATGCGGATGCGCATTCACTTCTGAAGGTTCACCGTGGGTCGCCCAGCGAG
TGTGAGCAATACCAGTGCCGCCATGCAGAGGATGTTCTTCCGCTGCCTGTGCCAGCATCT
GGACTTTACCGAGGCGACGCAGGCGGGTCATATGACCTTCTGCATCAACAACGGCCAGAC
CGGCAGAGTCATATCCGCGGTATTCCAGACGACGTAAACCTTCAAGAAGGATTTCTGCTA
CATCACGITGCGCGATCGCGCCAACAATTCCACACAIATGtatatctccttcttgaaTTC
TAACAATTGATTGAATGTATGCAAATAAATGCATACACCATAGGTGTGGTTTAATTTGAT
GCCCTTTTTCAGGGCTGGAATGTGTAAGAGCGGGGTTATTTATGCTGTTGTTTTTTTGTT
ACTCGGGAAGGGCTTTACCTCTTCCGCATAAACGCTTCCATCAGCGTTTATAGTTAAAAA
AATCTTTCGGAACTGGTTTTGCGCTTACCCCAACCAACAGGGGATTTGCTGCTTTCCATT
GAGCCTGTTTCTCTGCGCGACGTTCGCGGCGGCGTGTTTGTGCATCCATCTGGATTCTCC
TGTCAGTTAGCTTTGGTGGTGTGTGGCAGTTGTAGTCCTGAACGAAAACCCCCCGCGATT
GGCACATTGGCAGCTAATCCGGAATCGCACTTACGGCCAATGCTTCGTTTCGTATCACAC
ACCCCAAAGCCTTCTGCTTTGAATGCTGCCCTTCTTCAGGGCTTAATTTTTAAGAGCGTC
ACCIXCAIGGXGGXCAGXGCGXCCIGCXGAXGXGCXCAGXAICACCGCCAGXGGXAIIIA
TGTCAACACCGCCAGAGATAATTTATCACCGCAGATGGTTATCTGTATGTTTTTTATATG
AATTTATTTTTTGCAGGGGGGCATTGTTTGGTAGGTGAGAGATCAATTCTGCATTAATGA
ATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTGCTAGCGGA
GTGTATACTGGCTTACTATGTTGGCACTGATGAGGGTGTCAGTGAAGTGCTTCATGTGGC
AGGAGAAAAAAGGCTGCACCGGTGCGTCAGCAGAATATGTGATACAGGATATATTCCGCT
TCCTCGCTCACTGACTCGCTACGCTCGGTCGTTCGACTGCGGCGAGCGGAAATGGCTTAC
GAACGGGGCGGAGATTTCCTGGAAGATGCCAGGAAGATACTTAACAGGGAAGTGAGAGGG
CCGCGGCAAAGCCGTTTTTCCATAGGCTCCGCCCCCCTGACAAGCATCACGAAATCTGAC
GCTCAAATCAGTGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTG
GCGGCTCCCTCGTGCGCTCTCCTGTTCCTGCCTTTCGGTTTACCGGTGTCATTCCGCTGT
TATGGCCGCGTTTGTCTCATTCCACGCCTGACACTCAGTTCCGGGTAGGCAGTTCGCTCC
AAGCTGGACXGTATGCACGAACCCCCCGTTCAGTCCGACCGCXGCGCCTTATCCGGIAAC
IAXCGXCIXGAGXCCAACCCGGAAAGACAXGCAAAAGCACCACXGGCAGCAGCCACXGGX
AAXIGAXIXAGAGGAGXXAGXCXXGAAGXCAXGCGCCGGXXAAGGCXAAACIGAAAGGAC
AAGXXXXGGXGACXGCGCXCCXCCAAGCCAGXXACCXCGGXTCAAAGAGXXGGXAGCXCA
GAGAACCXTCGAAAAACCGCCCTGCAAGGCGGXXTTXXCGXTTTCAGAGCAAGAGATTAC
GCGCAGACCAAAACGATCTCAAGAAGAXCAXCXTATXAAXCAGATAAAATATTTCXAGGC
ggccgcGAACGAAAACXCACGXXAAGGGAXXXXGGXCAXGAGAXXAXCAAAAAGGAXCXX
CACCXAGAXCCXXXIAAAXXAAAAAXGAAGXXXXAAAXCAAICXAAAGXAXAXAXGAGXA
AACXXGGXCXGACAGXXACCAATGCXTAAXCAGXGAGGCACCXAXCXCAGCGAXCXGTCT
AXXXCGXICAXCCAIAGXXGCCXGACXCCCCGXCGXGXAGAXAACXACGAXACGGGAGGG
CTXACCAXCXGGCCCCAGXGCXGCAAXGAXACCGCGAGACCCACGCXCACCGGCXCCAGA
XXXAXCAGCAAXAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGXGGXCCXGCAACXXI
AXCCGCCICCAXCCAGXCXAXXAAXXGTXGCCGGGAAGCXAGAGXAAGXAGXXCGCCAGI
XAATAGXIXGCGCAACGXXGXXGCCAXXGCXACAGGCAXCGTGGXGXCACGCXCGXCGXT
XGGXAXGGCXXCAXXCAGCXCCGGXXCCCAACGAXCAAGGCGAGXXACAXGAXCCCCCAX
GXXGXGCAAAAAAGCGGIXAGCXCCXICGGXCCICCGAICGXXGXCAGAAGIAAGXXGGC
CGCAGXGIXAXCACTCAXGGXXAXGGCAGCACXGCAXAAXXCXCXXACXGXCAXGCCAXC
CGXAAGAIGCXXXXCXGXGACXGGXGAGXACXCAACCAAGXCAXXCXGAGAATAGXGTAT
GCGGCGACCGAGXXGCXCXXGCCCGGCGXCAAXACGGGAXAAXACCGCGCCACAXAGCAG
AACIXIAAAAGXGCXCAICAXXGGAAAACGXICXICGGGGCGAAAACXCICAAGGAICIX
ACCGCXGIXGAGAXCCAGXXCGAXGXAACCCACXCGXGCACCCAACIGAXCXXCAGCAXC
IXXXACXIXCACCAGCGXXXCXGGGXGAGCAAAAACAGGAAGGCAAAAXGCCGCAAAAAA
GGGAAXAAGGGCGACACGGAAAXGXXGAAXACXCAXACXCXXCCXXXXXCAAXAXXAXXG
AAGCAXXIAXCAGGGXXAXIGXCXCAIGAGCGGAXACAXAXXXGAAIGXAXXXAGAAAAA
IAAACAAAXAGGGGXTCCGCGCACAXXICCCCGAAAAGIGCCACCIGACGXCIAAGAAAC
CAXXAXXAXCAXGACAXXAACCXAIAAAAAXAGGCGXAXCACGAGGCCCXXXCGXC
SEQ ID NO: 13
>neuC_N-acetylglucosam¡ne-6-phosphate-2-ep¡merase_GI_15193223_in_pG317
MKKILFITGSRADYSKIKSLMYRVQNSSEFELYIFATGMHLSKNFGYTVKELYKNGFKNI
YEFINYDKYYQTDKALATTIDGFSRYANELKPDLIWHGDRIEPLAAAIVGALNNILVAH
IEGGEISGTIDDSLRHAISKLAH1HLVNDEFAKRRLMQLGEDEKSIFIIGSPDLELLNDN
KISLSEAKKYYDINYENYALLMFHPVTTEITSIKNQADNLVKALIQSNKNYIVIYPNNDL
GFELILQSYEEFKNNPRFKLFPSLRFEYFITLLKNADFIIGNSSCILKEALYLKTAGILV
GSRQNGRLGNENTLKVNANSDEILKAINT1HKKQDLFSAKLEILDSSKLFFEYLQSGDFF
KLSTQKVFKDIK SEQ ID NO: 14
>neuB_sial¡c_acid_synthase_GI_15193222_¡n_pG317
MKEIKIQNIIISEEKAPLVVPEIGINHNGSLELAKIMVDAAFSAGAKIIKHQTHIVEDEM
SKAAKKVIPGNAKISIYEIMQKCALDYKDELALKEYTEKLGLVYLSTPFSRAGANRLEDM
GVSAFKIGSGECNNYPLIKHIAAFKKPMIVSTGMNSIESIKPTVKILLDNEIPFVLMHTT
NLYPTPHNL\^RLNAMLELKKEFSCMVGLSDHTTDNLACLGAWLGACVLERHFTDSMHRS
GPDIVCSMDTKALKELIIQSEQMAIIRGNNESKKAAKQEQVTIDFAFASWSIKDIKKGE
VLSMDNIWKRPGLGGISAAEFENILGKKALRDIENDAQLSYEDFA SEQ ID NO: 15
>neuA_CMP-Neu5Ac_synthase_GI_15193224_¡n_pG317
MSLAIIPARGGSKGIKNKNLVLLNNKPLIYYTIKAALNAKSISKVWSSDSDEILNYAKS
QNVDILKRPISLAQDDTTSDKVLLHALKFYKDYEDWFLQPTSPLRTN1HINEAFNLYKN
SNANALISVSECDNKILKAFVCNDCGDLAGICNDEYPFMPRQKLPKTYMSNGAIYILKIK
EFLNNPSFLQSKTKHFLMDESSSLDIDCLEDLKKVEQIWKK SEQ ID NO: 16
>AAF42258 lacto-N-neotetraosa biosíntesis de glucisil transferasa LgtA
[Neisseria meningitidis MC58],
MP SEAFRRHRAYRE NKLQP LVSVLICAYNVEKYFAQ SL A A W N Q TWRN LDILIVDDG STD GTLAIAQRFQEQDGRIRILAQPRNSGLIPSLNIGLDELAKSGGGGEYIARTDADDIAAPD WIEKIVGEMEKDRSIIAMGAWLEVLSEEKDGNRLARHHEHGKIWKKPTRHEDIADFFPFG NPIHNNTMIMRRSVIDGGLRYNTERDWAEDYQFWYDVSKLGRLAYYPEALVKYRLHANQV SSKYSIRQHEIAQGIQKTARNDFLQSMGFKTRFDSLEYRQIKAVAYELLEKHLPEEDFER ARRFLYQCFKRTDT LPAGAWLDFAADGRMRRLF TLRQYFGILHRL LKNR SEQ ID NO: 17
>NP_207619 epítopo lipopoligosacárido 5G8 proteína asociada a la biosíntesis Lex2B [Helicobacter pylori 26695],
MRVFAISLNQKVCDTFGLVFRDTTTLLNSINATHHQAQIFDAIYSKTFEGGLHPLVKKHL
HPYFITQNIKDMGITTNLISEVSKFYYALKYHAKFMSLGELGCYASHYSLWEKCIELNEA
ICILEDDITLKEDFKEGLDFLEKHIQELGYIRLMHLLYDASVKSEPLSHKNHEIQERVGI
IKAYSEGVGTQGYVITPKIAKVFLKCSRKWWPVDTIMDATF1HGVKNLVLQPFVIADDE
QISTIARKEEPYSPKIALMRELHFKYLKYWQFV SEQ ID NO: 18
> E.coli_WbgO_YP_003500090 supuesta glucosil transferasa WbgO [cepa de Escherichia coli 055: H7 CB9615], MIIDEAESAESTHPWSVILPVNKKNPFLDEAINSILSQTFSSFEIIIVANCCTDDFYNE LKHKVNDKIKLIRTNIAYLPYSLNKAIDLSNGEFIARMDSDDISHPDRFTKQVDFLKNNP YVDWGTNAIFIDDKGREINKTKLPEENLDIVKNLPYKCCIVHPSVMFRKKVIASIGGYM
FSNYSEDYELWNRLSLAKIKFQNLPEYLFYYRLHEGQSTAKKNLYMVMVNDLVIKMKCFF
LTGNINYLFGGIRTIASFIYCKYIK
SEQ ID NO: 19
>BAA35319 regulador doble transcripcional de unión al ADN nagC [cepa de Escherichia coli K-12 sustr. W3110],
MTPGGQAQIGNVDLVKQLNSAAVYRLIDQYGPISRIQIAEQSQLAPASVTKITRQLIERG
LIKEVDQQASTGGRRAISIVTETRNFHAIGVRLGRHDATITLFDLSSKVLAEEHYPLPER
TQQTLEHALLNAIAQFIDSYQRKLRELIAISVILPGLVDPDSGK1HYMPHIQVENWGLVE
ALEERFKVXCFVGHDIRSLALAEHYFGASQDCEDSILVRVHRGTGAGIISNGRIFIGRNG
NVGEIGHIQVEPLGERCHCGNFGCLETIAANAAIEQRVLNLLKQGYQSRVPLDDCTIKTI
CKAANKGDSLASEVIEYVGRHLGKTIAIAINLFNPQKIVIAGEITEADKVLLPAIESCIN
TQ ALKAFRTNLPW RSELDHRSAIG AFALVKRAM LNG ILLQ HLLEN
SEQ ID NO: 20
>NP_418185 L-glutamina: D-fructosa-6-fosfato aminotransferasa glmS [cepa de Escherichia coli K-12 sustr. MG1655],
MCGIVGAIAQRDVAEILLEGLRRLEYRGYDSAGLAWDAEGHMTRLRRLGKVQMLAQAAE
EHPLHGGTGIAHTRWATHGEPSEVNAHPHVSEHIVWHNGI IENHEPLREELKARGYTFV
SETDTEVIAHLVNWELKQGGTLREAVLRAIPQLRGAYGTVIMDSRHPDTLLAARSGSPLV
IGLGMGENFIASDQLALLPVTRRFIFLEEGDIAEITRRSVNIFDKTGAEVKRQDrESNLQ
YDAGDKGIYRHYMQKEIYEQPNAIKNTLTGRISHGQVDLSELGPNADELLSKVEHIQILA
CGTSYNSGMVSRYWFESLAGIPCDVEIASEFRYRKSAVRRNSLMITLSQSGEIADTLAGL
RLSKELGYLGSLAICNVPGSSLVRESDLALMTNAGTEIGVASTKAFTTQLTVLLMLVAKL
SRLKGLDASIEHDIVHGLQALPSRIEQMLSQDKRIEALAEDFSDKHHALFLGRGDQYPIA
LEGALKLKEISY1HAEAYAAGELKHGPLALIDADMPVIVVAPNNELLEKLKSNIEEVRAR
GGQLYVFADQDAGFVS SDNMHIIEMPHVEEVIAPIFYTVPLQLLAYHVALIKGTDVDQPR
NLAKSVTVE
SEQ ID NO: 21
> BAF92026 beta-galactósido alfa-2,6-sialiltransferasa [Photobacterium sp. JT-ISH-224],
MKNFLLLTLILLTACNNSEENTQSIIKNDINKTIIDEEYVNLEPINQSNISFTKHSWVQT
CGTQQLLTEQNKESISLSWAPRLDDDEKYCFDFNGVSNKGEKYITKVTLNWAPSLEVY
VDHASLPTLQQLMDIIKSEEENPTAQRYIAWGRIVPTDEQMKELNITSFALINNHTPADL
VQEIVKQAQTKHRLNVKLSSNTAHSFDNLVPILKELNSFNNVTVTNIDLYDDGSAEYVm
YNWRDTLNKTDNLKIGKDYLEDVINGINEDTSNTGTSSVYNWQKLYPANYHFLRKDYLTL
EPSLHELRDYIGDSLKQMQWDGFKKFNSKQQELFLSIVNFDKQKLQNEYNSSNLPNFVFT
GTTVWAGNHEREYYAKQQINVINNAINESSPHYLGNSYDLFFKGHPGGGIINILIMQNYP
SMVDIPSKISFEVLMMTDMLPDAVAGIASSLYFTIPAEKIKFIVFTSTETITDRETALRS
PLVQVMIKLGIVKEENVLFWADLPNCETGVCIAV
A continuación, se proporciona la secuencia de ADN en formato Genbank de la nueva configuración de genes diseñados en el locus thyA de Escherichia coli en cepas utilizadas para producir oligosacáridos que contienen N-acetilglucosamina.
LOCUS E680_thyA::2.8RBS_lacZ 5877 bp ADN lineal BCT 04 MAR. 2013 DEFINICIÓN cepa de Escherichia coli K-12 sustr. MG1655, genoma completo.
REGISTRO NC_000913
VERSIÓN NC_000913.2 GI: 49175990
PALABRAS CLAVE FUENTE cepa de Escherichia coli K-12 sustr. MG1655 (desconocido)
ORGANISMO cepa de Escherichia coli K-12 sustr. MG1655
Bacterias; Proteobacterias; Gammaproteobacterias; Enterobacteriales; Enterobacteriaceae; Escherichia.
REFERENCIA 1 (bases 1 a 4639675)
AUTORES Riley, M., Abe, T., Arnaud, MB, Berlyn, MK, Blattner, FR, Chaudhuri, RR,
Glasner, JD, Horiuchi, T., Keseler, IM, Kosuge, T., Mori, H., Perna, NT, Plunkett, G. III, Rudd, K.E., Serres, M.H., Thomas, G.H., Thomson, N.R., Wishart, D. y Wanner, B.L.
TITULO Escherichia coli K-12: a cooperatively developed annotation snapshot--2005 REVISTA Nucleic Acids Res. 34 (1), 1-9 (2006)
PUBMED 16397293
OBSERVACIÓN Estado de la publicación: solo en línea
REFERENCIA 2 (bases 1 a 4639675)
AUTORES Blattner, FR, Plunkett, G. III, Bloch, CA, Perna, NT, Burland, V., Riley, M.,
Collado-Vides, J., Glasner, JD, Rode, CK, Mayhew, GF, Gregor, J., Davis, NW, Kirkpatrick, HA, Goeden, MA, Rose, DJ, Mau, B. y Shao, Y.
TITULO The complete genome sequence of Escherichia coli K-12
REVISTA Science 277 (5331), 1453-1474 (1997)
PUBMED 9278503
REFERENCIA 3 (bases 1 a 4639675)
AUTORES Arnaud, M., Berlyn, MKB, Blattner, FR, Galperin, MY, Glasner, JD, Horiuchi, T.,
Kosuge, T., Mori, H., Perna, NT, Plunkett, G. III, Riley, M., Rudd, K.E., Serres, M.H., Thomas, G.H. y Wanner, B.L.
TITULO Workshop on Annotation of Escherichia coli K-12
REVISTA Sin publicar
OBSERVACIÓN Woods Hole, Massachusetts, el 14-18 Noviembre de 2003 (correcciones de secuencia)
REFERENCIA 4 (bases 1 a 4639675)
AUTORES Glasner, JD, Perna, NT, Plunkett, G. III, Anderson, B.D., Bockhorst, J., Hu, J.C.,
Riley, M., Rudd, K.E. y Serres, M.H.
TITULO ASAP: Escherichia coli K-12 strain MG1655 version m56
REVISTA Sin publicar
OBSERVACIÓN ASAP: Escherichia coli K-12 strain MG1655 version m56
REFERENCIA 5 (bases 1 a 4639675)
AUTORES Hayashi, K., Morooka, N., Mori, H. y Horiuchi, T.
TITULO A more accurate sequence comparison between genomes of Escherichia coli K12 W3110 and MG1655 strains
REVISTA Sin publicar
OBSERVACIÓN accesiones GenBank AG613214 a AG613378 (correcciones de secuencia) REFERENCIA 6 (bases 1 a 4639675)
AUTORES Perna, N. T.
TITULO Escherichia coli K-12 MG1655 yqiK-rfaE intergenic region, genomic sequence correction
REVISIÓN Sin publicar
OBSERVACIÓN accesión GenBank AY605712 (correcciones de secuencia)
REFERENCIA 7 (bases 1 a 4639675)
AUTORES Rudd, KE
TITULO A manual approach to accurate translation start site annotation: ab E. coli K-12 case study
REVISTA Sin publicar
REFERENCIA 8 (bases 1 a 4639675)
CONSORCIO Proyecto de genoma NCBI
TITULO Presentación directa
REVISTA Enviado (04-MAR-2013) National Center for Biotechnology Information, NIH,
Bethesda, MD 20894, EE.UU.
REFERENCIA 9 (bases 1 a 4639675)
AUTORES Rudd, K.E.
TITULO Presentación directa
REVISTA Enviado (06-FEB-2013) Departamento de Bioquímica y Biología Molecular,
Universidad de Miami Miller School of Medicine, 118 Gautier Bldg., Miami, FL 33136, EE.UU.
OBSERVACIÓN Actualización de la secuencia por el remitente
REFERENCIA 10 (bases 1 a 4639675)
AUTORES Rudd, KE
TITULO Presentación directa
REVISTA Enviado (24-ABR-2007) Departamento de Bioquímica y Biología Molecular,
Universidad de Miami Miller School of Medicine, 118 Gautier Bldg., Miami, FL 33136, EE.UU.
(continuación)
OBSERVACIÓN Actualización de anotación de ecogene.org como una colaboración de base de datos múltiple
REFERENCIA 11 (bases 1 a 4639675)
AUTORES Plunkett, G. III.
TÍTULO Presentación directa
REVISTA Presentado (07-FEB-2006) Laboratorio de Genética, Universidad de Wisconsin,
425G Henry Mall, Madison, WI 53706-1580, EE.UU.
OBSERVACIÓN Actualizaciones de proteínas por el remitente
REFERENCIA 12 (bases 1 a 4639675)
AUTORES Plunkett, G. III.
TÍTULO Presentación directa
REVISTA Presentado (10-JUN-2004) Laboratorio de Genética, Universidad de Wisconsin,
425G Henry Mall, Madison, WI 53706-1580, EE.UU.
OBSERVACIÓN Actualización de secuencia por el remitente
REFERENCIA 13 (bases 1 a 4639675)
AUTORES Plunkett, G. III.
TÍTULO Presentación directa
REVISTA Presentado (13-OCT-1998) Laboratorio de Genética, Universidad de Wisconsin,
425G Henry Mall, Madison, WI 53706-1580, EE. UU.
REFERENCIA 14 (bases 1 a 4639675)
AUTORES Blattner, F.R. y Plunkett, G. III.
TÍTULO Presentación directa
REVISTA Presentado (02-SEP-1997) Laboratorio de Genética, Universidad de Wisconsin,
425G Henry Mall, Madison, WI 53706-1580, EE. UU.
REFERENCIA 15 (bases 1 a 4639675)
AUTORES Blattner, FR y Plunkett, G. III.
TÍTULO Presentación directa
REVISTA Presentado (16-JAN-1997) Laboratorio de Genética, Universidad de Wisconsin,
425G Henry Mall, Madison, WI 53706-1580, EE. UU.
COMENTARIO REFSEQ PROVISIONAL: Este registro aún no ha sido objeto de revisión final del NCBI. La secuencia de referencia es idéntica a U00096. El 24 de junio de 2004, esta versión de secuencia reemplazó gi: 16127994. Las actualizaciones de anotación actuales de U00096 proceden de EcoGene http://ecogene.org. Las sugerencias de las actualizaciones se pueden enviar al Dr. Kenneth Rudd (krudd@miami.edu). Estas actualizaciones se están generando a partir de una colaboración que también incluye ASAP/ERIC, el Coli Genetic Stock Center, EcoliHub, EcoCyc, RegulonDB y UniProtKB/Swiss-Prot.
COMPLETO: longitud completa.
CARACTERISTICAS Ubicación/Calificadores
Gen complemento (<1..245)
/gen = "ppdA"
/locus_tag = "b2826"
/gene_synonym = "ECK2822; JW2794"
/db_xref = "EcoGene: EG12081"
/db_xref = "GeneID: 945393"
CDS complemento (<1..245)
/gen = "ppdA"
/locus_tag = "b2826"
/gene_synonym = "ECK2822; JW2794"
/function = "enzima putativa; No clasificado"
/GO_component = "GO: 0009289 - pilus"
/GO_process = "GO: 0009101 - proceso biosintético de glicoproteína" /nota= "proteína A dependiente de la peptidasa prepilina"
/codon_start = 1
/transl_table = 11
/product = "proteína hipotética"
/protein_id = "NP 417303.1"
/db_xref = "GI: 16130730"
/db_xref = "ASAP: ABE-0009266"
/db_xref = "UniProtKB/Swiss: P33554"
/db_xref = "EcoGene: EG12081"
/db_xref = "GeneID: 945393"
Figure imgf000043_0001
fuente enlace (<1..449,4852.. >5877)
/organismo= "cepa de Escherichia coli K-12 sustr. MG1655"
/mol_type = "ADN genómico"
/cepa = "K-12 "
/sub_strain = "MG1655"
/db_xref = "taxón: 511145"
cebador 346.. 366
/nota = cagtcagtcaggcgccTTCGGGAAGGCGTCTCGAAGA (SEQ ID NO: 23) /marcador = 0268-THYA-R
característica mixta complemento (388..394)
/feature_type = "Bucle de horquilla"
/marcador = Terminador
cebador 400.. 449
/nota =GGCGTCGGCTCrGGCAGGATGTTTCGTAATTAGATAGCCACCGGCGCTTTag GaaacctactATGACCATGATTACGGATTCAC (SEQ IDNO: 24) /marcador="homología del cebador 50 pb thyA 3"
cebador 400..483
/nota -GGCGTCGGC1-CTGGCAGGATGTITCGTAATTAGATAGCCACCGGCGCTTrat taaacctactATGACCATGATTACGGATTCAC (SEQ ID NO: 25) /marcador=1389-thtAKANlacZ-R-2-8
cebador 400..483
Figure imgf000043_0002
/marcador=1516-thyAKANlacZ-R-0-8
cebador 400..483
/ nota=GGCGTCGGCTCTGGCAGGATGTITCGTAATTAGATAGCCACCGGCGCTTTag GaaacctactATGACCATGATTACGGAirCAC (SEQ IDNO: 27)
/marcador="1041-thyAKANlacZ-R (4-8)"
característica mixta complemento(401..407)
/feature_type="Bucle de horquilla "
/marcador=Terminador
Cebador 405..472
/nota =CGGCTCTGGCAGGATGTTTCGTAATTAGATAGCCACCGGCGCTTTaTTaaac (SEQ IDNO: 28)
ctactAIGACCATGAI
/marcador = 1394-2/8-F
gen complemento (unión (429..449,4852..4854))
/gen = "ThyA"
CDS complemento (unión (429..449,4852..4854))
/gen = "thyA"
/nota = "ECK2823: JW2795: b2827"
/codon_start = 1
/transl_table = 11
/product = "timidilato sintetasa"
/protein_id = "BAE76896.1"
/db xref = "GI: 85675643"
/ traducción ="mkqylelmqkvldegtqkn dr tgtgt ls ifg hqmrfnlqdgfp l
VTTKRCHLRSI1HELLWFLQGDTHIAYLHENNVTIWDEWADEHGDLGPVYGKQWRAWP
TPDGRHIDQITTVLNQLKNDPDSRRIIV.SAWNVGELDKMALAPCHAFFQFYVADGKLS
CQLYQRSCDVFLGLPFNIASYALLVHMMAQQCDLEVGDFVWTGGDTHLYSNHMDQTHL QLSREPRPLPKLIIKRKPESIFDYRFEDFEIEGYDPHPGIKAPVAI" (SEQ ID NOr 43)
RBS 450.. 461
/marcador ="2.8 RBS"
fuente 450.. 3536
/organismo =" Escherichia coli W3110"
"/mol_type = "ADN genómico"
/cepa = "K-12"
/sub_strain = "W3110"
/db_xref = "taxón: 316407"
/nota= "sinónimo: cepa de Escherichia coli K12 substr. W3110" misc_feature 450.. 4851
/feature_type = Inserción
/nota = "se origina a partir de KanR-lacZRBS (E403)" /marcador = Insertar
misc_feature 449M50
/feature type = "sitio de variación de RBS"
/marcador = "C en 0/8"
misc_feature 450.. 453
/feature_type = "sitio de variación de RBS"
/marcador = "CTTC en 0/8"
misc_feature 451.. 452
/feature_type = "sitio de variación de RBS"
/marcador = "GG en 4/8"
misc_feature 451.. 452
/feature_type = "sitio de variación de RBS"
/marcador = "TT en 2/8"
CDS 462.. 3536
/gen = "lacZ"
/nota = "ECK0341: JW0335: b0344"
/codon_start = 1
/transl_table = 11
/producto = "beta-D-galactosidasa"
/protein_id= "BAE76126.1"
/db xref = "GI: 85674486"
Figure imgf000045_0001

Figure imgf000046_0001

/ traducción ="mieqdgl hagspaawverl fgydwaqqtigc sdaavfr ls aqgr
PVLFVKTDLSGALNELQDEAARLSWLATTGVPCAAVLDWTEAGRDWLLLGEVPGQDL
LSSHLAPAEKVSIMADAMRRLHTLDPATCPFDHQAKHRIERARTRMEAGLVDQDDLDE
EHQGLAPAELFARLKARMPDGEDLWTHGDACGPNIMVENGRFSGFIDCGRLGVADRY QDTALATRDIAEELGGEWADRFLVLYGIAAPDSQRIAFYRLLDEFF" {SEQ ID NO: 30)
cebador complemento (3677..3696)
/marcador = "0389 KD13 K4"
unión de cebador 3791.. 3810
/marcador = "sitio de cebado común kt"
cebador 3791.. 3810
/marcador = "cebador 0344 Wanner Kt"
mutación 3811
/marcador = "A en wt (cambio silencioso)"
cebador complemento (4242..4261)
/marcador = "cebador 0343 Wanner K2"
unión de cebador 4261.. 4280
/marcador = "sitio de cebado común k2"
unión de cebador 4352.. 4371
/marcador = "sitio de cebado común k1"
cebador 4352.. 4371
/marcador = "cebador 0342 Wanner K1"
unidad de repetición 4790.. 4801
/marcador = "sitio FLP"
marca complemento (4790..4851)
/marcador = "marca ascendente KD13"
misc_feature complemento (4790..4823)
/feature type = "sitio FRT"
/marcador = "sitio FRT de 34 pb"
unidad de repetición complemento (4812..4823)
/marcador = "sitio Flp"
cebador complemento (4832..4851)
/marcador = "0338 P4w-P1 b"
cebador complemento (4832..4901)
Figure imgf000047_0001
/marcador=1040-thyAKANlacZ-F
sitio complemento (4858..4863)
/site_type = "sitio de enlace"
/marcador = "thyA RBS"
gen complemento (4861..5736)
/gen = "lgt"
CDS complemento (4861..5736)
/gen = "lgt"
/nota= "ECK2824: JW2796: b2828"
/codon_start = 1
/transl_table = 11
/product = "fosfatidilglicerol-prolipoproteína diacilgliceril transferasa" /protein_id="BAE76897.1"
/db xref = "GI: 85675644"
/ traducción^ ''missylhfpefdpv if sig pval hwyglmylvgfif amwlatr r
ANRPGSGWTKNEVENLLYAGFLGVFLGGRIGYVLFYNFPQFMADPLYLFRVWDGGMSF
HGGLIGVIWMIIFARRTKRSFFQVSDFIAPLIPFGLGAGRLGNFIMGELWGRVDPNF
PFAÍ-ILFPGSRTEDILLLQTNPQWQSIFDrYGVLPRHPSQLYELLLEGVVLFIILNLYI
RKPRPMGAVSGLFLIGYSAFR11VEFFRQPDAQFTGAWVQYISMGQILSIPMIVAGVI
MMVWAYRRSPQQHVS" (SEQ ID NO; 32)
promotor complemento (4957..4962)
/marcador = "thyA WEAK -10"
promotor complemento (4978..4983)
/marcador = "thyA -35"
cebador complemento (5076..5099)
/nota =cagtcagtcaggcgccTCCTCAACCTGTATATTCGTAYAC (SEQ
ID NO: 33)
/marcador = 0267-THYA-F
Sitio complemento (5739..5744)
/site type = "sitio de enlace"
/marcador = "Igt RBS"
promotor complemento (5823..5828)
/marcador = "Igt -10 (fuerte)"
ORIGEN
1 GCAGCGGAAC TCACAAGGCA CCATAACGTC CCCTCCCTGA TAACGCTGAT ACTGTGGXCG 61 CGGTTATGCC AGTTGGCATC TTCACGTAAA TAGAGCAAAT AGTCCCGCGC CTGGCTGGCG 121 GTITGCCATA GCCGTTGCGA CTGCTGCCAG TATTGCCAGC CATAGAGTCC ACTTGCGCTT 181 AGCATGACCA AAATCAGCAT CGCGACCAGC GTTICAATCA GCGTATAACC ACGTTGIGTT 241 TTCATGCCGG CAGTATGGAG CGAGGAGAAA AAAAGACGAG GGCCAGXTTC IA X IX C IIC G 301 GCGCAICXXC CGGACXAIIX ACGCCGXXGC AGGACGXXGC AAAAIXICGG GAAGGCGICX 361 CGAAGAAXIX AACGGAGGGT AAAAAAACCG ACGCACACIG GCGXCGGCXC IGGCAGGAIG 421 XXXCGTAAXX AGAXAGCCAC CGGCGCXXXa t t a a a c c ta c tAXGACCAXG AXXACGGAXX 481 CACTGGCCGT CGTTTTACAA CGTCGTGACT GGGAAAACCC TGGCGTIACC CAACTTAATC 41 GCCIXGCAGC ACAXCCCCCX IXCGCCAGCX GGCGXAAXAG CGAAGAGGCC CGCACCGAXC 601 GCCCXXCCCA ACAGXTGCGC AGCCTGAAXG GCGAAXGGCG CTXXGCCXGG XXXCCGGCAC 661 CAGAAGCGGX GCCGGAAAGC XGGCXGGAGX GCGAXCXXCC XGAGGCCGAX ACXGXCGICG 721 ICCCCXCAAA CXGGCAGAXG CACGGXXACG AIGCGCCCAX CTACACCAAC GTGACCXAIC
781 CCATTACGGT CAATCCGCCG TTTGTTCCCA CGGAGAATCC GACGGGTTGT TACTCGCTCA
841 CATTTAATGT TGATGAAAGC TGGCTACAGG AAGGCCAGAC GCGAATTATT TTTGATGGCG
901 TTAACTCGGC GTTTCATCTG TGGTGCAACG GGCGCTGGGT CGGTTACGGC CAGGACAGTC
961 GTTTGCCGTC TGAATTTGAC CTGAGCGCAT TTTTACGCGC CGGAGAAAAC CGCCTCGCGG
1021 TGATGGTGCT GCGCTGGAGT GACGGCAGTT ATCTGGAAGA TCAGGATATG TGGCGGATGA
1081 GCGGCATTTT CCGTGACGTC TCGTTGCTGC ATAAACCGAC TACACAAATC AGCGATTTCC
1141 ATGTTGCCAC TCGCTTTAAT GATGATTTCA GCCGCGCTGT ACTGGAGGCT GAAGTTCAGA
1201 TGTGCGGCGA GTTGCGTGAC TACCTACGGG TAACAGTTXC TTTATGGCAG GGTGAAACGC
1261 AGGTCGCCAG CGGCACCGCG CCTTTCGGCG GTGAAATTAT CGAIGAGCGT GGTGGTTATG
1321 CCGATCGCGT CACACTACGT CXGAACGXCG AAAACCCGAA ACTGTGGAGC GCCGAAATCC
1381 CGAATCTCTA XCGTGCGGTG GTTGAACTGC ACACCGCCGA CGGCACGCXG AXTGAAGCAG
1441 AAGCCTGCGA TGTCGGTTTC CGCGAGGTGC GGATTGAAAA TGGTCTGCTG CTGCTGAACG
1501 GCAAGCCGXX GCTGAXXCGA GGCGXXAACC GXCACGAGCA TCAXCCXCXG CAXGGTCAGG
1561 XCAXGGAXGA GCAGACGAXG GXGCAGGAXA XCCXGCXGAX GAAGCAGAAC AACXXXAACG
1621 CCGXGCGCTG XXCGCAITAT CCGAACCATC CGCTGXGGXA CACGCXGTGC GACCGCXACG
1681 GCCXGXAXGT GGXGGAXGAA GCCAAXAXXG AAACCCACGG CAXGGXGCCA ATGAAXCGXC
1741 XGACCGAXGA XCCGCGCXGG CXACCGGCGA XGAGCGAACG CGXAACGCGA ATGGXGCAGC
1801 GCGAXCGXAA XCACCCGAGX GXGAXCATCX GGXCGCXGGG GAAXGAAXCA GGCCACGGCG
1861 CXAAXCACGA CGCGCXGIAX CGCTGGAXCA AAXCTGICGA XCCXXCCCGC CCGGXGCAGX
1921 AXGAAGGCGG CGGAGCCGAC ACCACGGCCA CCGAXAXTAX TXGCCCGAXG XACGCGCGCG 1981 XGGAXGAAGA CCAGCCCXXC CCGGCXGTGC CGAAAXGGTC CAXCAAAAAA XGGCTTXCGC 2041 TACCXGGAGA GACGCGCCCG CTGATCCTXX GCGAAXACGC CCACGCGAXG GGTAACAGXC 2101 XXGGCGGXXX CGCTAAAXAC XGGCAGGCGX XXCGXCAGTA TCCCCGXXXA CAGGGCGGCX 2161 XCGXCXGGGA CXGGGXGGAX CAGXCGCTGA XXAAAXAXGA TGAAAACGGC AACCCGXGGX 2221 CGGCXXACGG CGGTGAXXXT GGCGATACGC CGAACGATCG CCAGTTCTGX AXGAACGGXC 2281 XGGXCXXXGC CGACCGCACG CCGCAXCCAG CGCXGACGGA AGCAAAACAC CAGCAGCAGX 2341 XXXXCCAGXX CCGTXXAXCC GGGCAAACCA XCGAAGXGAC CAGCGAAXAC CXGXTCCGXC 2401 AXAGCGAXAA CGAGCXCCXG CACXGGATGG XGGCGCXGGA TGGXAAGCCG CXGGCAAGCG 2461 GXGAAGXGCC XCTGGAXGXC GCTCCACAAG GXAAACAGTX GAXIGAACXG CCXGAACXAC 2521 CGCAGCCGGA GAGCGCCGGG CAACXCTGGC XCACAGXACG CGXAGXGCAA CCGAACGCGA 2581 CCGCAXGGXC AGAAGCCGGG CACAXCAGCG CCXGGCAGCA GXGGCGXCXG GCGGAAAACC 2641 XCAGXGXGAC GCTCCCCGCC GCGXCCCACG CCAXCCCGCA TCXGACCACC AGCGAAAXGG 2701 ATITXXGCAI CGAGCXGGGX AATAAGCGTT GGCAATXXAA CCGCCAGXCA GGCTTXCTXX 2761 CACAGAXGXG GATTGGCGAX AAAAAACAAC XGtXGACGCC GCXGCGCGAX CAGXTCACCC 2821 GTGCACCGCT GGATAACGAC AXTGGCGTAA GTGAAGCGAC CCGCATXGAC CCTAACGCCT 2881 GGGXCGAACG CXGGAAGGCG GCGGGCCAXX ACCAGGCCGA AGCAGCGXXG XXGCAGXGCA 2941 CGGCAGAXAC ACTTGCXGAX GCGGXGCTGA XXACGACCGC TCACGCGXGG CAGCATCAGG 3001 GGAAAACCXX AXXTATCAGC CGGAAAACCX ACCGGAXXGA TGGXAGIGGX CAAATGGCGA 3061 XXACCGXXGA XGXTGAAGXG GCGAGCGAXA CACCGCATCC GGCGCGGATX GGCCTGAACT 3121 GCCAGCXGGC GCAGGXAGCA GAGCGGGTAA ACXGGCXCGG AXXAGGGCCG CAAGAAAACX 3181 AXCCCGACCG CCXTACXGCC GCCXGITTXG ACCGCXGGGA TCXGCCAXXG XCAGACAXGX 3241 AXACCCCGXA CGTCXXCCCG AGCGAAAACG GXCXGCGCXG CGGGACGCGC GAAXTGAAXX 3301 AXGGCCCACA CCAGXGGCGC GGCGACXXCC AGXXCAACAX CAGCCGCXAC AGXCAACAGC 3361 AACXGAXGGA AACCAGCCAX CGCCAXCXGC XGCACGCGGA AGAAGGCACA TGGCXGAAXA 3421 XCGACGGXXX CCAXAXGGGG AXXGGXGGCG ACGACXCCXG GAGCCCGXCA GXAXCGGCGG 3481 AAXXCCAGCX GAGCGCCGGX CGCXACCAXX ACCAGXXGGX CXGGXGXCAA AAAXAAGCGG 3541 CCGCtXXAXG XAGGCXGGAG CXGCXXCGAA GXXCCXAXAC XXXCXAGAGA AXAGGAACXX 3601 CGGAAXAGGA ACTTCAAGAI CCCCXXATXA GAAGAACICG TCAAGAAGGC GAXAGAAGGC 3661 GAIGCGCXGC GAAXCGGGAG CGGCGAIACC GXAAAGCACG AGGAAGCGGX CAGCCCAXXC 3721 GCCGCCAAGC XCXXCAGCAA XAXCACGGGX AGCCAACGCX AXGXCCXGAX AGCGGXCCGC 3781 CACACCCAGC CGGCCACAGX CGAXGAAXCC tGAAAAGCGG CCAXXXXCCA CCAXGAXAXX 3841 CGGCAAGCAG GCATCGCCAX GGGXCACGAC GAGAXCCXCG CCGICGGGCA XGCGCGCCXX 3901 GAGCCXGGCG AACAGXXCGG CXGGCGCGAG CCCCXGAXGC XCXXCGXCCA GAXCAXCCXG 3961 AXCGACAAGA CCGGCXXCCA XCCGAGIACG XGCXCGCXCG AXGCGAXGXX XCGCXXGGIG 4021 GXCGAAXGGG CAGGXAGCCG GAXCAAGCGX AXGCAGCCGC CGCAXXGCAX CAGCCAXGAX 4081 GGAXACXXXC XCGGCAGGAG CAAGGXGAGA XGACAGGAGA XCCXGCCCCG GCACXXCGCC 4141 CAAXAGCAGC CAGICCCXXC CCGCXXCAGX GACAACGXCG AGCACAGCXG CGCAAGGAAC 4201 GCCCGXCGXG GCCAGCCACG AXAGCCGCGC XGCCXCGXCC TGCAGXXCAX TCAGGGCACC 4261 GGACAGGXCG GXCXXGACAA AAAGAACCGG GCGCCCCXGC GCXGACAGCC GGAACACGGC
4321 GGCAXCAGAG CAGCCGAXXG XCIGXXGXGC CCAGXCAXAG CCGAAXAGCC XCXCCACCCA
4381 AGCGGCCGGA GAACCXGCGX GCAAXCCAXC XXGXXCAAXC AXGCGAAACG AXCCXCAXCC 4441 TGTCTCTTGA TCAGATCTTG ATCCCCTGCG CCATCAGATC CTTGGCGGCA AGAAAGCCAT 4501 CCAGTTTACT TTGCAGGGCT TCCCAACCTT ACCAGAGGGC GCCCCAGCTG GCAATTCCGG 4561 TTCGCTTGCT GTCCATAAAA CCGCCCAGTC TAGCTATCGC CATGTAAGCC CACTGCAAGC 4621 TACCTGCTTT CTCTTTGCGC TTGCGTTTTC CCTTGTCCAG ATAGCCCAGT AGCTGACATT 4681 CATCCGGGGT CAGCACCGTT TCTGCGGACT GGCTTTCTAC GTGTTCCGCT TCCTTTAGCA 4741 GCCCTTGCGC CCTGAGTGCT TGCGGCAGCG TGAGCTTCAA AAGCGCTCTG AAGTTCCTAT 4801 ACTTTCTAGA GAATAGGAAC TTCGAACTGC AGGTCGACGG ATCCCCGGAA TCATGGTTCC 4861 TCAGGAAACG TGTTGCTGTG GGCTGCGACG ATATGCCCAG ACCATCATGA TCACACCCGC 4921 GACAATCATC GGGATGGAAA GAATTTGCCC CATGCTGATG TACTGCACCC AGGCACCGGT 4981 AAACTGCGCG TCGGGCTGGC GGAAAAACTC AACAATGATG CGAAACGCGC CGTAACCAAT 5041 CAGGAACAAA CCTGAGACAG CTCCCATTGG GCGTGGTTTA CGAATATACA GGTTGAGGAT 5101 AATAAACAGC ACCACACCTT CCAGCAGCAG CTCGTAAAGC TGTGATGGGT GGCGCGGCAG 5161 CACACCGTAA GTGTCGAAAA TGGATTGCCA CTGCGGGTTG GTTTGCAGCA GCAAAATATC 5221 TTCTGTACGG GAGCCAGGGA ACAGCATGGC AAACGGGAAG TTCGGGTCAA CGCGGCCCCA 5281 CAATTCACCG TTAATAAAGT TGCCCAGACG CCCGGCACCA AGACCAAACG GAATGAGTGG 5341 TGCGATAAAA TCAGAGACCT GGAAGAAGGA ACGTTTAGTA CGGCGGGCGA AGATAATCAT 5401 CACCACGATA ACGCCAAXCA GGCCGCCGTG GAAAGACATG CCGCCGTCCC AGACACGGAA 5461 CAGATACAGC GGATCGGCCA TAAACTGCGG GAAATTGTAG AACAGAACAT AACCAATACG 5521 TCCCCCGAGG AAGACGCCGA GGAAGCCCGC ATAGAGTAAG ITTTCAACTT CATTTTTGGT 5581 CCAGCCGCTG CCCGGACGAT TCGCCCGTCG TGTTGCCAGC CACATTGCAA AAATGAAACC 5641 CACCAGATAC ATCAGGCCGT ACCAGTGAAG CGCCACGGGT CCTATTGAGA AAATGACCGG 5701 ATCAAACTCC GGAAAATGCA GATAGCTACT GGTCATCTGT CACCACAAGT TCTTGTTATT 5761 TCGCTGAAAG AGAACAGCGA TTGAAATGCG CGCCGCAGGT TTCAGGCGCT CCAAAGGTGC 5821 GAATAATAGC ACAAGGGGAC CTGGCTGGTT GCCGGATACC GTTAAAAGAT ATGTATA
(SEQ ID NO: 34)
A continuación se proporciona la secuencia de ADN en formato Genbank de la configuración de genes en el locus nan de Escherichia coli, y los detalles de los criterios de valoración de la deleción encontrados en las cepas diseñadas por ingeniería genética E1017 y E1018.
LOCUS W3110_nanRATEKyhcH_región 5861 pb ADN lineal BCT 19FEB. 2009 DEFINICIÓN cepa de Escherichia coli K-12 sustr. W3110 cepa K-12.
REGISTRO AC 000091
VERSIÓN AC_000091.1 GI: 89106884
PALABRAS CLAVE FUENTE cepa de Escherichia coli K-12 sustr. W3110 (desconocido)
ORGANISMO cepa de Escherichia coli K-12 sustr. W3110
Bacterias; Proteobacterias; Gammaproteobacterias; Enterobacteriales; Enterobacteriaceae; Escherichia.
REFERENCIA 1
AUTORES Riley, M., Abe, T., Arnaud, MB, Berlyn, MK, Blattner, FR, Chaudhuri, RR,
Glasner, JD, Horiuchi, T., Keseler, IM, Kosuge, T., Mori, H., Perna, NT, Plunkett, G. III, Rudd, K.E., Serres, M.H., Thomas, G.H., Thomson, N.R., Wishart, D. y Wanner, B.L.
TÍTULO Escherichia coli K-12: a cooperatively developed annotation snapshot--2005
REVISTA Nucleic Acids Res. 34 (1), 1-9 (2006)
PUBMED 16397293
OBSERVACIÓN Estado de la publicación: solo en línea
REFERENCIA 2 (bases 1 a 4646332)
AUTORES Hayashi, K., Morooka, N., Yamamoto, Y., Fujita, K., Isono, K., Choi, S., Ohtsubo,
E., Baba, T., Wanner, BL, Mori, H. y Horiuchi, T.
TÍTULO Highly accurate genome sequences of Escherichia coli K-12 strains MG1655 and W3110
REVISTA Mol. Syst. Biol. 2, 2006 (2006)
PUBMED 16738553
REFERENCIA 3
(continuación)
AUTORES Yamamoto, Y., Aiba, H., Baba, T., Hayashi, K., Inada, T., Isono, K., Itoh, T.,
Kimura, S., Kitagawa, M., Makino, K., Miki, T., Mitsuhashi, N., Mizobuchi, K., Mori, H., Nakade, S., Nakamura, Y., Nashimoto, H., Oshima, T., Oyama, S., Saito, N., Sampei, G., Satoh, Y., Sivasundaram, S., Tagami, H., Takahashi, H., Takeda, J., Takemoto, K., Uehara, K., Wada, C., Yamagata, S. y Horiuchi, T. TITULO Construction of a contiguous 874-kb sequence of the Escherichia coli -K12 genome corresponding to 50.0-68.8 min on the linkage map and analysis of its sequence features
REVISTA DNA Res. 4 (2), 91-113 (1997)
PUBMED 9205837
REFERENCIA 4
AUTORES Itoh, T., Aiba, H., Baba, T., Hayashi, K., Inada, T., Isono, K., Kasai, H., Kimura,
S. , Kitakawa, M., Kitagawa, M., Makino, K., Miki, T., Mizobuchi, K., Mori, H., Mori, T. , Motomura, K., Nakade, S., Nakamura, Y., Nashimoto, H., Nishio, Y., Oshima, T., Saito, N., Sampei, G., Seki, Y., Sivasundaram, S., Tagami, H., Takeda, J., Takemoto, K., Wada, C., Yamamoto, Y. y Horiuchi, T.
TITULO A 460-kb DNA sequence of the Escherichia coli K-12 genome corresponding to the 40.1-50.0 min region on the linkage map
REVISTA DNA Res. 3 (6), 379-392 (1996)
PUBMED 9097040
REFERENCIA 5
AUTORES Aiba, H., Baba, T., Hayashi, K., Inada, T., Isono, K., Itoh, T., Kasai, H.,
Kashimoto, K., Kimura, S., Kitakawa, M., Kitagawa, M., Makino, K., Miki, T., Mizobuchi, K., Mori, H., Mori, T., Motomura, K., Nakade, S., Nakamura, Y., Nashimoto, H., Nishio, Y., Oshima, T., Saito, N., Sampei, G., Seki, Y., Sivasundaram, S., Tagami, H., Takeda, J., Takemoto, K., Takeuchi, Y., Wada, C., Yamamoto, Y. y Horiuchi, T.
TITULO A 570-kb DNA sequence of the Escherichia coli K-12 genome corresponding to the 28.0-40.1 min region on the linkage map
REVISTA DNA Res. 3 (6), 363-377 (1996)
PUBMED 9097039
REFERENCIA 6
AUTORES Arn, E.A. y Abelson, J.N.
TITULO The 2'-5' RNA ligase of Escherichia coli. Purification, cloning, and genomic disruption
REVISTA J. Biol. Chem. 271 (49), 31145-31153 (1996)
PUBMED 8940112
REFERENCIA 7
AUTORES Oshima, T., Aiba, H., Baba, T., Fujita, K., Hayashi, K., Honjo, A., Ikemoto, K.,
Inada, T., Itoh, T., Kajihara, M., Kanai, K., Kashimoto, K., Kimura, S., Kitagawa, M., Makino, K., Masuda, S., Miki, T., Mizobuchi, K., Mori, H., Motomura, K., Nakamura, Y., Nashimoto, H., Nishio, Y., Saito, N., Sampei, G, Seki, Y., Tagami, H., Takemoto, K., Wada, C., Yamamoto, Y., Yano, M. y Horiuchi, T.
TITULO A 718-kb DNA sequence of the Escherichia coli K-12 genome corresponding to the 12.7-28.0 min region on the linkage map
REVISTA DNA Res. 3 (3), 137-155 (1996)
PUBMED 8905232
REFERENCIA 8
AUTORES Fujita, N., Mori, H., Yura, T. e Ishihama, A.
TITULO Systematic sequencing of the Escherichia coli genome: analysis of the 2.4-4.1 min (110,917-193,643 bp) region)
REVISTA Nucleic Acids Res. 22 (9), 1637-1639 (1994)
PUBMED 8202364
REFERENCIA 9
AUTORES Janosi, L., Shimizu, I. y Kaji, A.
TITULO Ribosome recycling factor (ribosome releasing factor) is essential for bacterial growth
REVISTA Proc. Natl Acad Sci. USA 91 (10), 4249-4253 (1994)
PUBMED 8183897
REFERENCIA 10
AUTORES Allikmets, R., Gerrard, B., Court, D. y Dean, M.
TITULO Cloning and organization of the abc and mdl genes of Escherichia coli:
relationship to eukaryotic multidrug resistance
(continuación)
REVISTA Gene 136 (1-2), 231-236 (1993)
PUBMED 7904973
REFERENCIA 11
AUTORES van Heeswijk, WC, Rabenberg, M., Westerhoff, HV y Kahn, D.
TÍTULO The genes of the glutamine synthetase adenylylation cascade are not regulated by nitrogen in Escherichia coli
REVISTA Mol. Microbiol. 9 (3), 443-457 (1993)
PUBMED 8412694
REFERENCIA 12
AUTORES Zhao, S., Sandt, CH, Feulner, G., Vlazny, DA, Gray, JA y Hill, C.W.
TÍTULO Rhs elements of Escherichia coli K-12: complex composites of shared and unique components that have different evolutionary histories
REVISTA J. Bacteriol. 175 (10), 2799-2808 (1993)
PUBMED 8387990
REFERENCIA 13
AUTORES Yamada, M., Asaoka, S., Saier, MH Jr. y Yamada, Y.
TITULO Characterization of the gcd gene from Escherichia coli K-12 W3110 and regulation of its expression
REVISTA J. Bacteriol. 175 (2), 568-571 (1993)
PUBMED 8419307
REFERENCIA 14
AUTORES Cormack, R.S. y Mackie, G.A.
TÍTULO Structural requirements for the processing of Escherichia coli 5 S ribosomal RNA by RNase E in vitro
REVISTA J. Mol. Biol. 228 (4), 1078-1090 (1992)
PUBMED 1474579
REFERENCIA 15
AUTORES Gervais, F.G. y Drapeau, G.R.
TÍTULO Identification, cloning, and characterization of rcsF, a new regulator gene for exopolysaccharide synthesis that suppresses the division mutation ftsZ84 in Escherichia coli K-12
REVISTA J. Bacteriol. 174 (24), 8016-8022 (1992)
PUBMED 1459951
REFERENCIA 16
AUTORES Yamanaka, K., Ogura, T., Niki, H. y Hiraga, S.
TÍTULO Identification and characterization of the smbA gene, a suppressor of the mukB null mutant of Escherichia coli
REVISTA J. Bacteriol. 174 (23), 7517-7526 (1992)
PUBMED 1447125
REFERENCIA 17
AUTORES Condon, C., Philips, J., Fu, ZY, Squires, C. y Squires, C.L.
TÍTULO Comparison of the expression of the seven ribosomal RNA operons in Escherichia coli
REVISTA EMBO J. 11 (11), 4175-4185 (1992)
PUBMED 1396599
REFERENCIA 18
AUTORES Arnqvist, A., Olsen, A., Pfeifer, J., Russell, DG y Normark, s.
TÍTULO The Crl protein activates cryptic genes for curli formation and fibronectin binding in Escherichia coli HB101
REVISTA Mol. Microbiol. 6 (17), 2443-2452 (1992)
PUBMED 1357528
REFERENCIA 19
AUTORES Talarico, TL, Ray, PH, Dev, IK, Merrill, BM y Dallas, W.S.
TÍTULO Cloning, sequence analysis, and overexpression of Escherichia coli folK, the gene coding for 7,8-dihydro-6-hydroxymethylpterin-pyrophosphokinase REVISTA J. Bacteriol. 174 (18), 5971-5977 (1992)
PUBMED 1325970
REFERENCIA 20
AUTORES Li, S.J. y Cronan, J.E. Jr.
TÍTULO The genes encoding the two carboxyltransferase subunits of Escherichia coli acetyl-CoA carboxylase
R E V IS T A J. Biol. Chem. 267 (24), 16841-16847 (1992)
P U B M E D 1355089
(continuación)
REFERENCIA 21
AUTORES Yura, T., Mori, H., Nagai, H., Nagata, T., Ishihama, A., Fujita, N., Isono, K.,
Mizobuchi, K. y Nakata, A.
TÍTULO Systematic sequencing of the Escherichia coli genome: analysis of the 0-2.4 min region.
REVISTA Nucleic Acids Res. 20 (13), 3305-3308 (1992)
PUBMED 1630901
REFERENCIA 22
AUTORES Ghosh, SK, Biswas, SK Paul K. y Das, J.
TÍTULO Nucleotide and deduced amino acid sequence of the recA gene of Vibrio cholerae REVISTA Nucleic Acids Res. 20 (2), 372 (1992)
PUBMED 1741267
REFERENCIA 23
AUTORES Smallshaw, J.E. y Kelln, R.A.
TÍTULO Cloning, nucleotide sequence and expression of the Escherichia coli K-12 pyrH gene encoding UMP kinase
REVISTA Genetics (Life Sci. Adv.) 11, 59-65 (1992)
REFERENCIA 24
AUTORES O'Neill, G.P., Grygorczyk, R., Adam, M. y Ford-Hutchinson, A.W.
TÍTULO The nucleotide sequence of a voltage-gated chloride channel from the electric organ of Torpedo californica
REVISTA Biochim. Biofis Acta 1129 (1), 131-134 (1991)
PUBMED 1721838
REFERENCIA 25
AUTORES Kajie, S., Ideta, R., Yamato, I. y Anraku, Y.
TÍTULO Molecular cloning and DNA sequence of dniR, a gene affecting anaerobic expression of the Escherichia coli hexaheme nitrite reductase
REVISTA FEMS Microbiol. Lett. 67 (2), 205-211 (1991)
PUBMED 1663890
REFERENCIA 26
AUTORES Hershfield, MS, Chaffee, S., Koro-Johnson, L., Mary, A., Smith, AA y Short, S.A. TÍTULO Use of site-directed mutagenesis to enhance the epitopeshielding effect of covalent modification of proteins with polyethylene glycol
REVISTA Proc. Natl Acad Sci. U.S.A. 88 (16), 7185-7189 (1991)
PUBMED 1714590
REFERENCIA 27
AUTORES Shimizu, I. y Kaji, A.
TÍTULO Identification of the promoter region of the ribosome releasing factor cistron (frr) REVISTA J. Bacteriol. 173 (16), 5181-5187 (1991)
PUBMED 1860827
REFERENCIA 28
AUTORES Poulsen, LK, Refn, A., Molin, S. y Andersson, P.
TÍTULO The gef gene from Escherichia coli is regulated at the level of translation REVISTA Mol. Microbiol. 5 (7), 1639-1648 (1991)
PUBMED 1943701
REFERENCIA 29
AUTORES Poulsen, LK, Refn, A., Molin, S. y Andersson, P.
TÍTULO Topographic analysis of the toxic Gef protein from Escherichia coli REVISTA Mol. Microbiol. 5 (7), 1627-1637 (1991)
PUBMED 1943700
REFERENCIA 30
AUTORES Kawamukai, M., Utsumi, R., Takeda, K., Higashi, A., Matsuda, H., Choi, YL y Komano, T.
TÍTULO Nucleotide sequence and characterization of the sfs1 gene: sfs1 is involved in CRP*-dependent mal gene expression in Escherichia coli
REVISTA J. Bacteriol. 173 (8), 2644-2648 (1991)
PUBMED 2013578
REFERENCIA 31
AUTORES Hulton, C.S., Higgins, C.F. y Sharp, P.M.
TÍTULO ERIC sequences: a novel family of repetitive elements in the genomes of Escherichia coli, Salmonella typhimurium and other enterobacteria REVISTA Mol. Microbiol. 5 (4), 825-834 (1991)
(continuación)
PUBMED 1713281
REFERENCIA 32
AUTORES Munro, AW, Ritchie, GY, Lamb, AJ, Douglas, RM y Booth, I.R.
TÍTULO The cloning and DNA sequence of the gene for the glutathione-regulated potassium-efflux system KefC of Escherichia coli
REVISTA Mol. Microbiol. 5 (3), 607-616 (1991)
PUBMED 2046548
REFERENCIA 33
AUTORES Arigoni, F., Kaminski, PA, Hennecke, H. y Elmerich, C.
TÍTULO Nucleotide sequence of the fixABC region of Azorhizobium caulinodans ORS571:
similarity of the fixB product with eukaryotic flavoproteins, characterization of fixX, and identification of nifW
REVISTA Mol. Gen. Genet. 225 (3), 514-520 (1991)
PUBMED 1850088
REFERENCIA 34
AUTORES Mattick, JS, Anderson, BJ, Cox, PT, Dalrymple, BP, Bills, MM, Hobbs, M. y Egerton, J.R.
TÍTULO Gene sequences and comparison of the fimbrial subunits representative of Bacteroides nodosus serotypes A to I: class I and class II strains
REVISTA Mol. Microbiol. 5 (3), 561-573 (1991)
PUBMED 1675419
REFERENCIA 35
AUTORES Company, M., Arenas, J. y Abelson, J.
TÍTULO Requirement of the RNA helicase-like protein PRP22 for release of messenger RNA from spliceosomes
REVISTA Nature 349 (6309), 487-493 (1991)
PUBMED 1992352
REFERENCIA 36
AUTORES Umeda, M. y Ohtsubo, E.
TÍTULO Four types of IS1 with differences in nucleotide sequence reside in the Escherichia coli K-12 chromosome
REVISTA Gene 98 (1), 1-5 (1991)
PUBMED 1849492
REFERENCIA 37
AUTORES Hirvas, L., Koski,PAG. y Vaara, M.
TÍTULO The ompH gene of Yersinia enterocolitica: cloning, sequencing, expression, and comparison with known enterobacterial ompH sequences
REVISTA J. Bacteriol. 173 (3), 1223-1229 (1991)
PUBMED 1991717
REFERENCIA 38
AUTORES Bouvier, J. y Stragier, P.
TÍTULO Nucleotide sequence of the lsp-dapB interval in Escherichia coli
REVISTA Nucleic Acids Res. 19 (1), 180 (1991)
PUBMED 2011499
REFERENCIA 39
AUTORES Dicker, I.B. y Seetharam, S.
TÍTULO Cloning and nucleotide sequence of the firA gene and the firA200(Ts) allele from Escherichia coli
REVISTA J. Bacteriol. 173 (1), 334-344 (1991)
PUBMED 1987124
REFERENCIA 40
AUTORES Grimm, B., Bull, A. y Breu, V.
TÍTULO Structural genes of glutamate 1-semialdehyde aminotransferase for porphyrin synthesis in a cyanobacterium and Escherichia coli
REVISTA Mol. Gen. Genet. 225 (1), 1-10 (1991)
PUBMED 1900346
REFERENCIA 41
AUTORES Allen, B.L., Gerlach, G.F. y Clegg, S.
TÍTULO Nucleotide sequence and functions of mrk determinants necessary for expression of type 3 fimbriae in Klebsiella pneumoniae
R E V IS T A J. Bacteriol. 173 (2), 916-920 (1991)
P U B M E D 1670938
(continuación)
REFERENCIA 42
AUTORES Chen, H., Lawrence, CB, Bryan, SK y Moses, R.E.
TÍTULO Aphidicolin inhibits DNA polymerase II of Escherichia coli, an alpha-like DNA polymerase
REVISTA Nucleic Acids Res. 18 (23), 7185-7186 (1990)
PUBMED 2124684
REFERENCIA 43
AUTORES Mallonee, D.H., White, W.B. y Hylemon, P.B.
TÍTULO Cloning and sequencing of a bile acid-inducible operon from Eubacterium sp.
strain VPI 12708
REVISTA J. Bacteriol. 172 (12), 7011-7019 (1990)
PUBMED 2254270
REFERENCIA 44
AUTORES Young, C., Collins- Emerson, JM, Terzaghi, EA y Scott, D.B.
TÍTULO Nucleotide sequence of Rhizobium loti nodI
REVISTA Nucleic Acids Res. 18 (22), 6691 (1990)
PUBMED 2251131
REFERENCIA 45
AUTORES Chen, H., Sun, Y., Stark, T., Beattie, W. y Moses, R.E.
TITULO Nucleotide sequence and deletion analysis of the polB gene of Escherichia coli REVISTA DNA Cell Biol. 9 (9), 631-635 (1990)
PUBMED 2261080
REFERENCIA 46
AUTORES Eriani, G., Delarue, M., Poch, O., Gangloff, J. y Moras, D.
TÍTULO Partition of tRNA synthetases into two classes based on mutually exclusive sets of sequence motifs
REVISTA Nature 347 (6289), 203-206 (1990)
PUBMED 2203971
REFERENCIA 47
AUTORES Showalter, RE y Silverman, M.R.
TÍTULO Nucleotide sequence of a gene, hpt, for hypoxanthine phosphoribosyltransferase from Vibrio harveyi
REVISTA Nucleic Acids Res. 18 (15), 4621 (1990)
PUBMED 2388850
REFERENCIA 48
AUTORES Martin-Verstraete, I., Debarbouille, M., Klier, A. y Rapoport, G.
TÍTULO Levanase operon of Bacillus subtilis includes a fructose-specific phosphotransferase system regulating the expression of the operon REVISTA J. Mol. Biol. 214 (3), 657-671 (1990)
PUBMED 2117666
REFERENCIA 49
AUTORES Henrich, B., Monnerjahn, U. y Plapp, R.
TITULO Peptidase D gene (pepD) of Escherichia coli K-12: nucleotide sequence, transcript mapping, and comparison with other peptidase genes
REVISTA J. Bacteriol. 172 (8), 4641-4651 (1990)
PUBMED 1695895
REFERENCIA 50
AUTORES Nunn, D., Bergman, S. y Lory, S.
TÍTULO Products of three accessory genes, pilB, pilC, and pilD, are required for biogenesis of Pseudomonas aeruginosa pili
REVISTA J. Bacteriol. 172 (6), 2911-2919 (1990)
PUBMED 1971619
REFERENCIA 51
AUTORES Rosenthal, E.R. y Calvo, J.M.
TÍTULO The nucleotide sequence of leuC from Salmonella typhimurium
REVISTA Nucleic Acids Res. 18 (10), 3072 (1990)
PUBMED 2190189
REFERENCIA 52
AUTORES Kang, P.J. y Craig, E.A.
TÍTULO Identification and characterization of a new Escherichia coli gene that is a dosage-dependent suppressor of a dnaK deletion mutation
R E V IS T A J. Bacteriol. 172 (4), 2055-2064 (1990)
P U B M E D 2180916
(continuación)
REFERENCIA 53
AUTORES Wurgler, S.M. y Richardson, C.C.
TÍTULO Structure and regulation of the gene for dGTP triphosphohydrolase from Escherichia coli
REVISTA Proc. Natl Acad Sci. USA 87 (7), 2740-2744 (1990)
PUBMED 2157212
REFERENCIA 54
AUTORES Schaaff, I., Hohmann, S. y Zimmermann, F.K.
TÍTULO Molecular analysis of the structural gene for yeast transaldolase
REVISTA Eur. J. Biochem. 188 (3), 597-603 (1990)
PUBMED 2185015
REFERENCIA 55
AUTORES Ricca, E. y Calvo, J.M.
TÍTULO The nucleotide sequence of leuA from Salmonella typhimurium
REVISTA Nucleic Acids Res. 18 (5), 1290 (1990)
PUBMED 2181403
REFERENCIA 56
AUTORES Honore, N. y Cole, S.T.
TÍTULO Nucleotide sequence of the aroP gene encoding the general aromatic amino acid transport protein of Escherichia coli K-12: homology with yeast transport proteins REVISTA Nucleic Acids Res. 18 (3), 653 (1990)
PUBMED 2408019
REFERENCIA 57
AUTORES Angerer, A., Gaisser, S. y Braun, V.
TÍTULO Nucleotide sequences of the sfuA, sfuB, and sfuC genes of Serratia marcescens suggest a periplasmic-binding-protein-dependent iron transport mechanism REVISTA J. Bacteriol. 172 (2), 572-578 (1990)
PUBMED 2404942
REFERENCIA 58
AUTORES Surin, BP, Watson, JM, Hamilton, WD, Economou, A. y Downie, J.A.
TÍTULO Molecular characterization of the nodulation gene, nodT, from two biovars of Rhizobium leguminosarum
REVISTA Mol. Microbiol. 4 (2), 245-252 (1990)
PUBMED 2338917
REFERENCIA 59
AUTORES Zhou, Z. y Syvanen, M.
TÍTULO Identification and sequence of the drpA gene from Escherichia coli REVISTA J. Bacteriol. 172 (1), 281-286 (1990)
PUBMED 1688424
REFERENCIA 60
AUTORES Roncero, MI, Jepsen, LP, Stroman, P. y van Heeswijck, R.
TÍTULO Characterization of a leuA gene and an ARS element from Mucor circinelloides REVISTA Gene 84 (2), 335-343 (1989)
PUBMED 2693214
REFERENCIA 61
AUTORES Ichikawa, S. y Kaji, A.
TÍTULO Molecular cloning and expression of ribosome releasing factor
REVISTA J. Biol. Chem. 264 (33), 20054-20059 (1989)
PUBMED 2684966
REFERENCIA 62
AUTORES Minami-Ishii, N., Taketani, S., Osumi, T. y Hashimoto, T.
TÍTULO Molecular cloning and sequence analysis of the cDNA for rat mitochondrial enoyl-CoA hydratase. Structural and evolutionary relationships linked to the bifunctional enzyme of the peroxisomal beta-oxidation system
REVISTA Eur. J. Biochem. 185 (1), 73-78 (1989)
PUBMED 2806264
REFERENCIA 63
AUTORES Matsubara, Y., Indo, Y., Naito, E., Ozasa, H., Glassberg, R., Vockley, J., Ikeda,
Y., Kraus, J. Tanaka, K.
TÍTULO Molecular cloning and nucleotide sequence of cDNAs encoding the precursors of rat long chain acyl-coenzyme A, short chain acyl-coenzyme A, and isovalerylcoenzyme A dehydrogenases. Sequence homology of four enzymes of the acyl-CoA dehydrogenase family
(continuación)
REVISTA J. Biol. Chem. 264 (27), 16321-16331 (1989)
PUBMED 2777793
REFERENCIA 64
AUTORES Roa, B.B., Connolly, D.M. y Winkler, M.E.
TÍTULO Overlap between pdxA and ksgA in the complex pdxA-ksgA-apaG-apaH operon of Escherichia coli K-12
REVISTA J. Bacteriol. 171 (9), 4767-4777 (1989)
PUBMED 2670894
REFERENCIA 65
AUTORES Lindquist, S., Galleni, M., Lindberg, F. y Normark, s.
TÍTULO Signalling proteins in enterobacterial AmpC beta-lactamase regulation REVISTA Mol. Microbiol. 3 (8), 1091-1102 (1989)
REFERENCIA 2691840
REFERENCIA 66
AUTORES Xie, Q.W., Tabor, C.W. y Tabor, H.
TÍTULO Spermidine biosynthesis in Escherichia coli: promoter and termination regions of the speED operon
REVISTA J. Bacteriol. 171 (8), 4457-4465 (1989)
PUBMED 2666401
REFERENCIA 67
AUTORES Sato, S., Nakada, Y. y Shiratsuchi, A.
TÍTULO IS421, a new insertion sequence in Escherichia coli
REVISTA FEBS Lett. 249 (1), 21-26 (1989)
PUBMED 2542093
REFERENCIA 68
AUTORES Liu, J.D. y Parkinson, J.S.
TÍTULO Genetics and sequence analysis of the pcnB locus, an Escherichia coli gene involved in plasmid copy number control
REVISTA J. Bacteriol. 171 (3), 1254-1261 (1989)
PUBMED 2537812
REFERENCIA 69
AUTORES Henrich, B., Schroeder, U., Frank, RW y Plapp, R.
TÍTULO Accurate mapping of the Escherichia coli pepD gene by sequence analysis of its 5' flanking region
REVISTA Mol. Gen. Genet. 215 (3), 369-373 (1989)
PUBMED 2651887
REFERENCIA 70
AUTORES Lipinska, B., Sharma, S. y Georgopoulos, C.
TÍTULO Sequence analysis and regulation of the htrA gene of Escherichia coli: a sigma 32-independent mechanism of heat-inducible transcription
REVISTA Nucleic Acids Res. 16 (21), 10053-10067 (1988)
PUBMED 3057437
REFERENCIA 71
AUTORES Sung, Y.C. y Fuchs, J.A.
TITULO Characterization of the cyn operon in Escherichia coli K12
REVISTA J. Biol. Chem. 263 (29), 14769-14775 (1988)
PUBMED 3049588
REFERENCIA 72
AUTORES Lozoya, E., Hoffmann, H., Douglas, C., Schulz, W., Scheel, D. y Hahlbrock, K. TÍTULO Primary structures and catalytic properties of isoenzymes encoded by the two 4-coumarate: CoA ligase genes in parsley
REVISTA Eur. J. Biochem. 176 (3), 661-667 (1988)
PUBMED 3169018
REFERENCIA 73
AUTORES Andrews, S.C. y Guest, J.R.
TÍTULO Nucleotide sequence of the gene encoding the GMP reductase of Escherichia coli K12
REVISTA Biochem. J. 255 (1), 35-43 (1988)
PUBMED 2904262
REFERENCIA 74
AUTORES Jaiswal, AK, McBride, OW, Adesnik, M. y Nebert, D.W.
TÍTULO Human dioxin-inducible cytosolic NAD(P)H:menadione oxidoreductase. cDNA sequence and localization of gene to chromosome 16
(continuación)
REVISTA J. Biol. Chem. 263 (27), 13572-13578 (1988)
PUBMED 2843525
REFERENCIA 75
AUTORES Karpel, R., Olami, Y., Taglicht, D., Schuldiner, S. y Padan, E.
TÍTULO Sequencing of the gene ant which affects the Na+/H+ antiporter activity in Escherichia coli
REVISTA J. Biol. Chem. 263 (21), 10408-10414 (1988)
PUBMED 2839489
REFERENCIA 76
AUTORES Mellano, M.A. y Cooksey, D.A.
TÍTULO Nucleotide sequence and organization of copper resistance genes from Pseudomonas syringae pv. tomato
REVISTA J. Bacteriol. 170 (6), 2879-2883 (1988)
PUBMED 3372485
REFERENCIA 77
AUTORES Coleman, J. y Raetz, C.R.
TÍTULO First committed step of lipid A biosynthesis in Escherichia coli: sequence of the lpxA gene
REVISTA J. Bacteriol. 170 (3), 1268-1274 (1988)
PUBMED 3277952
REFERENCIA 78
AUTORES Gebhard, W., Schreitmuller, T., Hochstrasser, K. y Wachter, E.
TÍTULO Complementary DNA and derived amino acid sequence of the precursor of one of the three protein components of the inter-alpha-trypsin inhibitor complex REVISTA FEBS Lett. 229 (1), 63-67 (1988)
PUBMED 2450046
REFERENCIA 79
AUTORES Tomasiewicz, H.G. y McHenry, C.S.
TÍTULO Sequence analysis of the Escherichia coli dnaE gene
REVISTA J. Bacteriol. 169 (12), 5735-5744 (1987)
PUBMED 3316192
REFERENCIA 80
AUTORES Crowell, D.N., Reznikoff, W.S. y Raetz, C.R.
TÍTULO Nucleotide sequence of the Escherichia coli gene for lipid A disaccharide synthase
REVISTA J. Bacteriol. 169 (12), 5727-5734 (1987)
PUBMED 2824445
REFERENCIA 81
AUTORES Tabor, C.W. y Tabor, H.
TÍTULO The speEspeD operon of Escherichia coli. Formation and processing of a proenzyme form of S-adenosylmethionine decarboxylase
REVISTA J. Biol. Chem. 262 (33), 16037-16040 (1987)
PUBMED 3316212
REFERENCIA 82
AUTORES Nonet, M.L., Marvel, C.C. y Tolan, D.R.
TITULO The hisT-purF region of the Escherichia coli K-12 chromosome. Identification of additional genes of the hisT and purF operons
REVISTA J. Biol. Chem. 262 (25), 12209-12217 (1987)
PUBMED 3040734
REFERENCIA 83
AUTORES Coulton, JW, Mason, P. y Allatt, D.D.
TITULO fhuC and fhuD genes for iron (III)-ferrichrome transport into Escherichia coli K-12 REVISTA J. Bacteriol. 169 (8), 3844-3849 (1987)
PUBMED 3301821
REFERENCIA 84
AUTORES Horiuchi, T., Nagasawa, T., Takano, K. y Sekiguchi, M.
TÍTULO A newly discovered tRNA(lAsp) gene (aspV) of Escherichia coli K12 REVISTA Mol. Gen. Genet. 206 (2), 356-357 (1987)
PUBMED 3295485
REFERENCIA 85
AUTORES Ben-Bassat, A. Bauer, K., Chang, SY, Myambo, K., Boosman, A. y Chang, S. TÍTULO Processing of the initiation methionine from proteins: properties of the Escherichia coli methionine aminopeptidase and its gene structure
REVISTA J. Bacteriol. 169 (2), 751-757 (1987)
(continuación)
PUBMED 3027045
REFERENCIA 86
AUTORES Gronger, P., Manían, SS, Reilander, H., O'Connell, M., Priefer, UB y Puhler, A. TÍTULO Organization and partial sequence of a DNA region of the Rhizobium leguminosarum symbiotic plasmid pRL6JI containing the genes fixABC, nifA, nifB and a novel open reading frame
REVISTA Nucleic Acids Res. 15 (1), 31-49 (1987)
PUBMED 3029674
REFERENCIA 87
AUTORES Richardson, KK, Richardson, FC, Crosby, RM, Swenberg, JA y Skopek, T.R. TITULO DNA base changes and alkylation following in vivo exposure of Escherichia coli to N-methyl-N-nitrosourea or N-ethyl-N-nitrosourea
REVISTA Proc. Natl Acad Sci. U.S.A. 84 (2), 344-348 (1987)
PUBMED 3540961
REFERENCIA 88
AUTORES Chye, M.L. y Pittard, J.
TÍTULO Transcription control of the aroP gene in Escherichia coli K-12 : analysis of operator mutants
REVISTA J. Bacteriol. 169 (1), 386-393 (1987)
PUBMED 3025182
REFERENCIA 89
AUTORES Blanchin-Roland, S., Blanquet, S., Schmitter, JM y Fayat, G.
TÍTULO The gene for Escherichia coli diadenosine tetraphosphatase is located immediately clockwise to folA and forms an operon with ksgA
REVISTA Mol. Gen. Genet. 205 (3), 515-522 (1986)
PUBMED 3031429
REFERENCIA 90
AUTORES Takano, K., Nakabeppu, Y., Maki, H., Horiuchi, T. y Sekiguchi, M.
TÍTULO Structure and function of dnaQ and mutD mutators of Escherichia coli REVISTA Mol. Gen. Genet. 205 (1), 9-13 (1986)
PUBMED 3540531
REFERENCIA 91
AUTORES Mackie, G.A.
TÍTULO Structure of the DNA distal to the gene for ribosomal protein S20 in Escherichia coli K12: presence of a strong terminator and an IS1 element
REVISTA Nucleic Acids Res. 14 (17), 6965-6981 (1986)
PUBMED 2429258
REFERENCIA 92
AUTORES Koster, W. y Braun, V.
TÍTULO Iron hydroxamate transport of Escherichia coli: nucleotide sequence of the fhuB gene and identification of the protein
REVISTA Mol. Gen. Genet. 204 (3), 435-442 (1986)
PUBMED 3020380
REFERENCIA 93
AUTORES Breton, R., Sanfacon, H., Papayannopoulos, I., Biemann, K. y Lapointe, J.
TÍTULO Glutamyl-tRNA synthetase of Escherichia coli. Isolation and primary structure of the gltX gene and homology with other aminoacyl-tRNA synthetases REVISTA J. Biol. Chem. 261 (23), 10610-10617 (1986)
PUBMED 3015933
REFERENCIA 94
AUTORES Birnbaum, M.J., Haspel, H.C. y Rosen, O.M.
TÍTULO Cloning and characterization of a cDNA encoding the rat brain glucosetransporter protein
REVISTA Proc. Natl Acad Sol. U.S.A. 83 (16), 5784-5788 (1986)
PUBMED 3016720
REFERENCIA 95
AUTORES Cox, E.C. y Horner, D.L.
TÍTULO DNA sequence and coding properties of mutD(dnaQ) a dominant Escherichia coli mutator gene
REVISTA J. J. Mol. Biol. 190 (1), 113-117 (1986)
PUBMED 3023634
REFERENCIA 96
AUTORES Ohki, M., Tamura, F., Nishimura, S. y Uchida, H.
(continuación)
TÍTULO Nucleotide sequence of the Escherichia coli dnaJ gene and purification of the gene product
REVISTA J. Biol. Chem. 261 (4), 1778-1781 (1986)
PUBMED 3003084
REFERENCIA 97
AUTORES Coulton, JW, Mason, P., Cameron, DR, Carmel, G., Jean, R. y Rode, HN TÍTULO Protein fusions of beta-galactosidase to the ferrichrome-iron receptor of Escherichia coli K-12
REVISTA J. Bacteriol. 165 (1), 181-192 (1986)
PUBMED 3079747
REFERENCIA 98
AUTORES Lee, N., Gielow, W., Martin, R., Hamilton, E. y Fowler, A.
TÍTULO The organization of the araBAD operon of Escherichia coli
REVISTA Gene 47 (2-3), 231-244 (1986)
PUBMED 3549454
REFERENCIA 99
AUTORES Sekiguchi, T., Ortega-Cesena, J., Nosoh, Y., Ohashi, S., Tsuda, K. y Kanaya, S. TITULO DNA and amino-acid sequences of 3-isopropylmalate dehydrogenase of Bacillus coagulans. Comparison with the enzymes of Saccharomyces cerevisiae and Thermus thermophilus
REVISTA Biochim. Biophys. Acta 867, 36-44 (1986)
REFERENCIA 100
AUTORES Chong, P., Hui, I., Loo, T. y Gillam, S.
TÍTULO Structural analysis of a new GC-specific insertion element IS186
REVISTA FEBS Lett. 192 (1), 47-52 (1985)
PUBMED 2996940
REFERENCIA 101
AUTORES Icho, T., Sparrow, CP y Raetz, C.R.
TÍTULO Molecular cloning and sequencing of the gene for CDP-diglyceride synthetase of Escherichia coli
REVISTA J. Biol. Chem. 260 (22), 12078-12083 (1985)
PUBMED 2995358
REFERENCIA 102
AUTORES Nomura, T., Aiba, H. e Ishihama, A.
TÍTULO Transcriptional organization of the convergent overlapping dnaQ-rnh genes of Escherichia coli
REVISTA J. Biol. Chem. 260 (11), 7122-7125 (1985)
PUBMED 2987244
REFERENCIA 103
AUTORES Kamio, Y., Lin, CK, Regue, M. y Wu, H.C.
TÍTULO Characterization of the ileS-lsp operon in Escherichia coli. Identification of an open reading frame upstream of the ileS gene and potential promoter(s) for the ileS-lsp operon
REVISTA J. Biol. Chem. 260 (9), 5616-5620 (1985)
PUBMED 2985604
REFERENCIA 104
AUTORES Cowing, DW, Bardwell, JC, Craig, EA, Woolford, C., Hendrix, RW y Gross, CA TÍTULO Consensus sequence for Escherichia coli heat shock gene promoters REVISTA Proc. Natl Acad Sol. USA 82 (9), 2679-2683 (1985)
PUBMED 3887408
REFERENCIA 105
AUTORES Broome-Smith, JK, Edelman, A., Yousif, S. y Spratt, B.G.
TÍTULO The nucleotide sequences of the ponA and ponB genes encoding penicillinbinding protein 1A and 1B of Escherichia coli K12
REVISTA Eur. J. Biochem. 147 (2), 437-446 (1985)
PUBMED 3882429
REFERENCIA 106
AUTORES Becerril, B., Valle, F., Merino, E., Riba, L. y Bolívar, F.
TITULO Repetitive extragenic palindromic (REP) sequences in the Escherichia coli gdhA gene
REVISTA Gene 37 (1-3), 53-62 (1985)
PUBMED 3902576
REFERENCIA 107
AUTORES Friedberg, D., Rosenthal, ER, Jones, JW y Calvo, J.M.
(continuación)
TÍTULO Characterization of the 3' end of the leucine operon of Salmonella typhimurium REVISTA Mol. Gen. Genet. 199 (3), 486-494 (1985)
PUBMED 2993799
REFERENCIA 108
AUTORES Bouvier, J., Richaud, C., Richaud, F., Patte, JC y Stragier, p.
TÍTULO Nucleotide sequence and expression of the Escherichia coli dapB gene REVISTA J. Biol. Chem. 259 (23), 14829-14834 (1984)
PUBMED 6094578
REFERENCIA 109
AUTORES Richaud, C., Richaud, F., Martin, C., Haziza, C. y Patte, J.C.
TÍTULO Regulation of expression and nucleotide sequence of the Escherichia coli dapD gene
REVISTA J. Biol. Chem. 259 (23), 14824-14828 (1984)
PUBMED 6094577
REFERENCIA 110
AUTORES Nuesch, J. y Schumperli, D.
TÍTULO Structural and functional organization of the gpt gene region of Escherichia coli REVISTA Gene 32 (1-2), 243-249 (1984)
PUBMED 6397401
REFERENCIA 111
AUTORES Jagadeeswaran, P., Ashman, CR, Roberts, S. y Langenberg, J.
TÍTULO Nucleotide sequence and analysis of deletion mutants of the Escherichia coli gpt gene in plasmid pSV2 gpt
REVISTA Gene 31 (1-3), 309-313 (1984)
PUBMED 6396164
REFERENCIA 112
AUTORES Deutch, AH, Rushlow, KE y Smith, C.J.
TÍTULO Analysis of the Escherichia coli proBA locus by DNA and protein sequencing REVISTA Nucleic Acids Res. 12 (15), 6337-6355 (1984)
PUBMED 6089111
REFERENCIA 113
AUTORES Bouvier, J., Patte, JC y Stragier, p.
TÍTULO Multiple regulatory signals in the control region of the Escherichia coli carAB operon
REVISTA Proc. Natl Acad Sci. USA 81 (13), 4139-4143 (1984)
PUBMED 6377309
REFERENCIA 114
AUTORES Innis, MA, Tokunaga, M., Williams, ME, Loranger, JM, Chang, SY, Chang, S. y Wu, H.C.
TÍTULO Nucleotide sequence of the Escherichia coli prolipoprotein signal peptidase (lsp) gene
REVISTA Proc. Natl. Acad. Sci. U.S.A. 81 (12), 3708-3712 (1984)
PUBMED 6374664
REFERENCIA 115
AUTORES Bardwell, J.C. y Craig, E.A.
TÍTULO Major heat shock gene of Drosophila and the Escherichia coli heat-inducible dnaK gene are homologous
REVISTA Proc. Natl. Acad. Sci. U.S.A. 81 (3), 848-852 (1984)
PUBMED 6322174
REFERENCIA 116
AUTORES Pratt, D. y Subramani, S.
TÍTULO Nucleotide sequence of the Escherichia coli xanthine-guanine phosphoribosyl transferase gene
REVISTA Nucleic Acids Res. 11 (24), 8817-8823 (1983)
PUBMED 6324103
REFERENCIA 117
AUTORES Richardson, KK, Fostel, J. y Skopek, T.R.
TÍTULO Nucleotide sequence of the xanthine guanine phosphoribosyl transferase gene of E. coli
REVISTA Nucleic Acids Res. 11 (24), 8809-8816 (1983)
PUBMED 6324102
REFERENCIA 118
AUTORES Parsot, C., Cossart, P., Saint-Girons, I. y Cohen, G.N.
TÍTULO Nucleotide sequence of thrC and of the transcription termination región of the threonine operon in Escherichia coli K12
(continuación)
REVISTA Nucleic Acids Res. 11 (21), 7331-7345 (1983)
PUBMED 6316258
REFERENCIA 119
AUTORES Stephens, PE, Lewis, HM, Darlison, MG y Guest, J.R.
TÍTULO Nucleotide sequence of the lipoamide dehydrogenase gene of Escherichia coli K12
REVISTA Eur. J. Biochem. 135 (3), 519-527 (1983)
PUBMED 6352260
REFERENCIA 120
AUTORES Stephens, PE, Darlison, MG, Lewis, HM y Guest, J.R.
TÍTULO The pyruvate dehydrogenase complex of Escherichia coli K12. Nucleotide sequence encoding the dihydrolipoamide acetyltransferase component REVISTA Eur. J. Biochem. 133 (3), 481-489 (1983)
PUBMED 6345153
REFERENCIA 121
AUTORES Stephens, PE, Darlison, MG, Lewis, HM y Guest, J.R.
TÍTULO The pyruvate dehydrogenase complex of Escherichia coli K12. Nucleotide sequence encoding the pyruvate dehydrogenase component
REVISTA Eur. J. Biochem. 133 (1), 155-162 (1983)
PUBMED 6343085
REFERENCIA 122
AUTORES Kanaya, S. y Crouch, R.J.
TÍTULO Low levels of RNase H activity in Escherichia coli FB2 rnh result from a singlebase change in the structural gene of RNase H
REVISTA J. Bacteriol. 154 (2), 1021-1026 (1983)
PUBMED 6302075
REFERENCIA 123
AUTORES Overbeeke, N., Bergmans, H., van Mansfeld, F. y Lugtenberg, B.
TÍTULO Complete nucleotide sequence of phoE, the structural gene for the phosphate limitation inducible outer membrane pore protein of Escherichia coli K12 REVISTA J. Mol. Biol. 163 (4), 513-532 (1983)
PUBMED 6341601
REFERENCIA 124
AUTORES Gilson, E., Nikaido, H. y Hofnung, M.
TÍTULO Sequence of the malK gene in E.coli K12
REVISTA Nucleic Acids Res. 10 (22), 7449-7458 (1982)
PUBMED 6296778
REFERENCIA 125
AUTORES Stoner, C.M. y Schleif, R.
TÍTULO Is the amino acid but not the nucleotide sequence of the Escherichia coli araC gene conserved?
REVISTA J. Mol. Biol. 154 (4), 649-652 (1982)
PUBMED 6283093
REFERENCIA 126
AUTORES An, G., Bendiak, DS, Mamelak, LA y Friesen, J.D.
TÍTULO Organization and nucleotide sequence of a new ribosomal operon in Escherichia coli containing the genes for ribosomal protein S2 and elongation factor Ts REVISTA Nucleic Acids Res. 9 (16), 4163-4172 (1981)
PUBMED 6272196
REFERENCIA 127
AUTORES Mackie, G.A.
TÍTULO Nucleotide sequence of the gene for ribosomal protein S20 and its flanking regions
REVISTA J. Biol. Chem. 256 (15), 8177-8182 (1981)
PUBMED 6267039
REFERENCIA 128
AUTORES Little, J.W., Mount, D.W. y Yanisch-Perron, C.R.
TÍTULO Purified lexA protein is a repressor of the recA and lexA genes
REVISTA Proc. Natl. Acad. Sci. U.S.A. 78 (7), 4199-4203 (1981)
PUBMED 7027255
REFERENCIA 129
AUTORES Mulligan, R.C. y Berg, p.
TÍTULO Factors governing the expression of a bacterial gene in mammalian cells REVISTA Mol. Cell. Biol. 1 (5), 449-459 (1981)
(continuación)
PUBMED 6100966
REFERENCIA 130
AUTORES Lee, N.L., Gielow, W.O. y Wallace, R.G.
TÍTULO Mechanism of araC autoregulation and the domains of two overlapping promoters, Pc and PBAD, in the L-arabinose regulatory region of Escherichia coli REVISTA Proc. Natl. Acad. Sci. USA 78 (2), 752-756 (1981)
PUBMED 6262769
REFERENCIA 131
AUTORES Cossart, P., Katinka, M. y Yaniv, M.
TITULO Nucleotide sequence of the thrB gene of E. coli, and its two adjacent regions; the thrAB and thrBC junctions
REVISTA Nucleic Acids Res. 9 (2), 339-347 (1981)
PUBMED 6259626
REFERENCIA 132
AUTORES Miyada, CG, Horwitz, AH, Cass, LG, Timko, J. y Wilcox, G.
TÍTULO d Na sequence of the araC regulatory gene from Escherichia coli B/r REVISTA Nucleic Acids Res. 8 (22), 5267-5274 (1980)
PUBMED 7008027
REFERENCIA 133
AUTORES Katinka, M., Cossart, P., Sibilli, L., Saint-Girons, I., Chalvignac, MA, Le Bras, G.,
Cohen, GN y Yaniv, M.
TÍTULO Nucleotide sequence of the thrA gene of Escherichia coli
REVISTA Proc. Natl. Acad. Sci. USA 77 (10), 5730-5733 (1980)
PUBMED 7003595
REFERENCIA 134
AUTORES Ogden, S., Haggerty, D., Stoner, CM, Kolodrubetz, D. y Schleif, R.
TÍTULO The Escherichia coli L-arabinose operon: binding sites of the regulatory proteins and a mechanism of positive and negative regulation
REVISTA Proc. Natl. Acad. Sci. U.S.A. 77 (6), 3346-3350 (1980)
PUBMED 6251457
REFERENCIA 135
AUTORES Smith, D.R. y Calvo, J.M.
TÍTULO Nucleotide sequence of the E coli gene coding for dihydrofolate reductase REVISTA Nucleic Acids Res. 8 (10), 2255-2274 (1980)
PUBMED 6159575
REFERENCIA 136
AUTORES Johnsrud, L.
TÍTULO DNA sequence of the transposable element IS1
REVISTA Mol. Gen. Genet. 169 (2), 213-218 (1979)
PUBMED 375010
REFERENCIA 137
AUTORES Smith, B.R. y Schleif, R.
TÍTULO Nucleotide sequence of the L-arabinose regulatory region of Escherichia coli K12 REVISTA J. Biol. Chem. 253 (19), 6931-6933 (1978)
PUBMED 357433
REFERENCIA 138
AUTORES Greenfield, L., Boone, T. y Wilcox, G.
TITULO DNA sequence of the araBAD promoter in Escherichia coli B/r
REVISTA Proc. Natl. Acad. Sci. U.S.A. 75 (10), 4724-4728 (1978)
PUBMED 368797
REFERENCIA 139
AUTORES Young, R.A. y Steitz, J.A.
TÍTULO Complementary sequences 1700 nucleotides apart form a ribonuclease III cleavage site in Escherichia coli ribosomal precursor RNA
REVISTA Proc. Natl. Acad. Sci. U.S.A. 75 (8), 3593-3597 (1978)
PUBMED 358189
REFERENCIA 140
AUTORES Ohtsubo, H. y Ohtsubo, E.
TÍTULO Nucleotide sequence of an insertion element, IS1
REVISTA Proc. Natl. Acad. Sci. USA 75 (2), 615-619 (1978)
PUBMED 273224
REFERENCIA 141
AUTORES Musso, R., Di Lauro, R., Rosenberg, M. y de Crombrugghe, B.
(continuación)
TÍTULO Nucleotide sequence of the operator-promoter region of the galactose operon of Escherichia coli
REVISTA Proc. Natl. Acad. Sci. USA 74 (1), 106-110 (1977)
PUBMED 319453
REFERENCIA 142 (bases 1 a 4646332)
CONSORCIO NCBI Genome Project
TÍTULO Envío directo
REVISTA Enviado (10-NOV-2005) National Center for Biotechnology Information, NIH,
Bethesda, MD 20894, EE.UU.
REFERENCIA 143 (bases 1 a 4646332)
AUTORES Mori, H., Horiuchi, T. y Hirai, A.
TÍTULO Presentación directa
REVISTA Enviado (22-AUG-2005) Hirotada Mori, Graduate School of Biological Sciences,
Nara Institute of Science and Technology; 8916-5 Takayama, Ikoma, Nara 630­ 0101, Japón (Correo electrónico: hmori@gtc.naist.jp, Tel: 81-743-72-5660, Fax: 81-743-72- 5669)
COMENTARIO REFSEQ PROVISIONAL: Este registro aún no ha sido sometido a revisión final del NCBI. La secuencia de referencia se derivó de partir de AP009048. COMPLETO: longitud completa.
CARACTERISTICAS Ubicación/Calificadores
fuente complemento (<1..> 5861)
/organismo= "cepa de Escherichia coli K-12 sustr. W3110" /mol_type = "ADN genómico"
/strain = "K-12 "
/sub_strain = "W3110"
/db_xref = "Taxón: 316407"
gen complemento (<1..6)
/gen = "dcuD"
CDS complemento (<1..6)
/gen = "dcuD"
/nota= "ECK3216: JW3196: b3227"
/codon_start = 1
/transl_table = 11
/producto = "transportador predicho"
/protein_id = "AP 003769.1"
/db xref = "GI: 89109989"
/ tradvicción —MMFG111SViyfkJTMGYL,ILKNYKPQyVLJU^GIFEMMCGVÍJIjGF
GGVLDPTKSSGYLIVDIYNEILRMLSNRIAGLGLSIMAVGGYARYMERIGASRAMVSL
LSRPLKLIRSPYirLSATYVIGQIMAQFIXSASGLGMLLMVTLFPXLVSLGVSRLSAV
avi at t msiewgil et nsi faaqvagmkiat yf fhyql pvascvi isv ai shffv qr a
FDKKDKKrNHEQAEQKALDNVPPLYYAILPVMPLILMLGSLFLAHVGLMQSELHLVVV
MLLSLTVTMFVEFFRKHNLRETMDDVQAFFDGMGTQFANWXLWAGEIFAKGLTTIG
TVDAVIRGAEKSGLGGIGVMIIMALVIAICAIVMGSGNAPFMSFASLIPNIAAGLHVP
AWMIMPMHFATTLARAVSPITAVWVXSGIAGVSPFAWKRTAIPMAVGFWNMIAX IXLFY" (SEQ IDNO: 35)
cebador 330.. 348
/marcador="cebador de control ck nanR3"
gen 386.. 1177
/gene="nanR"
CDS 386.. 1177
/gene="nanR"
/note="ECK3215:JW3195:b3226"
/codon_start=1
/transl table=11
/product="regulador doble transcripcional de enlace de ADN"
/proteinJd="AP_003768.1"
/db xref="GI:89109988"
/ traducción =mmglmnafdsqtedsspaigrnlr srpla rkk ls emveeeleqmi
RRREFGEGEQLPSERELMAFFNVGRPSVREALAALKRKGLVQINNGERARVSRPSADT
IIGELSGMAKDFLSHPGGIAHFEQLRLFFESSLVRYAAEHATDEQIDLLAKALEIKSQ
SLDNHAAFIRSDVDFHRVLAEIPGNPIFMA1HVALLDWLIAARPTVTDQALHEHWKVS
YQOEIAIVDAIRRHDPDEADRALQSHLNSVSA.TWHAFGQTTNKKK" (SEQ ID NO: 36)
cebador 1005..1025
/marcador = "cebador de control nanR ck2"
cebador 1126..1146
/marcador = "cebador de control nanAFck"
promotor 1178..1278
/marcador = "región promotora del operón nan'
Sitio 1187..1191
/site_type = "sitio de enlace"
/marcador = "enlace CAP"
Sitio 1198.. 1202
/site_type = "sitio de enlace"
/marcador = "enlace de CAP"
promotor 1241..1246
/marcador = -10
primer_bind 1252..1301
/nota= "para eliminaciones de dnanA:: o dnanATE::marca" /marcador = "cebador H1-dnanA lambda rojo"
ARNm 1255
/marcador = 1
ARNm 1267
/marcador = 13
ARNm 1279
/marcador = 25
gen 1299.. 2192
/gen = "nanA"
CDS 1299.. 2192
/gen = "nanA"
/nota= "ECK3214: JW3194: b3225"
/codon_start = 1
/transl_table = 11
/product = "N-acetilneuraminato liasa"
/protein_id = "AP 003767.1"
/d b xref = "GI: 89109987"
/ traducción ="matnlrc-vmaallt pf dqqqaldkaslr rl vqfni qqgid gly v
GGSTGEAFVQSLSEREQVLEIVAEEAKGKIKLIAHVGCVSTAESQQLAASAKRYGFDA
VSAVTPFYYPF3FEEHCDHYRAIIDSADGIiPMWYNIPALSGVKLTLDQINTLVTLPG
VGALKQTSGDLYQMEQIRREHPDLVLYNGY3EIFASGLLAGADGGIGSTYNIMGWRYQ
GIVKALKEGDIQTAQKLQTECNKVIDLLIKTGVFRGLKTVLHYMDWSVPLCRKPFGP VDEKYLPELKALAQQLMQERG" (SEQ IDNO: 3") Región 1302.. 4424
/marcador ="DELECIÓN nanATE"
primer_bind complemento (2175..2224)
/marcador = "H2-dnanA lambda rojo cebador
gen 2301.. 3791
/gen = "nanT"
CDS 2301.. 3791
/gen = "nanT"
/nota= "ECK3213: JW3193: b3224"
/codon_start = 1
/transl_table = 11
/product = "transportador de ácido siálico"
/protein_id = "AP 003766.1"
/db xref = "GI: 89109986"
/ traducción =''mstttqnipwyrhlnraqwrafsaawlgylldgfdfvlialvlt
evqgefg lttvqaaslieaafis rhfgglmlgamgdryg rrlamvtsIVLFSAGTLAC GFAPGYITMFIARLVIGMGMAGEYG5SATYVIESWPKHLRNKASGFLISGFSVGAWA
AQVY SLWPVWGWRALFFIGILPIIFALWL RKNIPEAEDWKE KHAGKAPVRTMVDILY RGEHRIANIVMTLAAATALWFCFAGNLQNAAIVAVLGLLCAAIFIGFMVQSAGKRWPT GVMLIWWLFAFLYSWPIQALLPTYLKTDLAYNPHTVAMVLFFSGFGAAVGCCVGGFL GDWLGTRKAYVCSLLASQLLIIPVFAIGGANVWVLGLLLFFQQMLGQGIAGILPKLIG GY'FDTDQRAAGLGFTYNVGALGGAL AP11GALIAQRLDLGTALASLSFSLTFWILLI GLDMPSRVQRWLRPEALRTHDAIDGKPFSGAVPFGSAKNDLVKTKSn (SEQ ID NO: 38)
cebador complemento (2329..2350)
/marcador = "cebador de control nanARck"
primer_bind 3792..3841
/marcador = "cebador H1-dnanE lambda rojo"
gen 3839..4528
/gen = "nanE"
CDS 3839..4528
/gen = "nanE"
/nota= "ECK3212: JW3192: b3223"
/codon_start = 1
/transl_table = 11
/product = "N-acetilmannosamina-6-P epimerasa predicha" /protein_id = "AP 003765.1"
/db xref = "GI: 89109985"
/ traducción ="msllaqldqkiaangglivscqpvpdspldkpeiva_amalaaeq
AGAVAIRIEG VAHLQATRAWSVP11GIVKRDLE DSPVRITñYIE DVDALAQAGADJI AIDGTDRPRPVPVETLLAR1HHHGLLAMIDCSTPEDGLACQKLGAEIIGTTLSGYTTP ETPEEPDLALVKTLSDAGCRVIAEGRYNXPAQAADAMRHGAWAVTVGSAITRLEHICQ WYNTAMKKAVL" (SEQ ID NO: 39) primer_bind complemento (4425..4474)
/nota=" para la eliminación de dnanato:: marca"
/marcador = "cebador H2-dnanE lambda rojo"
RBS 4425.. 4448
/marcador = "péptido incomprensible C-terminal fusionado al péptido de marca KD13"
RBS 4449.. 4451
/marcador = "péptido incomprensible NEW STOP péptido después de la resolución del casete"
primer_bind 4486..4530
/marcador = "cebador nanK-H1 lambda rojo"
RBS 4515..4520
/marcador = "nanK RBS"
gen 4525..5400
/gen = "nanK"
CDS 4525.. 5400
/gen = "nanK"
/nota= "ECK3211: JW5538: b3222"
/codon_start = 1
/transl_table = 11
/product = "N-acetilmannosamina quinasa predicha"
/protein_id = "AP 003764.1"
/db xref = "GI: 89109984"
/ traducción =’'mttl ai di ggx kla aalig adgqird rr elp ip asqxpealrd a
LSALVSPLQAHAQRVAIASrGIIRDGSLLALWPHNLGGLLHFPLVKTLEQLXNLPTIA
INDAQAAAWAEFQALDGDirDMVFITVSTGVGGGWSGCKLLTGPGGLAGBIGHTLAD
PHGPVCGCGRTGCVEAIASGRGIAAAAQGELAGADAKTIFTRAGQGDEQAQQL1HRSA
RTLARLIADIKATTDCQCVWGGSVGLAEGYLALVETYLAQEPAAFHVDLLAAHYRHD AGLLGAALLAQGEKL" (GEQ IDNO: 40
RBS 4526..4528
/marcador = "Parada natural de NanE"
cebador complemento (5065..5083)
/marcador = "cebador de control nanKck1"
primer_bind complemento (5380..5424)
/marcador = "cebador nanK-H2 lambda rojo"
gen 5397..5861
/gen = "yhcH"
CDS 5397..5861
/gen = "yhcH"
/nota= "ECK3210: JW3190: b3221"
/codon_start = 1
/transl_table = 11
/product = "proteína hipotética"
/protein_id = "AP 003763.1"
/db xref = "GI: 89109983"
/ traducción =”mmmgevqslpsaglhpalgdalt lal aarpqekapgry el qgdn
IFMNVMTFHTQSPVEKKAELHEQYIDIQLLLNGEERILFGMAGTARQCEEFHHEDDYQ LCSTIDNEQAIILKPGMFAVFMPGEPHKPGCVVGEPGEIKKVVVKVKADLMA'1
(SEQ IDNO: 41)
ORIGEN
1 GAACATTGTT GAACTCCGTG TCAAAAGAAA ACGGTCAATC CCATAAACGG CAGATTGAAA 61 ACAACGATGT TATATTTTTT GCAAGGCTAT TTATGGTGCG GATGTCGTGT TTTTAATTGT 121 AGGTGAGGTG ATTTTTCATT AAAAAATATG CGCTTATGAT TATTTTGTAA GAACACATTC 181 ATAATATTCA TAATGCTCGT GAATAGTCTT ATAAATAATT CAAACGGGAT GTTTTTATCT 241 GCGXTACATT AAXTTTTCGC AAXAGXXAAT XAXXCCGXXA AXXAIGGXAA XGAXGAGGCA 301 CAAAGAGAAA ACCCIGCCAX IIXCCCCXAC TXXCAAXCCI GXGAXAGGAX GXCACXGAXG 361 ATGXTAATCA CACTGACCXX ACAGAATGGG CCTTATGAAC GCAXTTGATT CGCAAACCGA 421 AGATXCXXCA CCXGCAAXXG GXCGCAACXT GCGXAGCCGC CCGCIGGCGC GXAAAAAACX 481 CXCCGAAAXG GTGGAAGAAG AGCTGGAACA GAXGATCCGC CGXCGXGAAX XTGGCGAAGG 541 TGAACAATXA CCGTCTGAAC GCGAACTGAT GGCGTTCTTT AACGTCGGGC GTCCTTCGGT 601 GCGIGAAGCG CXGGCAGCGX XAAAACGCAA AGGXCXGGXG CAAAXAAACA ACGGCGAACG 661 CGCTCGCGXC XCGCGXCCXX CXGCGGACAC XAXCATCGGX GAGCXXTCCG GCAXGGCGAA 721 AGAXTTCCTX XCXCAXCCCG GTGGGAXXGC CCAXIXCGAA CAAXXACGXC XGXICXIXGA 781 AXCCAGXCXG GXGCGCXAXG CGGCXGAACA XGCCACCGAX GAGCAAAXCG AXXXGCXGGC 841 AAAAGCACXG GAAATCAACA GXCAGXCGCT GGAXAACAAC GCGGCATXCA XXCGXXCAGA 901 CGXIGAXXXC CACCGCGXGC IGGCGGAGAT CCCCGGIAAC CCAAICXXCA XGGCGAXCCA 961 CGXTGCCCXG CXCGACXGGC IIAIXGCCGC ACGCCCAACG GXXACCGAXC AGGCACTGCA 1021 CGAACAIAAC AACGXIAGIX AICAACAGCA XAXTGCGAIC GTIGATGCGA ICCGCCGXCA 1081 XGAXCCXGAC GAAGCCGAXC GXGCGXXGCA AXCGCAXCXC AACAGCGXCX CXGCXACCXG 1141 GCACGCXXXC GGXCAGACCA CCAACAAAAA GAAATAAXGC CACITTAGXG AAGCAGATCG 1201 CAXXAXAAGC XXXCXGXAXG GGGXGXXGCX XAAXXGAXCX GGXAXAACAG GXAXAAAGGX 1261 AXAXCGXXXA TCAGACAAGC AXCACXXCAG AGGTAXXXAX GGCAACGAAX XXACGXGGCG 1321 XAATGGCXGC ACXCCXGACX CCTXXXGACC AACAACAAGC ACXGGAXAAA GCGAGXCXGC 1381 GXCGCCXGGT XCAGXXCAAX AXTCAGCAGG GCATCGACGG TXTATACGXG GGXGGXXCGA 1441 CCGGCGAGGC CXXXGXACAA AGCCXXXCCG AGCGXGAACA GGXACXGGAA AXCGXCGCCG 1501 AAGAGGCGAA AGGXAAGAXX AAACXCAXCG CCCACGXCGG TXGCGXCAGC ACCGCCGAAA 1561 GCCAACAACT XGCGGCAXCG GCXAAACGTX AXGGCXXCGA XGCCGXCXCC GCCGXCACGC 1621 CGXTCTACXA TCCXXXCAGC XXTGAAGAAC ACXGCGAXCA CXAXCGGGCA ATXAXXGAXX 1681 CGGCGGATGG TIXGCCGAIG GIGGIGIACA ACATTCCAGC CCIGAGTGGG GTAAAACXGA 1741 CCCXGGAXCA GAXCAACACA CXXGXXACAX XGCCXGGCGX AGGXGCGCXG AAACAGACCX 1801 CXGGCGAXCX CTAXCAGAXG GAGCAGATCC GXCGTGAACA XCCIGAXCXX GTGCXCXAXA 1861 ACGGXTACGA CGAAAXCTXC GCCXCXGGTC XGCTGGCGGG CGCXGAXGGX GGTAXCGGCA 1921 GTACCTACAA CAXCAXGGGC XGGCGCXATC AGGGGAXCGX XAAGGCGCXG AAAGAAGGCG 1981 AXAXCCAGAC CGCGCAGAAA CXGCAAACTG AAXGCAAXAA AGXCAXXGAX XXACXGAXCA 2041 AAACGGGCGT AXXCCGCGGC CXGAAAACTG XCCTCCAXXA XAXGGAXGXC GXXXCXGXGC 2101 CGCXGXGCCG CAAACCGXXX GGACCGGXAG ATGAAAAATA XCXGCCAGAA CXGAAGGCGC 2161 XGGCCCAGCA GTXGAXGCAA GAGCGCGGGX GAGIXGXXIC CCCICGCXCG CCCCXACCGG 2221 GXGAGGGGAA AXAAACGCAX CXGXACCCTA CAAXXXXCAX ACCAAAGCGX GXGGGCAXCG 2281 CCCACCGCGG GAGACXCACA AXGAGXACTA CAACCCAGAA XAXCCCGXGG XAXCGCCAXC 2341 XCAACCGTGC ACAAXGGCGC GCAXXIICCG CXGCCIGGIX GGGAXATCXG CTXGACGGXX 2401 XXGAXTXCGX TXXAAXCGCC CXGGXACXCA CCGAAGXACA AGGXGAAXXC GGGCXGACGA 2461 CGGXGCAGGC GGCAAGTCXG AXCXCXGCAG CCXTTAXCXC XCGCXGGXXC GGCGGCCTGA 2521 XGCXCGGCGC TATGGGTGAC CGCXACGGGC GXCGTCXGGC AAXGGTCACC AGCAXCGXXC 2581 XCXXCXCGGC CGGGACGCXG GCCXGCGGCX TXGCGCCAGG CTACATCACC ATGTXTATCG 2641 CXCGXCXGGT CAXCGGCAXG GGGAXGGCGG GTGAAIACGG TXCCAGCGCC ACCXAXGXCA 2701 XXGAAAGCXG GCCAAAACAX CXGCGXAACA AAGCCAGXGG TXTXXTGAXX XCAGGCXXCX 2761 CTGTGGGGGC CGTCGTTGCC GCTCAGGTCI ATAGCCTGGT GGTTCCGGTC TGGGGCTGGC 2821 GTGCGCTGTT CTTTATCGGC ATTTTGCCAA TCATCTTTGC TCTCTGGCTG CGTAAAAACA 2881 TCCCGGAAGC GGAAGACTGG AAAGAGAAAC ACGCAGGTAA AGCACCAGTA CGCACAATGG 294 I TGGATATTCT CTACCGTGGT GAACATCGCA TTGCCAATAT CGTAATGACA CTGGCGGCGG 3001 CTACTGCGCT GTGGTTCTGC TTCGCCGGTA ACCTGCAAAA TGCCGCGATC GTCGCTGTTC 3061 TTGGGCTGTT ATGCGCCGCA ATCTTTATCA GCTTTATGGT GCAGAGTGCA GGCAAACGCT 3121 GGCCAACGGG CGTAATGCTG ATGGTGGTCG TGTTGTTTGC TTTCCTCTAC TCATGGCCGA 3121 TTCAGGCGCT GCTGCCAACG TATCTGAAAA CCGATCTGGC TTATAACCCG CATACTGTAG 3241 CCAATGTGCT GTTCTTTAGT GGCTTIGGCG CGGCGGTGGG ATGCTGCGTA GGTGGCTTCC 3301 TCGGTGACTG GCTGGGAACC CGCAAAGCGT ACGTXTGTAG CCTGCTGGCC TCGCAGCTGC 336 L TGATTATTCC GGTATTTGCG ATTGGCGGCG CAAACGTCTG GGTGCTCGGT CTGTTACTGT 8421 TCTTCCAGCA AATGCTTGGA CAAGGGATCG CCGGGATCIT ACCAAAACTG ATTGGCGGTT .248 I ATTTCGATAC CGACCAGCGT GCAGCGGGCC TGGGCTTTAC CTACAACGTT GGCGCATTGG 3541 GCGGTGCACT GGCCCCAATC ATCGGCGCGT TGATCGCTCA ACGTCTGGAT CTGGGTACTG .2601 CGCTGGCATC GCTCTCGTTC AGTCTGACGT TCGTGGTGAT CCTGCTGATT GGGCTGGATA 3661 TGCCTTCTCG CGTTCAGCGT TGGTTGCGCC CGGAAGCGTT GCGTACTCAT GACGCTATCG 3721 ACGGTAAACC ATTCAGCGGT GCCGTGCCGT TTGGCAGCGC CAAAAACGAT TTAGTCAAAA 3781 CCAAAAGTTA ATCCTGTTGC CCGGTCTATG TACCGGGCCT TTCGCTAAGG GAAGATGTAT 3841 GTCGTTACTT GCACAACTGG ATCAAAAAAT CGCTGCTAAC GGTGGCCTGA TTGTCTCCTG 8901 CCAGCCGGTT CCGGACAGCC CGCTCGATAA ACCCGAAATC GTCGCCGCCA TGGCATTAGC 3961 GGCAGAACAG GCGGGCGCGG TTGCCATTCG CATTGAAGGT GTGGCAAATC TGCAAGCCAC 402 L GCGTGCGGTG GTGAGCGTGC CGATTATTGG AATTGTGAAA CGCGATCTGG AGGATTCTCC 408 I GGTACGCATC ACGGCCTATA TTGAAGATGT TGATGCGCTG GCGCAGGCGG GCGCGGACAT 4141 TATCGCCATT GACGGCACCG ACCGCCCGCG TCCGGTGCCT GTTGAAACGC TGCTGGCACG 4201 TATTCACCAT CACGGTTTAC TGGCGATGAC CGACTGCTCA ACGCCGGAAG ACGGCCTGGC 4261 ATGCCAAAAG CTGGGAGCCG AAATTATTGG CACTACGCTT TCTGGCTATA CCACGCCTGA 4321 AACGCCAGAA GAGCCGGATC TGGCGCTGGT GAAAACGTTG AGCGACGCCG GATGTCGGGT 4381 GATTGCCGAA GGGCGTTACA ACACGCCTGC TCAGGCGGCG GATGCGATGC GCCACGGCGC 4441 GTGGGCGGTG ACGGTCGGTT CTGCAATCAC GCGTCTTGAG CACATTTGTC AGTGGTACAA 4501 CACAGCGATG AAAAAGGCGG TGCTATGACC ACACTGGCGA TTGATATCGG CGGTACTAAA 4561 CTTGCCGCCG CGCIGATTGG CGCTGACGGG CAGATCCGCG A 7CGTCGTGA ACTTCC7ACG ■1621 CCAGCCAGCC AGACACCAGA AGCCTTGCGT GATGCCTTAT CCGCATTAGT CTCTCCGTTG 4681 CAAGCTCATG CGCAGCGGGT TGCCATCGCT TCGACCGGGA TAATCCGTGA CGGCAGCTTG 4741 CTGGCGCTTA ATCCGCATAA TCTTGGTGGA TTGCTACACT TTCCGTTAGT CAAAACGCTG 4801 GAACAACTTA CCAATTTGCC GACCATTGCC ATTAACGACG CGCAGGCCGC AGCATGGGCG 4861 GAGTTTCAGG CGCTGGATGG CGATATAACC GATATGGTCT TTATCACCGT TTCCACCGGC 4921 GTTGGCGGCG GTGTAGTGAG CGGCTGCAAA CTGCTTACCG GCCCTGGCGG TCTGGCGGGG 4981 CATATCGGGC ATACGCTTGC CGATCCACAC GGCCCAGTCT GCGGCTGTGG ACGCACAGGT 5041 TGCGTGGAAG CGATTGCTTC TGGTCGCGGC ATTGCAGCGG CAGCGCAGGG GGAGTTGGCT 5101 GGCGCGGATG CGAAAACTAT TTTCACGCGC GCCGGGCAGG GTGACGAGCA GGCGCAGCAG 5161 CTGATTCACC GCTCCGCACG TACGCTTGCA AGGCTGATCG CTGATATTAA AGCCACAACT 5221 GATTGCCAGT GCGTGGTGGT CGGTGGCAGC GTTGGTCTGG CAGAAGGGTA TCTGGCGCTG 5281 GTGGAAACGT ATCIGGCGCA GGAGCCAGCG GCATTICATG TTGATTTACT GGCGGCGCAT 5341 TACCGCCATG ATGCAGGTTT ACTTGGGGCT GCGCTGTTGG CCCAGGGAGA AAAATIATGA 5401 TGATGGGTGA AGTACAGTCA TTACCGTCTG CTGGGTTACA TCCTGCG1'7A CAGGACGCGT 5 161 TAACGCTGGC ATTAGCTGCC AGACCGCAAG AAAAAGCGCC GGGTCGTTAC GAATTACAGG 5521 GCGACAATAT CTTTATGAAT GTCATGACGT TTAACACICA ATCGCCCGTC GAGAAAAAAG 5581 CGGAATTGCA CGAGCAATAC ATTGATATCC AGCTGTTATT AAACGGTGAG GAACGGATTC 5641 TGTTTGGCAT GGCAGGCACT GCGCGTCAGT GTGAAGAGTT CCACCATGAG GATGATTATC 5701 AGCTTTGCAG CACCATTGAT AACGAGCAAG CCATCATCTT AAAACCGGGA ATGTTCGCCG 5761 TGTTTATGCC AGGTGAACCG CATAAACCAG GATGCGTTGT CGGCGAGCCT GGAGAGATTA 5821 AAAAGGTTGT GGTGAAGGTT AAGGCTGATT TAATGGCTTA A (SEQ ID NO: 42) U

Claims (22)

REIVINDICACIONES
1. Un método para producir un oligosacárido sialilado en una bacteria que comprende:
proporcionar una bacteria, comprendiendo dicha bacteria, una sialil-transferasa exógena, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de lactosa permeasa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE), que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, y cultivar dicha bacteria en presencia de lactosa.
2. El método de la reivindicación 1, en donde dicha ruta catabólica deficiente en ácido siálico comprende además una mutación en el gen endógeno de transportador de ácido W-acetilneuramínico (nanT).
3. El método de una cualquiera de las reivindicaciones anteriores, en donde la mutación comprende una mutación nula.
4. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha capacidad sintética de ácido siálico comprende un gen exógeno de CMP-Neu5Ac sintetasa (neuA), un gen exógeno de ácido siálico sintasa (neuB) y un gen exógeno de UDP-GlcNac 2-epimerasa (neuC).
5. El método de una cualquiera de las reivindicaciones anteriores, en donde dicho gen exógeno de sialil-transferasa es a(2,3) sialil-transferasa, a(2,6) sialil-transferasa o a(2,8) sialil-transferasa.
6. El método de una cualquiera de las reivindicaciones anteriores, en donde dicho oligosacárido sialilado comprende 3'-sialillactosa (3'-SL) o 6'-sialillactosa (6'-SL).
7. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha bacteria comprende un gen endógeno de p-galactosidasa delecionado o inactivado, en particular, en donde dicho gen de p-galactosidasa delecionado o inactivado comprende el gen de lacZ de E. coli.
8. El método de la reivindicación 1, en donde dicha bacteria comprende un gen de p-galactosidasa recombinante que proporciona un nivel bajo, pero detectable, de actividad p-galactosidasa.
9. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha bacteria comprende además un gen lacA delecionado, inactivado o mutado.
10. El método de una cualquiera de las reivindicaciones anteriores, en donde dicha bacteria comprende una mayor capacidad de producción de UDP-GlcNAc, en particular
(a) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;
(b) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión del gen nagC de E. coli;
(c) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de nagC y glmS;
(d) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de nagC y glmY; o
(e) en donde dicha mayor capacidad de producción de UDP-GlcNAc comprende la sobreexpresión de nagC y glmZ.
11. Un método para producir, en una bacteria, un oligosacárido que contenga N-acetilglucosamina, que comprende:
proporcionar una bacteria, comprendiendo dicha bacteria un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa, un gen funcional de lactosa permeasa; y cultivar dicha bacteria en presencia de lactosa, en donde dicha bacteria comprende la sobreexpresión de
(a) un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;
(b) el gen nagC de E. coli;
(c) el gen nagC y el gen glmS;
(d) el gen nagC y el gen glmY; o
(e) el gen nagC y el gen glmZ.
12. El método de la reivindicación 11, en donde dicha bacteria comprende una mayor capacidad de producción de UDP-GlcNAc.
13. El método de la reivindicación 11 o 12, en donde dicho oligosacárido que contiene N-acetilglucosamina comprende una cualquiera seleccionada de Lacto-N-triosa 2 (LNT2), Lacto-N-tetraosa (LNT), Lacto-N-neotetraosa (LNnT), Lacto-N-fucopentaosa I (LNF I), Lacto-N-fucopentaosa II (LNF II), Lacto-N-fucopentaosa III (LNF III), Lacto-N-fucopentaosa V (Ln F V), Lacto-N-difucohexaosa I (LDFH I), Lacto-N-difucohexaosa II (LDFH II) y Lacto-N-neodifucohexaosa II (LFNnDFH II).
14. El método de una cualquiera de las reivindicaciones 1-13, en donde dicha bacteria es E. coli.
15. Un método de purificación de un oligosacárido sialilado producido mediante el método de una cualquiera de las reivindicaciones 1-10, que comprende unir dicho oligosacárido sialilado procedente de un lisado de células bacterianas o de un sobrenadante de cultivo de células bacterianas de dicha bacteria, a una columna de carbono, y eluir dicho oligosacárido sialilado de dicha columna.
16. Un método de purificación de un oligosacárido que contiene N-acetilglucosamina producido mediante el método de una cualquiera de las reivindicaciones 11-14, que comprende unir dicho oligosacárido que contiene N-acetilglucosamina procedente de un lisado de células bacterianas o de un sobrenadante de cultivo de células bacterianas de dicha bacteria, a una columna de carbono, y eluir dicho oligosacárido que contiene N-acetilglucosamina de dicha columna.
17. Un bacteria de E. coli aislada que comprende un gen endógeno de p-galactosidasa delecionado o inactivado, un gen exógeno de sialil-transferasa, una ruta catabólica deficiente en ácido siálico, una capacidad sintética de ácido siálico y un gen funcional de lactosa permeasa, en donde dicha ruta catabólica deficiente en ácido siálico comprende un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE) que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, en particular
(a) en donde dicha bacteria comprende además un gen de p-galactosidasa recombinante que proporciona un nivel bajo, pero detectable, de actividad p-galactosidasa; o
(b) un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa y un gen funcional de lactosa permeasa.
18. Una cepa hospedadora bacteriana aislada que comprende una construcción de ácido nucleico que comprende un gen exógeno de sialil-transferasa, un gen endógeno de p-galactosidasa delecionado o inactivado, una ruta de síntesis de ácido siálico, un gen funcional de lactosa permeasa y un gen delecionado de lactosa acetiltransferasa, en donde la cepa hospedadora bacteriana comprende además un gen endógeno de N-acetilneuraminato liasa (nanA) y un gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE) que están mutados y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, en particular en donde dicho gen exógeno de sialiltransferasa codifica una a(2,3) sialil-transferasa o una a(2,6) sialil-transferasa.
19. Una cepa hospedadora bacteriana aislada que comprende una construcción de ácido nucleico que comprende un gen exógeno de UDP-GlcNAc:Gala/p-R p 3-N-acetilglucosaminiltransferasa, un gen funcional de lactosa permeasa y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no está mutado, y en donde la cepa hospedadora bacteriana comprende la sobreexpresión de
(a) un gen nagC, un gen glmS, un gen glmY, un gen glmZ o cualquier combinación de los mismos;
(b) el gen nagC de E. coli;
(c) el gen nagC y el gen glmS;
(d) el gen nagC y el gen glmY; o
(e) el gen nagC y el gen glmZ.
20. El método de una cualquiera de las reivindicaciones 1-10, que comprende además recuperar dicho oligosacárido sialilado de dicha bacteria o de un sobrenadante de cultivo de dicha bacteria; o el método de una cualquiera de las reivindicaciones 11-13, que comprende además recuperar dicho oligosacárido que contiene N-acetilglucosamina de dicha bacteria o de un sobrenadante de cultivo de dicha bacteria.
21. El método de una cualquiera de las reivindicaciones 1-10, en donde dicha bacteria comprende una mayor capacidad de producción de UDP-GlcNac que comprende uno o más genes glm seleccionados del grupo que consiste en: glmS, glmY y glmZ.
22. Un método de producción de un oligosacárido sialilado de leche humana en una bacteria, que comprende: proporcionar una bacteria, comprendiendo dicha bacteria una mutación en el gen endógeno de N-acetilneuraminato liasa (nanA), una mutación en el gen endógeno de N-acetilmanosamina-6-fosfato epimerasa (nanE), una mutación en el gen endógeno de transportador de ácido N-acetilneuramínico (nanT) y un gen endógeno de N-acetilmanosamina quinasa (nanK) que no esté mutado, y cultivar dicha bacteria en presencia de lactosa.
ES18192520T 2013-03-14 2014-03-14 Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina Active ES2930286T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361782999P 2013-03-14 2013-03-14

Publications (1)

Publication Number Publication Date
ES2930286T3 true ES2930286T3 (es) 2022-12-09

Family

ID=51581464

Family Applications (2)

Application Number Title Priority Date Filing Date
ES14769797T Active ES2700274T3 (es) 2013-03-14 2014-03-14 Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina
ES18192520T Active ES2930286T3 (es) 2013-03-14 2014-03-14 Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES14769797T Active ES2700274T3 (es) 2013-03-14 2014-03-14 Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina

Country Status (8)

Country Link
US (3) US9758803B2 (es)
EP (3) EP3467100B1 (es)
CA (1) CA2904091A1 (es)
DE (1) DE14769797T1 (es)
DK (2) DK2970872T3 (es)
ES (2) ES2700274T3 (es)
HU (1) HUE060672T2 (es)
WO (1) WO2014153253A1 (es)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2707379A4 (en) 2011-05-13 2014-10-08 Glycosyn LLC USE OF PURIFIED 2'-FUCOSYLLACTOSIS, 3-FUCOSYLLACTOSIS AND LACTODIFUCOTETRAOSE AS PREBIOTICS
EP2919978B1 (en) * 2012-11-16 2016-10-12 Kongsberg Actuation Systems II, Inc. Method of forming a hose assembly
ES2700274T3 (es) * 2013-03-14 2019-02-14 Glycosyn LLC Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina
US9688970B2 (en) * 2013-10-01 2017-06-27 Kentucky Bioprocessing, Inc. Plant-based recombinant butyrylcholinesterase production methods
CN106460024B (zh) * 2014-06-27 2021-10-01 格礼卡姆股份公司 寡糖的制备
US11926858B2 (en) 2014-06-27 2024-03-12 Glycom A/S Oligosaccharide production
US20170204443A1 (en) * 2014-07-14 2017-07-20 Basf Se Biotechnological production of lnt, lnnt and the fucosylated derivatives thereof
US10350249B2 (en) 2014-12-12 2019-07-16 The Regents Of The University Of California Reduction of milk glycans and their degradation products in the neonate gut
WO2017152918A1 (en) 2016-03-07 2017-09-14 Glycom A/S Separation of oligosaccharides from fermentation broth
WO2017174037A1 (zh) * 2016-04-05 2017-10-12 孙镧 微生物发酵生产n-乙酰-d-氨基葡萄糖和/或d-氨基葡萄糖盐的方法
CN107267577A (zh) * 2016-04-05 2017-10-20 孙镧 微生物发酵生产n‑乙酰‑d‑氨基葡萄糖和/或d‑氨基葡萄糖盐的方法
WO2017174039A1 (zh) * 2016-04-05 2017-10-12 孙镧 微生物发酵生产n-乙酰-d-氨基葡萄糖和/或d-氨基葡萄糖盐的方法
EP3445770A4 (en) 2016-04-19 2020-03-18 Glycom A/S SEPARATION OF OLIGOSACCHARIDES FROM A FERMENTATION BROTH
EP3474861A4 (en) 2016-06-24 2020-04-15 Glycom A/S COMPOUNDS COMPRISING HMOS FOR THE PREVENTION AND / OR TREATMENT OF VIRAL AND / OR BACTERIAL INFECTIONS.
US10407516B2 (en) 2016-10-31 2019-09-10 Glycom A/S Crystalline HMO
US10633682B2 (en) 2017-03-07 2020-04-28 DePuy Synthes Products, Inc. Bioresorbable exopolysaccharides
US10767205B2 (en) 2017-03-07 2020-09-08 DePuy Synthes Products, Inc. Bacterium for the production of an exopolysaccharide comprising N-acetylglucosamine and D-glucose
US11214588B2 (en) 2017-06-30 2022-01-04 Glycom A/S Synthesis of oligosaccharides
CN110914284A (zh) 2017-07-12 2020-03-24 格礼卡姆股份公司 包含中性单糖或寡糖和酸性非碳水化合物组分的无定形混合物
SG11202000640RA (en) 2017-07-26 2020-02-27 Jennewein Biotechnologie Gmbh Sialyltransferases and their use in producing sialylated oligosaccharides
CN107312738B (zh) * 2017-07-26 2020-03-06 江南大学 一种高效生产果糖软骨素的重组大肠杆菌及其构建方法
WO2019063757A1 (en) 2017-09-29 2019-04-04 Frieslandcampina Nederland B.V. PROCESS FOR PURIFYING NEUTRAL HUMAN MILK (HMO) OLIGOSACCHARIDE FROM MICROBIAL FERMENTATION
EP3473644A1 (en) 2017-10-17 2019-04-24 Jennewein Biotechnologie GmbH Fermentative production of n-acetylneuraminic acid
CN107739728A (zh) * 2017-10-19 2018-02-27 江南大学 一种高效生产氨基葡萄糖的重组大肠杆菌及其应用
EP3486326A1 (en) * 2017-11-21 2019-05-22 Jennewein Biotechnologie GmbH Method for the purification of n-acetylneuraminic acid from a fermentation broth
CA3085931A1 (en) 2017-12-15 2019-06-20 Glycosyn LLC Sialyltransferases and uses thereof
ES2933995T3 (es) 2018-05-28 2023-02-15 Chr Hansen Hmo Gmbh Producción fermentativa de sacáridos sialilados
CN109825465B (zh) * 2019-02-27 2021-11-12 光明乳业股份有限公司 基于平衡udp-糖供给合成乳酰-n-新四糖的重组枯草芽孢杆菌及其构建方法与应用
CN109735480B (zh) * 2019-02-27 2021-11-12 光明乳业股份有限公司 一种合成乳酰-n-新四糖的重组枯草芽孢杆菌及其构建方法与应用
CN110066801B (zh) * 2019-04-30 2021-01-29 江南大学 一种枯草芽孢杆菌中唾液酸诱导表达元件及构建方法
EP3772539A1 (en) * 2019-08-08 2021-02-10 Jennewein Biotechnologie GmbH Sialyltransferases for the production of 6'-sialyllactose
EP3789495A1 (en) * 2019-09-03 2021-03-10 Jennewein Biotechnologie GmbH Production of sialylated oligosaccharides in bacillus cells
WO2021019104A2 (en) 2019-09-18 2021-02-04 Basf Se A production host for producing human milk oligosaccharides
US20230174991A1 (en) 2020-02-14 2023-06-08 Inbiose N.V. Kdo-free production hosts for oligosaccharide synthesis
AU2021273198A1 (en) 2020-05-13 2023-02-02 Glycosyn LLC Fucosylated oligosaccharides for prevention of coronavirus infection
AU2021271697A1 (en) 2020-05-13 2023-02-02 Glycosyn LLC 2'-fucosyllactose for the prevention and treatment of coronavirus-induced inflammation
CN116323927A (zh) * 2020-08-10 2023-06-23 因比奥斯公司 双糖及/或寡糖的细胞生产
AU2021324068A1 (en) 2020-08-10 2023-03-30 Inbiose N.V. Production of an oligosaccharide mixture by a cell
DK3954778T5 (da) 2020-08-10 2024-08-05 Inbiose Nv Produktion af en blanding af neutrale ikke-fucosylerede oligosaccharider af en celle
EP4192945A1 (en) * 2020-08-10 2023-06-14 Inbiose N.V. Cellular production of sialylated di- and/or oligosaccharides
EP4228436A1 (en) 2020-10-16 2023-08-23 Société des Produits Nestlé S.A. Nutritional composition comprising human milk oligosaccharides
WO2022101222A1 (en) 2020-11-10 2022-05-19 Société des Produits Nestlé S.A. Nutritional composition
KR20230124995A (ko) * 2020-12-22 2023-08-28 크리스찬 한센 에이치엠오 게엠베하 6'-시알릴락토스의 생산을 위한 시알릴트랜스퍼라제
CN114350584B (zh) * 2021-12-17 2024-03-01 嘉必优生物技术(武汉)股份有限公司 高产唾液酸乳糖的工程菌及其构建方法与应用
DK202201117A1 (en) 2022-12-09 2024-08-08 Dsm Ip Assets Bv Genetically modified udp-n-acetylgalactosamine producing cells
WO2024165611A1 (en) * 2023-02-07 2024-08-15 Inbiose N.V. Production of a disaccharide and/or milk oligosaccharide by a cell with reduced synthesis of udp-glcnac

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2796082B1 (fr) * 1999-07-07 2003-06-27 Centre Nat Rech Scient Procede de production d'oligosaccharides
WO2006034225A2 (en) * 2004-09-17 2006-03-30 Neose Technologies, Inc. Production of oligosaccharides by microorganisms
PT1991690E (pt) * 2006-03-09 2014-04-22 Centre Nat Rech Scient Método para a produção de oligossacáridos sialilados
BRPI0715253A2 (pt) 2006-09-26 2013-06-04 Univ Syracuse micràbio geneticamente manipulado, mÉtdo para a produÇço de Ácido siÁlico e mÉtodo para a produÇço de um anÁlogo de Ácido siÁlico n-acil
EP2076601B1 (en) 2006-10-03 2011-03-30 Centre National De La Recherche Scientifique -Cnrs- High yield production of sialic acid (neu5ac) by fermentation
AU2008240078B2 (en) * 2007-04-16 2012-10-25 Momenta Pharmaceuticals, Inc. Multi-dimensional chromatographic methods for separating N-glycans
CA2827313C (en) * 2011-02-16 2023-08-22 Glycosyn LLC Biosynthesis of human milk oligosaccharides in engineered bacteria
EP2707379A4 (en) 2011-05-13 2014-10-08 Glycosyn LLC USE OF PURIFIED 2'-FUCOSYLLACTOSIS, 3-FUCOSYLLACTOSIS AND LACTODIFUCOTETRAOSE AS PREBIOTICS
US9029136B2 (en) 2012-07-25 2015-05-12 Glycosyn LLC Alpha (1,2) fucosyltransferases suitable for use in the production of fucosylated oligosaccharides
ES2700274T3 (es) 2013-03-14 2019-02-14 Glycosyn LLC Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina
ES2962258T3 (es) 2014-05-15 2024-03-18 Glycosyn LLC Singenes de alfa(1,2) fucosiltransferasa para su utilización en la producción de oligosacáridos fucosilados

Also Published As

Publication number Publication date
EP3467100B1 (en) 2022-09-21
EP2970872B1 (en) 2018-09-05
DK2970872T3 (da) 2019-01-02
HUE060672T2 (hu) 2023-04-28
ES2700274T3 (es) 2019-02-14
DE14769797T1 (de) 2016-06-23
US11618912B2 (en) 2023-04-04
US10415069B2 (en) 2019-09-17
DK3467100T3 (da) 2022-11-14
DK2970872T1 (da) 2016-05-09
EP2970872A4 (en) 2016-11-09
US20160024543A1 (en) 2016-01-28
EP4166650A1 (en) 2023-04-19
CA2904091A1 (en) 2014-09-25
US20180057849A1 (en) 2018-03-01
US20200190548A1 (en) 2020-06-18
EP3467100A1 (en) 2019-04-10
EP2970872A1 (en) 2016-01-20
US9758803B2 (en) 2017-09-12
WO2014153253A1 (en) 2014-09-25

Similar Documents

Publication Publication Date Title
ES2930286T3 (es) Microorganismos y métodos para producir oligosacáridos sialilados y que contienen N-acetilglucosamina
US20210261995A1 (en) Biosynthesis of human milk oligosaccharides in engineered bacteria
CA2879677C (en) Alpha (1,2) fucosyltransferases suitable for use in the production of fucosylated oligosaccharides
BR112020012207A2 (pt) construção do ácido nucleico para expressão gênica in vitro e in vivo
US9481888B2 (en) Recombinant bacterium and methods of antigen and nucleic acid delivery
ES2933995T3 (es) Producción fermentativa de sacáridos sialilados
BR112020001628A2 (pt) sialiltransferases e uso das mesmas na produção de oligossacarídeos sialilados
US20240084246A1 (en) ß-1,3-GALACTOSYLTRANSFERASES FOR USE IN THE BIOSYNTHESIS OF OLIGOSACCHARIDES