MXPA02012880A - Construccion modificada hacia el extremo 3' del codon de iniciacion para sobreexpresion de proteina recombinante. - Google Patents

Construccion modificada hacia el extremo 3' del codon de iniciacion para sobreexpresion de proteina recombinante.

Info

Publication number
MXPA02012880A
MXPA02012880A MXPA02012880A MXPA02012880A MXPA02012880A MX PA02012880 A MXPA02012880 A MX PA02012880A MX PA02012880 A MXPA02012880 A MX PA02012880A MX PA02012880 A MXPA02012880 A MX PA02012880A MX PA02012880 A MXPA02012880 A MX PA02012880A
Authority
MX
Mexico
Prior art keywords
recombinant protein
sequence
further characterized
interest
mutated
Prior art date
Application number
MXPA02012880A
Other languages
English (en)
Inventor
Laurent Chevalet
Original Assignee
Pf Medicament
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pf Medicament filed Critical Pf Medicament
Publication of MXPA02012880A publication Critical patent/MXPA02012880A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • C12N15/71Expression systems using regulatory sequences derived from the trp-operon

Landscapes

  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

La invencion se refiere a una construccion para expresar un gen que codifica para una proteina recombinante de interes colocada bajo el control de un operon (Ptrp) de triptofan de una celula procariotica, que comprende directamente, hacia el extremo 3' del codon de iniciacion, una secuencia nucleica SEQ ID N° 1 y, hacia el extremo 3' de dicha secuencia, un cassette de clonacion multiple diseñado para recibir el gen que codifica para dicha proteina recombinante de interes, al menos acidos nucleicos de la secuencia nucleica SEQ ID N° 1 siendo mutados o suprimidos para permitir la sobreexpersion de dicha proteina recombinante; la invencion tambien se refiere a un vector que contiene dicha construccion, una celula hospedera procariotica transformada mediante dicho vector, asi como a un metodo para producir una proteina recombinante de interes utilizando la construccion de la invencion.

Description

CONSTRUCCIÓN MODIFICADA HACIA EL EXTREMO 3' DEL CODON DE INICIACIÓN PARA SOBREEXPRESION DE PROTEINA RECOMBINANTE MEMORIA DESCRIPTIVA La invención se refiere a una construcción para la expresión de un gen que codifica para una proteína recombinante de interés colocada bajo el control del operón Ptrp de triptofán, en una célula hospedera procariótica, que comprende, directamente corríente debajo del codón de iniciación, una secuencia de ácido nucleico de secuencia SEQ ID No. 1 y, corriente debajo de esta secuencia, un cassette de clonación múltiple para recibir el gen que codifica para dicha proteína recombinante de interés, al menos uno de los nucleótidos de la secuencia SEQ ID No. 1 mutado o suprimido para permitir la sobreexpresión de dicha proteína recombinante. La invención también se refiere a un vector que contiene dicha construcción, a una célula hospedera procariótica transformada con dicho vector, y también a un método para producir una proteína recombinante de interés utilizando una construcción de conformidad con la invención. La capacidad de los biotecnólogos para clonar un gen en cortos periodos, para expresarlos en forma de una proteína biológicamente activa y posteriormente crear variantes de la misma para establecer las relaciones secuencia/función ha hecho posible proponer una amplia gama de proteínas recombinantes para propósitos médicos o de investigación. Muchas enfermedades de humanos ahora se tratan o se evitan debido a la disponibilidad de moléculas derivadas de la biotecnología en forma pura y a un costo aceptable (K. Koths, Current Opinión in Biotechnology, 6, 681-687, 1995). Las células bacterianas son hospederos preferidos para la expresión de proteínas recombinantes ya que tienen requerimientos de nutrientes limitados mientras que al mismo tiempo son capaces de alcanzar altas densidades de crecimiento, pero también han sido la materia, en el pasado, de muchas investigaciones que han conducido a la generación de mutantes de interés y de sistemas de expresión de plásmidos variados. Entre las bacterias, Escherichia coli (E Coli) es la más comúnmente utilizada y el organismo más completamente caracterizado, a juzgar por la literatura abundante con relación a la expresión en el mismo de proteínas de origen procariótico o eucariótico. Sin embargo, no todas las proteínas se expresan en el mismo con la misma eficacia debido a las dificultades que pueden ocurrir en varios niveles: transcripción del gen de interés, traducción, eventos de posttraducción que afectan lo que resulta de la molécula en el entorno citoplásmico o periplásmico de ia bacteria (S.C. Makrides, Microbiological Reviews, 60, 512-538, 1996). Para ser traducido de manera eficaz, un ARN mensajero puede contener una secuencia especificando el enlace del ribosoma bacteriano y permitiendo la iniciación de la traducción. Esta secuencia, llamada sitio de enlace a ribosoma (RBS), se ubica en una región que cubre el codón de iniciación. El análisis estadístico de los dominios de iniciación de ARNm bacteriano revela la existencia de una ventana de 34 nucleótidos, cuya secuencia difiere de una distribución aleatoria (L. Gold, Annual Review of Biochemistry, 57, 199-233, 1988). Esta secuencia, oscila de la posición -20 a la posición +13 del ARNm si la posición +1 se atribuye al primer nucleótido del codón de iniciación, juega el papel de RBS al ayudar al ribosoma a distinguir los dominios de iniciación reales de toda las secuencias "similares a RBS". Muchas investigaciones han hecho posible refinar el conocimiento con relación a RBS para definir algunos elementos característicos del mismo: i) La secuencia de Shine-Dalaarno (SD): Debido a la secuenciación del extremo 3' del 16S ARN ribosomal (J. Shine and L. Dalgarno, Proc. Nati. Acad. Sci. U.S.A., 71, 1342-1346, 1974), la secuencia de "Shine-Dalgarno" se ha definido como 5' colocado en la región de ARNm del codón de iniciación presentando capacidad complementaria con la secuencia 5' -CCUCCUUA-3' del extremo 3' del 16S ARNr. La existencia de una interacción entre el 16S ARNr y el RBS, mediada por la secuencia de Shine-Dalgarno, se confirma por la representación fuerte de las bases de purina A y G en la región [-12; -7] de RBS naturales de ARNm de E Coli. Esta desviación se encuentra en una colección de 158 RBS aleatorios seleccionados por su capacidad de promover la expresión de un gen reportero (D. Barrick et al., Nucleic Acids. Res., 22, 1287-1295, 1994). ii) El codón de iniciación: Es el codón de AUG el que se utiliza preferencialmente como el codón de iniciación, aunque GUG y, a un menor grado, UUG pueden encontrarse ocasionalmente (S. Ringquist et al., Molecular Microbiology, 6, 1219-1229, 1992). ¡ii) La distancia entre la secuencia de SD v el codón de iniciación: Un estudio exhaustivo realizado por H. Chen et al. (Nucleic Acids Research, 22, 4953-4957, 1994a) ha mostrado la existencia de una distancia óptima que separa el extremo 3' de la secuencia de Shine-Dalgarno y el codón de iniciación. Tomando la secuencia de consenso 5' -UAAGGAGGU-3' como la secuencia de SD de referencia, el espacio que da el nivel máximo de expresión és 5 nucleótidos. Un espacio de entre 1 y 9 nucleótidos permanece favorable, asegurando un nivel de expresión al menos igual a 50% del nivel máximo. iv) Otras secuencias primarias: Dos apareamientos son conocidos por estar implicados en la iniciación de la traducción: el apareamiento entre el codón de iniciación de ARNm y tARN-fMet, en primer lugar, y el apareamiento entre la secuencia de SD y el extremo 3' de 16S ARNr, en segundo lugar. Los estudios de mutagénesis y análisis de ARNm atípicos (en particular ARNm que carecen de una secuencia guía) han hecho posible identificar nuevos elementos de secuencia dentro del entorno del codón AUG que puede contribuir a la eficacia total del dominio de iniciación. Los motivos ricos en adenina inmediatamente hacia el extremo 3' del codón de iniciación son favorables para la iniciación de la traducción (G.F.E. Scherer et al., Nucleic Acids Research, 8, 3895-3907, 1980; H. Chen et al., Journal of Molecular Biology, 240, 20-27, 1994b). De igual manera, los codones AAA y GCU, que son los más comunes en la segunda posición del codón (L. Gold, 1988), tienen un efecto positivo en la traducción, especialmente cuando el codón de iniciación es subóptimo (GUG o UUG) (S. Ringquist et al., 1992). Una secuencia identificada en el ARNm del gene 0.3 del fago T7, y nombrada "caja hacia el extremo 3'" (DB) debido a su posición hacia el extremo 3' con relación al codón de iniciación, es otro elemento promotor de la traducción (M.L. Sprengart et al., Nucleic Acids Research, 18, 1719-1723, 1990). Esta secuencia de 12 nucleótidos presenta capacidad complementaria con nucleótidos 1469-1483 del 16S ARNr, y se encuentra en formas similares en los dominios de iniciación de la traducción de varias E coli altamente expresadas y genes bacteriófago (M.L. Sprengart et al., 1990). Esta "caja hacia el extremo 3'" permite la iniciación de la traducción aún en ausencia de la secuencia de SD (M.L. Sprengart et al., The EMBO Joumal, 15, 665-674, 1996). Resultados recientes indican que, contrario a la hipótesis inicialmente expuesta, la secuencia de DB puede actuar por medio de un mecanismo diferente al apareamiento con la región 1469-1483 del 16S ARNr (M. O'Connor et al., Proc. Nati. Acad. Sci. E.U.A., 96, 8973-8978, 1999). v) Estructuras secundarias La secuencia del ARNm en proximidad a la región de SD puede influir la eficacia de la traducción por medio de la formación de estructuras secundarias. M.H. de Smit and J. van Duin (Journal of Molecular Biology, 235, 173-184, 1994) muestra que los apareamientos intramoleculares en el ARNm pueden ser dañinos para corregir la traducción al competir con el apareamiento de ARNm/ARNr, resulta aún más débil la capacidad complementaria de la región de SD con el 16S ARNr. De la misma manera, se ha mostrado que la expresión de la proquimocina en E coli depende de la composición de la región que conecta SD al codón de iniciación: una secuencia que limita las estructuras secundarias promueve la accesibilidad de RBS al ribosoma y conduce a la eficacia de traducción elevada (G. Wang et al., Protein Expression and Purification, 6, 284-290, 1995). Dada la importancia del paso de iniciación de traducción en la producción de la expresión de proteínas recombinantes, se han llevado a cabo muchos estudios con el objetivo de optimizar la región del RBS de los reactores de expresión de bacterias. Un enfoque intuitivo a consistido en primer lugar en colocar la región de SD de consenso completo (UAÁGGAGGU) hacia el extremo 5' de los genes de interés (G. Jay et al., Proc.. Nati. Acad. Sci. E.U.A., 78, 5543-5548, 1981). Más sistemáticamente, D.M. Marquis et al. (Gene, 42, 175-183, 1986) ha colocado esta secuencia hacia el extremo 3' de varios promotores y a una distancia variada (5 a 9 nucleótidos) del codón de iniciación. Con el gen IL-2 como un modelo, los resultados indican que una separación de SD/AUG de 6 nucleótidos es óptima para casi todos los promotores analizados. En un estudio comparativo entre las secuencias de SD de consenso y la secuencia de SD del gen lacZ, W. Mandecki et al. (Gene, 43, 131-13, 1986) sin embargo, ha notado que la secuencia de SD de consenso da una mayor expresión in vitro pero la expresión que es 2- a 2.5 veces más débil que la de lacZ in vivo. Todas las regiones de RBS derivadas de los genes de fago con su propia secuencia de SD también han probado ser superiores a la secuencia de SD de consenso para la expresión de proteínas de varios orígenes (plantas, células de mamíferos, bacterias) (P.O. Olins et al., Gene, 73, 227-235, 1988). Utilizando el promotor de triptofán K. Curry y C.S.C. Tomich (DNA, 7, 173-179, 1988) se ha comparado la eficacia de la secuencia de SD de consenso con la presente naturalmente en Ptrp. Sus resultados indican una dependencia muy fuerte con respecto al gen de interés estudiado, llevando a la conclusión de que es imposible construir un vector óptimo que funcione para todos los genes heterólogos M.K. Olsen et al. {Journal of Biotechnology, 9, 179-190, 1989), por sí mismos también trabajando con el promotor de triptofán y la secuencia de SD de consenso, se han obtenido muy altos niveles de expresión (20 a 30% de las proteínas totales) para varias proteínas heterólogas (hormonas de crecimiento, TNF) al enriquecer las secuencias flanqueadoras de la región de SD con nucleótidos A y T. Se han descrito resultados similares previamente por medio de H.A. De Boer et al. (DNA, 2, 231-235, 1983) los cuales han observado el efecto positivo de las bases A y T colocadas hacia el extremo 3' de la región de SD en el contexto del a-interferón que expresa Ptrp/PlacUV5 del promotor híbrido. Todos estos resultados se obtuvieron en el contexto de experimentos en donde un número limitado de parámetros se tomaron en cuenta. Consientes del gran número de factores, conocidos, o no conocidos, con una influencia en la iniciación de la traducción, y especialmente del papel no insignificante a priori de las interacciones entre factores que no se toman en cuenta en enfoques interactivos, algunos autores trataron subsecuentemente de seleccionar RBS sintéticos óptimos, in vivo, a partir de genotecas aleatorias de gran tamaño. B.S. Wilson et al. (BioTechniques, 17, 944-952, 1994) de esta manera seleccionó un repertorio de secuencias degeneradas en 16 posiciones hacia el extremo 5' del codón de iniciación, dentro de un cassette de expresión que contiene el gen ß-lactamasa bajo el control del promotor/operador lac. Dicho enfoque hizo posible identificar secuencias originales que expresan la ß-lactamasa con una eficacia 3 veces superior. Con otro gen que codifica para un scFv, este nivel de sobreexpresión con relación al RBS original es aproximadamente 2 veces. En vista de estos resultados, se estableció que las regiones del RBS que se describen como óptimas siempre se describen como tales en un contexto particular en donde tanto la secuencia del gen de interés como la secuencia de la región guía de ARNm, que por sí misma depende del tipo de promotor utilizado, están implicadas. El promotor de triptofán (B.P. Nichols and C. Yanofsky, Methods in Enzymology, 101 , 155-164, 1983) es uno de los sistemas principales utilizados en la expresión de proteína recombinantes (D.G. Yansura and D.J. Henner, Methods in Enzymology (Anonymous Academic Press, Inc., San Diego, CA) 54-60, 1990; D.G. Yansura and S.H. Bass, Methods in Molecular Biology, 62, 55-62, 1997), pero su RBS nunca ha sido el objeto de optimización sistémica utilizando un enfoque con base en la selección de secuencias aleatorias. Es importante para los biotecnólogos que desean el desarrollo de métodos a escala industrial tener herramientas que garanticen la expresión máxima sin tener en cuenta la proteína de interés. Como resultado, existe un gran interés en cualquier mejora que haga posible optimizar la expresión de proteínas recombinantes, ya sea si las mejoras se introducen por medio de la cepa hospedera, por medio del vector de expresión, por medio del método de cultivo y expresión o por medio de cualquier combinación de estos factores. Más particularmente, ia presente invención demuestra la ventaja, en términos de eficacia de traducción, de secuencias de nucleótidos novedosas, llevadas a cabo mediante un vector de expresión, en la región del sitio de enlace a ribosomas (RBS), hacia el extremo 3' del promotor de triptofán (Ptrp). Utilizando los oligonucleótidos degenerados introducidos hacia el extremo 5' del codón de iniciación, y posteriormente seleccionando clones que sobreexpresan el gen reportero de cloranfenicolacetiltransferasa (CAT), el solicitante busca secuencias de RBS optimizadas novedosas. En la búsqueda de secuencias optimizadas hacia el extremo 5' del codón de iniciación, se descubrió, de manera más sorprendente, que la secuencia de ácido nucleótido localizada directamente hacia el extremo 3' del codón de iniciación puede mutarse o suprimirse para sobreexpresar proteínas recombinantes. Las secuencias de esta forma obtenidas presentan una característica de mejora con respecto a la expresión de varios genes de interés de orígenes diversos. Además, un problema actual principal con relación a las limitaciones actuales de calidad es obtener una proteína recombinante que sea lo más pura posible, es decir, con un número mínimo de aminoácidos injertados hacia el extremo 5' o corriente debajo de la proteína recombinante, estos siendo aminoácidos originados de la construcción utilizada. Cuando la secuencia de aminoácido localizada entre el codón de iniciación y el primer sitio de clonación tiene supresiones para sobreexpresar las proteínas recombinantes, este problema también se resuelve mediante la presente invención. Un objeto de la presente invención es de esta manera una construcción para la expresión de un gen que codifica para una proteína recombinante de interés colocada bajo el control del promotor de operón Ptrp de triptofán, en una célula hospedera procariotica, que comprende, directamente hacia el extremo 3' del codón de iniciación, una secuencia de ".ácido nucleico de la secuencia SEQ ID No. 1 y, hacia el extremo 3' de esta secuencia, un cassette de clonación múltiple para recibir el gen que codifica para dicha proteína recombinante de interés, caracterizado porque al menos uno de los nucleótidos de ia secuencia SEQ ID No. 1 se muta o suprime para permitir la sobreexpresión de dicha proteína recombinante. Lo más sorprendente es obtener la sobreexpresión en virtud del objeto de la invención ya que la técnica anterior enseña el uso de esta secuencia SEQ ID No. 1 sin modificación. Para este efecto, debe hacerse mención en particular a las patentes de E.U.A. 5,714,589, E.U.A. 5,468,845, E.U.A. 5,418,135, E.U.A. 4,891 ,310, E.U.A. 4,789,702, WO 88/09344, E.U.A. 4,738,921 y EP O 212 532, que enseñan el uso de la secuencia SEQ ID No. 1 hacia el extremo 3' del codón de iniciación para la expresión de proteínas de interés. La expresión "proteína recombinante de interés" denota todas las proteínas, polipéptidos o péptidos obtenidos mediante recombinación genética y son capaces de ser utilizados en los campos tales como salud humana y de animales, cosmetología, nutrición de animales, industria agro o de industria química. Entre estas proteínas de interés, debe hacerse mención en particular, pero sin estar limitado a las mismas, de: - una citocina y en particular un a interleucina, un interferon, un factor de necrosis de tejido y un factor de crecimiento y en particular un factor de crecimiento hematopoietico (G-CSF, GM-CSF), una hormona de crecimiento de humano o insulina, un neuropéptido; - un factor o cofactor implicado en la coagulación y en el factor VIII particular, factor von Willebrañd, antitrombina lll, proteína C, trombina e hirudina; - una enzima y en particular tripsina, una ribonucleasa y ß- galactosidasa; - un inhibidor de enzima tal como a1 -antitripsina e inhibidores de proteasa virales; - una proteína capaz de inhibir la iniciación o progresión de cánceres, tales como productos de expresión de genes supresores de tumor, por ejemplo el gen P53; - una proteína capaz de estimular una respuesta inmunológica o una antígeno, tal como, por ejemplo, proteínas de membrana bacteriana Gram-negativas o fragmentos activos de las mismas, en particular proteínas Klebsiella OmpA o la proteína G del virus sincitial respiratorio de humanos; - un anticuerpo monoclonal que pueda o no humanizarse o un fragmento de anticuerpo tal como un scFv; - una proteína capaz de inhibir una infección viral o su desarrollo, por ejemplo los epítopes antigénicos del virus en cuestión o variantes modificadas de proteínas virales, capaces de competir con las proteínas virales nativas. - una proteína expuesta a contenerse en una composición cosmética, tal como una sustancia P o una dismutasa de superóxido; - una proteína alimenticia y en particular un alicamento; - una enzima capaz de dirigir la síntesis de los compuestos químicos o biológicos, o capaz de degradar ciertos compuestos químicos tóxicos; o cualquier otro - cualquier proteína con una toxicidad con respecto al microorganismo que la produce, en particular si este microorganismo es la bacteria E. Coli, tal como, por ejemplo, la proteasa del virus de VIH-1, la proteína ECP, "proteína catiónica de eosinófilo", o proteínas del poliovirus 2B y 3A. La expresión "secuencia de ácido nucleico de la secuencia SEQ ID No. 1, al menos uno de los ácidos nucleicos del cual se muta o suprime para permitir la sobreexpresión de dicha proteína recombinante" significa cualquier secuencia que comprende una supresión o una mutación de al menos un nucléótido de la secuencia SEQ ID No. 1 , que permite la sobreexpresión de la proteína recombinante comparada con la expresión de dicha proteína recombinante obtenida utilizando la secuencia no modificada SEQ ID No. 1. El término "supresión" significa la remoción de uno o más nucleótidos en uno o varios sitios de nucleótido de la secuencia SEQ ID No. 1. La secuencia resultante se hace más pequeña en comparación con la original.
El término "mutación" significa el reemplazo de un ácido nucleico con otro (A con C, G o T; C con A, G o T; G con A, C o T; T con A, C o G). La secuencia resultante tiene la misma longitud que la original. La sobreexpresión, es decir, el hecho de obtener una expresión mayor a la obtenida sin la modificación hacia el extremo 3' del codón de iniciación, puede determinarse en particular utilizando uno de los siguientes métodos: i) migrar las proteínas totales de la bacteria, mediante SDS-PAGE, y revelar la proteína recombinante mediante tinción con Coomassie Blue o mediante Western blotting; ii) analizar la proteína recombinante mediante un método que implica un anticuerpo específico (Elisa); iii) analizar enzimáticamente si la proteína recombinante posee una actividad catalítica. Preferiblemente, el método ii), que detalla lo que se da en el ejemplo lll, se utiliza. La expresión "cassette de clonación múltiple." significa una secuencia de nucleótido que contienen uno o más sitios de restricción, cuyos sitios pueden ser utilizados en los pasos de clonación del gen de interés hacia el extremo 3' del codón de iniciación. Preferiblemente, al menos un nucleótido de la secuencia SEQ ID No. 1 se suprime para permitir la sobreexpresión de dicha proteína recombinante.
La invención también se refiere a una construcción de conformidad con la invención en donde dicho nucleótido que se muta o suprime, preferiblemente se suprime, se ubica en el fragmento de la secuencia SEQ ID No. 2 de la secuencia SEQ ID No. 1. Otro objeto de la invención se refiere a las construcciones en donde dicho nucleótido que se muta o suprime, preferiblemente se muta, se ubica en el codón GTA y/o en el codón GCA y/o en el codón CTG de la secuencia SEQ ID No. 1. En una modalidad preferida de la invención, dicha secuencia SEQ ID No. 1 , al menos uno de los nucleótidos de los cuales se muta o suprime, tiene el nucleótido A en al menos la posición 1 , 2 y 3. En una modalidad preferida de la invención, al menos uno de los nucleótidos, y preferiblemente todos los nucleótidos, ubicados entré la secuencia de ácido nucleico de la secuencia SEQ ID No. 1 y el cassette de clonación múltiple pensado para recibir el gen que codifica para dicha proteína recombinante de interés se suprimen. En otra modalidad aún preferida de la invención, dicha secuencia SEQ ID No. 1 , al menos uno de los ácido nucleicos de la cual se muta o suprime, y todos los nucleótidos de la cual se ubican entre la secuencia de ácido nucleico de la secuencia SEQ ID No. 1 y el cassette de clonación múltiple se suprimen por completo, de manera que el codón de iniciación se encuentre directamente hacia el extremo 5' del cassette de clonación múltiple.
En una modalidad preferida de la invención, las construcciones contienen una secuencia de ácido nucleico directamente hacia el extremo 5' del codón de iniciación, cuya secuencia se elige a partir de las secuencias de la secuencia SEQ ID No. 3, SEQ ID No. 4, SEQ ID No. 5, SEQ ID No. 6, SEQ ID No. 7, SEQ ID No. 8, SEQ ID No. 9 y SEQ ID No. 10. La invención comprende una construcción de conformidad con la invención, caracterizada porque la célula hospedera procariótica es una bacteria gram-negativa, que preferiblemente pertenece a las especies E coli. Otro objeto de la invención se refiere a un vector que contiene una construcción como se definió anteriormente, ya que tiene una célula hospedera procariótica, que preferiblemente pertenece a las especies E coli, transformadas con dicho vector. Un objeto de la presente invención también es un método para producir una proteína recombinante de interés en una célula hospedera utilizando una construcción como se definió anteriormente. Un objeto de la presente invención es también un método para producir una proteína recombinante de interés de conformidad con la invención, en donde dicha construcción se introduce en una célula hospedera procariótica, preferiblemente por medio de un vector como se definió anteriormente. Se da preferencia a un método para producir una proteína recombinante de interés de conformidad con la invención, caracterizada porque comprende los siguientes pasos: a) clonar un gen de interés en un vector de conformidad con la invención; b) transformar una célula procariótica con un vector que contiene un gen que codifica para dicha proteína recombinante de interés; c) cultivar dicha célula transformada en un medio de cultivo que permite la expresión de la proteína recombinante; d) recuperar la proteína recombinante a partir del medio de cultivo o de dicha célula transformada. La invención también comprende el uso de una construcción, de un vector o de una célula hospedera procariótica de conformidad con la presente invención, para producir una proteína recombinante. Finalmente, la invención se refiere al uso de una proteína recombinante, para preparar un producto médico pensado para ser administrado a un paciente que requiere dicho tratamiento, caracterizada porque dicha proteína recombinante se produce utilizando un método para producir una proteína recombinante de interés de conformidad con la invención. Los siguientes ejemplos y figuras pretenden ilustrar la invención sin limitar el alcance de la misma.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La figura 1 es un mapa del vector de plásmido pTEXmpld y la secuencia SEQ ID No. 39 de la región 1-450 que comprende el promotor/operador Ptrp, la región guía TrpL, el sitio de clonación múltiple mp18 y el finalizador de transcripción. La figura 2 es un mapa de restricción de RBS (sitio de enlace a ribosoma) en el vector pTEXmpld (SEQ ID No. 40). La figura 3 es una estimación en el gel SDS-PAGE de la expresión CAT en bacterias transformadas con los vectores pTEXCAT o pTEXCAT4. La figura 4 es un estudio comparativo de la expresión de la ß-galactosidasa utilizando los vectores pTEX-ßGAL y pTEX4-ßGAL (cinéticas en un fermentador).
EJEMPLO 1 Este ejemplo ilustra uno de los aspectos que conducen a la invención, y en particular la manera en la cual se construye la genoteca de vectores plásmidos que transportan el promotor Ptrp de triptofán, y se mutan aleatoriamente hacia el extremo 5' del codón de iniciación. El vector de origen se describe en la figura 1. Es un plásmido derivado de pBR322 (F. Bolívar et al., Gene, 2, 95-113, 1977) en el cual se ha clonado el promotor/operador Ptrp (1-298), seguido por la secuencia que codifica para los primeros 7 aminoácidos de la guía de E. Coli TrpL (C. Yanofsky et al., Nucleic Acids Research, 9, 6647-6668, 1981), mediante un sitio de clonación múltiple y mediante el finalizador de transcripción E. coli trpt (C. Yanofsky et al., 1981). La porción 3' de Ptrp en pTEXmpld difiere de la secuencia natural mediante la presencia de un sitio de clonación Xbal hacia el extremo 5' del codón de iniciación ATG (véase la figura 2) y mediante una separación más grande entre SD y el codón de iniciación. Para permitir la selección de vectores modificados en su porción RBS, el gen reportero de cloranfenicol acetiltransferasa (CAT) se clona en los sitios EcoRI y Pstl de pTEXmpl 8. Para esto, la secuencia de codificación del gen cat se amplifica mediante PCR utilizando los oligonucleótidos CATfor y CATrev, cuyas secuencias son: CATfor: 5'-CCGGAATTCATGGAGAAAAAAATCACTGG-3' (SEQ ID No. 11 ) EcoRI CATrev: 5'-AAACTGCAGTTACGCCCCGCCCTG-3' (SEQ ID No.12) Pstl La reacción PCR se lleva a cabo utilizando el fagémido pBC SK (Stratagene, La Jolla, CA, USA) como una matriz. El producto de amplificación se carga en gel de agarosa y se purifica de conformidad con el método GeneClean (Bio101 , La Jolla, CA). La clonación del inserto en pTEXmpld se verifica, después de la transformación en E coli, mediante la aparición de colonias que se desarrollan en placas de un medio de agar LB (J. Sambrook et al., Molecular cloning. A laboratory manual, 2nd edición. Plainview, NY: Cold Spring Harbor Laboratory Press, 1989) en presencia de 30 µg/ml de cloranfenicol. La secuencia del inserto se confirma mediante secuenciación automática utilizando el equipo de "finalizador de colorante" y el secuenciador 373A de ADN (Perkin Elmer Applied Biosystems, Foster City, CA). El vector obtenido se llama pTEXCAT. La inserción de RBS que tiene una secuencia degenerada hacia el extremo 5' del codón de iniciación se lleva a cabo mediante la ligación de oligonucleótidos sintéticos en los sitios Spel y EcoRI del vector pTEXCAT. La región que oscila del sitio Spel al sitio EcoRI respectivamente en las posiciones -49 y +28 (véase figura 2) se suprime mediante digestión enzimática y se reemplaza con un heterodúplex formado por dos oligonucleótidos sintéticos parcialmente degenerados hibridados entre sí. Dos pares de oligonucleótidos se utilizan, implicando respectivamente los oligonucleótidos RanSD1/RanSD2 y RanSD3/RanSD4, cuyas secuencias son: d'CTAGTTAACTAGTACGCAAGTTCACGTAAANNNNNNNNNNNNNNNN ATGAAAGCMTTTTCGTACTGAATGCGG-3' (SEQ ID No. 13) RanSD2: S'AATTCCGCATtCAGTACGAAAATTGCTTTCATNNNNNNNNNNNNNNNNT TTACGTGAACTTGCGTACTAGTTAA-3' (SEQ ID No. 14) RanSD3: 5'CTAGTTAACTAGTACGCAAGTTCACGTAAATRRRRRRRNNNNNNATGAA AGCAATTTTCGTACTGAATGCGG-3' (SEQ ID No. 15) RanSD4: 5'AATTCCGCATTCAGTACGAAAATTGCTTTCATNNNNNNYYYYYYYATTTA CGTGAACTTGCGTACTAGTTAA-3' (SEQ ID No. 16). Los cuatro oligonucleótidos se sintetizaron mediante MWG Biotech (Ebersberg, Alemania) bajo condiciones que aseguran distribución equimolar de las bases para cada degeneración. El par RanSD1/RanSD2 introduce degeneración completa (N = mezcla de los cuatro nucleótidos A, C, T, G) en los 16 nucleótidos precedentes al codón ATG. El número de combinaciones (416, es decir 4.3 x 109 aproximadamente) permite que los RBS sean seleccionados, y los cuales son optimizados desde el punto de vista de su secuencia, Shine-Dalgarno (SD) y la secuencia ubicada entre la región SD y e! codón de iniciación, y también en el espacio SD-ATG. Esta genoteca se nombrará (N16) en los que resta del texto. El par RanSD3/RanSD4 introduce degeneración completa en los 6 nucleótidos precedentes al ATG y degeneración parcial en los 7 nucleótidos hacia el extremo 5'. El uso exclusivo de purinas (R = A ó G) en la cadena positiva y el uso de pirimidinas en la cadena complementaria (Y = C ó T) promueve la representación de secuencias del tipo Shine-Dalgarno en una distancia óptima (6 nucíeótidos) a partir del codón ATG. Esta segunda genoteca se nombra (R7N6). La linealización del vector pTEXCAT y la purificación en gel del mismo, la hibridación de los oligonucleótidos en pares, la ligadura de los heterodúplex al vector linealizado pTEXCAT y la transformación en E coli de la genoteca así constituida se realizan de acuerdo con las condiciones descritas por J. Sambrook et al. (1989). Por lo común, se agregan 100 f moles de vector y 1000 fmoles de inserto a una reacción de ligadura en presencia de ligasa T4 en un volumen final de 15 µl. La reacción se lleva a cabo durante la noche a 16°C. Las bacterias TOP10 electrocompetentes (50 µl) entonces se transforman mediante electroporación con 3 µl y la mezcla de ligadura bajo las condiciones recomendadas por el fabricante (Invitrogen, Carisbad, CA). La mezcla de transformación se coloca en placas en cajas con agar LB que contienen 200 µg/ml de ampicilina, dando pie a la aparición de colonias transformadas después de la incubación durante 16 horas a 37°C.
EJEMPLO II Las genotecas se examinan con base en la hipótesis que los clones que sobreexpresan la enzima CAT tendrán un aumento en la resistencia a cloranfenicol. Esto se valida mediante el experimento cuyos resultados aparecen en el cuadro 1 a continuación.
CUADRO 1 Resistencia al cloranfenicol de bacteria TOP10 x pTEXCAT en presencia o ausencia de IAA Los números (fila superior) indican el número de colonias contadas después de la incubación durante 1 d horas a 37°C, en donde cada medio se ha sembrado con 100 células aproximadamente. El índice de la fila inferior es un criterio cualitativo de crecimiento de colonia (- = ausencia de crecimiento a +++ = crecimiento máximo). Estos resultados muestran que las bacterias de E Coli TOP10 (Invitrogen, Carisbad, CA) transformadas con el vector pTEXCAT y colocadas en cajas que contienen diversas concentraciones de desarrollo de cloranfenicol, entre 300 y 600 µg/ml de cloranfenicol, con más fuerza en presencia de ácido 3-ß indol acrílico (IAA), un análogo de triptofan que actúan como un inductor a través de un efecto de desrepresión de Ptrp (R.Q. Marmorstein y P.B. Sigler, The Journal of Biological Chemistry, 264 9149-9154, 1989). Esto implica que los clones que sobreproducen CAT debido a una región de RBS optimizada pueden desarrollarse con mayor rapidez que la población de tipo silvestre en una concentración de cloranfeinicol menor que la MIC (concentración inhibidora mínima), o desarrollarse en presencia de concentraciones de cloranfenicol que son letales para la población de tipo silvestre.
EJEMPLO NI Este ejemplo ilustra la selección de clones a partir de las genotecas construidas de conformidad con la descripción del ejemplo 1. Las genotecas obtenidas en la forma de capas de colonias en cajas de agar LB + ampicilina se recogen en agua esterilizada para reconstituir una suspensión con una densidad óptica (OD) a 580 nm en la región de 1. Conforme a los resultados del ejemplo 2, esta suspensión se coloca sobre cajas de agar LB que contienen dosis letales de cloranfenicol (600, 700, 800 y 900 µg/ml) en una proporción de 100 µl de suspensión por caja de Petri. Las cajas son incubadas a 37°C y se observa la aparición de colonias resistentes, verificando al mismo que las cajas sembradas que usan una suspensión de bacterias TOP10 transformadas con el vector pTEXCAT de tipo silvestre no dan ningún crecimiento. Las colonias resistentes se aislan y se subcultivan varias veces en el medio de selección con el fin de confirmar su fenotipo de resistencia. Los clones seleccionados en esta etapa entonces quedan sujetos a una serie de análisis: (i) extracción del plásmido (equipo Qiagen, Hilden, Alemania) y secuenciación de la región que cubre los RBS, (ii) cultivo en matraces Erlenmeyer con inducción por IAA y luego la estimación del nivel de expresión de CAT mediante la prueba de ELISA, (iii) electroforesis, mediante SDS-PAGE, de las proteínas totales extraídas de los cultivos precedentes y tinción con azul Coomassie para visualizar las proteínas intracelulares totales. Los clones son secuenciados utilizando el equipo Dye Terminator en un secuenciador ABI 373A (Perkin Elmer Applied Biosystems, Foster City, CA). Los cultivos en matraces Erlenmeyer se preparan sembrando 25 ml de medio (30 g/l de caldo de soya triptíca (DIFCO) + 5 g/l de extracto de levadura (Difco)) más 8 mg/l de tetraciclina con una colonia en una caja o con una suspensión bacterial almacenada a -80°C. Cada precultivo es incubado sobre una plataforma agitada a 200 rpm, a 37°C durante la noche. Una fracción se transfiere en 50 ml del mismo medio para alcanzar una densidad óptica inicial igual a 1. Para inducir la proteína CAT se agregan 25 mg/l de IAA al medio, que entonces se agitan bajo las mismas condiciones durante 5 horas. Una fracción de la suspensión (3 x 1 ml diluido a OD = 0.1) se centrifuga y las células se almacenan a -20°C para analizar la CAT mediante ELISA (equipo CAT ELISA, Roche Diagnostics, Basel, Suiza). El resto de biomasa se recupera por centrifugación a 10 000 g, 4°C durante 15 minutos. La biomasa se recoge en regulador de pH TEL (25 mM Tris, 1 mM EDTA, 500 µg/ml .liosozima, pH 8) en una proporción de 5 ml por gramo de biomasa húmeda. Las células son lizadas por tratamiento con sonido (aparato para tratamiento de sonido VibraCell equipado con una microsonda, Sonics & Materials, Danbury, CT). Un ml de la suspensión resultante se centrifuga durante 5 minutos a 12 000 rpm. La pella se recogió con 200 µl de TEL para dar la fracción (I) insoluble. El sobrenadante se marca como "S". Las proteínas totales contenidas en las fracciones I y S son analizadas mediante electroforesis bajo condiciones de desnaturalización (SDS-PAGE) y tinción con azul Coomassie. El cuadro 2 a continuación indica las diversas secuencias de RBS obtenidas después de examinar las dos genotecas (N 6) y (RyNß). Después de la alineación en las bases de datos de nucleótidos de GenBank y EMBL es posible concluir que a la fecha no se ha descrito ninguna de las secuencias de 16 nucléotidos (estrategia (N16)) o de 13 nucleótidos (estrategia (R7N6) ubicadas de inmediato en el extremo 5' del condón AUG en los diversos clones aislados.
CUADRO 2 Secuencias novedosas de RBS aisladas utilizando una de ias estrategias (*) Cada secuencia de nucleótidos (ARN mensajero) comprende la región mutada hacia el extremo 3' del codón de iniciación. La secuencia de referencia del vector pTEXCAT aparece en la primera línea del cuadro. Las secuencias de ácido nucleico hacia el extremo 5' y hacia el extremo 3' del codón de iniciación de los vectores se representan en este cuadro después de la transcripción en la forma de ARN. En el extremo 3' de esta secuencia, sólo se representan los primeros dos codones del sitio de clonación múltiple, principalmente GAAUUC.
Por lo tanto se observó, con mayor sorpresa, que los clones descritos en el cuadro 2 tienen mutaciones en la región de RBS ubicada inmediatamente hacia el extremo 3' del codón AUG. Los clones pTEXCAT4 pTEXCATI ', y pTEXCAT3' llevan una mutación que afecta un aminoácido de la porción N-terminal de la proteína codificada (respectivamente Leu7Pro, Ala3Pro y Val6Ala). Los otros clones llevan rearreglos más grandes pTEXCAT2\ pTEXCATd', y pTEXCAT9', tienen supresiones que inducen, respectivamente, la pérdida de las regiones Ala3Leu7, Ne4Leu7 y He4Asn8. Dado que el análisis aleatorio de 10 clones de la genoteca (N?6) seleccionados en ampicilinas (es decir sin presión de selección de cloranfenicol), no muestra ninguna modificación en la región que codifica el péptido TrpL (datos no ilustrados), se deduce a partir de esto que las mutaciones en TrpL observadas en clones seleccionados por su habilidad para expresar CAT intervienen en ia expresión. De esta manera se demuestra la siguiente propiedad original: la expresión de proteínas recombinantes se ve afectada positivamente por mutaciones en el extremo 3' del codón de iniciación. La figura 3 presenta un análisis SDS-PAGE de las proteínas totales de bacterias transformadas con pTEXCAT o pTEXCAT4. Muestra la confirmación de la característica de sobreproducción del vector pTEXCAT4, dado que una proteína mayor que emigra en la posición esperada para CAT (28 kDa) se muestra claramente en extractos inducidos por IAA, en tanto que los extractos del vector obtenidos bajo las mismas condiciones de inducción, revelan sólo una banda de baja intensidad.
Con el fin de excluir la posibilidad que la sobreproducción sea provocada por modificaciones del vector fuera de la porción Spel-EcoRl, el vector pTEXCAT4 fue construido in vitro a partir de pTEXCAT mediante la digestión de Spel-EcoRI y la ligadura de un dúplex formado mediante los siguientes dos oligonucleótidos fosforilados: SDopt4-f: d'CTAGTTAACTAGTACGCAAGTTCACGTAAAACGGAGAAACCCCCCAATG AAAGCAATTTTCGTACCGAATGCGG-31 (SEQ ID No. 17) SDopt4-r: d'AATTCCGCATTCGGTACGAAAATTGCTTTCATTGGGGGGTTTCTCCGTTT TACGTGAACTTGCGTACTAGTTAA-3' (SEQ ID No. 18) El vector resultante, marcado como pTEXCAT-SD4, entonces se transformó en TOP10 de E coli, y se compararon con pTEXCAT4 en términos de potencial de expresión de enzima de CAT. Los resultados obtenidos indican que los niveles de expresión de pTEXCAT4 y pTEXCAT-SD4 son comparables entre sí y significativamente mayores que pTEXCAT. Esto comprueba la hipótesis que el incremento de expresión observado con los clones reclamados en esta solicitud de patente es provocado en realidad específicamente por las secuencias ubicadas entre los sitios Spel y EcoRI. Con el fin de demostrar la especificidad de las secuencias mutadas o suprimidas ubicadas directamente hacia el extremo 3' del codón de iniciación, la leucina CTG en la séptima posición del vector del tipo silvestre pTEXCAT se reemplazó con una prolina CCG, para dar el vector pTEXCAT- L7P. La prolina CCG en la séptima posición del vector pTEXCAT4 se reemplazó con una leucina CTG para el vector pTEXCAT4-P7L. Los resultados de este experimento aparecen en el cuadro 3 a continuación.
CUADRO 3 Comparación entre los niveles de expresión dados por los vectores pTEXCAT, PTEXCAT4. PTEXCAT-L7P v pTEXCAT4tP7L Los resultados (media ± desviación estándar) se obtuvieron en dos experimentos independientes. El nivel 1 es asignado en forma arbitraria al vector pTEXCAT. Estos resultados demuestran que la mutación en el extremo 3' del codón de iniciación es por sí misma responsable de la sobre-expresión, dado que esta mutación reintroducida en el vector de tipo silvestre hace posible obtener la misma sobre-expresión.
EJEMPLO IV Este ejemplo muestra que el efecto de sobre-expresión de las secuencias novedosas descritas no está limitado al gen reportero empleado para seleccionarlas, pero se transpone a otros genes, una vez que estos genes están ligados funcionalmente a ellos en el mismo vector. Para este efecto, el gen CAT de los vectores pTEXCAT y pTEXCAT4 se reemplazó con la secuencia del gen lacZ que codifica ß-galactosidasa de E coli. La clonación se realizó amplificando las secuencias lacZ mediante PCR utilizando el vector pßGAL-basic (Clontech, Palo Alto, CA) y luego insertando esta secuencia en el extremo 3' de trpL en los sitios Bsml y Hindlll únicos para dar, respectivamente, los vectores pTEX-ßGAL y pTEX4-ßGAL. Los dos vectores fueron transformados en la cadena de E Coli ICONE 2000 (solicitud de patente francesa FR 2 777 292, publicada el 15 de octubre de 1999) para el propósito de cultivar en un fermentador, seguido por cinética de expresión de ß-galactosidasa. Por lo común, las bacterias recombinantes ICONE 200 x pTEX-ßGAL y ICONE 200 x pTEX4-ßGAL se cultivaron en 200 ml de medio completo (30 g/l de caldo de soya tríptica (DIFCO), 5 g/l de extracto de levadura (DIFCO)) durante ia noche a 37°C. La suspensión de células obtenidas se transfirió en forma estéril a un fermentador (Chemap model CF3000, volumen 3.5 I) que contenía 1.8 litros del siguiente medio (concentraciones para 2 litros de cultivo final): 90 g/l de glicerol, 5 g/l de (NH4)2S04, 6 g/l de KH2P04, 4 g/l de K2HP04, 9 g/l de Na3- citrato.2H20, 2 g/l de MgS?4.7H2?, 1 g/l de extracto de levadura, elementos traza, 0.06% de agente antiespuma, 8 mg/l de tetraciclina, 200 mg/l de triptofan. El pH se ajustó a 7.0 añadiendo amonia acuosa. El nivel de oxígeno disuelto se mantuvo a 30% de saturación mediante servo-control de la velocidad de agitación y luego de la velocidad de aeración midiendo 02 disuelto. Cuando la densidad óptica de cultivo alcanza un valor entre 30 y 40, se lleva a cabo la inducción añadiendo 25 ml/l de IAA (Sigma, St Louis, MO). Se llevó a cabo un análisis cinético de la densidad óptica del cultivo (OD a 560 nm) y de la actividad de la ß-galactosidasa intracelular. El nivel de actividad de la ß-galactosidasa se estima mediante análisis colorimétrico mezclando 30 µl de muestra (fracción "S" véase ejemplo 3) 204 µl de regulador de pH (50 mM Tris-HCl, pH 7.5 - 1 mM MgCI2) y 66 µl de ONPG (4 mg/ml en 50 mM Tris-HCl, pH 7.5). La mezcla de reacción se incuba a 37°C. La reacción se detiene añadiendo 500 µl de 1M Na2C03. La OD a 420 nm, con relación al tiempo de incubación, es proporcional a la actividad de ß-galactosidasa presente en la muestra. Dado que E. Coli ICONE 200 tiene una supresión completa del operón lac, la actividad de ß-galactosidasa medida se debe únicamente a la expresión del gen lacZ del plásmido. Los resultados de este estudio comparativo indican que, en dos experimentos independientes, el vector pTEX4-ßGAL da un nivel de actividad de ß-galactosidasa aproximadamente 50 veces mayor que pTEX-ßGAL (figura 4). A partir de esto se deduce que la secuencia original aislada en la región del RBS del vector pTEXCAT4 potencia la expresión no sólo de la proteína CAT, pero también de otras proteínas tales como, a manera de ejemplo, la ß-galactosidasa. Con base en este ejemplo es posible concluir que otras proteínas de interés biotecnológico pueden expresarse en forma conveniente utilizando uno de los vectores de conformidad con la invención, introduciendo su secuencia de codificación en el extremo 3' de las secuencias mutadas o suprimidas conforme a la invención.
EJEMPLO V Comparación entre los niveles de expresión dados por los vectores pTEXwt (que no es parte de la invención) y los vectores pTEX9'. pTEXIO'. pTEX11' y TEX12' Los vectores pTEXIO', pTEX11' y pTEX12' se derivan del vector pTEX9, pero también comprenden mutaciones adicionales, como se indica en el cuadro 4 a continuación: CUADRO 4 Comparación entre los niveles de expresión dados por los vectores pTEXwt PTEX9'. pTEXIO'. pTEXIV y pTEX12' (*) Cada secuencia de nucleótidos (ARN mensajero) comprende la región mutada hacia el extremo 3' del codón de iniciación. La secuencia de referencia del vector pTEXCAT aparece en la primera línea del cuadro. Las secuencias de ácidos nucleicos hacia el extremo 5' y hacia el extremo 3' del codón de iniciación de los vectores se representan en este cuadro después de la transcripción en la forma de ARN. En el extremo 3' de estas secuencias, sólo se representan los primeros dos codones del sitio de clonación múltiple, principalmente GAAUUC. Los métodos para determinar la expresión son los empleados en los ejemplos anteriores.
Estos resultados demuestran que las supresiones hacia el extremo 3' del codón de iniciación hacen posible obtener una sobreexpresión hasta de más de 250 veces mayor que la expresión observada utilizando el vector de tipo silvestre.

Claims (1)

  1. NOVEDAD DE LA INVENCIÓN REIVINDICACIONES 1.- Una construcción para la expresión de un gen que codifica una proteína recombinante de interés que se encuentra bajo el control del operón Ptrp de triptofan, en una célula hospedera procariotica, que comprende, directamente hacia el extremo 3' del codón de iniciación, una secuencia de ácidos nucleicos de la secuencia SEQ ID No. 1 y, hacia el extremo 3' de esta secuencia, un cassette de clonación múltiple que tiene el propósito de recibir el gen que codifica dicha proteína recombinante de interés, caracterizada porque al menos uno de los nucleótidos de la secuencia SEQ ID No. 1 es mutado o suprimido con el fin de permitir la sobreexpresión de dicha proteína recombinante. 2.- La construcción de conformidad con la reivindicación 1 , caracterizada además porque al menos uno de los nucleótidos de la secuencia SEQ ID No. 1 se suprime. 3.- La construcción de conformidad con la reivindicación 1 , caracterizada además porque dicho al menos un nucleótido que es mutado o suprimido se localiza en el fragmento de secuencia SEQ ID No. 2 de la secuencia SEQ ID No. 1. 4.- La construcción de conformidad con la reivindicación 1 , caracterizada además porque dicho al menos un nucleótido que es mutado o suprimido, de preferencia mutado, se localiza en el .codón GTA de la secuencia SEQ ID No. 1. 5.- La construcción de conformidad con la reivindicación 1 , caracterizada además porque dicho al menos un nucleótido que es mutado o suprimido, de preferencia mutado, se localiza en el codón GCA de la secuencia SEQ ID No. 1. 6.- La construcción de conformidad con la reivindicación 1 , caracterizada además porque dicho al menos un nucleótido que es mutado o suprimido, de preferencia mutado, se localiza en el codón CTG de la secuencia SEQ ID No. 1. 7.- La construcción de conformidad con la reivindicación 1 , caracterizada además porque dicha secuencia SEQ ID No. 1 , al menos uno de los ácidos nucleicos de los cuales es mutado o suprimido, tiene el nucleótido A al menos en posición 1 , 2 y 3. 3.- La construcción de conformidad con la reivindicación 1 , caracterizada además porque dicha secuencia SEQ ID No. 1 es suprimida por completo. - 9.- La construcción de conformidad con una reivindicaciones 1 a 8, caracterizada además porque al menos uno de los nucleótidos, y de preferencia todos los nucleótidos, localizados entre la secuencia de ácidos nucleicos de la secuencia SEQ ID No. 1 y el cassette de clonación múltiple cuyo propósito es recibir el gen que codifica dicha proteína recombinante de interés es suprimida. 10.- La construcción de conformidad con cualquiera de las reivindicaciones 1 a 9, caracterizada además porque la secuencia de ácidos nucleicos hacia el extremo 5' directamente del codón de iniciación se elige a partir de las secuencias SEQ ID No. 3 a SEQ ID No. 10. 11.- La construcción de conformidad con cualquiera de las reivindicaciones 1 a 10, caracterizada además porque la célula hospedera procariótica es una bacteria gram-negativa. 12.- La construcción de conformidad con cualquiera de las reivindicaciones 1 a 11 , caracterizada además porque la célula hospedera procariótica es E coli. 13.- Un vector que contiene una construcción como se reclama en cualquiera de las reivindicaciones 1 a 12. 14.- Una célula hospedera procariótica transformada con un vector como se reclama en la reivindicación 13. 15.- La célula hospedera procariótica de conformidad con la reivindicación 14, caracterizada además porque es E coli. 16.- Un método para producir una proteína recombinante de interés en una célula hospedera utilizando una construcción como se reclama en cualquiera de las reivindicaciones 1 a 12. i 7.- El método para producir una proteína recombinante de interés de conformidad con la reivindicación 16, caracterizada además porque dicha construcción se introduce en una célula hospedera procariótica. 18.- El método para producir una proteína recombinante de interés de conformidad con las reivindicaciones 16 o 17, caracterizado además porque dicha construcción se introduce en una célula hospedera procariótica a través de un vector como se reclama en la reivindicación 13. 19.- El método para producir una proteína recombinante de interés de conformidad con una de las reivindicaciones 16 a 18, caracterizado además porque comprende los siguientes pasos: a) clonar un gen de interés en un vector como se reclama en la reivindicación 13; b) transformar una célula procariótica con un vector que contiene un gen que codifica dicha proteína recombinante de interés; c) cultivar dicha célula transformada en un medio de cultivo que permite la expresión de la proteína recombinante; y d) recuperar la proteína recombinante a partir del medio de cultivo o de dicha célula transformada. 20.- El uso de una construcción como se reclama en cualquiera de las reivindicaciones 1 a 12, de un vector como se reclama en la reivindicación 13 o de una célula como se reclama en la reivindicación 14 ó 15 para producir una proteína recombinante. 21.- El uso de una proteína recombinante producida mediante un método como se reclama en una de las reivindicaciones 16 a 19, para preparar un producto medicinal administrable a un paciente que requiera un tratamiento.
MXPA02012880A 2000-06-22 2001-06-21 Construccion modificada hacia el extremo 3' del codon de iniciacion para sobreexpresion de proteina recombinante. MXPA02012880A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0008002A FR2810675B1 (fr) 2000-06-22 2000-06-22 Construction modifiee en aval du codon d'initiation pour la surexpression de proteines recombinantes
PCT/FR2001/001952 WO2001098453A2 (fr) 2000-06-22 2001-06-21 Vecteurs d'expression comprenant un fragment modifie de l'operon tryptophane

Publications (1)

Publication Number Publication Date
MXPA02012880A true MXPA02012880A (es) 2003-05-14

Family

ID=8851556

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA02012880A MXPA02012880A (es) 2000-06-22 2001-06-21 Construccion modificada hacia el extremo 3' del codon de iniciacion para sobreexpresion de proteina recombinante.

Country Status (10)

Country Link
US (1) US20040260060A1 (es)
EP (1) EP1315822A2 (es)
JP (1) JP2004500875A (es)
CN (1) CN1443242A (es)
AU (1) AU6922401A (es)
BR (1) BR0111907A (es)
CA (1) CA2413612A1 (es)
FR (1) FR2810675B1 (es)
MX (1) MXPA02012880A (es)
WO (1) WO2001098453A2 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101128586A (zh) 2004-12-22 2008-02-20 健泰科生物技术公司 制备可溶性多跨膜蛋白的方法
CA2695510A1 (en) * 2007-08-03 2009-02-12 Thomas M. Ramseier Translation initiation region sequences for the optimal expression of heterologous proteins
KR100961565B1 (ko) * 2008-03-10 2010-06-07 충남대학교산학협력단 목적하는 단백질 발현 수준을 제공하는 초기 코돈의발굴방법, 및 이를 이용한 재조합 단백질의 발현 조절 방법및 생산 방법
US20110129873A1 (en) * 2008-04-30 2011-06-02 Monsanto Technology Llc Recombinant DNA Vectors for Expression of Human Prolactin Antagonists
EP2313507A2 (en) * 2008-07-03 2011-04-27 Pfenex Inc High throughput screening method and use thereof to identify a production platform for a multifunctional binding protein
CN110491447B (zh) * 2019-08-05 2021-08-17 浙江省农业科学院 一种用于异源基因体外表达的密码子优化方法及应用
CN115960934A (zh) * 2022-08-24 2023-04-14 深圳柏垠生物科技有限公司 大肠杆菌表达外源基因优化方法及其序列

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4738921A (en) * 1984-09-27 1988-04-19 Eli Lilly And Company Derivative of the tryptophan operon for expression of fused gene products
US4772555A (en) * 1985-03-27 1988-09-20 Genentech, Inc. Dedicated ribosomes and their use
US5149792A (en) * 1989-12-19 1992-09-22 Amgen Inc. Platelet-derived growth factor B chain analogs
US6121416A (en) * 1997-04-04 2000-09-19 Genentech, Inc. Insulin-like growth factor agonist molecules
GB9716790D0 (en) * 1997-08-07 1997-10-15 Creative Peptides Sweden Ab Recombinant DNA molecules comprising multimeric copies of a gene sequence and expression thereof

Also Published As

Publication number Publication date
WO2001098453A3 (fr) 2002-08-01
CA2413612A1 (fr) 2001-12-27
US20040260060A1 (en) 2004-12-23
FR2810675B1 (fr) 2002-09-27
EP1315822A2 (fr) 2003-06-04
AU6922401A (en) 2002-01-02
JP2004500875A (ja) 2004-01-15
BR0111907A (pt) 2003-12-30
FR2810675A1 (fr) 2001-12-28
WO2001098453A2 (fr) 2001-12-27
CN1443242A (zh) 2003-09-17

Similar Documents

Publication Publication Date Title
US5034322A (en) Chimeric genes suitable for expression in plant cells
EP0131623B1 (en) Chimeric genes suitable for expression in plant cells
KR20170063399A (ko) F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
JP2016136959A (ja) 発現系
CN103555644A (zh) 用于无抗生素ColE1质粒增殖的宿主-载体系统
AU4011599A (en) New Escherichia coli Host/vector System Based on Antibiotic-free Selection by Complementation of an Auxotrophy
CN113549639B (zh) 一种降低烟叶总蛋白及烟气苯酚含量的调控基因
US5256568A (en) Vectors and transformed most cells for recombinant protein production with reduced expression of selectable markers
AU708080B2 (en) Process for producing recombinant proteins, plasmids and modified cells
MXPA02012880A (es) Construccion modificada hacia el extremo 3' del codon de iniciacion para sobreexpresion de proteina recombinante.
CN112481309B (zh) Ago蛋白的用途及组合物和基因编辑方法
MXPA97001614A (es) Procedimiento de produccion de proteinas recombinantes, plasmidos y celulas modificadas
US4654307A (en) Novel bacteria containing a plasmid having a tRNA code
JPS63233790A (ja) 細菌中に含まれるプラスミドの安定化方法及びこれにより得られる菌株
JP3549210B2 (ja) プラスミド
CN110878293B (zh) 缺失yceD基因的地衣芽胞杆菌在异源蛋白生产中的应用
CN1989255A (zh) 降低细胞中的自发突变率
ZA200300550B (en) Construct modified downstream of the initiation codon for recombinant protein overexpression.
NZ214549A (en) Expression control dna sequences
CN112391397A (zh) 一种烟草黄酮单加氧酶基因NtCYP75B2及其应用
AU2001256433C1 (en) Mutant strains capable of producing chemically diversified proteins by incorporation of non-conventional amino acids
JP2009514506A (ja) E.コリ株dsm6601のプラスミド不含のクローン
RU2221868C2 (ru) Ген l-аспарагиназы erwinia carotovora и штамм escherichia coli вкпм № в-8174 - продуцент l-аспарагиназы erwinia carotovora
EP1251175B1 (en) Method for diversifying the chemical composition of protein produced in vivo by genetically disabling the editing function of their aminoacyl tRNA synthetases
WO2023193837A1 (en) Expression vector for production of recombinant proteins in prokaryotic host cells