WO2009121994A1

WO2009121994A1 - Proteínas de fusión con un dominio lectina de tipo beta-trébol, procedimiento de obtención y sus aplicaciones

Info

Publication number: WO2009121994A1
Application number: PCT/ES2009/070079
Authority: WO
Inventors: José Miguel MANCHEÑO GÓMEZ; Iván ANGULO HERRERA
Original assignee: Consejo Superior De Investigaciones Científicas
Priority date: 2008-04-02
Filing date: 2009-03-30
Publication date: 2009-10-08
Also published as: ES2327309A1; ES2327309B1

Abstract

La presente invención describe un nuevo método general de expresión y purificación de proteínas de fusión conteniendo un dominio peptídico lectina β-trébol como etiqueta de afinidad y solubilidad. Esta etiqueta permite producir diferentes proteínas de fusión solubles con elevados rendimientos y purificarlas mediante un protocolo de purificación eficaz, sencillo y de bajo coste. Dicho protocolo está basado en Ia capacidad del péptido para unir azúcares derivados de galactosa y consta de una sola etapa de cromatografía de afinidad que emplea matrices derivadas de agarosa y lactosa como eluyente.

Description

PROTEÍNAS DE FUSIÓN CON UN DOMINIO LECTINA DE TIPO BETA- TRÉBOL, PROCEDIMIENTO DE OBTENCIÓN Y SUS APLICACIONES

SECTOR DE LA TÉCNICA La invención se puede encuadrar de un modo genérico en el sector de Ia biotecnología, con evidentes aplicaciones en el campo farmacéutico y, actualmente, en el desarrollo de proyectos de genómica estructural de alto rendimiento. De un modo más concreto, Ia invención se encuadraría en los procesos de producción y purificación de proteínas de fusión.

ESTADO DE LA TÉCNICA

El exitoso desarrollo de proyectos de genómica ocurrido en los últimos años ha permitido obtener una vasta cantidad de información genética, especialmente de organismos procariotas, en donde el número de genomas secuenciados se contará por miles en pocos años (Abby, S. & Daubin, V. (2007). Trends Microbiol. 15, 135-141 ). Un factor decisivo de este éxito ha sido, sin duda alguna, Ia homogeneidad química y estructural de los ácidos nucleicos, Io cual ha permitido desarrollar protocolos de secuenciación de alto rendimiento ("high throughput") de carácter universal. Actualmente, en Ia era post-genómica, el interés se dirige principalmente al análisis funcional y estructural de las proteínas codificadas por dichos genomas. En este sentido, y a diferencia de los ácidos nucleicos, las proteínas son química y estructuralmente mucho más heterogéneas, Io cual supone de fado Ia imposibilidad de desarrollar protocolos de alto rendimiento universales para Ia purificación y caracterización estructural de estas moléculas (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-320). Otros problemas relevantes asociados al diseño de este tipo de procesos de alto rendimiento es el bajo rendimiento en Ia producción y Ia escasa solubilidad de muchas de las proteínas sobre- expresadas (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353-358). Esto último ha conducido a Ia búsqueda de sistemas de sobre-expresión de proteínas recombinantes alternativos al que puede considerarse el sistema de expresión por excelencia: Ia bacteria Escheríchia coli. Algunos sistemas considerados están basados en células eucariotas de mamífero, levaduras o de insectos (Greene, JJ. (2004). Methods Mol. Biol. 267, 3-14; DaIy, R. & Hearn, MT. (2005). J. Mol. Recognit. 18, 119-138; Kost, T.A., Condreay, JP. & Jarvis, D. L. (2005). Nat. Biotechnol. 23, 567-575) o bien sistemas libres de células (Murthy, T.V., Wu, W., Qiu, Q.Q., Shi, Z. Labaer, J. & Brizuela, L. (2004). Prot. Expr. Purif. 36, 217-225). No obstante, el bajo coste, Ia facilidad de manejo y de escalado de cultivos siguen haciendo de E. coli el sistema de sobre- expresión prácticamente universal (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353-358).

Una aproximación empleada actualmente en el desarrollo de protocolos de alto rendimiento universales de producción/purificación de proteínas en E. coli es el uso de etiquetas de afinidad ("affinity tag") (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320; Arnau, J., Lauritzen, C, Petersen, G. E. & Petersen, J. (2006). Prot. Express. Purif. 48, 1-13). Estas etiquetas son proteínas o péptidos que, fusionados a Ia proteína recombinante de interés, idealmente permitirían aumentar el rendimiento de su expresión, incrementar su solubilidad y desarrollar un protocolo simple y eficaz de purificación. Se puede afirmar que actualmente no existe una etiqueta de afinidad que reúna estas características de un modo general o universal; de hecho, se considera que el uso combinado de varias etiquetas podría ser una posible solución al diseño de estrategias generales (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320). Obviamente, el empleo sistemático de esta aproximación combinatorial requiere de un conocimiento preciso de las ventajas e inconvenientes de las correspondientes etiquetas individuales. En Ia Tabla I se muestran las principales etiquetas de afinidad

("affinity tag") pues permiten desarrollar protocolos de purificación genéricos basados en cromatografías de afinidad, mientras que en Ia

Tabla II, aparecen etiquetas que en algunos casos se ha comprobado actúan como "agentes solubilizantes" ("solubility enhancers").

Tabla I. Principales etiquetas de afinidad

Etiqueta Proteína Matriz Referencia

His6 Etiqueta de seis Metales inmovilizados 1 histidinas

GST Glutathion-S-transferase Glutation 2

MBP Maltose-binding protein Amilosa 3

FLAG Péptido FLAG Anticuerpo anti-FLAG 4

BAP Péptido aceptor de Avidita 5 biotina

Strep Il Péptido de unión a Streptavidina 6 streptavidina

CBP Péptido de unión a Calmodulina 7 calmodulina

1. Gaberc-Porekar, V. & Menart, V. (2001 ). J. Biochem. Biophys.

Methods 49, 335-360. 2. Smith, D. B. & Johnson, K.S. (1988). Gene 67, 31-40.

3. di Guan, C, Li, P., Riggs, P. D. & Inoue, H. (1998). Gene 67, 21- 30.

4. Einhauer, A. & Jungbauer, A. (2001 ). J. Biochem. Biophys. Methods 49, 455-465. 5. Schatz, PJ. (1993). Biotechnology (NY) 11 , 1138-1143.

6. Voss, S. & Skerra, A. (1997). Protein Eng. 10, 975-982.

7. Vaillancourt, P., Zheng, C. F., Hoang, D.Q. & Breister, L. (2000) Methods Enzymol. 326, 340-362. Tabla I. Principales etiquetas solubilizantes

Etiqueta Proteína Origen Referencia

MBP Maltose-binding Escheríchia coli 8 protein

GST Glutathione-S- Schischosoma 9 transferase japonicum

Trx Thioredoxin Escherichia coli 10

NusA N-Utilization Escheríchia coli 11 substance

SUMO Small Ubiquitin- Homo sapiens 12 modifier

SET Solubility-enhancing Sintético 13 tag

8. Nallamsetty, S. & Waugh, D.S. (2006). Prot. Expr. Puríf. 45, 175- 182.

9. Nygren, P.A., Stahl, S. & Uhlen, M. (1993). Trends Biotechnol. 12, 184-188.

10. LaVaINe, E. R., DiBlasio, E.A., Kovacic, S., Grant, K.L., Schendel,

P.F. & McCoy, J. M. (1993). Biotechnology (NY). 11 , 187-193. H . Davis, G. D., Elisee, C, Newham, D. M. & Harrison, R.G. (1999).

Biotechnol. Bioeng. 65, 382-388. 12. Marblestone, J. G., Edavettal., S.C., Lim, Y., Lim, P., Zuo, X. &

Butt, T.R. (2006). Prot. Sci. 15, 182-189. 13.Zhang, Y.B., Howitt, J., McCorkle, S., Lawrence, P., Springer, K.

& Freimuth, P. (2004). Prot. Expr. Puríf. 36, 207-216.

Hoy día el interés se centra principalmente en MBP, GST, NusA y

Trx. No obstante y teniendo en cuenta, por un lado, que estudios recientes demuestran una baja eficacia de GST (Dyson, M. R., Shadbolt, S. P., Vincent, KJ. , Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32) y Trx (Marblestone, J.G., Edavettal., S.C., Lim, Y., Lim, P., Zuo, X. & Butt, T. R. (2006). Prot. Sci. 15, 182-189) como agentes solubilizantes en E. coli y, por otro, que NusA, aun con una eficacia similar a MBP como agente solubilizante, no permite desarrollar un protocolo de purificación inmediato (Davis, G. D., Elisee, C, Newham, D. M. & Harrison, R.G. (1999). Biotechnol. Bioeng. 65, 382-388; Dummler, A., Lawrence, A. M. & de Marco, A. (2005). Microb. CeII Fact. 4, 34), MBP ha devenido una de las etiquetas de afinidad sobre Ia que más interés se tiene y una de las más ampliamente estudiadas (Dyson, M. R., Shadbolt, S. P., Vincent, K. J., Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32; Braud, S., Moutiez, M., BeNn, P., Abello, N., Drevet, P., Zinn-Justin, S., Courcon, M., Masson, C, Dassa, J. & Charbonnier, J. B. (2005). J. Proteome Res. 4, 2137-2147). Asimismo, puede afirmarse que Ia eficacia de estas etiquetas es función de Ia proteína "acompañante" (Dyson, M. R., Shadbolt, S. P., Vincent, KJ. , Perera, R.L. & McCafferty, J. (2004). BMC Biotechnol. 4, 32), Io cual no es sino reflejo de Ia diversidad química y estructural de las proteínas. Indudablemente, una validación cualitativa de las etiquetas de afinidad requerirá de una aproximación a gran escala o "proteómica" (Esposito, D. & Chatterjee, D. K. (2006). Curr. Opin. Biotechnol. 17, 353- 358).

Tabla II. Principales etiquetas de afinidad

Etiqueta Proteína Matriz Referencia

His6 Etiqueta de seis Metales inmovilizados 7 histidinas

GST Glutathion-S-transferase Glutation 8

MBP Maltose-binding protein Amilosa 9

FLAG Péptido FLAG Anticuerpo anti-FLAG 10

BAP Péptido aceptor de Avidina 11 biotina

Strep Il Péptido de unión a Streptavidina 12 streptavidina

CBP Péptido de unión a Calmodulina 13 calmodulina

H. Gaberc-Porekar, V. & Menart, V. (2001 ). J. Biochem. Biophys.

Methods 49, 335-360.

15.Smith, D. B. & Johnson, K.S. (1988). Gene 67, 31-40. 16. di Guan, C, Li, P., Riggs, P. D. & Inoue, H. (1998). Gene 67, 21-

30. 17. Einhauer, A. & Jungbauer, A. (2001 ). J. Biochem. Biophys.

Methods 49, 455-465.

18.Schatz, PJ. (1993). Biotechnology (NY) 11 , 1138-1143. 19.Voss, S. & Skerra, A. (1997). Protein Eng. 10, 975-982.

20.Vaillancourt, P., Zheng, C. F., Hoang, D.Q. & Breister, L. (2000)

Methods Enzymol. 326, 340-362.

Una etiqueta de afinidad ideal aumenta el rendimiento en Ia producción de proteínas (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-

320). Este efecto está asociado normalmente con etiquetas proteicas (no péptidos pequeños) situadas en el extremo N-terminal de Ia fusión, en donde Ia etiqueta proporcionaría un entorno eficaz para iniciar el proceso de traducción, evitando que el ARNm adoptara estructuras secundarias que pudiesen interferir en Ia unión a los ribosomas (Hartz, D., McPheeters,

D.S., Green, L. & GoId, L. (1991 ). J. Mol. Biol. 218, 99-105). Por otro lado, también deben permitir desarrollar un protocolo de purificación eficaz, potencialmente escalable a procesos de alto rendimiento con costes mínimos (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320). En este sentido, Ia matriz cromatográfica de afinidad cobra especial relevancia (ver

Tabla II), distinguiéndose dos grandes grupos: matrices con proteínas inmovilizadas, que suelen ser caras, con baja capacidad de unión y vidas medias cortas (FLAG, BAP, Strepll, CBP), y matrices con ligandos de pequeño tamaño (MBP, GST), más baratas y estables. Por otro lado, Ia disociación de Ia proteína inmovilizada en Ia matriz debe producirse en condiciones no "agresivas" para el estado nativo de Ia proteína.

Claramente, cualquier estrategia basada en el uso de etiquetas de afinidad debería proporcionar Ia posibilidad de eliminarla de un modo eficaz (Waugh, D.S. (2005). Trends Biotechnol. 23, 316-320), aspecto éste especialmente relevante cuando se trata de proteínas con potenciales aplicaciones en terapia humana (Arnau, J., Lauritzen, C, Petersen, G. E. & Petersen, J. (2006). Prot. Express. Purif. 48, 1-13). La disponibilidad de endoproteasas con una especificidad exquisita como AcTEV® (tobáceo etch virus; Invitrogen) o PreScission® (Amersham Biotech) han mitigado notablemente este problema. Puesto que los determinantes de Ia especificidad de estas endoproteasas se localizan en el lado C-terminal del enlace peptídico diana (TEV: ENLYFQ/G; PreScission: LEVLFQ/GP), tras Ia hidrólisis, estos permanecerán en las etiquetas si están situadas en el extremo N-terminal de Ia proteína de fusión.

Finalmente, de acuerdo a las expectativas de aumento de inversiones en el mercado farmacéutico en fármacos de naturaleza proteica para el periodo 2004-2010 (de 34000 a 52000 millones de dólares; Pavlou, A.K. & Reichert, J. M. (2004). Nat. Biotechnol. 22, 1513-

1519), se espera Ia aparición de nuevas proteínas de interés terapéutico, de ahí que Ia búsqueda de nuevas etiquetas de afinidad sea actualmente un campo de intensa investigación (Arnau, J., Lauritzen, C, Petersen, G. E.

& Petersen, J. (2006). Prot. Express. Purif. 48, 1-13).

En resumen, Ia puesta a punto de un procedimiento de alto rendimiento de carácter general de producción y/o purificación de proteínas se enfrenta al problema de Ia heterogeneidad química y estructural de estas moléculas. Concretamente, los tres principales desafíos a los que se intenta aportar soluciones mediante el uso de las etiquetas de afinidad y solubilidad son:

• Aumento del rendimiento de Ia producción de las proteínas heterólogas, • Aumento de Ia solubilidad de Ia proteína de interés, y

• Aportar un protocolo de purificación eficaz y fácilmente escalable a procesos de alto rendimiento

DESCRIPCIÓN DE LA INVENCIÓN

Breve Descripción

Un aspecto de Ia invención Io constituye una proteína de fusión recombinante, en adelante proteína de fusión de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de aminoácidos del péptido LSLi₅₀ del hongo Laetiporus sulphureus (SEQ ID NO2), y b) una secuencia análoga a Ia SEQ ID NO2 de a).

En el sentido utilizado en esta descripción, el término "análoga" pretende incluir a cualquier secuencia de aminoácidos que pueda ser aislada o construida en base a Ia secuencia de aminoácidos mostrada en Ia SEQ. ID NO2, por ejemplo, mediante Ia introducción de sustituciones de aminoácidos conservativas o no conservativas, incluyendo Ia inserción de uno o más aminoácidos, Ia adición de uno o más aminoácidos en cualquiera de los extremos de Ia molécula o Ia deleción de uno o más aminoácidos en cualquier extremo o en el interior de Ia secuencia.

En general, una secuencia de aminoácidos análoga es sustancialmente homologa a Ia secuencia de aminoácidos identificada como Ia SEQ ID NO2. En el sentido utilizado en esta descripción, Ia expresión "sustancialmente homologa" significa que las secuencias de aminoácidos en cuestión tienen un grado de identidad, a nivel de aminoácidos, de, al menos, un 60%, preferentemente de, al menos un 85%, o más preferentemente de, al menos, un 95%.

Otro aspecto de Ia invención Io constituye el procedimiento de obtención de Ia proteína de fusión, en adelante procedimiento de Ia invención, que comprende las siguientes etapas:

i) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSLi₅₀ (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, ii) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escherichia coli, en

Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, iii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, iv) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado. Para llevar a cabo el paso i) del procedimiento de Ia invención es necesario elaborar una construcción genética que comprenda Ia secuencia de ADN codificante del peptido SEQ ID NO2, Ia proteína o péptido de interés y opcionalmente, una secuencia de reconocimiento de endoproteasas, por ejemplo, TEV (tobáceo etch virus endoprotease) con objeto de separar Ia etiqueta de afinidad de Ia proteína de interés.

Así, otro aspecto de Ia invención Io constituye una construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión de Ia invención, en adelante construcción genética de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de ADN SEQ ID NO1 , y b) una secuencia homologa a Ia SEQ ID NO1.

La construcción genética de Ia invención permite Ia expresión de una proteína de interés unida al péptido de SEQ ID NO2. Esta construcción genética de Ia invención, también puede comprender, en caso necesario y para permitir un mejor aislamiento, detección o secreción al exterior de Ia célula del péptido de interés expresado, una secuencia de nucleótidos que codifica para un péptido susceptible de ser utilizado con fines de aislamiento, detección o secreción de dicho péptido. Por tanto, un objeto particular de Ia presente invención Io constituye una construcción genética de Ia invención que comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David Lañe (1999). CoId Spring Harbor Laboratory Press. New York. Capítulo: Tagging proteins. Pp. 347-377). La construcción genética de Ia invención descrita previamente puede aislarse y obtenerse por un experto mediante el empleo de técnicas ampliamente conocidas en el estado de Ia técnica (Sambrook et al. "Molecular cloning, a Laboratory Manual 2nd ed., CoId Sping Harbor Laboratory Press, N.Y., 1989 vol 1-3). Dichas secuencias de nucleótidos pueden estar integradas en un vector de expresión génica que permite Ia regulación de Ia expresión de Ia misma en condiciones adecuadas en el interior de las células.

Por tanto, otro aspecto de Ia presente invención Io constituye un vector de expresión, en adelante vector de expresión de Ia invención, que comprende una construcción genética de Ia invención y que permite Ia expresión de una proteína o péptido. Ejemplos de una realización particular se pueden encontrar en los ejemplos de Ia presente invención. En general, un vector de expresión comprende, además de Ia construcción genética descrita en Ia invención, un promotor que dirige su transcripción (por ejemplo, pT7, plac, ptrc, ptac, pBAD, ret, etc.), al que está operativamente enlazado, y otras secuencias necesarias o apropiadas que controlan y regulan dicha transcripción y, en su caso, Ia traducción del producto de interés, por ejemplo, señales de inicio y terminación de transcripción (tlt2, etc.), señal de poliadenilación, origen de replicación, secuencias de unión a ribosomas (RBS), secuencias codificantes de reguladores transcripcionales, (enhancers), silenciadores transcripcionales (silencers), represores, etc. Ejemplos de vectores de expresión apropiados pueden seleccionarse de acuerdo con las condiciones y necesidades de cada caso concreto entre plásmidos de expresión, vectores virales (DNA o RNA), cósmidos, cromosomas artificiales, etc. que pueden contener, además, marcadores utilizables para seleccionar las células transfectadas o transformadas con el gen o genes de interés. La elección del vector dependerá de Ia célula huésped y del tipo de uso que se quiera realizar. Por tanto, según un modo de realización particular de Ia presente invención dicho vector es un plásmido o un vector viral. La obtención de dicho vector puede realizarse por métodos convencionales conocidos por los técnicos en Ia materia al igual que para Ia transformación de microorganismos y células eucariotas se pueden utilizar diferentes métodos ampliamente conocidas - transformación química, electroporación, microinyección, etc. - descritos en diversos manuales [Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989). Molecular cloning: a laboratory manual, 2nd ed. CoId Spring Harbor Laboratory, CoId Spring Harbor, N.Y.].

Otro aspecto de Ia presente invención Io constituye una célula huésped, en adelante célula de Ia invención, que comprende Ia construcción genética o el vector de expresión de Ia invención, preferentemente una célula procariota. Una realización particular de Ia invención Io constituye una célula huésped de Ia invención constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.

Descripción detallada La presente invención se refiere a un nuevo método general o universal de expresión y purificación de proteínas de fusión conteniendo un dominio lectina β-trébol como etiqueta de afinidad.

La presente invención se basa en que los inventores han observado que el módulo lectina de Ia proteína hemolítica del hongo Laetiporus sulphureus (los primeros 150 aminoácidos: LSL150) (SEQ ID NO2) es funcional en tanto que parte constituyente de numerosas proteínas recombinantes de fusión diseñadas ad hoc. Es decir, que por un lado, Ia

SEQ ID NO2 es versátil desde una perspectiva de plegamiento de proteínas pues se pliega adecuadamente estando acompañada de diferentes proteínas en su extremo C-terminal y, por otro, conserva su capacidad de unión de azúcares. Sorprendentemente, las proteínas recombinantes de interés fusionadas al extremo C-terminal de SEQ ID NO2 también se pliegan adecuadamente, según se deduce de los resultados de actividad llevados a cabo con las proteínas puras. Además, estas proteínas de interés mantienen su estado nativo incluso una vez separadas de SEQ ID NO2 mediante tratamiento proteolítico (TEV proteasa; ver más abajo). Todo ello ha permitido purificar diversas proteínas de fusión conteniendo Ia SEQ ID NO2 en su extremo N-terminal empleando un único protocolo de purificación.

En este sentido, los inventores han observado que Ia SEQ ID NO2 (de origen eucariota) se produce en E. coli (procariota) con un elevado rendimiento (aprox. 80 mg por litro de cultivo), plegándose adecuadamente. De hecho, Ia estructura tridimensional de SEQ ID NO2 producida en E. coli que han determinado es esencialmente igual a Ia del correspondiente módulo lectina de LSL aislada directamente del hongo L. sulphureus (Figura 3). Esta estructura es garantía del plegamiento adecuado de SEQ ID NO2 expresada heterólogamente en un organismo procariota, Io cual no es siempre obvio. Sorprendentemente, en todos los ejemplos indicados más abajo, el rendimiento con el que se obtienen las proteínas de fusión construidas (ver ejemplos más abajo) es tal que permite afrontar proyectos de cristalización de las proteínas puras, una vez separadas de SEQ ID NO2, con un coste bajo. En el caso concreto de Ia proteína PLD de A. haemolyticum (ver ejemplo 3), su expresión con una etiqueta de histidinas (His6 tag) en las mismas condiciones que LSL₁₅₀- PLD, no permitía obtener Ia proteína de fusión soluble. Es decir, Ia secuencia SEQ ID NO2 reúne propiedades de etiqueta de afinidad y de solubilidad. En este sentido, es de destacar que actualmente se desconocen las bases moleculares por las cuales una proteína actúa como etiqueta de solubilidad y que, por ello, no disponemos de criterios objetivos con los cuales realizar una búsqueda sistemática de proteínas que pudiesen actuar como tales. En nuestro caso particular, podemos afirmar que del análisis estructural y biofísico de Ia secuencia SEQ ID N02 no se pueden deducir sus propiedades como etiqueta de solubilidad. La idea inicial de que cualquier proteína muy soluble puede actuar como tal se ha comprobado incorrecta (Waugh, D. S. (2005). Trends Biotechnol. 23, 316-320). Aunque Ia solubilidad es una propiedad necesaria para una potencial etiqueta de solubilidad, es obvio que no es un requisito suficiente.

En tanto que etiqueta de afinidad y de solubilidad, Ia SEQ ID NO2 permite producir diferentes proteínas de fusión con elevados rendimientos y establecer un protocolo de purificación de las mismas de carácter general, eficaz, sencillo y de bajo coste. Estas características se deben a factores de distinta naturaleza. En primer lugar, se debe a que el método de purificación de Ia proteína de fusión implica una única etapa cromatográfica de afinidad. En segundo lugar, a que el costo de los principales componentes empleados en dicho protocolo, esto es, las matrices cromatográficas derivadas de agarosa (Sepharose™ 4B, 6B, CL- 4B, CL-6B) y eluyentes (D(+)-lactosa), es sorprendentemente bajo. Así, y a modo de comparación, mientras que el precio medio de estas resinas está en torno a unos 420-580€/litro (en el caso de Sepharose™ 6B se emplea una columna con unos 25 mi de resina) y el de D(+)-lactosa como eluyente unos 28€/kilo, el precio de los componentes empleados en el sistema descrito en (Tielker, D., Rosenau, F., Bartels, K. M., Rosenbaum, T. & Jaeger, K.E. (2006). Bio-Techniques 41 , 327-332), esto es, manosa- agarosa es de 33120 €/litro y el de D-manosa de unos 900 €/kilo. Y, finalmente, en tercer lugar, las matrices cromatográficas empleadas, por una parte, no requieren de ningún tratamiento químico adicional para actuar como matrices de afinidad frente a Ia secuencia SEQ ID NO2 y, por otra, al ser esencialmente inertes a los homogeneizados celulares y no requerir regeneraciones más allá de su lavado con buffer, pueden reutilizarse de un modo esencialmente continuo.

Una vez comprobada Ia capacidad de Ia secuencia SEQ ID N02 para actuar como etiqueta de afinidad y solubilidad, se puede afirmar a posteriorí que ésta reúne características ventajosas adicionales para ser empleada biotecnológicamente en procesos de producción y purificación de proteínas. En primer lugar, al ser un dominio monomérico no impone restricciones estéricas sobre Ia proteína C-terminal "acompañante"; en segundo lugar, al carecer de residuos de cisteína Ia secuencia SEQ ID NO2 no demanda el uso de agentes moduladores del estado redox del medio y, finalmente, en tercer lugar, esta secuencia es LSLi₅₀ es desde una perspectiva evolutiva un módulo proteico, por Io que está adaptada estructural y funcionalmente a ser parte constituyente de proteínas modulares, como son de facto las proteínas recombinantes de fusión. En este sentido es destacable el hecho de que ninguna de las etiquetas de afinidad (proteínas) actualmente relevantes, como MBP, GST o Trx, proceden de proteínas modulares.

Por tanto, un aspecto de Ia invención Io constituye una proteína de fusión recombinante, en adelante proteína de fusión de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: c) Ia secuencia de aminoácidos del péptido LSL150 del hongo

Laetiporus sulphureus (SEQ ID NO2), y d) una secuencia análoga a Ia SEQ ID NO2 de a).

En general, una secuencia de aminoácidos análoga es sustancialmente homologa a Ia secuencia de aminoácidos identificada como Ia SEQ ID N02. En el sentido utilizado en esta descripción, Ia expresión "sustancialmente homologa" significa que las secuencias de aminoácidos en cuestión tienen un grado de identidad, a nivel de aminoácidos, de, al menos, un 60%, preferentemente de, al menos un 85%, o más preferentemente de, al menos, un 95%.

Otro aspecto de Ia invención Io constituye el procedimiento de obtención de Ia proteína de fusión, en adelante procedimiento de Ia invención, que comprende las siguientes etapas: v) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSL₁₅₀ (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, vi) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escheríchia coli, en Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, vii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, viii) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado.

Para llevar a cabo el paso i) del procedimiento de Ia invención es necesario elaborar una construcción genética que comprenda Ia secuencia de ADN codificante del peptido SEQ ID NO2, Ia proteína o péptido de interés y opcionalmente, una secuencia de reconocimiento de endoproteasas, por ejemplo, TEV (tobáceo etch virus endoprotease) con objeto de separar Ia etiqueta de afinidad de Ia proteína de interés.

Así, otro aspecto de Ia invención Io constituye una construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión de Ia invención, en adelante construcción genética de Ia invención, que comprende, al menos, una secuencia del siguiente grupo: c) Ia secuencia de ADN SEQ ID NO1 , y d) una secuencia homologa a Ia SEQ ID NO1.

La construcción genética de Ia invención permite Ia expresión de una proteína de interés unida al péptido de SEQ ID NO2. Esta construcción genética de Ia invención, también puede comprender, en caso necesario y para permitir un mejor aislamiento, detección o secreción al exterior de Ia célula del péptido de interés expresado, una secuencia de nucleótidos que codifica para un péptido susceptible de ser utilizado con fines de aislamiento, detección o secreción de dicho péptido. Por tanto, un objeto particular de Ia presente invención Io constituye una construcción genética de Ia invención que comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag) (Using antibodies: a laboratory manual. Ed. Harlow and David Lañe (1999). CoId Spring Harbor Laboratory Press. New York. Capítulo: Tagging proteins. Pp. 347-377).

La construcción genética de Ia invención descrita previamente puede aislarse y obtenerse por un experto mediante el empleo de técnicas ampliamente conocidas en el estado de Ia técnica (Sambrook et al.

"Molecular cloning, a Laboratory Manual 2nd ed., CoId Sping Harbor

Laboratory Press, N.Y., 1989 vol 1-3). Dichas secuencias de nucleótidos pueden estar integradas en un vector de expresión génica que permite Ia regulación de Ia expresión de Ia misma en condiciones adecuadas en el interior de las células.

Por tanto, otro aspecto de Ia presente invención Io constituye un vector de expresión, en adelante vector de expresión de Ia invención, que comprende una construcción genética de Ia invención y que permite Ia expresión de una proteína o péptido. Ejemplos de una realización particular se pueden encontrar en los ejemplos de Ia presente invención.

En general, un vector de expresión comprende, además de Ia construcción genética descrita en Ia invención, un promotor que dirige su transcripción (por ejemplo, pT7, plac, ptrc, ptac, pBAD, ret, etc.), al que está operativamente enlazado, y otras secuencias necesarias o apropiadas que controlan y regulan dicha transcripción y, en su caso, Ia traducción del producto de interés, por ejemplo, señales de inicio y terminación de transcripción (tlt2, etc.), señal de poliadenilación, origen de replicación, secuencias de unión a ribosomas (RBS), secuencias codificantes de reguladores transcripcionales, (enhancers), silenciadores transcripcionales (silencers), represores, etc. Ejemplos de vectores de expresión apropiados pueden seleccionarse de acuerdo con las condiciones y necesidades de cada caso concreto entre plásmidos de expresión, vectores virales (DNA o RNA), cósmidos, cromosomas artificiales, etc. que pueden contener, además, marcadores utilizables para seleccionar las células transfectadas o transformadas con el gen o genes de interés. La elección del vector dependerá de Ia célula huésped y del tipo de uso que se quiera realizar. Por tanto, según un modo de realización particular de Ia presente invención dicho vector es un plásmido o un vector viral. La obtención de dicho vector puede realizarse por métodos convencionales conocidos por los técnicos en Ia materia al igual que para Ia transformación de microorganismos y células eucariotas se pueden utilizar diferentes métodos ampliamente conocidas - transformación química, electroporación, microinyección, etc. - descritos en diversos manuales [Sambrook, J., Fritsch, E. F., and Maniatis, T. (1989). Molecular cloning: a laboratory manual, 2nd ed. CoId Spring Harbor Laboratory, CoId Spring Harbor, N.Y.].

Otro aspecto de Ia presente invención Io constituye una célula huésped, en adelante célula de Ia invención, que comprende Ia construcción genética o el vector de expresión de Ia invención, preferentemente una célula procariota.

Una realización particular de Ia invención Io constituye una célula huésped de Ia invención constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.

DESCRIPCIÓN DE LAS FIGURAS

Figura 1.- Plásmido pKLSL150 y secuencia de Ia proteína LSL₁₅₀. Parte izquierda: esquema del vector de expresión pKLSL150 que contiene Ia secuencia de 450 nt que codifica para Ia proteína LSL₁₅₀ bajo el control del promotor de T7 y un regulador inducible por IPTG. Este plásmido contiene el gen de resistencia a Ia Kanamicina (Kan), el gen del represor lacl, y un sitio múltiple de clonaje (Ncol/Xhol). Parte derecha: secuencia de nucleótidos y aminoácidos de Ia proteína LSL₁₅₀ flanqueada por los sitios de restricción Ncol y EcoRI utilizados en el clonaje.

Figura 2.- Análisis mediante SDS-PAGE de Ia purificación de Ia proteína de fusión LSL₁₅₀. En el gel aparecen muestras de diferentes fracciones del perfil de elución de LSL₁₅₀ al lavar Ia columna con buffer conteniendo 0.2 M lactosa. A Ia izquierda se muestran patrones de masa molecular con sus correspondientes masas en kDa.

Figura 3.- Estructura tridimensional de Ia proteína LSLi₅₀. Parte izquierda: representación del esqueleto peptídico de LSL₁₅₀ (negro: hebras β; gris: bucles). Parte derecha: esqueleto peptídico del módulo lectina de Ia proteína completa aislada directamente del hongo Laetiporus sulphureus

(negro: hebras β; gris: bucles). N: extremo amino terminal; C: extremo carboxilo terminal. La estructura de ambas proteínas se ha determinado mediante cristalografía de proteínas. La superposición revela una rmsd para 148 carbonos α de 1.1 A, esto es, son casi perfectamente superponibles.

Figura 4.- Plásmido pKLSLt y secuencia de reconocimiento de Ia TEV proteasa. Parte superior: esquema del vector de expresión pKLSLt derivado del pKLSL150 (Figura 1 ). En él se han insertado, en el extremo 3^' de Ia secuencia que codifica para Ia proteína LSL₁₅₀, las secuencias que codifican para el linker y para el sitio de reconocimiento por Ia TEV proteasa. Se indica asimismo, Ia situación de un sitio múltiple de clonaje (EcoRI/Xhol). Parte inferior: secuencia de nucleótidos y aminoácidos del extremo C-terminal de LSL_150, así como del linker, de Ia secuencia de corte TEV y de los sitios de restricción.

Figura 5.- Plásmido pKLSLt-EGFP. Parte superior: esquema del vector de expresión pKLSLt -EGFP derivado del pKLSLt (Figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia Enhancer Green

Fluorescence Protein (EGFP) de Aequorea victoria (Clontech) de 720 pb entre los sitios de restricción EcoRI y Not I. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.

Figura 6.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSL₁₅₀-EGFP y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSL150-EGFP tras Sepharose™ 4B; 4. tratamiento de LSL150-EGFP con TEV proteasa; 5. EGFP tras filtración en gel con Superdex 75; 6. LSL₁₅₀ tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.

Figura 7.- Plásmido pKLSLt-PLD. Parte superior: esquema del vector de expresión pKLSLt -PLD derivado del pKLSLt (Figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína PLD (fosfolipasa dependiente de esfingomielina del microorganismo Arcanobacterium haemolyticum) de 846 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.

Figura 8.- Análisis mediante SDS-PAGE de Ia expresión y purificación de

Ia proteína de fusión LSL₁₅₀-PLD y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSL₁₅₀-PLD tras Sepharose™ 4B; 4. tratamiento de LSL₁₅₀-PLD con TEV proteasa; 5. PLD tras filtración en gel con Superdex 75; 6. LSLi₅₀ tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.

Figura 9.- Plásmido pKLSLt-SMD. Parte superior: esquema del vector de expresión pKLSLt -SMD derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína SMD (fosfolipasa dependiente de esfingomielina del microorganismo Corynebacteríum pseudotuberculosis) de 802 pb entre los sitios de restricción EcoRI y Hind ///. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.

Figura 10.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLi₅₀-SMD y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSLi₅₀-SMD tras Sepharose™ 4B; 4. tratamiento de LSLi₅₀-SMD con TEV proteasa; 5. SMD tras filtración en gel con Superdex 75; 6. LSLi₅₀ tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.

Figura 11.- Plásmido pKLSLt-CPL7. Parte superior: esquema del vector de expresión pKLSLt -CPL7 derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína CPL7 (mureín hidrolasa del fago Cp-7 del microorganismo Streptoccocus pneumoniae) de 1003 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.

Figura 12.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLi₅₀-CPL7 y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. marcadores de masa molecular (kDa); 2. fracción soluble del homogeneizado celular; 3. proteína LSI_i₅o-CPL7 tras Sepharose™ 4B; 4. tratamiento de LSLi₅₀-CPL7 con TEV proteasa; 5. CPL7 tras filtración en gel con Superdex 75; 6. LSLi₅₀ tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.

Figura 13.- Plásmido pKLSI_t-IP5_2K. Parte superior: esquema del vector de expresión pKLSLt -IP5_2K derivado del pKLSLt (figura 4) en el cual se ha insertado Ia secuencia que codifica para Ia proteína IP5_2K (Inositol (1 ,3,4,5,6)-pentakisfosfato quinasa de Arabidopsis thaliana) de 1353 pb entre los sitios de restricción EcoRI y Hind III. Parte inferior: secuencia de nucleótidos y aminoácidos del sitio de corte TEV y parte de Ia proteína clonada.

Figura 14.- Análisis mediante SDS-PAGE de Ia expresión y purificación de Ia proteína de fusión LSLiso-IP5_2K y del tratamiento de ésta con Ia TEV proteasa. Calles: 1. fracción soluble del homogeneizado celular; 2 marcadores de masa molecular (kDa).; 3. proteína LSLiso-IP5_2K tras Sepharose™ 4B; 4. tratamiento de LSLiso-IP5_2K con TEV proteasa; 5. IP5_2K tras filtración en gel con Superdex 75. A Ia izquierda se muestra Ia masa molecular en kDa.

EJEMPLOS DE LA INVENCIÓN

Ejemplo 1.- Desarrollo del vector con el dominio lectina β-trébol del hongo Laetiporus sulphureus Con objeto de caracterizar estructuralmente el dominio lectina β-trébol base de Ia invención, el gen que codifica para este péptido LSL150 fue expresado heterólogamente en E. coli. Concretamente, el péptido LSL₁₅₀ de Ia invención (SEQ ID NO2) es el módulo lectina de Ia proteína modular LSL (Mr 35 kDa) producida por el hongo Laetiporus sulphureus (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463). LSL150 está constituido por los 150 primeros aminoácidos de LSL (17 kDa), que adoptan una estructura denominada de β-trébol (Mancheño. J. M., Tateno, H., Goldstein, IJ. , Martínez-Ripoll, M. & Hermoso, J.A. (2005). J. Biol. Chem. 280, 17251-17259). Este se puede describir como un pequeño barril β formado por 6 hebras β, en uno de cuyos extremos se encuentra el denominado triplete de bucles. La estructura en su conjunto resulta de Ia triplicación de una unidad estructural básica de unos 50 residuos, cada una de las cuales poseería capacidad de unión de azúcares derivados de galactosa. Por ello, LSL₁₅₀ tiene tres potenciales sitios de unión de azúcares, dos de los cuales son competentes para unir disacáridos conteniendo galactosa según se ha demostrado (Mancheño. J. M., Tateno, H., Goldstein, IJ. , Martínez-Ripoll, M. & Hermoso, J.A. (2005). J. Biol. Chem. 280, 17251-17259).

Previamente, el vector plasmídico pKLSL150 (Figura 1 ) fue construido insertando Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL₄₅₀) en el vector pET28a+ (Novagen). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno, H. & Goldstein, IJ. (2003).

J. Biol. Chem. 278, 40455-40463), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen LSL_45O y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y EcoRI respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSL150 siguiendo procedimientos estándares de clonaje (Sambrook, J.

& Russell, D.W. (2001 ). CoId Spring Harbour Lab. Press. 3rd Ed).

Para Ia producción de Ia proteína LSLi₅₀ recombinante, se transformaron bacterias E. coli (BL21 DE3) con el vector de expresión pKLSL150, en donde Ia expresión del gen que codifica para ella se encuentra bajo el control transcripcional del promotor de T7. Las células de E. coli fueron crecidas en 1 L de medio Luria Bertani LB conteniendo kanamicina (50 μg/mL) durante 3-4 horas a 37⁰C, hasta alcanzarse una OD₆oonm de 0.6, momento en donde se induce Ia expresión de Ia proteína mediante Ia adición de 0.3 mM IPTG y posterior incubación a 16⁰C durante 20 horas. Los cultivos celulares se separaron del medio de cultivo mediante centrifugación a 4000 x g durante 15 min. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 4⁰C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de Ia proteína LSLi₅₀ mediante lavado con el mismo buffer anterior conteniendo lactosa 0.2 M. La columna puede ser empleada de nuevo sin necesidad de etapas de regeneración adicionales, simplemente tras equilibrarla de nuevo en el buffer de lavado sin azúcar. Debido a que Ia matriz cromatográfica resulta ser inerte a los homogeneizados celulares su uso continuado está garantizado. La proteína así purificada se ha conseguido con un rendimiento de aproximadamente 50 mg/litro de cultivo. El protocolo de purificación proporciona proteína LSLi₅₀ electroforéticamente pura (Figura 2).Todas las etapas del proceso de purificación se realizan a 4⁰C. Se ha determinado Ia estructura tridimensional de LSLi₅₀ recombinante mediante cristalografía de proteínas, encontrándose que es perfectamente superponible (rmsd 1.1 A para 148 carbonos) al dominio lectina de LSL aislada directamente del hongo Laetiporus sulphureus (Figura 3), Io cual es garantía del plegamiento adecuado de esta proteína expresada heterólogamente. El extraordinario rendimiento de Ia producción de LSLi₅₀, que apunta a unas muy eficaces etapas de transcripción y traducción, así como Ia eficacia, sencillez y costes perfectamente asumibles del protocolo de purificación condujeron al planteamiento de Ia hipótesis de trabajo de que LSL150 pudiese actuar como etiqueta de afinidad y de solubilidad en Ia producción de proteínas de fusión. Además, esta molécula posee características muy atractivas como etiqueta de fusión: en primer lugar, es extraordinariamente soluble (se han preparado soluciones de hasta 60-80 mg/ml). Aunque esta característica no es un requisito suficiente para considerarse un agente solubilizante, sí que es un requisito necesario para serlo; en segundo lugar, es monomérica, por Io que no va a contribuir al establecimiento de interacciones intermoleculares entre las proteínas de fusión de las que forme parte, y en tercer lugar, carece de residuos de cisteína, Io que implica Ia ausencia de problemas de oxidaciones.

Con objeto de validar esta hipótesis se han construido una serie de fusiones génicas entre Ia secuencia que codifica para LSLi₅₀ y las secuencias que codifican para distintas proteínas, entre las cuales se ha incorporado Ia secuencia de reconocimiento de Ia proteasa TEV. Para ello se construyó el vector plasmídico pKLSLt insertando en el vector pET28a+ (Novagen) Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL450) seguida de Ia secuencias de nucleótidos que codifican para un linker de unión y el sitio de reconocimiento de Ia TEV proteasa [LTEV). Dicho inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno, H. & Goldstein, IJ. (2003). J. Biol. Chem. 278, 40455-40463) y oligonucleótidos que hibridan en Ia región inicial y final del gen LSL₄₅₀ y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y Ia secuencia (LTEV) seguida de Ia secuencia diana para Ia enzima de restricción EcoRI, respectivamente (Figura 4). Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt siguiendo procedimientos estándares de clonaje (Sambrook, J. & Russell, D. W. (2001 ). CoId Spring Harbour Lab. Press. 3rd Ed).

Ejemplo 2.- Expresión de Ia proteína de fusión LSL_I50-EGFP

2.1.- Construcción del vector plasmídico pKLSLt

Con objeto de validar las aplicaciones del dominio SEQ ID NO2 se han construido una serie de fusiones génicas entre Ia secuencia de ADN que codifica para el dominio LSL150 (SEQ ID NO1 ) y las secuencias que codifican para distintas proteínas, entre las cuales se ha incorporado Ia secuencia de reconocimiento de Ia proteasa TEV. Para ello se construyó el vector plasmídico pKLSLt insertando en el vector pET28a+ (Novagen) Ia fase de lectura abierta de los primeros 450 nt del gen de Ia proteína LSL (LSL₄₅₀) seguida de Ia secuencias de nucleótidos que codifican para un linker de unión y el sitio de reconocimiento de Ia TEV proteasa (LTEV). Dicho inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el pET43-LSLa (Tateno & Goldstein, 2003) y oligonucleótidos que hibridan en Ia región inicial y final del gen LSL450 y presentan en sus extremos las secuencias diana de las enzimas de restricción Ncol y Ia secuencia (LTEV) seguida de Ia secuencia diana para Ia enzima de restricción EcoRI, respectivamente (Figura 4). Tras Ia reacción, el fragmento obtenido y el vector pET28a+, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).

2.2.- Construcción del vector plasmídico pKLSLt-EGFP El vector plasmídico pKLSLt-EGFP (Figura 5) fue construido insertando una fase de lectura abierta de 720 nt del gen de Ia proteína EGFP (Enhancer Green Fluorescence Protein) en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pCMV-EGFP (Clontech), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen EGFP y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Notl, respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-EGFP siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).

2.3.- Producción y purificación de Ia proteína de fusión LSL₁₅₀-EGFP

Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-EGFP (Figura 5) durante 3-4 horas a 37⁰C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una ODβoonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSL150-EGFP mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 16⁰C durante 20 horas. Tras centrifugación a 4000 x g durante 15 min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 4⁰C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-EGFP mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 6). Las fracciones conteniendo LSL150-EGFP se juntaron (Figura 6, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas Centriprep YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde EGFP y LSL150 (Figura 6, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 6, calles 5 y 6, respectivamente).

Ejemplo 3.- Expresión de Ia proteína de fusión LSLi₅₀-PLD

3.1.- Construcción de los plásmidos bacterianos El vector plasmídico pKLSLt-PLD (Figura 7) fue construido insertando Ia fase de lectura abierta de los primeros 846nt del gen de Ia fosfolipasa dependiente de esfingomielina (PLD) de Ia bacteria patógena Arcanobacterium haemolyticum en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pJB31 (proporcionado por el Dr. Stephen Billington del Department of Veterinary Science and Microbiology, University of Arizona), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen PLD y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-PLD siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).

3.2.- Producción y purificación de Ia proteína de fusión LSLi₅₀-PLD

Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-PLD (Figura 7) durante 3-4 horas a 37⁰C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD₆oonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSLi₅₀-PLD mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 16⁰C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 4⁰C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL150-PLD mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 8). Las fracciones conteniendo LSLi₅₀-PLD se juntaron (Figura 8, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde PLD y LSLi₅₀ (Figura 8, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 8, calles 5 y 6, respectivamente).

Ejemplo 4.- Expresión de Ia proteína de fusión LSL₁₅₀-SMD

4.1. - Construcción de los plásmidos bacterianos

El vector plasmídico pKLSLt-SMD (Figura 9) fue construido insertando Ia fase de lectura abierta de 802nt del gen de Ia fosfolipasa dependiente de esfingomielina del microorganismo patógeno Corynebacteríum pseudotuberculosis (SMD) en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pJG90 (Tambourgi et al., 2002), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen EGFP y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionó el plásmido recombinante pKLSLt-SMD siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).

4.2.- Purificación de Ia proteína de fusión LSLi₅₀-SMD

Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-SMD (Figura 9) durante 3-4 horas a 37⁰C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD₆oonm de 0.6.

En ese momento se induce Ia expresión de Ia proteína LSL150-SMD mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a

16⁰C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 4⁰C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSL₁₅₀-SMD mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 10). Las fracciones conteniendo LSL150-SMD se juntaron (Figura 10, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde SMD y LSL150 (Figura 10, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 10, calles 5 y 6, respectivamente).

Ejemplo 5.- Expresión de Ia proteína de fusión LSLi₅₀-CPL7

5.1.- Construcción de los plásmidos bacterianos

El vector plasmídico pKLSLt-CPL7 (Figura 11 ) fue construido insertando Ia fase de lectura abierta de los primeros 1003nt del gen de Ia proteína mureín hidrolasa CPL7 del bacteriófago Cp-7 de Streptococcus pneumoniae en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pCP700 (García, P., García, JL., García, E., Sánchez-Puelles, J. M., López, R. (1990) Gene 86, 81-88), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen CPL7 y presentan en sus extremos las secuencias diana de las enzimas de restricción EcoRI y Hindlll respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación y se seleccionándose el plásmido recombinante pKLSI_t-CPL7 siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).

5.2.- Purificación de Ia proteína de fusión LSLi₅₀-CPL7 Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-CPL7 (Figura 11 ) durante 3-4 horas a 37⁰C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD₆oonm de 0.6. En ese momento se induce Ia expresión de Ia proteína LSL₁₅₀-CPI-J mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 16⁰C durante 20 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpms en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 4⁰C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSLi₅₀-CPL7 mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 12). Las fracciones conteniendo LSLi₅₀-CPL7 se juntaron (Figura 12, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde CPL7 y LSL₁₅₀ (Figura 12, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 12, calles 5 y 6, respectivamente).

Ejemplo 6.- Expresión de Ia proteína de fusión LSLi₅₀-IP5_2K

5.1.- Construcción de los plásmidos bacterianos

El vector plasmídico pKLSLt-IP5_2K (Figura 13) fue construido insertando Ia fase de lectura abierta de los primeros 1353nt del gen de Ia proteína Inositol (1 ,3,4,5,6)-pentakisfosfato quinasa de Arabidopsis thaliana en el vector pKLSLt (Figura 4). El inserto se obtuvo mediante reacción en cadena de Ia polimerasa (PCR) utilizando como molde el plásmido pET28c conteniendo el cDNA de IP5_2K (proporcionado por Ia Dr. Beatriz González, Grupo de Cristalografía, Insto. Rocasolano, CSIC), así como oligonucleótidos específicos que hibridan en Ia región inicial y final del gen IP5_2K y presentan en sus extremos las secuencias diana de las enzimas de restricción Sacl y Xhol respectivamente. Tras Ia reacción, el fragmento obtenido y el vector pKLSLt, fueron digeridos con las correspondientes enzimas de restricción, purificados y ligados en presencia de Ia enzima T4 ligasa (Roche). Posteriormente, se transformaron bacterias competentes con el producto de Ia ligación, seleccionándose el plásmido recombinante pKLSLt-IP5_2K siguiendo procedimientos estándares de clonaje (Sambrook y Russell; 2001 ).

5.2.- Purificación de Ia proteína de fusión LSLi₅₀-IP5_2K

Se incubaron células de E. coli (BL21 DE3) conteniendo el plásmido pKLSLt-IP5_2K (Figura 13) durante 3-4 horas a 37⁰C en 1 L de medio LB conteniendo kanamicina (50 μg/mL), hasta alcanzarse una OD₆oonm de 1. En ese momento se induce Ia expresión de Ia proteína LSL₁₅₀-IP5_2K mediante Ia adición de 0.3 mM IPTG, tras Io cual se mantiene el cultivo a 16⁰C durante 16 horas. Tras centrifugación a 4000 x g durante 15min, las células se separaron del medio de cultivo. El sedimento así obtenido se resuspende en 25 mi de buffer 20 mM Tris, pH 8.0 conteniendo 0.1 M NaCI y 0.04% azida sódica. Con objeto de romper las células y obtener un homogeneizado celular, el sedimento resuspendido se pasó por una French press. La fracción soluble del homogeneizado celular se obtiene mediante centrifugación a 20000 rpm en un rotor SS34 durante 30 minutos. Esta fracción soluble se aplicó en una columna de Sepharose™ 4B, equilibrada previamente en buffer 20 mM Tris-HCI, pH 8.0 con 0.1 M NaCI y 0.04% azida sódica y mantenida a 4⁰C. Tras lavado exhaustivo de Ia columna con el mismo buffer (se alcanza línea base en mediciones de Abs 280 nm), se lleva a cabo Ia elución de LSLi₅₀-IP5_2K mediante lavado de Ia matriz cromatográfica con el mismo buffer anterior conteniendo lactosa 0.2 M (Figura 14). Las fracciones conteniendo LSL150- IP5_2K se juntaron (Figura 14, calle 3), concentrándose Ia proteína mediante ultrafiltración con membranas YM-10 (Amicon). El tratamiento de esta proteína con TEV proteasa en buffer 50 mM Tris, pH 8.0, con 20OmM NaCI, 0.04% azida sódica (80:1 ; w/w), rinde IP5_2K y LSL150 (Figura 14, calle 4) las cuales se resolvieron posteriormente mediante cromatografía de penetrabilidad en Superdex 75 (Figura 14, calles 5).

A modo de comparación, IP5_2K se ha producido como proteína de fusión con GST (GST-IP5_2K) y purificado siguiendo protocolos estándar para esta etiqueta afinidad/solubilidad (resultados no mostrados). Al igual que LSL-I P5_2K, GST-I P5_2K fue tratada con TEV proteasa, y posteriormente IP5_2K purificada mediante cromatografía de penetrabilidad en Superdex 75. Los rendimientos finales de ambas purificaciones llevadas a cabo en paralelo, en condiciones experimentales esencialmente idénticas, fueron: 23 mg de IP5 2K partiendo de 4 litros de cultivo con el sistema basado en LSL y de 3.2 mg con el basado en GST.

Claims

REIVINDICACIONES

1.- Proteína de fusión recombinante caracterizada porque comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de aminoácidos del péptido LSL₁₅₀ del hongo

Laetiporus sulphureus (SEQ ID NO2), y b) una secuencia análoga a Ia SEQ ID NO2 de a).

2.- Procedimiento de obtención de Ia proteína de fusión según reivindicación 1 caracterizado porque comprende las siguientes etapas: i) Obtención de una construcción génica que comprende Ia secuencia de nucleótidos de LSLi₅₀ (SEQ ID NO1 ) y Ia secuencia que codifica para Ia proteína o péptido de interés, y del vector de expresión que Io comprende, ii) Transformación de una célula huésped, preferentemente procariota, más preferentemente de Escherichia coli, en Ia que Ia construcción génica o el vector de expresión de i) bajo control de los promotores adecuados, permite Ia expresión de Ia proteína o péptido de fusión de interés, y purificación del extracto crudo de las células, iii) Inmovilización de Ia proteína o péptido de fusión en matrices derivadas de agarosa mediante el paso de extracto crudo de ii) a través de Ia matriz, iv) Disociación de Ia proteína o péptido de fusión de Ia matriz cromatográfica mediante lavado de Ia matriz con un medio conteniendo uno o varios azúcares competidores, y, opcionalmente v) Separación del péptido SEQ ID NO2 de Ia proteína de fusión mediante tratamiento proteolítico adecuado.

3.- Construcción genética codificante de Ia secuencia de ADN codificante de Ia proteína de fusión según reivindicación 1 caracterizada porque comprende, al menos, una secuencia del siguiente grupo: a) Ia secuencia de ADN SEQ ID NO1 , y b) una secuencia homologa a Ia SEQ ID NO1.

A - Construcción genética según reivindicación 3 caracterizada porque comprende cualquier otra secuencia de nucleótidos codificante de un péptido o secuencia peptídica que permita el aislamiento, Ia detección o Ia secreción al exterior de Ia célula del péptido expresado, por ejemplo, a título ilustrativo y sin que limite el alcance de Ia invención, una secuencia de polihistidina (6xHis), una secuencia peptídica reconocible por un anticuerpo monoclonal (por ejemplo, para su identificación, o cualquier otra que sirva para purificar Ia proteína de fusión resultante por cromatografía de inmunoafinidad: péptidos etiqueta tales como c-myc, HA, E-tag).

5.- Vector de expresión caracterizado porque comprende una construcción genética según reivindicaciones 3 y 4 que permite Ia expresión de una proteína o péptido.

6.- Vector de expresión según reivindicación 5 caracterizado porque el vector es un plásmido o un vector viral.

7.- Célula huésped caracterizada porque comprende Ia construcción genética según reivindicaciones 3 y 4 o el vector de expresión según reivindicaciones 5 y 6, preferentemente una célula procariota.

8.- Célula huésped según reivindicación 7 caracterizada porque está constituida por una célula E. coli., preferentemente células E. coli BL21 DE3.