ES2689245T3 - Agentes y procedimientos para la expresión y secreción de péptidos y proteínas - Google Patents

Agentes y procedimientos para la expresión y secreción de péptidos y proteínas Download PDF

Info

Publication number
ES2689245T3
ES2689245T3 ES12777908.0T ES12777908T ES2689245T3 ES 2689245 T3 ES2689245 T3 ES 2689245T3 ES 12777908 T ES12777908 T ES 12777908T ES 2689245 T3 ES2689245 T3 ES 2689245T3
Authority
ES
Spain
Prior art keywords
nucleic acid
protein
sequence
psu
hlya1
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12777908.0T
Other languages
English (en)
Inventor
Christian Schwarz
Lutz Schmitt
Sander Hendrikus Joannes Smits
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Numaferm GmbH
Original Assignee
Numaferm GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Numaferm GmbH filed Critical Numaferm GmbH
Application granted granted Critical
Publication of ES2689245T3 publication Critical patent/ES2689245T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/555Interferons [IFN]
    • C07K14/56IFN-alpha
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/036Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site

Abstract

Molécula de ácido nucleico aislada que comprende una primera y una segunda secuencia de ácido nucleico para la producción eficaz de un péptido recombinante o proteína de interés, en la que la primera secuencia de ácido nucleico comprende un fragmento de hemolisina C (HlyC) y (i) tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 1 o uno de sus fragmentos 3', en la que el fragmento comprende al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 5, o su complementaria, o ii) tiene una secuencia de nucleótidos que tiene al menos 70 % de identidad de secuencia con la secuencia de nucleótidos como se define en i); y la segunda secuencia de ácido nucleico codifica al menos un péptido o proteína de interés y está situada 3' de la primera secuencia de ácido nucleico, en la que la primera secuencia de ácido nucleico no es una secuencia que codifica HlyC de longitud completa y mejora la expresión de al menos uno péptido o proteína de interés y la molécula de ácido nucleico aislada no incluye una secuencia de nucleótidos que codifica HlyC de longitud completa, en la que los fragmentos de la secuencia que codifica HlyC no son expresados ya que no se transcriben y/o traducen en una secuencia de proteína.

Description

DESCRIPCIÓN
Agentes y procedimientos para la expresión y secreción de péptidos y proteínas Campo de la invención
La presente invención se basa en el campo de la biología molecular, expresión de péptidos y proteínas 5 recombinantes, y se refiere a secuencias de ácidos nucleicos que comprenden fragmentos del gen de hemolisina C y/o hemolisina A para mejorar la expresión y secreción de un péptido o proteína de interés.
Antecedentes de la invención
En los últimos años, la producción de proteínas/enzimas recombinantes para usar en procedimientos industriales se ha vuelto cada vez más importante y se espera que pronto muchos procedimientos industriales involucren 10 tecnologías recombinantes.
Sin embargo, la expresión de péptidos y proteínas recombinantes es todavía limitada, ya que se requieren grandes esfuerzos para obtener los péptidos y proteínas deseadas con un plegamiento natural, en altas cantidades y alta pureza.
En general, la purificación del producto es costosa y especialmente la etapa final al 100% de pureza tiende a 15 aumentar el coste de forma exponencial. En especial las proteínas presentan un problema particular en la recuperación aguas abajo porque son difíciles de separar unas de otras y son propensas a la degradación y desnaturalización (Hacking, AJ (1986) "Economic aspects of biotechnology", Cambridge University Press). En cierta medida, se han desarrollado enfoques de secreción de proteínas, en los que la proteína deseada se expresa en una célula hospedante y se exporta al espacio extracelular, con el fin de evitar la laboriosa purificación de proteínas a 20 partir del lisado bruto. Sin embargo, muchas rutas de secreción de proteínas implican la degradación proteolítica del polipéptido transportado, conduciendo a un producto peptídico o proteico al menos parcialmente fragmentado o a una secreción incompleta del péptido o proteína de interés, p. ej., debido a la detención de los polipéptidos en el periplasma. Por lo tanto, se están investigando actualmente los sistemas de secreción tipo 1 (T1SS), que se encuentran principalmente en bacterias Gram negativas, ya que exportan sus sustratos afines en una sola etapa 25 desde el citosol al medio extracelular sin la formación de sustratos intermedios periplásmicos, que a menudo experimentan al menos proteolisis periplasmática parcial. Entre la familia de los T1SS, la hemolisina (Hly) T1SS descrita por Bakkes y col. que implica HlyA como sustrato de transporte es de particular interés, ya que carece de cualquier actividad proteolítica (Bakkes y col. (2010), J. Biol. Chem.; 285 (52): 40573-80) y por lo tanto no degrada el péptido o proteína de interés secretado. La hemolisina (Hly) del T1SS de E. coli consiste en la proteína de 30 membrana interna HlyB, que es un transportador de casete de unión a ATP (ABC), la proteína de membrana externa TolC y la proteína de fusión de membrana HlyD en la membrana interna. El sustrato que interacciona con la HlyA se exporta a través del sistema de secreción de hemolisina de una manera dependiente de ATP.
Gentschev y col. (Gene 179 (7), páginas 133-140) describen el desarrollo de sistemas de administración de antígenos basados en la ruta de secreción de hemolisina de E. coli.
35 Aunque se han realizado grandes esfuerzos hasta ahora, el sistema de Hly T1S todavía no se usa industrialmente, ya que los rendimientos de péptidos y proteínas expresados y secretados son todavía demasiado bajos para su aplicación en cualquier procedimiento comercialmente relevante.
En particular, la producción recombinante de grandes cantidades de péptidos con altas purezas es todavía limitada, de modo que los procedimientos de producción actuales para péptidos todavía se basan mayoritariamente en la 40 síntesis química de alto coste.
Todavía son necesarios en la técnica procedimientos que permitan la producción eficaz de un péptido o proteína recombinante de interés.
Resumen de la invención
En un primer aspecto, la presente invención se refiere a una molécula de ácido nucleico aislada que comprende, 45 consiste esencialmente en, o consiste en una primera secuencia de ácido nucleico, en la que la primera secuencia de ácido nucleico comprende un fragmento de la secuencia de nucleótidos que codifica la hemolisina C (HlyC) (i) tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 1 o un fragmento 3' de la misma, en la que el fragmento comprende al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 5, o su complementaria, o (ii) tiene una secuencia de nucleótidos que tiene al menos 70 % de identidad de secuencia con la 50 secuencia de nucleótidos como se define en i), y la segunda secuencia de ácido nucleico codifica al menos un péptido o proteína de interés y está situada en 3' de la primera secuencia de ácido nucleico, en la que la primera secuencia de ácido nucleico no es una secuencia que codifica la HlyC de longitud completa y mejora la expresión del al menos un péptido o proteína de interés, y la molécula de ácido nucleico aislada no incluye una secuencia de nucleótidos que codifica la HlyC de longitud completa, en la que los fragmentos de la secuencia que codifica la HlyC
5
10
15
20
25
30
35
40
45
50
55
no se expresan ya que no se transcriben y/o traducen a una secuencia proteica.
La primera secuencia de ácido nucleico no es una secuencia que codifica la HlyC de longitud completa y la molécula de ácido nucleico aislada de la invención no incluye una secuencia de nucleótidos que codifica la HlyC de longitud completa, como se expone en la SEQ ID NO: 158 o una complementaria de la misma.
En la molécula de ácido nucleico aislada, la primera secuencia de ácido nucleico puede tener una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 2-27 y fragmentos 3' de la misma, en la que los fragmentos comprenden al menos la secuencia como se expone en la SEQ ID NO: 2, o sus complementarias. En diferentes realizaciones del primer aspecto, la molécula de ácido nucleico aislada comprende, consiste esencialmente en o consiste en una primera y una segunda secuencia de ácido nucleico, en la que la primera secuencia de ácido nucleico se define como antes; y la segunda secuencia de ácido nucleico codifica al menos un péptido o proteína de interés y está situada en 3' de la primera secuencia de ácido nucleico.
En realizaciones preferidas, la molécula de ácido nucleico aislada de la invención comprende además una tercera secuencia de ácido nucleico situada en 3' de la primera secuencia de ácido nucleico y 5' o 3' de la segunda secuencia de ácido nucleico o que flanquea la segunda secuencia de ácido nucleico en cuanto que la segunda secuencia de ácido nucleico se inserta en la tercera secuencia de ácido nucleico, en la que el tercer ácido nucleico está operativamente unido a la segunda secuencia de ácido nucleico y codifica la hemolisina A (HlyA) o un fragmento de la misma. En diferentes realizaciones, la tercera secuencia de ácido nucleico (i) tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 29 o un fragmento de la misma, en la que el fragmento comprende al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 30 o su complementaria, o (ii) tiene una secuencia de nucleótidos que tiene al menos 70 % de identidad de secuencia con la tercera secuencia de ácido nucleico como se define en i); o (iii) tiene una secuencia de nucleótidos que codifica un polipéptido que tiene al menos 91 % de homología de secuencia con el polipéptido codificado por la secuencia de nucleótidos como se define en (i).
En diferentes realizaciones, la tercera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 30-40, y sus fragmentos, en la que los fragmentos comprenden al menos la secuencia como se expone en la SEQ ID NO: 30, y sus complementarias.
La molécula de ácido nucleico aislada de la invención puede comprender así una combinación de la primera y tercera secuencias de ácidos nucleicos como se han definido antes. En diferentes realizaciones, la primera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 5-27 o sus complementarias y la tercera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 29-40.
En otras realizaciones más, la molécula de ácido nucleico aislada puede comprender además al menos una cuarta secuencia de ácido nucleico que codifica (i) un marcador de afinidad, en la que la secuencia de nucleótidos que codifica el marcador de afinidad está operativamente unida al extremo 5' o 3' de la segunda o tercera secuencia de ácido nucleico; y/o (ii) un sitio de escisión de proteasa, en la que la secuencia de nucleótidos que codifica el sitio de escisión de proteasa está operativamente unida a la segunda molécula de ácido nucleico y a la tercera molécula de ácido nucleico, de modo que está situada entre la segunda y tercera secuencia de ácido nucleico. En realizaciones, donde la segunda secuencia de ácido nucleico está insertada en la tercera secuencia de ácido nucleico, la secuencia que codifica el sitio de escisión de proteasa puede estar en cualquiera de los extremos del segundo ácido nucleico unida a una parte de la tercera secuencia de ácido nucleico o ambos extremos pueden comprender una secuencia que codifica un sitio de escisión de proteasa.
En diferentes realizaciones, la molécula de ácido nucleico aislada de la invención, comprende, consiste esencialmente en o consiste en una secuencia de ácido nucleico como se expone en cualquiera de las SEQ ID NO: 66, 71, 74, 79, 84, 89, 93, 98, 103, 110, 115, 120, 125, 130, 135, 140, 145, 220, 227, 234, 239, 244,
249, 254, 259, 264, 269, 274, 279, 284, 289, 294, 299, 304, 325, 327, 329 y 331.
En un aspecto adicional, la presente invención se refiere a un vector que comprende una molécula de ácido nucleico según la invención.
También están abarcadas por la presente invención las células hospedantes que comprenden una molécula de ácido nucleico o un vector según la invención.
Se describe además en la presente memoria un péptido o proteína recombinante codificada por una molécula de ácido nucleico según la invención. El péptido o proteína recombinante puede consistir en una secuencia de aminoácidos seleccionada del grupo que consiste en las SEQ ID NO: 46, 68, 73, 76, 81, 86, 91, 95, 100, 105, 113,
117, 122, 127, 132, 137, 142, 147-150, 222, 229, 236, 241, 246, 251, 256, 261, 266, 271, 276, 281, 286, 291, 296,
301, 306, 316 y 333-336.
En otro aspecto, la invención se dirige a un procedimiento para la expresión de un péptido o proteína recombinante, en la que el procedimiento comprende (a) introducir una molécula de ácido nucleico o un vector de la invención, en la que la molécula o vector de ácido nucleico codifica el péptido o proteína recombinante, en una célula hospedante
5
10
15
20
25
30
35
40
45
50
55
adecuada; y (b) cultivar la célula hospedante en un medio de cultivo en condiciones que permitan la expresión del péptido o proteína recombinante.
El procedimiento, en diferentes realizaciones, puede comprender además recuperar el péptido o proteína expresado de la célula hospedante y/o el medio de cultivo. En realizaciones preferidas de los procedimientos descritos en la presente memoria, el procedimiento comprende además la secreción del péptido o proteína recombinante expresado en el medio de cultivo, cultivando la célula hospedante en condiciones que permiten la secreción del péptido o proteína recombinante en el medio de cultivo. Para lograr esto, la célula hospedante puede comprender moléculas de ácido nucleico adicionales que codifican los componentes de un sistema de secreción.
En diferentes realizaciones de los procedimientos de la invención, (a) la célula hospedante es una célula procariota, por ejemplo, una célula de E. coli ; y/o (b) la célula hospedante expresa HlyB y HlyD, por ejemplo, de forma endógena o por introducción de secuencias de ácido nucleico exógenas; y/o (c) la expresión se lleva a cabo en un medio de cultivo mínimo; y/o (d) el medio de cultivo comprende Ca2+ 1-40 mM; y/o (e) el péptido o proteína recombinante expresado es el péptido o proteína recombinante según la invención; y/o (f) el péptido o proteína recombinante se purifica usando un procedimiento seleccionado de cromatografía de afinidad, cromatografía de intercambio iónico, cromatografía de fase inversa, cromatografía de exclusión por tamaño molecular y combinaciones de los mismos; y/o (g) el procedimiento comprende el tratamiento del péptido o proteína recombinante con una proteasa adecuada para la escisión de un sitio de escisión de proteasa dentro del péptido o proteína recombinante; y/o (h) el procedimiento comprende una etapa como se define en (g) seguido de purificación del péptido o proteína recombinante.
Se describe además en la presente memoria el uso de una molécula de ácido nucleico de la invención o un vector según la invención para la expresión de un péptido o proteína recombinante.
Se describe además en la presente memoria una molécula de ácido nucleico aislada que consiste esencialmente en o consiste en una primera secuencia de ácido nucleico que codifica un fragmento de hemolisina A y que tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 34 o su complementaria o una secuencia de nucleótidos que tiene al menos 70 % de identidad de secuencia con la secuencia de nucleótidos expuesta en la SEQ ID NO: 34 o su complementaria o una secuencia de nucleótidos que codifica el polipéptido con la secuencia de aminoácidos expuesta en la SEQ ID NO: 46. La molécula de ácido nucleico aislada no incluye la secuencia de nucleótidos que codifica la hemolisina A de longitud completa, por ejemplo, no incluye la secuencia de nucleótidos completa expuesta en la SEQ ID NO: 29.
La molécula de ácido nucleico aislada puede comprender una primera y una segunda secuencias de ácidos nucleicos, en la que la primera secuencia de ácido nucleico se define como antes, es decir, que tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 34 o su complementaria, y la secuencia del segundo ácido nucleico codifica al menos un péptido o proteína de interés y está operativamente unida al extremo 3' o 5' de la primera secuencia de ácido nucleico.
La molécula de ácido nucleico aislada puede comprender además al menos una tercera secuencia de ácido nucleico que codifica un marcador de afinidad y/o un sitio de escisión de proteasa, en la que la al menos una tercera secuencia de ácido nucleico está operativamente unida al extremo 5' y/o 3' de la primera molécula de ácido nucleico y/o la segunda molécula de ácido nucleico.
La molécula de ácido nucleico aislada puede tener la secuencia de nucleótidos tal como se expone en una cualquiera de las SEQ ID NO: 67, 72, 75, 80, 85, 90, 94, 99, 104, 111, 116, 121, 126, 131, 136, 141, 146, 221, 228, 235, 240, 245, 250, 255, 260, 265, 270, 275, 280, 285, 290, 295, 300, 305, 315, 326, 328, 330 y 332.
Las moléculas de ácido nucleico también pueden estar comprendidas en un vector, como se describe en relación con las moléculas de ácido nucleico del primer aspecto anterior. De forma similar, las células hospedantes que incluyen este vector o molécula de ácido nucleico también se describen en la presente memoria y también se pueden definir como se han dado antes.
Se describe además en la presente memoria el péptido o proteína recombinante codificado por una molécula de ácido nucleico según la descripción anterior. El péptido o proteína recombinante puede comprender o consistir en una secuencia de aminoácidos seleccionada del grupo que consiste en las SEQ ID NO: 46, 68, 73, 76, 81, 86, 91, 95, 100, 105, 113, 117, 122, 127, 132, 137, 142, 147-150, 222, 229, 236, 241, 246, 251, 256, 261, 266, 271, 276, 281, 286, 291, 296, 301, 306, 316 y 333 -336.
Se describe además en la presente memoria un procedimiento para la expresión de un péptido o proteína recombinante, en el que el procedimiento comprende (a) introducir una molécula de ácido nucleico o un vector según la descripción, en la que la molécula o vector de ácido nucleico codifica el péptido o proteína recombinante, en una célula hospedante adecuada; y (b) cultivar la célula hospedante en un medio de cultivo en condiciones que permitan la expresión del péptido o proteína recombinante y la secreción del péptido o proteína recombinante en el medio de cultivo. El procedimiento puede comprender además recuperar el péptido o proteína expresado de la célula hospedante y/o el medio de cultivo. Como ya se ha detallado antes, en estos procedimientos, la célula hospedante puede ser una célula procariota; y/o la célula hospedante puede expresar la HlyB y HlyD; y/o la
5
10
15
20
25
30
35
40
45
50
55
expresión se puede llevar a cabo en un medio de cultivo mínimo; y/o el medio de cultivo puede comprender Ca2+1- 40 mM; y/o el péptido o proteína recombinante expresado puede ser el péptido o proteína recombinante según la invención; y/o el péptido o proteína recombinante se puede purificar usando un procedimiento seleccionado de cromatografía de afinidad, cromatografía de intercambio iónico, cromatografía de fase inversa, cromatografía de exclusión por tamaño molecular y combinaciones de los mismos; y/o el procedimiento puede comprender el tratamiento del péptido o proteína recombinante con una proteasa adecuada para la escisión de un sitio de escisión de proteasa dentro del péptido o proteína recombinante; y/o el procedimiento puede comprender una etapa como se define en (g) seguido de purificación del péptido o proteína recombinante.
También se describe en la presente memoria el uso de una molécula de ácido nucleico o vector según la descripción anterior para la expresión de un péptido o proteína recombinante.
Se entiende que todas las combinaciones de las realizaciones desveladas antes también está previsto que estén dentro del alcance de la presente invención.
Breve descripción de los dibujos
La figura 1 muestra la organización natural de los genes en el operón de hemolisina.
La figura 2 muestra un gel de SDS-PAGE teñido con Coomassie, en el que las bandas se han cargado con líquido sobrenadante de cultivo celular de E. coli que coexpresa HlyB, HlyD y HlyA de longitud completa (banda 1), un fragmento C-terminal de HlyA que incluye 7 repeticiones GG (banda 2), un fragmento C-terminal de HlyA que incluye 4 repeticiones GG (banda 3), un fragmento C-terminal de HlyA que incluye 3 repeticiones GG (= HlyA1, banda 4), un fragmento C-terminal de HlyA que incluye 2 repeticiones GG (banda 5), un fragmento C-terminal de HlyA que incluye 1 repetición GG (banda 6), un fragmento C-terminal de HlyA que incluye una repetición GG no conservada (banda 7), o un fragmento C-terminal de HlyA sin ninguna repetición GG (banda 8) y un marcador de peso molecular (entre las bandas 5 y 6).
La figura 3 muestra la arquitectura de la secuencia de nucleótidos de ejemplo de una secuencia de ácido nucleico para usar en la expresión de la proteína de fusión HlyA1. Un fragmento 3" de hemolisina C, de 148 NT de longitud, está fusionado a través del extremo 3" con el gap (hueco) de 11 NT de longitud y un fragmento terminal 3" de 657 NT de longitud de la secuencia de nucleótidos que codifica la HlyA (= HlyA1) de longitud completa. Una molécula de ácido nucleico que tiene esta arquitectura es la molécula de ácido nucleico que consiste en la secuencia de nucleótidos como se expone en la SEQ ID NO: 154.
La figura 4 muestra geles de SDS-PAGE teñidos con Coomassie, en la que el gel superior (Figura 4A) se ha cargado con muestras del líquido sobrenadante de cultivo de BL21 DE3 de E. coli y el gel inferior (Figura 4B) con las células correspondientes. Las bandas se han cargado con muestras procedentes de células que coexpresaban HlyB, HlyD y 1) HlyAc (vector pSOI-HlyAc de Bakkes y col. (2010) J. Biol. Chem.; 285 (52): 40573- 80), 2) HlyA1 (SEQ ID NO: 46, un fragmento C-terminal de HlyA de longitud completa que consiste en 7 repeticiones gG y la secuencia de secreción completa, pBAD), 3) y 4) HlyA1 (en la que el vector pBAD comprende una secuencia de nucleótidos como se muestra en la figura 3, en concreto, un fragmento terminal 3" de HlyC, la secuencia de gap, y un fragmento de HlyA como se expone en la SEQ VID NO: 154), 5) HlyA1 (la misma construcción de nucleótidos que en 3) y 4) pero dentro del vector pSU . El vector completo tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 63. 6) y 7) HlyA1 (el vector usado en 5) que carece del fragmento de HlyC y la secuencia de gap, es decir, que carece de la secuencia expuesta en la SEQ ID NO: 12), 8) y 9) HlyA1 (el vector usado en 5) que carece del fragmento de HlyC pero que incluye la secuencia de gap, es decir, que incluye la SEQ ID NO: 2 en lugar de SEQ ID NO: 12, y 10) HlyAc (la variante de HlyA de 1) clonado en el vector pSU que comprende el fragmento de HlyC y la secuencia de gap como se expone en la SEQ ID NO: 12.
La figura 5 muestra dos geles de SDS-PAGE, en la que el gel de la izquierda se ha cargado con cantidades variables de BSA como una referencia interna para la estimación de la cantidad de HlyA1 secretada (SEQ ID NO: 46) cargada en el gel de la derecha. En el gel de la derecha, se han cargado 16 pl/banda de líquido sobrenadante de cultivo celular. El líquido sobrenadante se obtuvo de cultivos de 5 horas después de inducir la secreción. Se obtuvieron entre 625-930 mg de HlyA1/litro de medio.
La figura 6 muestra un gel de SDS-PAGE sobre el que se cargaron líquidos sobrenadantes de cultivo celular 16 pl/banda (bandas 2-5 y 7-10), marcador de peso molecular (banda 6) y lisado de células enteras (bandas 11-14). Las células se han transformado para la expresión y secreción de HlyA1 (SEQ ID NO: 46) y se cultivaron en medio mínimo. La secreción se indujo a una DO600 de 0,6 y las células se cultivaron adicionalmente durante 5 horas, hasta una DO600 de 1,4.
La figura 7 muestra dos geles de SDS-PAGE sobre los que se cargaron líquidos sobrenadantes de cultivo celular 16 pl/banda. Los líquidos sobrenadantes cargados en el gel de la figura 7A se obtienen de cultivos de E. coli que expresan Mab40-HlyA1 (SEQ ID NO: 73) en condiciones que varían, mientras que los líquidos sobrenadantes cargados en el gel de la figura 7B se obtienen de cultivos de E. coli que expresan Mab42-HlyA1 (SEQ ID NO: 76).
La figura 8 muestra un gel de SDS-PAGE sobre el que se cargaron células enteras que expresan interferón alfa 2
5
10
15
20
25
30
35
40
45
50
(bandas a la izquierda del marcador de peso molecular) o líquidos sobrenadantes de cultivo celular 16 pl/banda del cultivo de estas células. La banda marcada con «-» corresponde a interferón alfa 2-HlyA1 sin un sitio de escisión proteolítica entre el interferón alfa-2 y HlyA1, mientras que la banda marcada con «+» corresponde al interferón alfa 2-HlyA1 con un sitio de escisión del factor Xa entre el interferón alfa-2 y la HlyA1 (SEQ ID NO: 127).
La figura 9 muestra un gel SDS-PAGE sobre el que se han cargado células enteras que expresan diferentes proteínas/péptidos que se van a secretar o las correspondientes proteínas secretadas/proteínas, en concreto, calcitonina de salmón, calcitonina humana, factor liberador de corticotropina humana y Fuzeon/T20 (SEQ ID NO: 100, 95, 105 y 91). Para cada factor liberador de corticotropina humana y Fuzeon/T20, se cargaron en el gel muestras de dos cultivos de expresión cultivados en diferentes condiciones (cuatro bandas a la derecha).
La figura 10 muestra un gel de SDS-PAGE sobre el que se han cargado diferentes proteínas secretadas, en concreto HlyA1, HlyA de longitud completa, y IFABP (G80V)-, interferón alfa-2 y proteínas de fusión factor liberador de corticotropina humana-HlyA1 (SEQ ID NO: 46, 41, 148, 127 y 105, respectivamente).
La figura 11 muestra un gel de SDS-PAGE sobre el que se han cargado el marcador de peso molecular y el interferón alfa-2-HlyA1 secretado y purificado (SEQ ID NO: 127). La muestra de interferón alfa-2-HlyA1 cargada en la banda marcada con «+DTT» se ha tratado con DTT 50 mM antes de la carga en el gel, mientras que la muestra cargada en la banda «- DTT» no se ha sometido a dicho tratamiento.
La figura 12 muestra los resultados de un ensayo biológico para cuantificar la actividad biológica del interferón alfa 2 humano recombinante usando una línea celular de epitelio pigmentario de la retina humana (RPE) clonal, que alberga de manera estable un promotor/potenciador del elementos de respuesta estimulados por interferón (ISRE) frente a un gen indicador de luciferasa de luciérnaga. El rec-IFNa2 (PBL) disponible en el mercado sirvió como control positivo y como una referencia para la evaluación de la actividad biológica. Los diagramas muestran que para todas las diluciones ensayadas, el interferón alfa-2 escindido producido por el procedimiento de la presente invención presenta la actividad biológica más fuerte. Sorprendentemente, el interferón alfa-2-HlyA1 no escindido con
0 sin DTT adicional presentaba actividades más altas en comparación con el interferón alfa-2 disponible en el mercado (PBL).
La figura 13 muestra (A) una representación esquemática de los derivados de pSU-HlyA1 con alargamientos 5' truncados de hlyC y regiones de gap, (B) representación esquemática de construcciones de secreción con longitud variable del alargamiento 5' frente al gen HlyA.
La figura 14 muestra (A) un análisis de secreción de pSJ37 HlyB/D y pSU-HlyA1 con truncamientos 5'; lisados celulares; (B) análisis de secreción de pSJ37 HlyB/D y pSU-HlyA1 con truncamientos 5'; muestras de líquido sobrenadante.
La figura 15 muestra un análisis de secreción con plásmidos pSU-HlyA-full con alargamientos truncados 5'. (A) lisados celulares; (B) líquidos sobrenadantes celulares.
La figura 16 muestra una representación esquemática de los derivados de pSU-HlyA1 con regiones 5' alargadas de hlyC y la región de gap.
La figura 17 muestra un análisis de secreción de HlyA1 con derivados de pSU-HlyA1. (A) El alargamiento 5' delante de hlyA1 que consiste en el gap y partes de hlyC se truncó por etapas y se analizaron los niveles de secreción de HlyA1; (B) En comparación con A, el alargamiento 5' delante hlyA1 se alargó por etapas por las partes ausentes de hlyC y se analizaron los niveles de secreción. Se muestran geles SDS-PAGe teñidos con CBB de muestras de líquidos sobrenadantes del cultivo celular después de los experimentos de secreción. (C) y (D) muestran los correspondientes geles de SDS-PAGE teñidos con CBB de las muestras de lisado celular después de los experimentos de secreción.
La figura 18 muestra el análisis de SDS-PAGE de diferentes experimentos de secreción con las proteínas indicadas. Se muestran muestras de lisado celular y líquido sobrenadante después de los experimentos de secreción. * indica la posición de las proteínas secretadas.
La figura 19 muestra la escisión proteolítica de la señal de secreción del IFN2a secretado. A: el IFN2aXaHis-HlyA1 secretado se purificó por IMAC del líquido sobrenadante del cultivo. Se incubaron 50 pg de IFN2aXaHis-HlyA1 con
1 pl de Factor Xa (nEb) y se tomaron muestras en los tiempos de medición indicados y se analizaron por SDS- pAgE con posterior tinción con CBB. B: HisTEV_IFN2a-HlyA1 se trató como se describe en A.
La figura 20 muestra un análisis de secreción de pSU-GG_IFN2a en comparación con pSU-IFN2a.
La figura 21 muestra un análisis de secreción de los plásmidos pSU-IFNA1, 8, 16 y 21, como se indica. Se muestran geles de SDS-PAGE teñidos con CBB de muestras de lisado celular (izquierda) y líquido sobrenadante (derecha) después de los experimentos de secreción. También se muestran las referencias de peso molecular.
La figura 22 muestra el análisis de transferencia Western de muestras de líquido sobrenadante después del análisis
5
10
15
20
25
30
35
40
45
50
55
de secreción con pSJ37 en combinación de los plásmidos pSU-IFNA1, pSU-IFNA8, pSU-IFNA16 y pSU-IFNA21. Descripción detallada de la invención
Los términos usados en la presente memoria, salvo que se indique explícitamente lo contrario, tienen los siguientes significados.
«Al menos uno», como se usa en la presente memoria, se refiere a uno o más, en particular 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más. «Aislado» como se usa en la presente memoria en relación con una molécula significa que dicha molécula se ha separado al menos parcialmente de otras moléculas u otros componentes celulares con las que se asocia de forma natural. «Aislado» puede significar que la molécula se ha purificado para separarla de otras moléculas y componentes, tal como otras proteínas y ácidos nucleicos y residuos celulares.
«Ácido nucleico» como se usa en la presente memoria incluye todas las formas naturales de ácidos nucleicos, tales como ADN y ARN. Preferentemente, las moléculas de ácido nucleico de la invención son ADN.
El término «fragmento 3'», como se usa en la presente memoria en relación con una molécula de ácido nucleico, se refiere a una secuencia de ácido nucleico que, comparada con su secuencia de ácido nucleico de referencia, es más corta en cuanto que carece de uno o más nucleótidos 5' terminales. Un fragmento 3' de SEQ ID NO: 1, como se describe en la presente memoria, comprende al menos los nucleótidos 3' de la secuencia expuesta en la SEQ ID NO: 5.
El término «fragmento 5'», como se usa en la presente memoria en conexión con una molécula de ácido nucleico, se refiere a una secuencia de ácido nucleico que, comparada con su secuencia de ácido nucleico de referencia, está acortada en uno o más nucleótidos 3' terminales. El acortamiento se produce empezando desde el extremo 3', de modo que queda una cadena contigua de nucleótidos que empieza en el extremo 5'. El fragmento tiene preferentemente una longitud de al menos 20, más preferentemente al menos 50 nucleótidos.
El término «péptido» se usa a lo largo de la memoria descriptiva para designar un polímero de restos de aminoácidos conectados entre sí mediante enlaces peptídicos. Un péptido según la presente invención tiene 2-100 restos de aminoácidos.
Los términos «proteína» y «polipéptido» se usan indistintamente a lo largo de la memoria descriptiva para designar un polímero de restos de aminoácidos conectados entre sí mediante enlaces peptídicos. Una proteína o polipéptido según la presente invención tiene preferentemente 100 o más restos de aminoácidos.
La expresión «un fragmento N-terminal» se refiere a una secuencia de péptido o proteína que en comparación con una secuencia de péptido o proteína de referencia está truncada de forma C-terminal, de modo que queda un polímero de aminoácidos contiguos que empieza en el extremo N-terminal del péptido o proteína. En algunas realizaciones, dichos fragmentos pueden tener una longitud de al menos 10 aminoácidos.
La expresión «un fragmento C-terminal» se refiere a una secuencia de péptido o proteína que, en comparación con una secuencia de péptido o proteína de referencia, está truncada de forma N-terminal, de modo que queda un polímero de aminoácidos contiguos que empieza en el extremo C del péptido o proteína. En algunas realizaciones, dichos fragmentos pueden tener una longitud de al menos 10 aminoácidos.
La expresión «proteína de fusión» como se usa en la presente memoria, se refiere a péptidos y proteínas que están conectados entre sí de forma N o C-terminal. Dichas proteínas de fusión pueden ser codificadas por secuencias de ácido nucleico que están operativamente fusionadas entre sí. En algunas realizaciones, una proteína de fusión se refiere a al menos un péptido o proteína de interés fusionado de forma C-terminal con una cadena de polipéptido según la invención, por ejemplo, una cadena de polipéptido que comprende HlyA o uno de sus fragmentos o uno de sus homólogos.
En general, el experto en la técnica entiende que para poner en práctica la presente invención, cualquier secuencia de nucleótidos descrita en la presente memoria puede o debe comprender un codón de inicio y/o de parada adicional o que un codón de inicio y/o de parada de cualquiera de las secuencias descritas en la presente memoria puede o debe ser eliminado dependiendo de la construcción de ácido nucleico usada. El experto en la técnica basará esta decisión, p. ej., en si una secuencia de ácido nucleico comprendida en la molécula de ácido nucleico de la presente invención se va a traducir y/o se va a traducir como una proteína de fusión.
El sistema de secreción de hemolisina (Hly) es un sistema de secreción de proteínas que se produce principalmente en bacterias Gram negativas. Este sistema de secreción pertenece a la familia de sistemas de secreción de tipo I que transportan sus sustratos de una forma dirigida por ATP en una sola etapa desde el citosol hasta el espacio extracelular sin una estación intermedia en el periplasma. El sistema de secreción de Hly comprende hemolisina B (HlyB) que representa un transportador del casete de unión a ATP (ABC), la proteína de fusión de membrana hemolisina D (HlyD) y la proteína de membrana exterior universal TolC. La toxina hemolítica de ~110kDA hemolisina A (HlyA) es un sustrato de transporte del sistema de secreción de Hly. A nivel genético, los componentes necesarios para la secreción específica de hemolisina A están organizados en una estructura de operón (véase la
5
10
15
20
25
30
35
40
45
50
55
60
figura 1). La secuencia de ácido nucleico que codifica la hemolisina C (HlyC) también forma parte de este operón, pero no es necesaria para la secreción de HlyA a través del sistema de secreción de Hly. La HlyC cataliza la acilación de la HlyA que produce HlyA hemolítica. La HlyA es una proteína que consta de 1024 restos de aminoácidos y para su exportación a través del sistema de secreción de Hly requiere su extremo C, que comprende aproximadamente 40-60 aminoácidos. Además, la HlyA se caracteriza por que comprende de forma N-terminal a los 50 aminoácidos C-terminales un dominio que comprende varias repeticiones ricas en glicina (GG) (GGXGXDXXX, en las que X puede ser cualquier aminoácido). Las repeticiones ricas en glicina son la característica de la familia de toxinas con repeticiones en toxina (RTX, por sus siglas en inglés repeats in toxin). Las repeticiones ricas en glicina se unen al Ca2+ lo que induce su plegamiento. Por lo tanto, en ausencia de Ca2+, el dominio que comprende las repeticiones ricas en glicina no está estructurado. La secuencia de aminoácidos de una proteína HlyA se expone en la SEQ ID NO: 41, codificada por la secuencia de nucleótidos expuesta en la SEQ ID NO: 29). Una secuencia de nucleótidos ilustrativa que codifica la HlyC se expone en la SEQ ID NO: 158.
La presente invención se basa en el descubrimiento sorprendente de los autores de la invención de que la presencia de la secuencia de ácido nucleico que consiste en la secuencia de ácido nucleico que codifica un fragmento de HlyC del operón de hemolisina y la secuencia de gap situada entre las secuencias que codifican la HlyC y HlyA en el operón de hemolisina (véase la figura 1), en la que la secuencia de ácido nucleico tiene la secuencia como se expone en la SEQ ID NO: 1 o un fragmento 3' terminal de la misma, en la que dicho fragmento comprende la SEQ ID NO: 5, o su complementario o un homólogo de la misma, 5' a una secuencia de ácido nucleico que codifica un péptido o proteína de interés, puede mejorar la expresión y los rendimientos de secreción de dicho péptido o proteína de interés.
Por lo tanto, en un primer aspecto, la presente invención se refiere a una molécula de ácido nucleico aislada según las reivindicaciones adjuntas, que comprende, consiste esencialmente en o consiste en una primera secuencia de ácido nucleico, en la que la primera secuencia de ácido nucleico comprende la secuencia de nucleótidos como se expone en la SEQ ID NO: 1 o un fragmento 3' de la misma, en la que el fragmento comprende al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 5, o su complementaria. El ácido nucleico aislado según el primer aspecto puede aumentar la expresión y secreción de otros péptidos o proteínas si se sitúa en la dirección 5', es decir en 5' de la secuencia que codifica dichos péptidos o proteínas. Dicha primera secuencia de ácido nucleico comprende un fragmento de la secuencia de nucleótidos que codifica la hemolisina C (HlyC). La expresión «fragmento de la secuencia de nucleótidos que codifica la hemolisina C» como se usa en la presente memoria, significa que la molécula de ácido nucleico aislada no comprende una secuencia de longitud completa que codifique la hemolisina C, sino solo sus fragmentos 3'. En particular las moléculas de ácido nucleico aisladas de la invención no incluyen una secuencia de longitud completa que codifique la HlyC, como se expone por ejemplo en la SEQ ID NO: 158 o su complementaria. Los fragmentos de la secuencia que codifica la HlyC no se expresan en cuanto que no son transcritos y/o traducidos en una secuencia de proteína, sino que solo ejercen sus efectos a nivel del ácido nucleico. El fragmento mínimo comprendido por las moléculas de ácido nucleico de la invención es la secuencia de nucleótidos de SEQ ID NO: 5 que incluye la secuencia de gap entre los genes que codifican la HlyC y HlyA. Por lo tanto, las moléculas de ácido nucleico de la invención pueden incluir fragmentos del gen de HlyC con la condición de que está excluido el gen de HlyC de longitud completa.
En diferentes realizaciones, este aspecto de la invención también incluye homólogos de la secuencia mencionada antes. El término «homólogos» u «homólogo» como se usa en la presente memoria se refiere a una secuencia de polinucleótido o polipéptido que tiene una secuencia muy similar o una alta identidad de secuencia (p. ej., 70%, 80 %, 90 %, 95 %, 97,5 %, 99 % o más) con otra secuencia de polinucleótido o polipéptido o parte de la misma. Con respecto a la molécula de ácido nucleico aislada de la invención, el término homólogo incluye por lo tanto secuencias de ácido nucleico que tienen al menos 70, preferentemente 80, más preferentemente 90, incluso más preferentemente 95, 97,5 o 99 % de identidad de secuencia con la secuencia de nucleótidos de la primera secuencia de ácido nucleico como se ha definido antes. La identidad de secuencia puede ocurrir a lo largo de un tramo continuo de nucleótidos o puede ser discontinua.
La expresión «identidad de secuencia», como se usa en la presente memoria, significa que el resto en una posición dada es idéntico al de una posición correspondiente de un ácido nucleico de referencia.
El término «complementaria», como se usa en la presente memoria, se refiere a secuencias de nucleótidos que pueden hibridar con una secuencia de referencia formando emparejamiento de bases de Watson-Crick. Esto incluye «complementarias completas» en las que cada nucleótido de una secuencia dada tiene emparejamiento de base de Watson-Crick con un nucleótido correspondiente en la secuencia de referencia, o cada nucleótido de una secuencia de referencia tiene emparejamiento de base con un nucleótido en una secuencia dada.
En diferentes realizaciones del primer aspecto de la invención, en la molécula de ácido nucleico aislada la primera secuencia de ácido nucleico puede tener una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 5-27 y sus fragmentos 3', en la que los fragmentos comprenden al menos la secuencia como se expone en la SEQ ID NO: 5, o sus complementarias. En realizaciones preferidas, la primera secuencia de ácido nucleico comprende o consiste en las secuencias de nucleótidos expuestas en una cualquiera de las SEQ ID NO: 1, 5-27, más preferentemente las SEQ ID NO: 8-16.
5
10
15
20
25
30
35
40
45
50
55
En otras realizaciones más, los fragmentos 3' de las secuencias de nucleótidos expuestas en una cualquiera de las SEQ ID NO: 1 y 6-27 comprenden al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 5. En otras realizaciones más, los fragmentos 3' de las secuencias de nucleótidos expuestas en una cualquiera de las SEQ ID NO: 1 y 7-26 comprenden al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 6. En otra realización, los fragmentos 3' de las secuencias de nucleótidos expuestas en una cualquiera de las SEQ ID NO: 1 y 8-26 comprenden al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 7.
En un aspecto alternativo, los fragmentos 3' de la SEQ ID NO: 1 como se ha descrito antes comprenden al menos la secuencia de nucleótidos expuesta en la SEQ ID NO: 28. En una realización específica, el fragmento 3' puede consistir en la secuencia de nucleótidos como se expone en la SEQ ID NO: 28.
La molécula de ácido nucleico aislada de la invención, además del primer ácido nucleico como se ha definido antes, comprende una segunda secuencia de ácido nucleico, en la que dicha segunda secuencia de ácido nucleico codifica al menos un péptido o polipéptido de interés. La segunda secuencia de ácido nucleico está situada 3' respecto a la primera secuencia de ácido nucleico. Ambas secuencias, es decir, la primera y la segunda secuencias de ácidos nucleicos pueden estar operativamente unidas. En diferentes realizaciones, la segunda secuencia de ácido nucleico codifica al menos 2, 3, 4, 5 o más péptidos o proteínas de interés. Estos se pueden expresar como una fusión o por separado. Según este aspecto, la segunda molécula de ácido nucleico puede comprender, por lo tanto, más de un gen que codifica un polipéptido de interés. En una realización específica, la segunda molécula de ácido nucleico puede, por ejemplo, codificar una proteasa y otro polipéptido o péptido, donde la proteasa, si se expresa, cataliza la escisión del otro polipéptido o proteína fuera de la construcción de fusión, o el procesamiento del otro polipéptido o proteína.
La secuencia como se expone en la SEQ ID NO: 1 o uno de sus fragmentos 3' terminales, o su complementaria o un homólogo de la misma está operativamente unida a la secuencia que codifica el péptido o proteína de interés en cuanto que puede influir en su expresión, pero no es traducida. La secuencia como se expone en la SEQ ID NO: 1 o uno de sus fragmentos 3' terminales, o su complementaria o un homólogo de la misma no se traduce o no se traduce en una sola cadena polipeptídica junto con el péptido y proteína de interés. Por lo tanto, la secuencia como se expone en la SEQ ID NO: 1 o uno de sus fragmentos 3' terminales, o su complementaria o un homólogo de la misma no se traduce y la composición de proteínas resultante del hospedante que comprende la molécula de ácido nucleico contendrá el péptido o proteína de interés sin una pareja de fusión.
La expresión «operativamente unido» en el contexto de secuencias de ácido nucleico significa que una primera secuencia de ácido nucleico está unida a una segunda secuencia de ácido nucleico de modo que la primera secuencia de ácido nucleico se sitúa en una relación funcional con la segunda secuencia de ácido nucleico. Por ejemplo, una secuencia promotora está operativamente unida a una secuencia codificante de un gen heterólogo si el promotor puede iniciar la transcripción de la secuencia codificante. En un contexto adicional, una secuencia que codifica el primer péptido o proteína, p. ej., un marcador de afinidad y/o un sitio de escisión de proteasa, está unida a una segunda secuencia que codifica un péptido o proteína, p. ej., un péptido o proteína de interés, de modo que si las dos secuencias se traducen, se obtiene una única cadena de péptido/proteína.
En una realización, la primera y la segunda secuencias de ácidos nucleicos están directamente unidas entre sí en cuanto que el nucleótido 3' terminal de la primera secuencia de ácido nucleico está acoplado con el nucleótido 5' terminal del segundo ácido nucleico. En otras realizaciones, hay una secuencia de nucleótidos conectora presente entre la primera y la segunda secuencia de ácido nucleico.
El término «gap (hueco)» como se usa en la presente memoria, se refiere a la secuencia que hay en el operón de hemolisina entre el casete de HlyC y HlyA como se ilustra en Figura 1. La secuencia de nucleótidos del gap se expone en la SEQ ID NO: 5.
La primera secuencia de ácido nucleico puede incluir nucleótidos no naturales o PNA como sustitución de los respectivos nucleótidos naturales. La expresión «nucleótidos no naturales» se refiere a nucleótidos distintos de los que comprenden 5"-fosfo-ribosa o 5"-fosfo-desoxirribosa y adenina, guanina, citosina, timina o uracilo. Por lo tanto, un nucleótido no natural puede comprender una o más modificaciones del resto de azúcar y/o el resto de base. Además, la cadena principal de fosfodiéster de ADN y ARN puede ser reemplazada por una cadena principal diferente, tal como una cadena principal peptídica.
La presente invención se basa además en el descubrimiento de los autores de la invención de que el uso de la secuencia detallada del fragmento HlyC + gap de SEQ ID NO: 1 es particularmente eficaz para una expresión mejorada de la segunda secuencia de ácido nucleico que codifica el péptido o proteína de interés si la molécula de ácido nucleico comprende además una tercera secuencia de ácido nucleico que codifica la HlyA o uno de sus fragmentos 3". Por lo tanto, en realizaciones adicionales, la molécula de ácido nucleico comprende además una tercera secuencia de ácido nucleico, estando la tercera secuencia de ácido nucleico 3" o 5" de la al menos una segunda secuencia de ácido nucleico que codifica un péptido o proteína de interés. En otra realización, la tercera secuencia de ácido nucleico flanquea la segunda secuencia de ácido nucleico en cuanto que la segunda secuencia de ácido nucleico está insertada en la tercera secuencia de ácido nucleico. «Insertado», como se usa en este contexto, significa que una parte 5" terminal de la tercera secuencia de ácido nucleico se sitúa en 5" respecto a la
5
10
15
20
25
30
35
40
45
50
55
segunda secuencia de ácido nucleico, mientras que una parte 3" terminal se sitúa en 3" respecto a la segunda secuencia de ácido nucleico. Si está insertada en la tercera secuencia de ácido nucleico, la segunda secuencia de ácido nucleico preferentemente está puesta de manera que no destruya las regiones o dominios funcionales del polipéptido codificado por la tercera secuencia de ácido nucleico, es decir, HlyA.
La tercera secuencia de ácido nucleico puede estar operativamente unida a la segunda secuencia de ácido nucleico y codifica la hemolisina A (HlyA) o uno de sus fragmentos. En realizaciones preferidas, están operativamente unidas de modo que se son expresadas como una única cadena polipeptídica, es decir, una proteína de fusión del péptido o proteína de interés y la HlyA o uno de sus fragmentos. El marcador de HlyA puede facilitar la secreción del péptido o polipéptido de interés.
En diferentes realizaciones, la tercera secuencia de ácido nucleico tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 29 o uno de sus fragmentos, en la que el fragmento comprende al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 30 o su complementaria. También están cubiertos homólogos de estas secuencias, en particular secuencias de ácidos nucleicos que tienen una secuencia de nucleótidos que tiene al menos 70 %, 80 %, 90 %, 95 %, 97,5 %, 99 o 99,5 % de identidad de secuencia con la tercera secuencia de ácido nucleico como se ha definido antes. En realizaciones adicionales, dichos homólogos se definen por tener una secuencia de nucleótidos que codifica un polipéptido que tiene al menos 91 %, preferentemente al menos 95 %, más preferentemente al menos 97 % de homología o identidad de secuencia con el polipéptido codificado por la secuencia nucleótidos como se ha definido antes. En diferentes realizaciones, la secuencia de polipéptido codificada puede ser idéntica. Dicha secuencia homóloga puede ser, por ejemplo, una versión de codones optimizados de la secuencia de referencia.
«Codones optimizados» significa que los codones que codifican un resto de aminoácido se sustituyen por un codón diferente que codifica el mismo aminoácido, pero que es usado con más frecuencia por un organismo hospedante dado para este aminoácido particular. Se entiende que dichas secuencias de nucleótidos que codifican un polipéptido homólogo pueden tener una alta variabilidad de secuencia de modo que la identidad de secuencia entre moléculas de ácido nucleico que codifican los mismos polipéptidos u homólogos puede ser baja.
En diferentes realizaciones, la tercera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 30-40, y sus fragmentos, en la que los fragmentos comprenden al menos la secuencia como se expone en la SEQ ID NO: 30, y sus complementarias. Preferentemente, la tercera secuencia de ácido nucleico tiene la secuencia de nucleótidos expuesta en la SEQ ID NO: 34 o una secuencia de nucleótidos que codifica la secuencia de aminoácidos expuesta en la SEQ ID NO: 46.
La molécula de ácido nucleico aislada de la invención puede comprender una combinación de la primera y tercera secuencias de ácidos nucleicos como se han definido antes. En diferentes realizaciones, la primera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 1 y 5-27 o sus complementarias, y la tercera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 29-40. Las combinaciones preferidas son las secuencias de nucleótidos expuestas en las SEQ ID NO: 8-16 y la secuencia de nucleótidos de SEQ ID NO: 34.
En diferentes realizaciones, la arquitectura de la molécula de ácido nucleico es (en la orientación de 5' a 3'): A-B, A- C, A-B-C o A-C-B, en la que A es la primera, B es la segunda y C es la tercera secuencia de ácido nucleico como se ha definido antes. También se contemplan construcciones de ácido nucleico en las que falta la segunda secuencia de ácido nucleico y la construcción solo comprende la primera y la tercera secuencia de ácido nucleico, por ejemplo, en la forma A-C. La segunda secuencia de ácido nucleico B puede codificar más de un polipéptido o péptido y puede tener la forma D-E-F-G-H-..., donde cada uno de D, E, F, G y h puede estar presente o ausente y representa una secuencia que codifica un polipéptido o péptido diferente.
En diferentes realizaciones, la molécula de ácido nucleico se construye de manera que la proteína codificada por la tercera secuencia de ácido nucleico no se traduce o se traduce por separado del péptido o proteína codificado por la segunda secuencia de ácido nucleico.
En algunas realizaciones, los péptidos o proteínas codificados por la segunda y la tercera secuencias de ácidos nucleicos se cotraducen, conduciendo a una única cadena polipeptídica, es decir, una proteína de fusión.
Los autores de la invención han encontrado además, que las proteínas de fusión resultantes que comprenden la proteína codificada por la tercera secuencia de ácido nucleico, p. ej., la HlyA o sus fragmentos C-terminales, fusionadas con el extremo C del péptido o proteína de interés, son secretadas de forma más eficaz al espacio extracelular en comparación con otros sistemas de secreción. Por lo tanto, la combinación de la primera y la tercera secuencias de ácidos nucleicos con la segunda secuencia de ácido nucleico que codifica el péptido o proteína de interés permite una expresión y secreción mejoradas del péptido o proteína de interés deseado. Este procedimiento es particularmente adecuado en organismos que comprenden un sistema de secreción de tipo 1 (T1SS), en particular células hospedantes que expresan TolC, HlyB y HlyD. El uso del sistema de secreción de tipo 1 asegura que el péptido o proteína es secretado directamente al espacio extracelular sin una etapa intermedia en el periplasma y evita la exposición del péptido o proteína expresada a proteasas.
5
10
15
20
25
30
35
40
45
50
55
60
La definición de que «la tercera secuencia de ácido nucleico tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 29 o uno de sus fragmentos, en la que el fragmento comprende al menos la secuencia de nucleótidos expuesta en la SEQ ID NO: 30», significa que la secuencia de nucleótidos comprende al menos la secuencia de nucleótidos que codifica los aminoácidos 975-1016 de la HlyA (basada en la secuencia de aminoácidos de HlyA como se expone en la SEQ ID NO: 41), en la que la HlyA es codificada por la secuencia de ácido nucleico como se expone en la SEQ ID NO: 29. En algunas realizaciones, la tercera secuencia de ácido nucleico tiene una secuencia seleccionada del grupo que consiste en las SEQ ID NO: 31-40 o sus fragmentos. En diferentes realizaciones, los fragmentos de las secuencias de nucleótidos de las SEQ ID NO: 29 y 31-38 comprenden al menos la secuencia de nucleótidos de SEQ ID NO: 39 o 40. En otras realizaciones, los fragmentos de las secuencias de nucleótidos expuestas en las SEQ ID NO: 29 y 31-37 comprenden al menos la secuencia de nucleótidos expuesta en la SEQ ID NO: 38. En otras realizaciones más, los fragmentos de las secuencias de nucleótidos expuestas en las SEQ ID NO: 29 y 31-33 comprenden al menos la secuencia de nucleótidos expuesta en la SEQ ID NO: 34, 35, 36 o 37. En otras realizaciones más, la tercera secuencia de ácido nucleico tiene una secuencia que corresponde a una secuencia seleccionada del grupo que consiste en las SEQ ID NO: 29 y 31-39 que carecen de los 24 nucleótidos más 3' terminales. Por lo tanto, estas secuencias codifican fragmentos de HlyA que carecen de los 8 restos de aminoácidos más C-terminales.
En algunas realizaciones, la molécula de ácido nucleico se caracteriza además por que la molécula de ácido nucleico comprende además al menos una cuarta secuencia de ácido nucleico que codifica un marcador de afinidad y/o un sitio de escisión de proteasa, en la que la al menos una cuarta secuencia de ácido nucleico está operativamente unida al extremo 5' y/o 3' de la al menos una segunda molécula de ácido nucleico y/o la tercera molécula de ácido nucleico.
La secuencia de nucleótidos que codifica el sitio de escisión de proteasa puede estar operativamente unida a la segunda molécula de ácido nucleico y a la tercera molécula de ácido nucleico de modo que está situada entre la segunda y la tercera secuencias de ácidos nucleicos. En realizaciones, donde la segunda secuencia de ácido nucleico está insertada en la tercera secuencia de ácido nucleico, la secuencia que codifica el sitio de escisión de proteasa puede estar en cualquier extremo del segundo ácido nucleico unido a una parte de la tercera secuencia de ácido nucleico o ambos extremos pueden comprender una secuencia que codifica un sitio de escisión de proteasa.
La expresión «marcador de afinidad», como se usa en la presente memoria, se refiere a entidades que están acopladas a una molécula de interés y permiten el enriquecimiento del complejo entre la molécula de interés y el marcador de afinidad usando un receptor de marcador de afinidad. En algunas realizaciones, los marcadores de afinidad se pueden seleccionar del grupo que consiste en Strep-tag® o Strep-tag® II, el marcador myc, el marcador FLAG, el marcador His, el marcador de modificador tipo ubiquitina de pequeño tamaño (SUMO), el marcador de péptido NorpD covalente pero disociable (CYD), el marcador de la cadena pesada de la proteína C (HPC), el marcador de péptido de unión a calmodulina (CBP) o el marcador HA o proteínas tales como la proteína de unión a estreptavidina (SBP), proteína de unión a maltosa (MBP) y glutatión-S-transferasa.
La expresión «sitio de escisión de proteasa» se refiere a la secuencia peptídica que puede ser escindida por una proteasa seleccionada, permitiendo así la separación de secuencias peptídicas o proteicas que están interconectadas por un sitio de escisión de la proteasa. En algunas realizaciones, el sitio de escisión de proteasa se selecciona del grupo que consiste en un sitio de escisión de Factor Xa, de proteasa de virus del grabado del tabaco (TEV), de enteroquinasa, de proteasa SUMO Express, de proteinasa Arg-C, de endopeptidasa Asp-N, de endopeptidasa Asp-N + Glu N-terminal, de caspasa1, de caspasa2, de caspasa3, de caspasa4, de caspasa5, de caspasa6, de caspasa7, de caspasa8, de caspasa9, de caspasa10, de quimotripsina de alta especificidad, de quimiotripsina de baja especificidad, de clostripaína (Clostridiopeptidasa B), de glutamil-endopeptidasa, de granzimaB, de pepsina, de prolina-endopeptidasa, de proteinasa K, peptidasa I estafilocócica, de trombina, de tripsina, y de termolisina.
En algunas realizaciones, la molécula de ácido nucleico se construye de modo que la primera secuencia de ácido nucleico no se traduce. En algunas realizaciones, la molécula de ácido nucleico se construye de modo que la segunda secuencia de ácido nucleico se traduce en un péptido o proteína individual. En realizaciones adicionales, la molécula de ácido nucleico comprende al menos la primera, la segunda y la tercera secuencias de ácidos nucleicos como se han definido antes y se construye de modo que la segunda secuencia de ácido nucleico se traduce en un péptido o proteína individual. En diferentes realizaciones, la molécula de ácido nucleico comprende al menos la primera, segunda y tercera secuencias de ácidos nucleicos como se han definido antes y se construye de modo que la segunda y tercera secuencias de ácidos nucleicos se traducen en un péptido o proteína de fusión. La molécula de ácido nucleico se puede construir de modo que el péptido o proteína traducida codificada por la segunda secuencia de ácido nucleico y el péptido o proteína codificada por la tercera secuencia de ácido nucleico estén fusionados. «Fusionado», como se usa en este contexto, significa que los péptidos o proteínas resultantes están directamente conectados entre sí o unidos entre sí por uno o más aminoácidos, péptidos o proteínas, por ejemplo, uno o más sitios de escisión de proteasa y/o marcadores de afinidad.
En algunas realizaciones, la molécula de ácido nucleico comprende al menos la primera, segunda y tercera secuencias de ácidos nucleicos como se han definido antes y se construye de modo que la segunda secuencia de ácido nucleico se traduce en un péptido o proteína individual.
En algunas realizaciones, el al menos un péptido o proteína de interés codificado por la al menos una segunda secuencia de ácido nucleico es un sustrato del sistema de secreción tipo 1, como se describe a continuación, y la molécula de ácido nucleico puede no requerir la presencia de una tercera secuencia de ácido nucleico para la expresión y secreción del péptido o proteína de interés. El sustrato del sistema de secreción tipo 1 puede inducir su 5 exportación por sí mismo. La expresión «un péptido o proteína de interés» como se describe en la presente memoria, cubre cualquier péptido o proteína natural o no natural. En algunas realizaciones, el péptido o proteína de interés es un péptido o proteína no natural/sintético. Sintético a este respecto significa que la secuencia del péptido o proteína ha sido diseñada artificialmente. Por lo tanto, una secuencia que codifica un péptido o proteína de interés puede comprender una secuencia de ácido nucleico que codifica uno, dos o más péptidos o proteínas naturales. 10 Estos péptidos o proteínas naturales se pueden haber modificado adicionalmente, p. ej., por mutagénesis de la secuencia codificante.
Si el péptido o proteína de interés comprende dos o más péptidos o proteínas naturales, los dos o más péptidos o proteínas pueden estar separados por sitios de escisión de proteasas.
En general, se puede elegir cualquier péptido o proteína como proteína de interés. En algunas realizaciones, la 15 proteína de interés es una proteína que no forma un homodímero u homomultímero. Evitar péptidos o proteínas que autointeraccionan puede ser ventajoso si el péptido o proteína recombinante se va a secretar en el líquido sobrenadante del cultivo celular, porque la formación de complejos de proteínas más grandes puede alterar una exportación de proteína eficaz. Sin embargo, la proteína de interés también puede ser un péptido o proteína que es una subunidad de un complejo de péptido o proteína más grande. Dicho péptido o proteína se puede aislar después 20 de la expresión y opcionalmente la secreción y ser adecuado para una reconstitución in vitro del complejo multipéptido o proteína. En algunas realizaciones, la proteína o péptido de interés es un péptido que tiene menos de 100 restos de aminoácidos. Si estos péptidos comprenden pre y/o prosecuencias en su estado natural, después de la traducción, la secuencia de ácido nucleico que codifica el péptido de interés puede modificar genéticamente para limitar a la secuencia que codifica el péptido maduro. Un péptido ilustrativo es la insulina, p. ej., insulina humana. La 25 secreción de péptidos y proteínas sobreexpresados es especialmente ventajosa cuando el péptido o la proteína son dañinos para la célula hospedante. Por esta razón, la presente invención es particularmente ventajosa para la expresión de lipasas y proteasas que se sabe que son tóxicas para la célula hospedante y, por lo tanto, la expresión de estas proteínas por la síntesis y procedimientos de la invención representa una realización específica de la presente invención.
30 En diferentes realizaciones, el péptido o proteína de interés es una enzima.
La Unión Internacional de Bioquímica y Biología Molecular ha desarrollado una nomenclatura para enzimas, los números EC; cada enzima se describe por una secuencia de cuatro números precedidos por «EC». El primer número clasifica de forma amplia a la enzima en función de su mecanismo.
La nomenclatura completa se puede consultar en
http://www.chem.qmul.ac.uk/iubmb/enzyme/.
35 Por consiguiente, un péptido o proteína de interés según la presente invención se puede elegir de cualquiera de las clases EC1 (Oxidorreductasas), EC2 (Transferasas), EC3 (Hidrolasas), EC4 (Liasas), EC5 (Isomerasas), y EC 6 (Ligasas), y las subclases de las mismas.
En algunas realizaciones, el péptido o proteína de interés depende del cofactor o alberga un grupo prostético. Para la expresión de dichos péptidos o proteínas, en algunas realizaciones, se puede añadir el cofactor o grupo prostético 40 correspondiente al medio de cultivo durante la expresión.
En ciertos casos, el péptido o proteína de interés es una deshidrogenasa o una oxidasa.
En el caso de que el péptido o proteína de interés sea una deshidrogenasa, en algunas realizaciones, el péptido o proteína de interés se elige del grupo que consiste en alcohol deshidrogenasas, glutamato deshidrogenasas, lactato deshidrogenasas, celobiosa deshidrogenasas, formiato deshidrogenasas y aldehídos deshidrogenasas.
45 En caso de que el péptido o proteína de interés sea una oxidasa, en algunas realizaciones, el péptido o proteína de interés se selecciona del grupo que consiste en citocromo P450 oxidorreductasas, en particular p450 BM3 y mutantes de las mismas, peroxidasas, monooxigenasas, hidrogenasas, monoaminooxidasas, aldehídos oxidasas, xantina oxidasas, aminoácidos oxidasas y NADH oxidasas.
En realizaciones adicionales, el péptido o proteína de interés es una transaminasa o una quinasa.
50 En caso de que el péptido o proteína de interés sea una transaminasa, en algunas realizaciones, el péptido o proteína de interés se elige del grupo que consiste en alanina aminotransferasas, aspartato aminotransferasas, glutamato-oxaloacético transaminasas, histidinol-fosfato transaminasas e histidinol-piruvato transaminasas.
En diferentes realizaciones, si el péptido o proteína de interés es una quinasa, el péptido o proteína de interés se elige del grupo que consiste en nucleósido difosfato quinasas, nucleósido monofosfato quinasas, piruvato quinasa y 55 glucoquinasas.
5
10
15
20
25
30
35
40
45
50
55
En algunas realizaciones, si el péptido o proteína de interés es una hidrolasa, el péptido o proteína de interés se elige del grupo que consiste en lipasas, amilasas, proteasas, celulasas, nitrilo hidrolasas, halogenasas, fosfolipasas y esterasas.
En algunas realizaciones, si el péptido o proteína de interés es una liasa, el péptido o proteína de interés se selecciona del grupo que consiste en aldolasas, p. ej., hidroxinitrilo liasas, enzimas dependientes de tiamina, p. ej., benzaldehído liasas y piruvato descarboxilasas.
En diferentes realizaciones, si el péptido o proteína de interés es una isomerasa, el péptido o proteína de interés se elige del grupo que consiste en isomerasas y mutasas.
En algunas realizaciones, si el péptido o proteína de interés es una ligasa, el péptido o proteína de interés puede ser una ADN ligasa.
En algunas realizaciones, el péptido o proteína de interés puede ser un anticuerpo. Este puede incluir una inmunoglobulina completa o fragmento de la misma, cuyas inmunoglobulinas incluyen las diferentes clases e isotipos, tales como IgA, IgD, IgE, IgG1, IgG2a, IgG2b e IgG3, IgM, etc. Sus fragmentos pueden incluir Fab, Fv y F(ab')2, Fab', y similares.
También están contemplados en la presente memoria péptidos y proteínas terapéuticamente activos de interés, p. ej., una citocina.
Por lo tanto, en ciertas realizaciones, el péptido o proteína de interés se selecciona del grupo que consiste en citoquinas, en particular interferones humanos o murinos, interleuquinas, factores estimuladores de colonias, factores de necrosis, p. ej., factor de necrosis tumoral y factores de crecimiento.
En algunas realizaciones, si el péptido o proteína de interés es un interferón, el péptido o proteína de interés se puede seleccionar del grupo que consiste en interferón alfa, p. ej., alfa-1, alfa-2, alfa-2a y alfa-2b, alfa-2, alfa-16, alfa 21, beta, p. ej., beta-1, beta-la y beta-1b o gamma.
En realizaciones adicionales, el péptido o proteína de interés es un péptido antimicrobiano, en particular un péptido seleccionado del grupo que consiste en bacteriocinas y lantibióticos, p. ej., nisina, catelicidinas, defensinas y saposinas.
También se describen en la presente memoria péptidos o proteínas de interés que son péptidos o proteínas terapéuticamente activos. En algunas realizaciones, el péptido o proteína de interés es un péptido terapéuticamente activo. En algunas realizaciones, un péptido terapéuticamente activo se puede seleccionar del grupo que consiste en Fuzeon/T20, calcitonina humana, calcitonina de salmón, factor liberador de corticotropina humana, Mab40, Mab42, péptidos asociados con la enfermedad de Alzheimer y exenatida.
En algunas realizaciones, el péptido o proteína de interés es un sustrato de secreción tipo I. Se han comentado o descrito en la bibliografía más de 1000 proteínas como sustratos de secreción tipo I. Muchas de ellas tienen características interesantes para el uso biotecnológico, en particular proteasas y lipasas. Han descrito proteasas y lipasas adecuadas Baumann y col. (1993) EMBO J 12, 3357 - 3364; y Meier y col. (2007) J. BIOL. CHeM.: 282 (43), pp. 31477-31483.
Por supuesto, como ya se ha mencionado anteriormente, la al menos una secuencia de ácido nucleico que codifica el péptido o proteína de interés se puede someter a mutagénesis y conducir así a un péptido mutado o proteína de interés en el nivel de proteína.
El término «mutación», como se usa en la presente memoria, se refiere a una variación en la secuencia de nucleótidos y/o aminoácidos de una secuencia de nucleótidos o proteína dada e incluye sustituciones, eliminaciones, truncamientos e inserciones. En un ejemplo específico, la mutación es una mutación puntual, es decir, la sustitución de uno o más nucleótidos y/o aminoácidos en una secuencia dada. Se entiende que si el término «mutación» se usa en relación con una secuencia de proteína, que la secuencia de nucleótidos que codifica la proteína puede comprender mutaciones o modificaciones múltiples, incluyendo mutaciones silenciosas que, por ejemplo, sirven para aumentar la eficacia de expresión (optimización de codones) sin cambiar la secuencia de aminoácidos. En la presente invención, la mutación es preferentemente la sustitución de uno o dos aminoácidos por otros aminoácidos. Alternativamente o además, la molécula de ácido nucleico puede comprender intercambios de nucleótidos que no alteran la secuencia de proteína codificada, las denominadas mutaciones silenciosas. En algunas realizaciones, las mutaciones, p. ej., mutaciones silenciosas aumentan la eficacia de la expresión y/o secreción del péptido o proteína codificada por la molécula de ácido nucleico. Es importante que las mutaciones pueden inducirse a lo largo de toda la molécula de ácido nucleico de la presente invención. Por lo tanto, las mutaciones pueden no estar limitadas a secuencias que codifican un péptido o proteína. Por consiguiente, también los tramos de secuencias no codificantes se pueden someter a mutagénesis. Este tipo de mutación también está dentro del alcance de la expresión mutación silenciosa. La mutagénesis de secuencias no codificantes puede ser ventajosa, p. ej., para lograr una expresión y/o secreción mejorada de un péptido o proteína codificada por un tramo de secuencia diferente dentro de la molécula de ácido nucleico.
5
10
15
20
25
30
35
40
45
50
55
60
El término «mutagénesis» como se usa en la presente memoria significa que las condiciones experimentales se eligen de modo que el aminoácido que se encuentra naturalmente en una posición de la secuencia dada de una secuencia de proteína se puede sustituir por al menos un aminoácido que no está presente en esta posición específica en la respectiva secuencia de polipéptido natural. El término «mutagénesis» también incluye la modificación (adicional) de la longitud de segmentos de secuencia por eliminación o inserción de uno o más aminoácidos. Por lo tanto, está dentro del alcance de la invención que, por ejemplo, un aminoácido en una posición de secuencia elegida se sustituya por un tramo de tres mutaciones aleatorias, conduciendo a una inserción de dos restos de aminoácidos en comparación con la longitud del respectivo segmento de la proteína de tipo natural. Dicha inserción o eliminación se puede introducir independientemente una de otra en cualquiera de los segmentos de péptido que se pueden someter a mutagénesis en la invención.
El término «mutagénesis aleatoria» significa que no está presente ningún aminoácido individual predeterminado (mutación) en una determinada posición de secuencia, sino que se puede incorporar uno de al menos dos aminoácidos diferentes con una cierta probabilidad en una posición de secuencia predefinida durante la mutagénesis.
La secuencia codificante natural de una secuencia de proteína, es decir, el respectivo segmento génico de una enzima, se puede usar como un punto de partida para la mutagénesis de las posiciones de aminoácidos seleccionadas en la presente invención. Para la mutagénesis de las posiciones de aminoácidos citadas, el experto en la técnica tiene a su disposición los diversos procedimientos convencionales establecidos para la mutagénesis dirigida al sitio (Sambrook, J. y col. (2001) "Molecular Cloning: A Laboratory Manual", 3a Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY). Una técnica usada habitualmente es la introducción de mutaciones mediante PCR (reacción en cadena de la polimerasa) usando mezclas de oligonucleótidos sintéticos, que llevan una composición de bases degeneradas en las posiciones de secuencia deseadas. Por ejemplo, el uso del codón NNK o NNS (en la que N = adenina, guanina, citosina o timina, K = guanina o timina, S = adenina o citosina) permite la incorporación de los 20 aminoácidos más el codón de parada ámbar durante la mutagénesis, mientras que el codón VVS limita el número de aminoácidos posibles incorporados a 12, ya que excluye la incorporación de los aminoácidos Cys, Ile, Leu, Met, Phe, Trp, Tyr, Val en la posición seleccionada de la secuencia de polipéptido (V = adenina, guanina o citosina); el uso del codón NMS (en el que M = adenina o citosina), por ejemplo, restringe el número de aminoácidos posibles a 11 en una posición de secuencia seleccionada puesto que excluye la incorporación de los aminoácidos Arg, Cys, Gly, Ile, Leu, Met, Phe, Trp, Val en una posición de secuencia seleccionada. Otra posibilidad es el uso de codones NDT o NDC (en el que D = adenina, guanina o timina) ya que esto proporciona una relación 1:1 entre el número de codones y los aminoácidos codificados, por lo que reduce el esfuerzo de cribado y conduce a una conjunto equilibrado de 12 restos de aminoácidos polares, no polares, aromáticos, no aromáticos, hidrófilos e hidrófobos (Arg, Asn, Asp, Cys, Gly, His, Ile, Leu, Phe, Ser, Tyr, Val (Reetz MT y col., 2008, ChemBioChem, 21; 9(11): 1797-804)).
En relación con esto, se observa que también se pueden incorporar codones para otros aminoácidos (distintos de los 20 aminoácidos naturales habituales) tales como selenocisteína o pirrolisina en una molécula de ácido nucleico de la presente invención. También es posible, como describen Wang, L. y col. ((2001) Science 292, 498-500) o Wang, L., y Schultz, PG ((2002) Chem. Comm. 1, 1-11) usar codones «artificiales» tales como UAG que normalmente son reconocidos como codones de parada, con el fin de insertar otros aminoácidos no habituales, por ejemplo o-metil-L-tirosina o p-aminofenilalanina.
El uso de unidades estructurales de nucleótidos con especificidad de pares de bases reducida, como por ejemplo inosina, 8-oxo-2"-deoxiguanosina o 6-(2-desoxi-p-D-ribofuranosil)-3,4-dihidro-8H-pirimidino-1,2-oxazina-7-ona (Zaccolo y otros (1996) J. Mol. Biol. 255, 589-603), es otra opción para la introducción de mutaciones en un segmento de secuencia elegido.
Otra posibilidad es la llamada mutagénesis de triplete. Este procedimiento usa mezclas de diferentes tripletes de nucleótidos, cada uno de los cuales codifica un aminoácido, para su incorporación en la secuencia codificante (Virnekas B, Ge L, Plückthun A, Schneider KC, Wellnhofer G, Moroney SE. (1994). Nucleic Acids Res 22, 56005607).
Una estrategia posible para introducir mutaciones en las posiciones seleccionadas se basa en el uso de dos oligonucleótidos, cada uno de los cuales deriva parcialmente de uno de los correspondientes tramos de secuencia en la que se localiza la posición de aminoácido que va a mutar. Cuando se sintetizan estos oligonucleótidos, un experto en la técnica puede usar mezclas de unidades estructurales de ácidos nucleicos para la síntesis de los tripletes de nucleótidos que corresponden a las posiciones de aminoácidos que van a mutar, de modo que surgen los codones que codifican todos los aminoácidos naturales, lo que finalmente da como resultado la generación de una biblioteca de proteínas. Están disponibles una multitud de procedimientos establecidos para el ligado y clonación (Sambrook, J. y col. (2001), véase antes). Por ejemplo, las secuencias de reconocimiento para endonucleasas de restricción también presentes en la secuencia del vector de clonación se pueden modificar genéticamente en la secuencia de los oligonucleótidos sintéticos. Por lo tanto, después de la amplificación del respectivo producto de la PCR y la escisión enzimática, el fragmento resultante se puede clonar fácilmente usando las correspondientes secuencias de reconocimiento.
5
10
15
20
25
30
35
40
45
50
55
También se pueden someter a mutagénesis aleatoria segmentos de secuencia más largos dentro del gen que codifica el péptido o proteína seleccionados para mutagénesis mediante procedimientos conocidos, por ejemplo, mediante el uso de la reacción en cadena de la polimerasa en condiciones de tasa de error aumentada, por mutagénesis química o mediante el uso de cepas bacterianas mutadoras. Dichos procedimientos también se pueden usar para una optimización adicional de la afinidad o especificidad por el objetivo de una muteína de polimerasa. Las mutaciones que se producen posiblemente fuera de los segmentos de mutagénesis experimental a menudo se toleran o incluso pueden demostrar ser ventajosas, por ejemplo, si contribuyen a una mejor eficacia de plegamiento o estabilidad del plegamiento del péptido o proteína mutados. En particular, para secuencias de ácido nucleico largas y difíciles de amplificar, se puede aplicar el protocolo de mutagénesis basado en PCR proporcionado por Reetz y colaboradores (Sanchis J y col., Appl. Microbiol. Biotechnol. noviembre 2008; 81 (2): 387-97).
Como se usa en la presente memoria, la expresión «resto de aminoácido mutado» significa un resto de aminoácido que difiere del resto de aminoácido en la misma posición de la secuencia en el péptido o proteína de tipo natural.
Para algunos péptidos o proteínas de interés, el gen natural o ADNc que codifica el péptido o proteína comprende una secuencia 5" que codifica un péptido señal de secreción. En algunas realizaciones, la secuencia de nucleótidos que codifica este péptido está comprendida en el ADN que codifica el péptido o proteína de interés de la presente invención. En otras realizaciones, esta secuencia de nucleótidos se ha eliminado mediante modificación genética. En realizaciones adicionales, esta secuencia se ha sustituido por un péptido de separación/secreción diferente o marcador de afinidad. La elección del péptido de separación/secreción de sustitución puede depender del organismo hospedante elegido para la expresión de proteínas, la posterior purificación o la aplicación del péptido o proteína de interés. En realizaciones adicionales, la secuencia del péptido o proteína de interés se ha truncado de forma N- y/o C-terminal con respecto a la secuencia de la enzima de tipo natural. Por consiguiente, en ciertas realizaciones, el péptido o proteína de interés comprende una eliminación de al menos un aminoácido N-terminal con respecto a la secuencia de la enzima de tipo natural. En realizaciones adicionales, el péptido o proteína de interés comprende una eliminación de al menos un aminoácido C-terminal en relación con la secuencia de la enzima de tipo natural. En realizaciones alternativas, el péptido o proteína de interés comprende una eliminación de al menos un aminoácido N- y/o C-terminal con respecto a la secuencia de enzima de tipo natural. En algunas realizaciones, el péptido o proteína de interés comprende una eliminación de al menos 10, 20, 30, 40, 50 o más aminoácidos N- y/o C-terminales en relación con el péptido de tipo natural o la secuencia de proteína.
En algunas realizaciones, una secuencia de ácido nucleico que codifica un péptido o proteína de interés se somete a mutagénesis con el fin de modificar la cinética de plegamiento del péptido o proteína codificada, en particular para ralentizar la cinética de replegamiento de la proteína. Los autores de la invención han encontrado que, en ciertos casos, un mutante con cinética de replegamiento ralentizada es secretado de forma incluso más eficaz que su homólogo natural sin afectar a la estabilidad de la proteína.
Esta mutagénesis se puede lograr por mutación específica del sitio basada en un diseño racional o una mutación aleatoria. Un posible procedimiento es el uso de la PCR propensa a error, que da como resultado mutaciones puntuales aleatorias en un intervalo seleccionado de posiciones de la secuencia del péptido o proteína de interés. La PCR propensa a error se puede llevar a cabo según cualquier protocolo conocido tal como el descrito por Zaccolo y col. (1996) J. Mol. Biol. 255, 589-603. Otros procedimientos de mutagénesis aleatoria que son adecuados para dichos fines incluyen la mutagénesis de inserción/eliminación aleatoria (RID) como describen Murakami, h y col. (2002) Nat. Biotechnol. 20, 76-81 o la recombinación aleatoria no homóloga (NRR), como describen Bittker, JA y col. (2002) Nat. Biotechnol. 20, 1024-1029. Se puede usar en especial el diseño racional, si está disponible la estructura cristalina o la estructura de RMN del péptido o proteína de interés. Una posibilidad puede ser mutar los restos de aminoácidos que inducen un plegamiento rígido del péptido o proteína de interés o tienen, en comparación con otros restos de aminoácidos, una posición bastante fija dentro de la estructura tridimensional.
Los mutantes resultantes se pueden cribar respecto a la cinética de replegamiento deseada usando técnicas espectroscópicas, por ejemplo, espectroscopia de CD.
En algunas realizaciones, el al menos un segundo ácido nucleico codifica un péptido o proteína de interés que se selecciona del grupo que consiste en MBP, lipasa CalB, proteasa SprP, hidrolasa PlaB, hidrolasa PlaK, hidrolasa PlbF, lipasa TesA, Vif, interferón alfa-1 humano, alfa-2, alfa-8, alfa-16, alfa-21, interferón beta humano, interferón gamma humano, interferón alfa murino, interferón gamma murino, IFABP, Cas2, proteína Affibody ZA3, nisina, factor liberador de corticotropina, péptido beta-amiloide, exenatida, Fuzeon/T20, calcitonina de salmón, Mab40, Mab42, lipasa LipA, SprP, la proteína Vif de VIH-1 y calcitonina humana.
En diferentes realizaciones de la presente invención, la molécula de ácido nucleico comprende o consiste en una secuencia de ácido nucleico como se expone en las SEQ ID NO: 66, 71, 74, 79, 84, 89, 93, 98, 103, 110, 115, 120, 125, 130, 135, 140, 145, 220, 227, 234, 239, 244, 249, 254, 259, 264, 269, 274, 279, 284, 289, 294, 299, 304, 325, 327, 329 y 331 que codifican proteínas de fusión.
En algunas realizaciones, las moléculas de ácido nucleico definidas antes pueden estar comprendidas en un vector, por ejemplo, un vector de clonación o expresión. En general, las moléculas de ácido nucleico de la invención también pueden ser parte de un vector o cualquier otro tipo de vehículo de clonación, que incluye, pero no se limita
5
10
15
20
25
30
35
40
45
50
55
a, un plásmido, un fagémido, un fago, un baculovirus, un cósmido o un cromosoma artificial.
En general, una molécula de ácido nucleico descrita en esta solicitud puede estar operativamente unida a una secuencia reguladora (o secuencias reguladoras) para permitir la expresión de esta molécula de ácido nucleico.
Dichos vehículos de clonación pueden incluir, además de las secuencias reguladoras descritas antes y una secuencia de ácido nucleico de la presente invención, secuencias de replicación y control derivadas de una especie compatible con la célula hospedante que se usa para la expresión, así como marcadores de selección que confieren un fenotipo seleccionable en células transformadas o transfectadas. Se conocen en la técnica un gran número de vectores de clonación adecuados, y están disponibles en el mercado.
En algunas realizaciones, las moléculas de ácido nucleico descritas en la presente memoria están comprendidas en un vector de clonación. En algunas realizaciones, las moléculas de ácido nucleico descritas en la presente memoria están comprendidas en un vector de expresión.
Los vectores pueden comprender elementos reguladores para la replicación y marcadores de selección. En algunas realizaciones, el marcador de selección se puede seleccionar del grupo que consiste en genes que confieren resistencia a ampicilina, kanamicina, cloranfenicol, tetraciclina, blasticidina, espectinomicina, gentamicina, higromicina y zeocina.
Una molécula de ácido nucleico de la presente invención descrita antes, que comprende una secuencia de ácido nucleico que codifica una proteína de interés, si está integrada en un vector, debe estar integrada de modo que se pueda expresar el péptido o proteína de interés. Por lo tanto, un vector de la presente invención comprende elementos de secuencia que contienen información con respecto a la regulación de transcripción y/o traducción, y dichas secuencias están «operativamente unidas» a la secuencia de nucleótidos que codifica el polipéptido. Una unión operativa en este contexto es una unión en la que los elementos reguladores de la secuencia y la secuencia que se va a expresar están conectados de una manera que permite la expresión génica. La naturaleza precisa de las regiones reguladoras necesarias para la expresión génica puede variar entre las especies, pero en general estas regiones comprenden un promotor que, en procariotas, contiene tanto el promotor por sí mismo, es decir, los elementos de ADN que dirigen el inicio de la transcripción, como los elementos de ADN que, cuando se transcriben en ARN, señalarán el inicio de la traducción. Dichas regiones promotoras normalmente incluyen secuencias 5' no codificantes implicadas en el inicio de la transcripción y traducción, tales como las cajas -35/-10 y el elemento Shine- Dalgarno en procariotas o la caja TATA, secuencias CAAT y elementos de casquete 5' en eucariotas. Estas regiones también pueden incluir elementos potenciadores o represores, así como secuencias señal y líder traducidas para dirigir el polipéptido natural a un compartimiento específico de una célula hospedante.
Además, las secuencias 3' no codificantes pueden contener elementos reguladores implicados en la terminación transcripcional, poliadenilación o similares. Sin embargo, si estas secuencias de terminación no son funcionalmente satisfactorias en una célula hospedante particular, entonces se pueden sustituir por señales funcionales en esa célula.
Por lo tanto, un vector que comprende una molécula de ácido nucleico de la invención puede comprender una secuencia reguladora, preferentemente una secuencia promotora. En algunas realizaciones, el promotor es idéntico u homólogo a secuencias promotoras del genoma del hospedante. En dichos casos, las polimerasas endógenas pueden ser capaces de transcribir la secuencia de la molécula de ácido nucleico comprendida en el vector. En diferentes realizaciones, el promotor se selecciona del grupo de promotores débiles, intermedios y fuertes, preferentemente de promotores débiles a intermedios.
En otra realización preferida, un vector que comprende una molécula de ácido nucleico de la presente invención comprende una secuencia promotora y una secuencia de terminación de la transcripción. Son promotores adecuados para la expresión en procariotas, por ejemplo, el promotor araBAD, el promotor tet, el promotor lacUV5, el promotor CMV, el promotor alfa EF1, el promotor AOX1, el promotor tac, el promotor T7 o el promotor lac. Los ejemplos de promotores útiles para la expresión en células eucarióticas son el promotor SV40 o el promotor CMV. Además, una molécula de ácido nucleico de la invención puede comprender elementos reguladores de la transcripción, p. ej., elementos represores, que permiten la transcripción y traducción reguladas de secuencias codificantes comprendidas en la molécula de ácido nucleico. El elemento de represión se puede seleccionar del grupo que consiste en el represor de Lac, AraC, o MalR.
El vector puede ser eficaz para la expresión de proteínas procariotas o eucariotas. En particular, las moléculas de ácido nucleico de la presente invención pueden estar comprendidas en un vector para la expresión de proteínas procariotas. En algunas realizaciones, el vector es pSU-HlyA o pSU-HlyA1 y tiene una secuencia de nucleótidos como se expone en la SEQ ID NO: 62 o 63, respectivamente. Dichas secuencias de vectores todavía no incluyen la segunda secuencia de nucleótidos que codifica el péptido o la proteína de interés, pero están, no obstante, construidas de modo que dicha secuencia se puede insertar fácilmente usando técnicas bien conocidas por los expertos en la técnica.
En algunas realizaciones, el vector se selecciona del grupo que consiste en un vector pET, un vector pBAD, un vector pK184, un vector pMONO, un vector pSELECT, vector pSELECT-Tag, un vector pVITRO, un vector pVITRO,
5
10
15
20
25
30
35
40
45
50
55
un vector pVIVO, un vector pORF, un vector pBLAST, un vector pUNO, un vector pDUO, un vector pZERO, un vector pDeNy, un vector pDRIVE, un vector pDRIVE-SEAP, un vector HaloTag®Fusion, un vector pTARGET™, un vector Flexi®, un vector pDEST, un vector pHIL, un vector pPIC, un vector pMET, un vector pPink, un vector pLP, un vector pTOPO, un vector pBud, un vector pCEP, un vector pCMV, un vector pDisplay, un vector pEF, un vector pFL, un vector pFRT, un vector pFastBac, un vector pGAPZ, un vector pIZ/V5, un vector pLenti6, un vector pMIB, un vector pOG, un vector pOpti, un vector pREP4, un vector pRSET, un vector pSCREEN, un vector pSecTag, un vector pTEFI, un vector pTracer, un vector pTrc, un vector pUB6, un vector pVAXI, un vector pYC2, un vector pYES2, un vector pZeo, un vector pcDNA, un vector pFLAG, un vector pTAC, un vector pT7, un vector gateway®, un vector pQE, un vector pLEXY, un vector pRNA, un vector pPK, un vector pUMVC, un vector pLIVE, un vector pCRUZ, un vector Duet, y otros vectores o derivados de los mismos.
Los vectores de la presente invención se pueden elegir del grupo que consiste en vectores de número de copias alto, medio y bajo.
En algunas realizaciones, el vector es el vector pSU que comprende la molécula de ácido nucleico de la presente invención. En algunas realizaciones, el vector pSU comprende la primera secuencia de ácido nucleico y opcionalmente (i) la segunda secuencia de ácido nucleico y/o (ii) la tercera secuencia de ácido nucleico y/o (iii) la cuarta secuencia de ácido nucleico, siendo todas estas secuencias como se han definido antes. Específicamente, el vector pSU puede comprender cualquiera de las combinaciones y arquitecturas específicas de secuencias descritas antes.
El vector se construye de modo que la primera secuencia de ácido nucleico que comprende el fragmento de HlyC o su homólogo no se traduce o se traduce como una secuencia de aminoácidos individual.
Los vectores de la presente invención descritos antes se pueden usar para la transformación o transfección de una célula hospedante con el fin de lograr la expresión de un péptido o proteína que es codificada por una molécula de ácido nucleico descrita antes y comprendida en el ADN del vector. Por lo tanto, en un aspecto adicional, la presente invención también se refiere a una célula hospedante que comprende un vector o molécula de ácido nucleico como se describe en la presente memoria.
También están contempladas en la presente memoria células hospedantes, que comprenden una molécula de ácido nucleico como se describe en la presente memoria integrada en sus genomas. El experto en la técnica conoce los procedimientos adecuados para lograr la integración de la molécula de ácido nucleico. Por ejemplo, la molécula se puede suministrar a las células hospedantes por medio de transferencia de liposomas o infección viral y después la molécula de ácido nucleico se puede integrar en el genoma del hospedante por medio de recombinación homóloga. En algunas realizaciones, la molécula de ácido nucleico se integra en un sitio en el genoma del hospedante, que media la transcripción del péptido o proteína de la invención codificada por la molécula de ácido nucleico. En diversas realizaciones, la molécula de ácido nucleico comprende además elementos que median la transcripción de la molécula de ácido nucleico una vez que la molécula está integrada en el genoma del hospedante y/o que sirven como marcadores de selección.
En algunas realizaciones, la molécula de ácido nucleico de la presente invención se transcribe mediante una polimerasa codificada de forma natural en el genoma del hospedante. En diferentes realizaciones, la molécula de ácido nucleico se transcribe mediante una ARN-polimerasa que no es natural para el genoma del hospedante. En dichas realizaciones, la molécula de ácido nucleico de la presente invención puede comprender además una secuencia que codifica una polimerasa y/o el genoma del hospedante se puede modificar genéticamente o la célula hospedante se puede infectar para que comprenda una secuencia de ácido nucleico que codifica una polimerasa exógena.
La célula hospedante se puede elegir específicamente como una célula hospedante capaz de expresar el gen. Además o por otra parte, con el fin de producir un péptido o proteína, un fragmento del péptido o proteína o una proteína de fusión del péptido o proteína con otro polipéptido, el ácido nucleico que codifica el péptido o proteína se puede modificar genéticamente para la expresión en un sistema adecuado. La transformación se puede realizar usando técnicas convencionales (Sambrook, J. y col. (2001), véase antes).
Los organismos hospedantes procariotas o eucariotas que comprenden dicho vector para la expresión recombinante de un péptido o proteína de interés como se describe en la presente memoria también forman parte de la presente invención. Las células hospedantes adecuadas pueden ser células procariotas. En algunas realizaciones, las células hospedantes se seleccionan del grupo que consiste en bacterias Gram positivas y Gram negativas. En algunas realizaciones, la célula hospedante es una bacteria Gram negativa, tal como E. coli. En algunas realizaciones, la célula hospedante es E. coli, en particular E. coli BL21 (DE3) u otros derivados de E. coli K12 o E. coli B834. En realizaciones adicionales, la célula hospedante se selecciona del grupo que consiste en Escherichia coli (E. coli), Pseudomonas, Serratia marcescens, Salmonella, Shigella (y otras enterobacteriáceas), Neisseria, Hemophilus, Klebsiella, Proteus, Enterobacter, Helicobacter, Acinetobacter, Moraxella, Helicobacter, Stenotrophomonas, Bdellovibrio, Legionella, bacterias del ácido acético, Bacillus, Bacilli, Carynebacterium, Clostridium, Listeria, Streptococcus, Staphylococcus y células Archaea. Las células hospedantes eucariotas adecuadas son, entre otras, células CHO, células de insecto, hongos, células de levadura, p. ej., Saccharomyces cerevisiae, S. pombe, Pichia
5
10
15
20
25
30
35
40
45
50
55
pastoris.
Las células hospedantes transformadas se cultivan en condiciones adecuadas para la expresión de la secuencia de nucleótidos que codifica un péptido o proteína de la invención. En algunas realizaciones, las células se cultivan en condiciones adecuadas para la expresión y secreción de la secuencia de nucleótidos que codifica un péptido o proteína de la invención.
Para producir el péptido o proteína recombinante de interés, se introduce un vector de la invención en un organismo hospedante procariota o eucariota adecuado mediante tecnología de ADN recombinante (como ya se ha indicado antes). Para este fin, la célula hospedante se transforma primero con un vector que comprende una molécula de ácido nucleico según la presente invención, usando procedimientos convencionales establecidos (Sambrook, J. y col. (2001), véase antes). Después, la célula hospedante se cultiva en condiciones que permiten la expresión del ADN heterólogo y, por lo tanto, la síntesis del polipéptido correspondiente. Posteriormente, el polipéptido se recupera de la célula o del medio de cultivo.
Por lo tanto, la presente invención también se refiere a un péptido o proteína recombinante codificada por una molécula de ácido nucleico como se describe en la presente memoria. Estas proteínas pueden comprender un péptido o una proteína de interés fusionados de forma C-terminal con la HlyA o uno de sus fragmentos. Por ejemplo, la HlyA o sus fragmentos que tienen la secuencia peptídica como se expone en las SEQ ID NO: 41-52 y sus fragmentos se pueden fusionar al extremo C de la proteína de interés. Estas fusiones de HlyA son particularmente ventajosas si la proteína de interés va a ser secretada en el espacio extracelular. Por supuesto, en ciertas realizaciones, el péptido o proteína de interés se fusiona de forma C-terminal con al menos un sitio de escisión de proteasa y/o marcador de afinidad y esta entidad se fusiona de forma C-terminal con la HlyA o sus fragmentos. En algunas realizaciones, el péptido o proteína de interés se fusiona de forma N-terminal con al menos un marcador de afinidad y/o sitio de escisión de proteasa y se fusiona de forma C-terminal a la HlyA o sus fragmentos. Por supuesto, el péptido o proteína de interés se puede fusionar con HlyA o sus fragmentos por al menos un sitio de escisión de proteasa y/o marcador de afinidad.
En diferentes realizaciones, el péptido o proteína recombinante comprende o consiste en una secuencia de aminoácidos seleccionada del grupo que consiste en una cualquiera de las SEQ ID NO: 46, 68, 73, 76, 81, 86, 91, 95, 100, 105, 113, 117, 122, 127, 132, 137, 142, 147-150, 222, 229, 236, 241, 246, 251, 256, 261, 266, 271, 276, 281, 286, 291, 296, 301, 306, 316 y 333-336.
Para la expresión de los péptidos y proteínas de la presente invención, los expertos en la materia conocen varios protocolos adecuados.
La expresión de un péptido o proteína recombinante de la presente invención se puede lograr mediante el siguiente procedimiento que comprende: (a) introducir una molécula de ácido nucleico o vector de la invención en una célula hospedante, en la que la molécula o vector de ácido nucleico codifica el péptido recombinante o proteína; y (b) cultivar la célula hospedante en un medio de cultivo en condiciones que permitan la expresión del péptido o proteína recombinante.
La etapa (a) se puede llevar a cabo usando técnicas de transformación y transfección adecuadas conocidas por los expertos en la técnica. Estas técnicas normalmente se seleccionan en función del tipo de célula hospedante en la que se va a introducir el ácido nucleico. En algunas realizaciones, la transformación se puede lograr usando electroporación o tratamiento de choque térmico de la célula hospedante.
La etapa (b) puede incluir una etapa de cultivo que permite el crecimiento de las células hospedantes. Alternativamente, dicha etapa que permite el crecimiento de las células hospedantes y una etapa que permite la expresión de la proteína o péptido se puede realizar por separado en cuanto que primero se cultivan las células de modo que crezcan hasta una densidad deseada y después se cultivan en condiciones que permiten la expresión del péptido o proteína de interés. Sin embargo, la etapa de expresión todavía puede permitir el crecimiento de las células.
El procedimiento puede incluir además una etapa de recuperación de la proteína o péptido expresado. La proteína o péptido se puede recuperar del medio de crecimiento, si es secretada, o de las células o de ambos. La recuperación del péptido o proteína puede incluir diferentes etapas de purificación.
En general, se puede usar cualquier medio de cultivo conocido adecuado para el crecimiento del hospedante seleccionado en este procedimiento. En diferentes realizaciones, el medio es un medio rico o un medio mínimo. También se contempla en la presente memoria un procedimiento, en el que las etapas de hacer crecer las células y expresar el péptido o proteína comprenden el uso de diferentes medios. Por ejemplo, la etapa de crecimiento se puede llevar a cabo usando un medio rico que se reemplaza por un medio mínimo en la etapa de expresión. En ciertos casos, el medio se selecciona del grupo que consiste en medio LB, medio TB, medio 2YT, medio sintético y medio mínimo.
En algunas realizaciones, se añade glicerol al medio de cultivo en concentraciones de 0,1 % en v/v hasta 50 % en v/v. La adición de glicerol al medio de crecimiento puede influir positivamente en la cantidad de péptido o proteína
5
10
15
20
25
30
35
40
45
50
55
60
secretada. Sin desear estar sujeto a una teoría específica, se cree que la velocidad de plegamiento de las proteínas y péptidos expresados de forma recombinante en el citoplasma de la célula hospedante de expresión, se reduce debido a la presencia de glicerol en el medio de cultivo. A medida que se reduce la velocidad de plegamiento de péptidos o proteínas intracelulares, aumenta la eficacia de la secreción.
En algunas realizaciones, el procedimiento anterior comprende además la secreción del péptido o proteína recombinante en el medio de cultivo cultivando la célula hospedante en condiciones que permiten la secreción del péptido o proteína recombinante en el medio de cultivo. La expresión «condiciones que permiten la secreción del péptido o proteína recombinante en el medio de cultivo» significa que la temperatura y el medio se eligen de modo que sea secretado el péptido o proteína de interés. En algunas realizaciones, esto implica complementar el medio con un inductor de expresión de proteínas o cambiar un parámetro físico para inducir la expresión de proteínas. Por ejemplo, si el vector que codifica el péptido o la proteína de interés se construye de manera que la secuencia que codifica el péptido o proteína de interés se encuentre bajo control transcripcional, se puede añadir al medio la adición de un sustrato que libera la supresión del control de la transcripción o las condiciones de cultivo se pueden restablecer para inducir la transcripción. Por lo tanto, en algunas realizaciones, el medio puede complementarse con IPTG, arabinosa, triptófano y/o maltosa, y/o se puede cambiar la temperatura del cultivo y/o el cultivo se puede exponer a luz UV. En diferentes realizaciones, las condiciones que permiten la secreción del péptido o proteína recombinante son las mismas que se usan para la expresión del péptido o proteína.
En algunas realizaciones, la célula hospedante es una célula procariota, tal como E. coli, en particular E. coli BL21 (DE3) y E. coli DH5a.
Además, en diferentes realizaciones preferidas donde se desea la secreción y la molécula de ácido nucleico o vector de la invención incluye la tercera secuencia de ácido nucleico que codifica HlyA o uno de sus fragmentos, la célula hospedante puede expresar los otros componentes del T1SS. Estos componentes pueden incluir HlyB y HlyD, en los que en algunos casos las dos proteínas son expresadas de forma endógena, mientras que en otros casos las dos proteínas son expresadas de forma recombinante. En el último caso, las moléculas de ácido nucleico que codifican HlyB y/o HlyD pueden estar comprendidas en el vector que alberga la molécula de ácido nucleico de la presente invención. Alternativamente, ambas proteínas están codificadas juntas en uno o dos vectores adicionales. Por ejemplo, HlyB y HlyD pueden estar codificados en un solo vector de expresión que comprende varios sitios de integración para codificar secuencias de ácido nucleico. Dicho vector también puede comprender una molécula de ácido nucleico de la presente invención. Los vectores adecuados pueden ser vectores Duet (Novagen) o derivados de los mismos. El uno o los dos vectores adicionales mencionados anteriormente pueden comprender marcadores de selección que son iguales o diferentes del marcador de selección del vector de la presente invención. Las células hospedantes que comprenden la combinación deseada de vectores de expresión se pueden seleccionar fácilmente si los marcadores de selección de los vectores empleados son diferentes entre sí. En algunas realizaciones, si la célula hospedante no expresa TolC de manera endógena, también puede estar comprendida una molécula de ácido nucleico que codifica TolC en uno de los vectores comprendidos en la célula hospedante o introducirse en el hospedante con un vector adicional. En algunas realizaciones, si se desea la expresión y secreción del péptido o proteína recombinante de la presente invención, la célula hospedante expresa HlyB, HlyD y TolC además del péptido o proteína recombinante de la presente invención. Esto permite la secreción del péptido o proteína recombinante, si el péptido o proteína comprende HlyA, un fragmento C-terminal de la misma, como se ha definido anteriormente, o un homólogo de la misma. Alternativamente, el péptido o proteína recombinante también puede ser secretado si el péptido o proteína de interés se elige del grupo de sustratos del sistema de secreción tipo 1 como se describe en la presente memoria.
En algunas realizaciones, el cultivo completo de la célula hospedante, p. ej., durante el crecimiento y la expresión, se lleva a cabo en un medio mínimo. En diferentes realizaciones, el procedimiento comprende la secreción del péptido o proteína recombinante y, durante la secreción, la célula hospedante se puede cultivar en un medio mínimo. El medio mínimo es ventajoso si se secreta el péptido o proteína recombinante, ya que el contenido de proteínas, lípidos, carbohidratos, pigmentos e impurezas en este medio se reduce y por lo tanto evita o reduce la necesidad de etapas de purificación exhaustivas.
Además, los autores de la invención encontraron que una complementación del medio de cultivo con sales de metales alcalinotérreos es ventajosa para la secreción del péptido o proteína recombinante de la presente invención. Para una mejora de la secreción, el medio se puede complementar al menos durante la secreción o durante todo el cultivo celular con al menos una sal de metal alcalinotérreo. En algunas realizaciones, la concentración final en el medio está en el intervalo de 1-40 mM. En algunas realizaciones, el medio de secreción se puede complementar con al menos una sal de metal alcalinotérreo seleccionada del grupo que consiste en una sal de magnesio, sal de calcio, sal de estroncio o sal de bario. En algunas realizaciones, el medio de secreción comprende 1-40 mM de una sal de calcio. La concentración total de sal de metal alcalinotérreo 1-40 mM se puede lograr combinando varias sales de diferentes metales alcalinotérreos y/o el mismo metal alcalinotérreo. Si el metal alcalinotérreo se selecciona de sal de magnesio, sal de calcio, sal de estroncio o sal de bario, la composición puede comprender 1-40 mM de una única sal de calcio, estroncio o bario o de combinaciones de varias sales de magnesio, calcio, estroncio o bario, conduciendo a una concentración total en el intervalo de 1-40 mM. En particular, se puede lograr una concentración de sal de calcio en el intervalo de 1-40 mM combinando varias sales de calcio que conducen a una concentración total de 1-40 mM. En algunas realizaciones, las sales de calcio se seleccionan del grupo que consiste en CaCl2,
5
10
15
20
25
30
35
40
45
50
55
CaCO3, Ca(OH)2, CaSO4^2H2O, Ca3(PO4)2, Ca(CH3COO)2^O y Ca(C2H3O2)2. En una realización específica, el medio contiene iones Ca2+ 1-40 mM. Por consiguiente el medio complementado puede ser el medio usado en la etapa de cultivo que permite la expresión y/o secreción del péptido o proteína.
En particular, si el péptido o proteína recombinante de la presente invención comprende una o más repeticiones GG de HlyA, la eficacia de la secreción aumenta significativamente si el medio se complementa con sales de metales alcalinotérreos. Por lo tanto, en algunas realizaciones, el péptido o proteína recombinante comprende al menos una secuencia de aminoácidos como se expone en cualquiera de las sEq ID NO: 41-49 o sus fragmentos C-terminales, en la que la secuencia de aminoácidos comprende al menos la secuencia como se expone en la SEQ ID: 49 o sus homólogos que tienen al menos 91 % de identidad de secuencia.
En algunas realizaciones, el péptido o proteína recombinante expresado es un péptido o proteína recombinante como se describe en la presente memoria. En algunas realizaciones, la proteína expresada y secretada se selecciona del grupo de proteínas y péptidos descrito anteriormente.
En diferentes realizaciones, el procedimiento también abarca la purificación del péptido o proteína recombinante, en la que el péptido o proteína recombinante se purifica usando un procedimiento seleccionado de cromatografía de afinidad, cromatografía de intercambio iónico, cromatografía de fase inversa, cromatografía de exclusión por tamaño molecular y sus combinaciones.
En varias realizaciones, el procedimiento puede comprender el tratamiento del péptido o proteína recombinante con una proteasa adecuada para la escisión de un sitio de escisión de proteasa dentro del péptido o proteína recombinante. En algunas realizaciones, el péptido o proteína recombinante se purifica antes de la escisión proteolítica usando uno o más procedimientos descritos anteriormente. También después de la escisión del péptido o proteína recombinante, el procedimiento puede comprender una etapa de purificación adicional como se ha definido anteriormente. Por lo tanto, en algunas realizaciones, el péptido o proteína recombinante se purifica, se somete a escisión proteolítica y el péptido o proteína de interés se purifica adicionalmente.
Después de la purificación y/o secreción del péptido o proteína de la presente invención, en particular del péptido o proteína de interés, el péptido o proteína se puede fusionar a un resto que prolonga la semivida en el suero del péptido o proteína. Dichos restos son bien conocidos en la técnica y los expertos en la técnica pueden recurrir a la práctica habitual para identificar restos adecuados. Los restos de ejemplo incluyen, pero no se limitan a una parte Fc de una inmunoglobulina, un dominio CH3 de una inmunoglobulina, un dominio CH4 de una inmunoglobulina, albúmina o un fragmento de albúmina, un péptido de unión a albúmina, una proteína de unión a albúmina, transferrina, una molécula de polialquilenglicol, hidroxietil-almidón, ácido palmítico y otras moléculas de ácidos grasos. La fusión puede ser en el extremo N o C, pero también puede ser en una cadena lateral de aminoácido que sea susceptible de dicha modificación, incluyendo las cadenas laterales de cisteína, lisina, serina, treonina, ácido glutámico y ácido aspártico.
En varias otras realizaciones, los restos de cisteína en la secuencia polipeptídica del péptido o proteína de la presente invención, p. ej., el péptido o proteína de interés, se pueden mutar a otros aminoácidos o eliminar, por ejemplo, para evitar la formación de puente disulfuro. En otras realizaciones, el péptido o proteína de la invención puede incluir uno o más aminoácidos que están mutados a restos de cisteína con el fin de generar sitios de acoplamiento para modificaciones, por ejemplo para la conjugación con otros compuestos, tales como polietilenglicol (PEG), biotina, péptidos o proteínas, o para la formación de enlaces disulfuro que no se encuentran de forma natural. Por lo tanto, el procedimiento descrito antes también puede comprender el acoplamiento de compuestos, tales como polietilenglicol (PEG), biotina, péptidos o proteínas, o para la formación de enlaces disulfuro que no se encuentran de forma natural.
Se describe además en la presente memoria el uso de un vector o molécula de ácido nucleico como se describe en la presente memoria, para la expresión de un péptido o proteína recombinante. El vector se puede usar para la expresión y secreción de un péptido o proteína recombinante. La expresión o expresión y secreción se pueden lograr usando el procedimiento descrito en la presente memoria.
Se describe además en la presente memoria que la secreción de un péptido o proteína de interés se puede lograr y/o mejorar en comparación con otros sistemas de secreción si la secuencia que codifica el péptido o proteína de interés está comprendida en una molécula de ácido nucleico en la que en 3' respecto a esta secuencia que codifica el péptido o proteína de interés, está presente una secuencia que codifica un fragmento de HlyA específico, en la que el fragmento consiste en la secuencia de nucleótidos como se expone en la sEq ID NO: 34 o su complementaria. Las proteínas de fusión codificadas por estas moléculas nucleicas son secretadas más eficazmente que las proteínas de fusión conocidas que usan sistemas de secreción tipo 1. Además, las proteínas de fusión de la presente invención son secretadas más eficazmente que las proteínas de fusión que implican otros sistemas de secreción. Además, la secreción de las proteínas de fusión de la presente invención por el sistema de secreción tipo 1, permite la exportación directa de las proteínas de fusión al entorno extracelular y evita el daño proteolítico de estas proteínas de fusión y aumenta la estabilidad de las proteínas de fusión en el espacio extracelular.
Se describe en la presente memoria una molécula de ácido nucleico que comprende o consiste en una primera
5
10
15
20
25
30
35
40
45
50
55
secuencia de ácido nucleico, en la que dichas primeras secuencias de ácido nucleico tienen la secuencia de nucleótidos expuesta en la SEQ ID NO: 34 o su complementaria. Alternativamente, la primera secuencia de ácido nucleico puede tener una secuencia de nucleótidos que tiene al menos 70 %, al menos 80, al menos 90, al menos 95, al menos 97,5, al menos 99 o al menos 99,5 % de identidad de secuencia con la secuencia de nucleótidos como se expone en la SEQ ID NO: 34 o su complementaria. Puede tener una secuencia de nucleótidos que codifica el polipéptido con la secuencia de aminoácidos expuesta en la SEQ ID NO: 46 o uno de sus homólogos. El homólogo de la secuencia expuesta en la SEQ ID NO: 46 comparte al menos 80, preferentemente 90, más preferentemente 91, incluso más preferentemente 95 % o más de identidad de secuencia con la secuencia de aminoácidos expuesta en la SEQ ID NO: 46 y puede tener la misma longitud.
La molécula de ácido nucleico no incluye la secuencia de longitud completa que codifica la HlyA, como se expone por ejemplo en la SEQ ID NO: 29. La molécula de ácido nucleico puede no codificar una proteína de longitud completa HlyA o uno de sus fragmentos diferente de la expuesta en la SEQ ID NO: 46 o su homólogo. Esto significa que la secuencia de nucleótidos puede tener al menos 70, 80, 90, 95, 97,5, 99 o 99,5 % de identidad de secuencia con la secuencia indicada en la SEQ ID NO: 34 y todavía codifica el polipéptido de SEQ ID NO: 46 o uno de sus homólogos.
Una molécula de ácido nucleico puede por lo tanto comprender o consistir en la primera secuencia de ácido nucleico como se ha definido antes y una segunda secuencia de ácido nucleico, en la que la segunda secuencia de ácido nucleico codifica al menos un péptido o proteína de interés. La segunda secuencia de ácido nucleico puede estar situada en 5' o 3' de la primera secuencia de ácido nucleico, pero preferentemente está en 5' de la primera secuencia de ácido nucleico. Ambas secuencias pueden estar directamente adyacentes entre sí o estar conectadas por una secuencia conectora.
La segunda secuencia de ácido nucleico que codifica un péptido o proteína de interés se puede definir como se ha descrito antes en conexión con los otros aspectos de la invención, en particular, las construcciones de ácido nucleico que comprenden fragmentos de secuencia de HlyC.
La molécula de ácido nucleico puede comprender además al menos una tercera secuencia de ácido nucleico que codifica un marcador de afinidad y/o un sitio de escisión de proteasa, en la que la al menos una tercera secuencia de ácido nucleico está operativamente unida al extremo 5' y/o 3' de la primera molécula de ácido nucleico y/o la al menos una segunda molécula de ácido nucleico. La tercera secuencia de ácido nucleico se define similar a la cuarta secuencia de ácido nucleico descrita anteriormente en conexión con las moléculas de ácido nucleico que contienen el fragmento de HlyC.
La molécula de ácido nucleico puede comprender o consistir en una secuencia de ácido nucleico como se expone en una cualquiera de las SEQ ID NO: 67, 72, 75, 80, 85, 90, 94, 99, 104, 111, 116, 121, 126, 131, 136, 141, 146, 221, 228, 235, 240, 245, 250, 255, 260, 265, 270, 275, 280, 285, 290, 295, 300, 305, 315, 326, 328, 330 y 332.
La molécula de ácido nucleico puede comprender al menos la primera y la segunda secuencias de ácidos nucleicos como se han definido antes y se puede construir de manera que la primera secuencia de ácido nucleico se traduce en un péptido o proteína individual. La molécula de ácido nucleico puede comprender al menos la primera y la segunda secuencias de ácidos nucleicos como se ha definido antes y se puede construir de manera que la primera y la segunda secuencias de ácidos nucleicos se traducen en un péptido o proteína de fusión. La molécula de ácido nucleico se puede construir de modo que una vez que se traduce la secuencia de ácido nucleico, se fusionan el péptido o proteína codificada por la primera secuencia de ácido nucleico y el péptido o proteína codificada por la segunda secuencia de ácido nucleico. «Fusionado», como se usa en este contexto, significa que los péptidos o proteínas resultantes están directamente conectados entre sí o unidos por uno o más aminoácidos, péptidos o proteínas, p. ej., uno o más sitios de escisión de proteasas y/o marcadores de afinidad.
Las moléculas de ácido nucleico pueden estar comprendidas en vectores que se definen como se ha descrito antes en conexión con las otras construcciones de ácido nucleico de la invención. De forma similar, estas moléculas de ácido nucleico y vectores pueden estar comprendidos en células hospedantes, como se ha definido. También se describen en la presente memoria los péptidos o proteínas recombinantes codificados por estas moléculas de ácido nucleico. Estos péptidos o proteínas recombinantes pueden comprender o consistir en una secuencia de aminoácidos seleccionada del grupo que consiste en las SEQ ID NO: 46, 68, 73, 76, 81, 86, 91, 95, 100, 105, 113, 117, 122, 127, 132, 137, 142, 147-150, 222, 229, 236, 241, 246, 251, 256, 261, 266, 271, 276, 281, 286, 291, 296, 301, 306, 316 y 333 -336.
Se describe además en la presente memoria un procedimiento para la expresión de un péptido o proteína recombinante que usa las moléculas de ácido nucleico descritas anteriormente que puede comprender las etapas de:
(a) introducir una molécula de ácido nucleico o un vector como se ha descrito antes en una célula hospedante adecuada, en la que la molécula de ácido nucleico o vector codifica el péptido o proteína recombinante; y
(b) cultivar la célula hospedante en un medio de cultivo en condiciones que permiten la expresión del péptido o proteína recombinante y opcionalmente la secreción del péptido o proteína recombinante en el medio de cultivo.
5
10
15
20
25
30
35
40
45
El procedimiento se puede definir además como los otros procedimientos de la invención descritos anteriormente. Específicamente, el procedimiento puede comprender además recuperar el péptido o proteína expresado de la célula hospedante y/o del medio de cultivo. Además, la célula hospedante puede ser una célula procariota; y/o la célula hospedante puede expresar HlyB y HlyD; y/o la expresión se puede llevar a cabo en un medio de cultivo mínimo; y/o el medio de cultivo puede comprender Ca2+ 1-40 mM; y/o el péptido o proteína recombinante expresado puede ser el péptido o proteína recombinante descrito anteriormente y comprender o consistir en una secuencia de aminoácidos seleccionada del grupo que consiste en las SEQ ID NO: 46, 68, 73, 76, 81, 86, 91 , 95, 100, 105, 113, 117, 122, 127, 132, 137, 142, 147-150, 222, 229, 236, 241, 246, 251, 256, 261, 266, 271, 276, 281, 286 , 291, 296, 301, 306, 316 y 333-336; y/o el péptido o proteína recombinante se puede purificar usando un procedimiento seleccionado de cromatografía de afinidad, cromatografía de intercambio iónico, cromatografía de fase inversa, cromatografía de exclusión por tamaño molecular y sus combinaciones; y/o el procedimiento puede comprender el tratamiento del péptido o proteína recombinante con una proteasa adecuada para la escisión de un sitio de escisión de proteasa dentro del péptido o proteína recombinante; y/o el procedimiento puede comprender una etapa de escisión seguida de purificación del péptido o proteína recombinante.
Se entiende que las realizaciones específicas descritas anteriormente en relación con los procedimientos de expresión de proteínas y péptidos usando las moléculas de ácido nucleico que contienen HlyC/gap también están dirigidas a la aplicación a los procedimientos de expresión de proteínas y péptidos que usan las moléculas de ácido nucleico que contienen el fragmento de HlyA específico.
Ejemplos
Materiales y procedimientos
Expresión del hospedante: Escherichia coli BL21 (DE3) (Novagen)
Plásmidos para la expresión de HlyB y HlyD: pSJ37 HlyB,D o pK184 HlyB,D se han descrito previamente en Jenewein, S. (2008), Dissertation Heinrich-Heine-University Düsseldorf y Bakkes y col. (2010) JBC; 285 (52): 4057380, respectivamente.
Todos los oligonucleótidos se adquirieron en Eurofins MWG.
Las secuencias de nucleótidos de codones optimizados que codifican la exenatida, calcitonina humana, calcitonina de salmón, Fuzeon y factor liberador de corticotropina humana se adquirieron en Genscript. La secuencia de nucleótidos que codifica la HlyC del plásmido pHly152 se adquirió en Genscript.
Todas las enzimas se adquirieron en NEB, Clontech, Invitrogen o Fermentas.
Protocolo de expresión
1. Transformación de células químicamente competentes con un vector de expresión que codifica el péptido o proteína de interés y siembra en placa de las células transformadas en placas de agar LB que comprenden antibiótico(s) adecuado(s) para la selección de las células transformadas.
2. Incubación de las placas de agar durante la noche a 37 °C.
3. Inoculación en medio 2YT que comprende antibióticos de una sola colonia de la placa de agar para cultivo de una noche.
4. Incubación a 37 °C y agitación del cultivo durante la noche.
5. Inoculación en el cultivo principal que comprende medio 2YT y opcionalmente CaCl2 5 mM, del cultivo de una noche dando como resultado una DO600 de 0,01 - 0,2 (matraces +/- deflectores, dependiendo de la proteína que se va a secretar)
6. Incubación del cultivo a 37 °C a diferentes rpm, dependiendo de la identidad del péptido o proteína de interés.
7. Inducción de la expresión del péptido o proteína de interés con IPTG 1 mM a una DO600 de 0,4 -1,0.
8. Incubación de los cultivos durante 4-8 horas, dependiendo de la proteína que se va a expresar.
9. Centrifugación de las células durante 30 min a 50.000 g y 4 °C.
10. Lisis de las células bacterianas.
11. Purificación cromatográfica por FPLC usando una columna de exclusión por tamaño molecular (Superdex 75 16/60) para separar la proteína de interés de otros componentes de lisado.
Protocolo de expresión y secreción
5
10
15
20
25
30
35
40
45
50
1. Transformación de células químicamente competentes con un vector de expresión que codifica el péptido o proteína de interés fusionado con un sustrato de secreción, p. ej., pSU-A1 + péptido/proteína de fusión, y un vector de expresión que codifica HlyB y HlyD y siembra de las células transformadas en placas de agar LB que comprenden antibiótico(s) adecuado(s) para la selección de las células transformadas, p. ej., ampicilina y kanamicina.
2. Incubación durante la noche a 37 °C.
3. Inoculación en medio 2YT que comprende antibióticos de una única colonia para un cultivo de una noche.
4. Incubación a 37 °C y agitación del cultivo durante la noche.
5. Inoculación en el cultivo principal y opcionalmente CaCl2 5 mM, del cultivo de una noche dando como resultado una DO600 de 0,01 - 0,2 (matraces +/- deflectores, dependiendo de la proteína que se va a secretar).
6. Incubación del cultivo a 37 °C a diferentes rpm, dependiendo de la identidad del péptido o proteína de interés.
7. Inducción de la expresión del péptido o proteína de interés fusionado con un sustrato de secreción y del complejo de transporte, que consiste en HlyB y HlyD, codificado por pSJ37 o pK184 HlyB, D (TolC, la tercera proteína de este complejo de transporte es expresada consecutivamente de forma endógena en E. coli) con IPTG 1 mM a una DO600 de 0,4-1-0-
8. Incubación de los cultivos durante 4 - 8 horas, dependiendo de la proteína que se va a secretar.
9. Opcionalmente: centrifugación de las células durante 30 min a 50.000 g y 4 °C.
10. Concentración del medio sin células.
11. Opcionalmente: purificación cromatográfica por FPLC usando una columna de exclusión por tamaño molecular (Superdex 75 16/60) para separar los componentes restantes del medio.
Ejemplo 1: clonación de fragmentos de HlyA
Todos los procedimientos de clonación se hicieron con el kit InFusionAdvantage Cloning Kit (ClonTech). Los procedimientos generales de biología molecular son bien conocidos por los expertos en la técnica (Sambrook y col., 2001, véase antes).
En resumen, la clonación de pSU-HlyA1 se llevó a cabo como sigue: el plásmido parental pSU-HlyA de longitud completa (SEQ ID NO: 62) que comprende la secuencia que codifica el fragmento HlyC y la secuencia gap (SeQ ID NO: 12) y HlyA (SEQ ID NO: 29) se amplificó con los oligonucleótidos psU HlyA_lin_for (5'- TATATTAATTTAAATGATAGCAATCTTACTG-3', SEQ ID NO: 53) y pSU HlyA_lin_rev (5'- TTAATTACCTCTTAACCAGTTAATG-3', SEQ ID NO: 54) para generar un plásmido linealizado. El gen que codifica HlyA1 se amplificó a partir del mismo plásmido (pSU-HlyA) con los oligonucleótidos pSU-HlyA1_for (5'- TTAAGAGGTAATTAAATGGGAAATTCTCTTGCAAAAAATG-3', SEQ ID NO: 55) y pSU-HlyA1_rev (5'- ATTTAAATTAATATATTATGCTGATGTGGTCAG-3', SEQ ID NO: 56) que contienen alargamientos 5' de 15 pb, que son complementarios de los extremos del vector linealizado para permitir la reacción de In-Fusion. Los productos de PCR extraídos en gel de ambas reacciones separadas se usaron para la reacción de In-Fusion como se describe en el manual (ClonTech). El vector resultante pSU-HlyA1 tenía la secuencia expuesta en la SEQ ID NO: 63. La secuencia que codifica HlyA1 corresponde a la secuencia expuesta en la SEQ ID NO: 34. La proteína codificada (SEQ ID NO: 46) comprende 3 repeticiones GG conservadas.
Todos los demás fragmentos C-terminales de HlyA en pSU se generaron de la misma manera usando un cebador directo adaptado para la amplificación del inserto deseado.
Otros ejemplos de construcciones eran 7 repeticiones GG de HlyA, 4 repeticiones GG de HlyA, 2 repeticiones GG de HlyA, 1 repetición GG de HlyA, repetición GG no conservada de HlyA, no repetición Gg de HlyA (secuencias codificantes SEQ ID NO: 32, 33, 35, 36, 37 y 38, las secuencias polipeptídicas correspondientes SEQ ID NO: 44, 45, 47, 48, 49 y 50).
En caso de que se desee la generación de un fragmento C-terminal, que carezca de hasta los últimos 8 aminoácidos C-terminales de la cadena polipeptídica de HlyA, el cebador inverso se puede ajustar en consecuencia.
Se usaron estrategias análogas para la generación de las correspondientes construcciones de vectores pSU que carecían de la secuencia que codifica el fragmento de HlyC y la secuencia de gap y la clonación de las correspondientes construcciones de vectores pBAD o construcciones de vectores pET, respectivamente.
Ejemplo 2: optimización del marcador del sustrato de secreción:
Con el fin de optimizar la expresión y secreción del péptido o proteína de interés, primero se investigó la expresión y
5
10
15
20
25
30
35
40
45
50
55
60
secreción del sustrato de secreción HlyA y sus fragmentos. Se generaron varias construcciones de truncamiento de HlyA basadas en el vector pSU con el fin de identificar el fragmento de HlyA que confiere al péptido o proteína de interés la mejor expresión y perfil de secreción. Por lo tanto, se cotransformaron células de E. coli BL21 (DE3) con el vector pK184 HlyB,D que codifica HlyB y HlyD y el vector pSU que codifica HlyA o su fragmento, y se sembraron en una placa de agar. La expresión de la proteína se llevó a cabo como se ha detallado antes. Después de 5 h, las células se sedimentaron por centrifugación y el medio de cultivo se guardó para una la posterior investigación. Se cargó una parte alícuota de 16 pl de cada cultivo de expresión en un gel de SDS sin purificación previa. Después del desplazamiento en el gel, las bandas de proteína se detectaron usando tinción con azul brillante de Coomassie. Los resultados se muestran en la figura 2. Las bandas 1-8 corresponden a las proteínas codificadas por las secuencias de nucleótidos expuestas en las SEQ ID NO: 29, 32-38 (las secuencias de proteínas se exponen en las SEQIDNO:41, 44-50), con las proteínas codificadas por las SEQ ID NO: 32-38 y que tienen la secuencia de aminoácidos expuesta en las SEQ ID NO: 44-50 que tienen una metionina de inicio adicional en la cadena polipeptídica. Como muestra la figura 3, todos los marcadores de sustrato de secreción se expresaron y secretaron con éxito. Los mejores resultados se obtuvieron para HlyA1 (banda 4, SEQ ID NO: 34 y 46).
Ejemplo 3: análisis de la construcción de expresión de HlyA1
Durante la secuenciación de las construcciones de HlyA descritas antes, se descubrió que el vector parental pSU- HlyA comprendía una secuencia de nucleótidos no traducida entre la región promotora y la secuencia que codifica HlyA, y que esta secuencia también se ha pasado a los vectores que codifican la fragmentos de HlyA descritos antes. Esta estructura se resalta en la figura 3 para la construcción de HlyAI. Como se indica, el ARNm resultante de la transcripción del vector comprende un fragmento de HlyC no traducido y una secuencia gap (que corresponde a la secuencia expuesta en la SEQ ID NO: 12). Estas secuencias derivan probablemente de una clonación no basada en PCR de HlyA que condujo a la integración de otros elementos del operón de hemolisina, en concreto un fragmento de la secuencia que codifica HlyC y la secuencia gap entre el elemento que codifica HlyC y HlyA. Para la estructura de este operón de hemolisina en particular, véase la figura 1.
Con el fin de analizar adicionalmente la construcción de expresión de HylA1 y la relevancia de las secuencias no traducidas adicionalmente integradas que tienen una secuencia como se expone en la SEQ ID NO: 159, se llevaron a cabo experimentos adicionales comparando la expresión y secreción de HlyA1 con o sin la presencia de la secuencia expuesta en la SEQ ID NO: 12 y los resultados se compararon con la construcción de HlyAc publicada previamente (pSOI-HlyAc, Bakkes y col. (2010) J. Biol. Chem.; 285 (52): 40573-80, que comprende una secuencia que codifica un fragmento de un sustrato del sistema de secreción de tipo 1 HlyA relacionado lejanamente, un marcador de His y un sitio de escisión de TEV en el vector pBAD). Los resultados se muestran en la figura 4, en la que la figura 4A muestra un gel de SDS teñido en el que se han cargado líquidos sobrenadantes de cultivo celular, mientras que la figura 4B muestra un gel de SDS teñido en el que se ha cargado el lisado bruto de las células correspondientes. Banda 1: pSOI-HlyAc (Bakkes y col. (2010) J. Biol. Chem.; 285 (52): 40573-80, que comprende una secuencia que codifica un fragmento de un sustrato del sistema de secreción tipo 1 relacionado con HlyA, un marcador His y un sitio de escisión de TEV en el vector pBAD), banda 2: pSOI-HlyA1 (que codifica HlyA1 (SEQ ID NO: 34, 46), vector pBAD), bandas 3 y 4: pSOI-HlyA1 + fragmento de HlyC + gap (vector que comprende el mismo inserto que pSU-HlyA1), banda 5: pSU-HlyA1 (vector que comprende el fragmento de HlyC y secuencia gap; SEQ ID NO: 63), bandas 6 y 7: pSU-HlyA1 menos fragmento de HlyC y gap (vector pSU que comprende la secuencia de inserción que codifica HlyA1 solamente (SEQ ID NO: 176)), bandas 8 y 9: pSU-HlyA1 + gap (vector pSU que comprende las secuencias que codifican HlyA1 y que corresponden a la secuencia gap (SEQ ID NO: 2 y 34)), y banda 10: pSU-HlyAc (vector pSU que comprende el fragmento de HlyC y la secuencia gap (SEQ ID NO: 12) 5" respecto a la secuencia que codifica HlyAc).
Como se puede concluir de la comparación de la banda 5 con la banda 10, HlyA1 se expresa y secreta mucho más eficazmente que la HlyAc descrita previamente. Además, la comparación de las bandas 6 y 7 con la 8 y 9 muestra que la presencia de la secuencia de gap 5" respecto a la secuencia que codifica HlyA1 es ventajosa para la expresión y secreción de HlyA1. La expresión es incluso mayor si el vector comprende tanto el fragmento de HlyC como la secuencia gap (véase la banda 5 y bandas 6 y 7). Además, HlyA1 se expresa y secreta eficientemente si el vector pBAD carece del fragmento de HlyC y la secuencia gap (banda 2). Sin embargo, la expresión aumenta si estas dos secuencias están integradas en el vector pBAD (bandas 3 y 4). Por lo tanto, los autores de la invención encontraron que el uso de HlyA1 es ventajoso con respecto a la HlyAc descrita previamente. Además, la presencia de la secuencia que codifica el fragmento de HlyC y la secuencia de gap 5" respecto a la secuencia que codifica HlyA1 o HlyAc aumenta la expresión y secreción de ambas proteínas. Por lo tanto, se puede concluir que estas secuencias potencian la expresión de péptidos y proteínas en general. Además, la secuenciación del plásmido pSU puso de manifiesto que el vector comprende un origen de replicación homólogo a los orígenes de número de copias bajo, mientras que pBAD es un vector de número de copias de bajo a intermedio. Por lo tanto, el uso del vector pSU es particularmente ventajoso frente al pBAD en presencia del fragmento de HlyC y la secuencia gap (compárese la expresión de HlyA1 en las bandas 3 y 4 con la banda 5 y las bandas 6 y 7) y parece que el uso de vectores de número de copias bajo es particularmente ventajoso en combinación el con fragmento de HlyC y la secuencia gap.
Ejemplo 4: expresión/secreción de HlyAl
Con el fin de determinar la expresión media y la velocidad de secreción para HlyA1 (SEQ ID NO: 46), se llevaron a
5
10
15
20
25
30
35
40
45
50
cabo en paralelo varios cultivos que comprendían esta construcción de expresión (SEQ ID NO: 63), como se ha descrito antes. 5 horas después de la inducción de la expresión (la DO600 del medio era aproximadamente 5), los protocolos de expresión se han dado anteriormente, las células se separaron del líquido sobrenadante del cultivo celular y se cargaron 16 jl de líquido sobrenadante en un gel de SDS-PAGE. En paralelo, se cargó un segundo gel de SDS-PAGE con cantidades definidas de una dilución de BSA. Después de completar la electroforesis, ambos geles se tiñeron con azul brillante Coomassie (Fig. 5). Usando un procedimiento densitométrico, las intensidades de tinción del gel de BSA sirvieron como una calibración aproximada para la evaluación de las bandas detectadas en el gel de HlyA y la determinación de las cantidades de proteína secretada. La cuantificación puso de manifiesto que se secretaron entre 625 - 930 mg de HlyA1 por litro de medio de cultivo, que corresponde a aproximadamente 200 mg/DO y litro de cultivo celular, que es aproximadamente 30 veces mayor que los resultados publicados anteriormente para la HlyAc (Bakkes y col. (2010) J. Biol. Chem.; 285 (52): 40573 - 80).
Ejemplo 5: purificación de HlyA1
Una muestra de 50 ml del líquido sobrenadante de cultivo celular descrito antes se sometió a cromatografía de exclusión por tamaño molecular. Se tomaron fracciones de 3 ml y se analizaron usando SDS-PAGE. Se obtuvieron 550 |jl de HlyA1 con una concentración de proteína de 20,5 mg/ml. Los resultados demuestran que se obtuvo una muestra homogénea de HlyA1 después de la cromatografía de exclusión por tamaño molecular (datos no mostrados).
Ejemplo 6: expresión de HlyA1 en medio mínimo
HlyA1 se expresó y secretó en un medio mínimo, ya que esto reduce los esfuerzos de purificación. Se recogieron los cotransformantes de E. coli BL21 (DE3) pSU-HlyA1 (SEQ ID NO: 63) + pk184 HlyB,D (Jenewein, Bakkes y col., véase antes) de la placa de agar descrita antes y se cultivaron durante la noche. Se transfirió una parte alícuota de cada cultivo a medio de cultivo de expresión que comprendía medio mínimo complementado con los antibióticos adecuados, conduciendo a una DO600 de 0,1. Cuando los cultivos alcanzaron una DO600 de 0,6, se indujeron la expresión y la secreción usando IPTG y el cultivo continuó durante otras 5 horas, alcanzando una DO600 de 1,4. Después las células se separaron del medio de cultivo por centrifugación. Se cargó una parte alícuota de 16 jl de cada líquido sobrenadante de cultivo celular y lisado de células enteras de cultivos seleccionados en un gel de SDS. La cuantificación puso de manifiesto que HlyA1 se secretó en un nivel de 100 mg/DO (Figura 6).
Ejemplo 7: construcción de proteínas de fusión de HlyA1
Con el fin de investigar la eficacia de la expresión y la secreción asistida por HlyA1 de péptidos o proteínas de interés, se generaron varias proteínas de fusión de HlyA1. Por lo tanto, el vector pSU-HlyA1 (SEQ ID NO: 63) se usó como sitio de integración de la secuencia que codifica el péptido o proteína de interés. Las secuencias que codifican los péptidos o proteínas de interés se integraron entre el codón de inicio de HlyA1 y el resto de la secuencia de HlyA1.
Clonación del interferón alfa 2b [Homo sapiens]
Se amplificó pSU-HlyA1 con los oligonucleótidos pSU HlyA1_lin_for (5'-GGAAATTCTCTTGCAAAAAATGTATTA-3', SEQ ID NO: 57) y pSU HlyA1_lin_rev (5'-CATTTAATTACCTCTTAACCAGTTAATG-3', SEQ ID NO: 58) para generar un plásmido linealizado.
En general, los genes de interés se amplificaron a partir de un ADN molde con oligonucleótidos cebadores que se reasocian con el primer codón después del ATG de inicio (directo) y hasta el último aminoácido que carece del codón de parada (inverso). Los oligonucleótidos cebadores comprendían 15 pb adicionales de la secuencia 5'- AGAGGTAATTAAATG-3' (directo, SEQ ID NO: 160) y 5'-TGCAAGAGAATTTCC-3' (inverso, SEQ ID NO: 161) en sus extremos 5' ' para generar fragmentos que tienen extremos homólogos al vector pSU-HlyA1 linealizado.
Para la amplificación del gen de IFNa2 se eligió como molde un vector que comprende la secuencia de interferón alfa 2 que codifica INFa2 (GenBank: n.° de acceso: NP_000596, versión: NP_000596.2 GI: 11067751, número de acceso de Uniprot: Q86UP4 (Última modificación el 27 de julio de 2011. Versión 48). Se usaron los siguientes oligonucleótidos en la reacción de amplificación:
pSU-IFN2a_para
(AGAGGTAATTAAATGTGTGATCTGCCGCAGACTC, SEQ ID NO: 59) y pSU-IFN2a_rev
(TGCAAGAGAATTTCCTTCCTTACTTCTTAAACTTTCTTGCAAGTTT, SEQ ID NO: 60).
Para la construcción de una proteína de fusión que comprende un sitio de escisión del factor Xa entre HlyA1 y el interferón alfa 2, la reacción de amplificación se llevó a cabo con el mismo cebador directo y el siguiente inverso:
5' - TGCAAGAGAATTTCCACGGCCATCAATTTCCTTACTTCTTAAACTTTCTTGCAAGTTT-3' (SEQ ID NO: 61)
Las letras subrayadas marcan los codones que codifican el sitio Xa (secuencia de aminoácidos codificada, inversa y complementaria: IDGR), la letra negrita corresponde al final del pSU-A1 linealizado con el ATG de inicio, las letras en cursiva corresponden al final del pSU-HlyA1 linealizado que comprende el gen de HlyA1.
La reacción de In-Fusion se llevó a cabo según el manual (ClonTech) con productos de PCR extraídos con gel. La 5 construcción de ácido nucleico resultante que comprende el fragmento de HlyC y la secuencia gap, interferón alfa 2 y HlyA1, tenía una secuencia de nucleótidos como se expone en la SEQ ID NO: 125 y codificaba una proteína que tiene una secuencia de aminoácidos como se expone en la SEQ ID NO: 127.
Del mismo modo, la calbindina (CalB), precursor del beta-amiloide Mab40, precursor del beta-amiloide Mab42, proteína de unión al péptido de Alzheimer (Zab3), exenatida, Fuzeon, calcitonina humana, calcitonina de salmón, 10 factor liberador de corticotropina humana, factor liberador de corticotropina humano dimérico, interferón gamma humano, interferón gamma murino, nisina, ifnar12, ifnar34 e IFABP, se clonaron usando los siguientes cebadores para dar la secuencia codificante y la secuencia de proteína indicadas. Habitualmente, el vector de ADN que comprende un gen que codifica el péptido o proteína de interés servía como molde para la reacción de amplificación, excepto para exenatida, calcitonina humana, calcitonina de salmón, Fuzeon y factor liberador de corticotropina 15 humana donde el ADN sintético servía como molde. En las secuencias de nucleótidos sintéticas se llevó a cabo la optimización de codones para la expresión en E. coli.
Péptido/proteína de interés
Proteína de tipo natural, número de acceso número de versión, fecha Construcción Cebador directo SEQ ID NO: Cebador inverso SEQ ID NO: Secuencia de inserto del vector/ secuencia codificante SEQ ID NO: Secuencia de proteína/ SEQ ID NO:
CalB
Acceso P41365 Versión P41365.1 GI: 1170790, PLN 31-MAY-2011 HlyCfragm- gap-CalB- HlyA1 64 65 66/67 68
precursor del péptido beta- amiloide [Homo sapiens], 40 aminoácidos
Acceso AAB26265 Versión AAB26265.2 GI: 8176534, 14-JUL-2000 HlyCfragm- gap-Mab40- HlyA1 69 70 71/72 73
precursor del péptido beta- amiloide [Homo sapiens], 42 aminoácidos,
Acceso AAB26265 Versión AAB26265.2 GI: 8176534, 14-JUL-2000 HlyCfragm- gap-Mab42- HlyA1 155 156 74/75 76
Proteína de unión al péptido de Alzheimer (Zab3) con marcador-His
2OTK E Versión 2OTK E GI: 167744864, 13-FEB-2008 HlyCfragm- gap-Zab3- HlyA1 77 78 79/80 81
Exenatida
1JRJ A Versión 1JRJ A GI: 17942697, VRT 10-JUL-2009 HlyCfragm- gap- Exenatide- HlyA1 82 83 84/85 86
Fuzeon
Acceso 3H00_A Versión 3H00 A GI: 281307071, VRL 19-DEC-2009 HlyCfragm- gap-Fuzeon- HlyA1 87 88 89/90 91
calcitonina humana
Acceso ACB14881 Versión ACB14881.1 GI: 170320110, SYN 24-MAR-2008 HlyCfragm- gap-hu calcitonin- HlyA1 92 151 93/94 95
calcitonina de salmón
Acceso BAA00281 Versión BAA00281.1 GI: 220946, SYN 21-MAY-2003 HlyCfragm- gap-sal calcitonin- HlyA1 96 97 98/99 100
factor liberador de corticotropina humana
Acceso AAX18228 Versión AAX18228.1 GI: 60280464, VRT 01-OCT-2005 HlyCfragm- gap-HCRF- HlyA1 101 102 103/104 105
Péptido/proteína de interés
Proteína de tipo natural, número de acceso número de versión, fecha Construcción Cebador directo SEQ ID NO: Cebador inverso SEQ ID NO: Secuencia de inserto del vector/ secuencia codificante SEQ ID NO: Secuencia de proteína/ SEQ ID NO:
Factor liberador de corticotropina humana doble
Acceso AAX18228 Versión AAX18228.1 GI: 60280464, VRT 01-OCT-2005 HlyCfragm- gap-HCRF- Fxa-HCRF- HlyA1 Primer conjunto: 106 Segundo conjunto: 108 Primer conjunto: 107 Segundo conjunto: 109 110/111 112
interferón gamma humano, incluido el sitio de escisión de Fx
Acceso NP_000610 Versión NP 000610.2 GI: 56786138, PRI 02-OCT-2011 HlyCfragm- gap-hu IFN gamma- HlyA1 113 114 115/116 117
IFN gamma murino, incluido el sitio de escisión de Fx
Acceso NP_032363 Versión NP 032363.1 GI: 33468859, ROD 02-OCT-2011 HlyCfragm- gap-mu IFN gamma- HlyA1 118 119 120/121 122
nisina
Acceso P13068 Versión P13068.1 GI: 125973, BCT 03-MAY-2011 HlyCfragm- gap-Nisin- HlyA1 128 129 130/131 132
Ifnar 1,2 humano (que carece del péptido señal)
Acceso AAH02590 Versión AAH02590.1 GI: 33876901, PRI 30-SEP-2003 HlyCfragm- gap-Ifnar 1,2-HlyA1 133 134 135/136 137
Ifnar 3,4 humano
Acceso P17181 Versión P17181.3 GI: 90110827, PRI 21-SEP-2011 HlyCfragm- gap-Ifnar 3,4-HlyA1 138 139 140/141 142
IFABP
Acceso NP_037200 Versión NP 037200.1 GI: 6978827, ROD 14-AGO-2011 HlyCfragm- gap-IFABP- HlyA1 152 153 145/146 147
HlyCfragm-gap-HCRF-HCRF-HlyA1 se clonó usando la siguiente estrategia: El gen sintético se amplificó con los oligonucleótidos pSU-Hum.Corti_for y pSU-Hum.Corti2x_rev (SEQ ID NO: 106 y 107). El vector pSU-Hum.Cortico que comprende la construcción HlyCfragm-gap-HCRF-HlyA1 se amplificó y linealizó por PCR con los 5 oligonucleótidos pSU-Cortico_lin_for y pSU HlyA1_lin_rev (SEQ ID NO: 108 y 109). Se usaron productos de PCR extraídos con gel para la reacción de In-Fusion.
Las construcciones IFABP G80V-HlyA1, IFABP G121V-HlyA1, IFABP G80V/G121V-HlyA1 se clonaron a partir de HlyCfragm-gap-IFABP-HlyA1 usando protocolos de mutagénesis estándar (véase el protocolo de mutagénesis de Quikchange, Sambrook y col., (2001), véase antes). Las proteínas resultantes fueron IFABP G80V-HlyA1, IFABP 10 G121V-HlyA1, IFABP G80V/G121V-HlyA1 (SEQ ID NO: 148-150, respectivamente).
Ejemplo 8: expresión y secreción de proteínas de fusión de HlyA1
E. coli BL21 (DE3), cotransformada con una construcción de proteína de fusión de HlyAl seleccionada de la tabla anterior y pK184-HlyB,D, se cultivó en un cultivo de expresión, como se ha detallado antes.
En una primera serie de experimentos, se investigaron las construcciones que codifican las proteínas de fusión 15 Mab40-HlyA1 y Mab42-HlyA1. Se ensayaron varias condiciones para cada construcción. Después de terminarse la expresión y secreción, se cargaron 16 pl/banda de líquido sobrenadante de cultivo celular de cada cultivo en un gel de SDS. La figura 7A muestra los resultados derivados de cultivos de E. coli que expresan Mab40-HlyA1 (SEQ ID NO: 73) en condiciones variables, mientras que los líquidos sobrenadantes cargados en el gel de la figura 7B derivaban de cultivos de E. coli que expresan Mab42-HlyA1 (SEQ ID NO: 76). Esencialmente, en todas las 20 condiciones ensayadas, se expresaron las proteínas de fusión deseadas. Además, ambas proteínas podían purificarse adicionalmente de forma satisfactoria usando cromatografía de exclusión por tamaño molecular (datos no mostrados).
5
10
15
20
25
30
35
40
45
50
55
60
En la siguiente etapa, se analizaron dos construcciones que codifican una proteína de fusión interferón alfa 2-HlyA1. La primera construcción comprendía un sitio de escisión del Factor Xa entre el interferón alfa 2 y HlyA1, mientras que este sitio de escisión estaba ausente en la segunda construcción. La figura 8 muestra un gel de SDS-PAGE sobre el cual se cargaron células enteras que expresan interferón alfa 2 (bandas en el lado izquierdo del marcador de peso molecular) o líquidos sobrenadantes de cultivo celular 16 pl/banda. La banda marcada con «-» corresponde a la proteína de fusión de interferón alfa 2-HlyA1 que carece de un sitio de escisión proteolítica entre el interferón alfa-2 y HlyA1, mientras que la banda marcada con «+» corresponde a la proteína de fusión interferón alfa 2-HlyA1 que comprende el sitio de escisión del factor Xa entre el interferón alfa-2 y HlyA1 (que corresponde a la secuencia polipeptídica como se expone en la SEQ ID NO: 127).
Además, se analizó la expresión y secreción de proteínas de fusión adicionales. Las figuras 9 y 10 muestran de forma ilustrativa la expresión satisfactoria de las proteínas de fusión IFABP (G80V)-, IFABP-, factor de liberación de corticotropina humana (HCRF)-, calcitonina de salmón-, calcitonina humana-y Fuzeon/T20- HlyA1 (SEQ ID NO: 148, 147, 105, 100, 95 y 91, respectivamente). También las proteínas de fusión CalB-, Zab3-, exenatida-, HCRF- FactorXa-HCRF-, interferón gamma humano-, interferón gamma murino-, nisina-, Ifnar1,2-, Ifnar 3,4-, IFABP G121V- e IFABP G80V/G121V- HlyA1 (SEQ ID NO: 68, 81, 86, 112, 117, 122, 132, 137, 142, 149 y 150) se expresaron y secretaron satisfactoriamente.
Ejemplo 9: plegamiento y función del interferón alfa-2-HlyA1 recombinante
Después de la expresión y secreción de interferón alfa-2-HlyA1, usando células de E. coli BL21 (DE3) que llevaban los plásmidos pK184-HlyB,D y pSU-IFNalpha2 + Xa cultivadas en 200 ml de medio 2YT, el líquido sobrenadante exento de células se concentró hasta aproximadamente de 2,2 ml. Se cargaron 2 ml en una columna de filtración en gel (Superdex 75 16/60) preequilibrada en tampón (Tris-HCl 10 mM, NaCl 120 mM, CaCl2 6 mM, pH 7,3) con un sistema de FPLC (GE Healthcare). Las fracciones de elución que contenían IFNalfa2-HlyA1 se mezclaron y se concentraron por ultrafiltración (Amicon Filter Devices, Millipore) a 480 pl. La concentración de proteína se determinó utilizando un dispositivo NanoDrop (PeqLab), la masa molecular calculada (43,54 kDA) y el coeficiente de extinción (40.590 M'1.cm_1) y se encontró que era 6,41 mg/ml. Esto corresponde a un rendimiento de aproximadamente 15 mg/l de cultivo celular. Se diluyeron 20 pl de muestra de proteína a 1 mg/ml en solución salina tamponada con fosfato de Dulbecco (DPBS) (adquirido sin complemento de calcio y magnesio) complementado con CaCl2 5 mM, y FCS al 1 % y se almacenó a -80 °C hasta su uso. En la siguiente etapa, se añadieron 30 pl de Factor Xa (NEB) a los 460 pl restantes de IFNalfa2 (6,41 mg/ml) y la mezcla se incubó durante la noche a 20 °C. El IFNalfa2 se purificó del IFN2alfa-HlyA1 sin escindir, HlyA1 y Factor Xa usando una cromatografía de intercambio aniónico. El IFNalfa 2 (19,84 kDA, 18.700 M'1.cirr1) eluyó en el flujo que pasaba y se concentró por ultrafiltración a 0,46 mg/ml (corresponde a 1 mg/ml de IFNalfa2-HlyA1) y se almacenó en DPBS complementado con CaCl2 5 mM y FCS al 1 % a -80 °C hasta su uso.
El interferón alfa 2 nativo y también el recombinante comprenden cuatro restos de cisteína. En condiciones naturales, el interferón alfa 2 comprende dos puentes de cisteína. Por lo tanto, era interesante estudiar si la proteína secretada también comprende puentes disulfuro funcionales. Se siguió un procedimiento previamente publicado (Li y col., (2002) Protein Expr. Purif., 25 (3): 437-47) preincubando una parte alícuota de esta proteína con DTT 50 mM antes de cargarla en un gel de SDS y comparando la migración de la proteína con la correspondiente proteína no reducida. Los resultados mostrados en la figura 11 indican que la formación de puentes de cisteína se produce durante el proceso de secreción, ya que la migración de la proteína cambia ligeramente debido a la preincubación con DTT. Por lo tanto, se puede suponer que el interferón alfa 2 recombinante secretado todavía tiene su plegamiento natural.
Para demostrar que el interferón alfa 2 recombinante es completamente funcional, se llevaron a cabo dos ensayos para estudiar la actividad biológica de la proteína recombinante.
El primer ensayo se basó en la evaluación de una interacción entre el interferón alfa 2 recombinante obtenido después de digestión con Factor Xa (y por lo tanto sin HlyA1) y cromatografía de intercambio aniónico, con una concentración de 0,46 mg/ml, con un elemento de respuesta estimulado con interferón (ISRE). Por lo tanto, se usó una línea celular del epitelio pigmentario de la retina humana (RPE) clonal, que alberga de manera estable un promotor/potenciador del elemento de respuesta estimulado con interferón (ISRE) frente a un gen indicador de luciferasa de luciérnaga y se vigiló la interacción del interferón alfa 2 con ISRE siguiendo una reacción de luminiscencia catalizada por luciferasa de luciérnaga, ya que la línea celular indicadora responde de manera dependiente de la dosis al tratamiento con IFN tipo I (IFN-a o IFN-p) con expresión de luciferasa (datos no mostrados). En estos experimentos, las células se sembraron simultáneamente en placas de 24 pocillos, se dejaron crecer hasta confluencia y se incubaron con las diluciones escalonadas indicadas de preparaciones de proteínas recombinantes durante 6 h a 37 °C en 5 % de CO2. Específicamente, las células se trataron con rec-IFNa2 disponible en el mercado de PBL (proveedor) que tenía una actividad en estado no diluido de 105U/ml (PBL), que servía como control positivo, HlyA1 (epítopo), que servía como control negativo, interferón alfa-2 escindido por el factor Xa y purificado (para el protocolo, véase más arriba), interferón alfa 2-HlyA1 no escindido (no escindido, 1 mg/ml de proteína), e interferón alfa 2-HlyA1 no escindido, tratado con DTT (DTT, 1 mg/l de proteína y DTT 100 mM). Todos los compuestos se ensayaron en varias diluciones que variaban de 10'3 a 10'8. Una vez finalizada la incubación, se lisaron las células y se midió la actividad de luciferasa usando el kit de ensayo del gen indicador de
luciferasa según las instrucciones del fabricante (Roche, Mannheim, Alemania) en un luminómetro de microplacas (modelo Minthras LB940, Berthold Technologies). Cada punto de medición se determinó por triplicado (n = 3). Se muestra el valor medio aritmético +/- desviación estándar. La figura 12 muestra los resultados de este experimento. A partir de estos datos, se calculó que la actividad, por ejemplo para IFNalfa2, era: 3,23 +/- 0,4*108 U/ml. Por lo 5 tanto, el interferón alfa 2 que resulta del procedimiento de la presente invención es altamente activo. A partir de ambos diagramas de la figura 12 se puede concluir que para todas las diluciones ensayadas, el interferón alfa-2 escindido producido por el procedimiento de la presente invención presentaba la actividad biológica más fuerte. También el interferón alfa-2-HlyA1 no escindido y el interferón alfa-2-HlyA1 tratado con DTT no escindido presentaron actividades más altas en comparación con el interferón alfa-2 disponible en el mercado (PBL).
10 En el segundo ensayo, se evaluó la actividad del interferón alfa 2 analizando la potencia antiviral del péptido o proteína. Específicamente, el efecto antiviral del interferón alfa-2 se analizó preincubando fibroblastos de pulmón MRC-5 humano (ATCC CCL-171) durante 24 h con la dilución indicada de la proteína recombinante y después se infectó con UFP/pocillo de rhabdovirus virus de la estomatitis vesicular (VSV). 2 días después de infección, las células vivas se tiñeron con violeta cristal (0,05 % [p/v] en etanol al 20 % [v/v]) para la contratinción y visualización 15 del efecto citolítico del VSV. Como en el ensayo anterior, rec-IFNa2 (PBL) disponible en el mercado servía como control positivo y HlyA1 (epítopo) como control negativo para la evaluación de la actividad biológica. Además, se evaluaron el interferón alfa-2-HlyA1 no escindido y el interferón alfa-2-HlyA1 tratado con DTT, no escindido. Todos los compuestos se ensayaron en varias diluciones. En todas las condiciones ensayadas, el interferón alfa-2 escindido por el Factor Xa y purificado producido por el procedimiento de la presente invención presentó la actividad 20 biológica antiviral más fuerte. El interferón alfa 2-HlyA1 no escindido y el interferón alfa 2-HlyA1 tratado con DDT, no escindido mostraron una actividad similar, que era significativamente más fuerte que el interferón alfa 2 disponible en el mercado (datos no mostrados).
Ejemplo 10: análisis de fragmentos HlyC/gap
Como se demuestra en el ejemplo 3, la presencia de un fragmento de la secuencia codificante de HlyC + la 25 denominada secuencia gap (148 nt 3"-terminales del gen de HlyC + secuencia gap de 11 nt de longitud, SEQ ID NO: 12) en la construcción de expresión podría afectar beneficiosamente a la expresión y secreción de HlyA1 (SEQ ID NO: 46). Para investigar más la influencia de esta secuencia en la expresión, se diseñaron construcciones adicionales que comprenden fragmentos de la secuencia de SEQ ID NO: 12. Para esto, el plásmido parental pSU-HlyA1 (SEQ ID NO: 63) se amplificó con oligonucleótidos en las posiciones deseadas y se ligó.
30 Se llevaron a cabo experimentos comparables usando pSU-HlyA de longitud completa (SEQ ID NO: 62) que codifica HlyA de longitud completa (SEQ ID NO: 41) en lugar de HlyA1 (SEQ ID NO: 46).
Los plásmidos pSU-HlyA1 (SEQ ID NO: 63) y pSU-HlyA de longitud completa (SEQ ID NO: 62) se usaron como plantillas. Para los truncamientos de fragmentos de HlyC 5", se usaron los siguientes oligonucleótidos cebadores en una reacción de PCR (todos fosforilados en el extremo 5', encargados en MWG Eurofins):
35 Inverso: A1minC_Pi_rev: GCTCGAATTCGTAATCATG (el mismo para todas las construcciones) (SEQ ID NO: 162)
Directo:
a) Gap5_11_Pi_for: ATTAAATGGGAAATTCTCTTGC (SEQ ID NO: 163)
b) Gap8_11_Pi_for: GTAATTAAATGGGAAATTCTCTTG (SEQ ID NO: 164)
c) Gap+6_Pi_for: GGTTAAGAGGTAATTAAATGGG (SEQ ID NO: 165)
40 d) Gap+12_Pi_for: TTAACTGGTTAAGAGGTAATTAAATG (SEQ ID NO: 166)
e) Gap+21_Pi_for: AATTTTTCATTAACTGGTTAAGAG (SEQ ID NO: 167)
f) Gap+30_Pi_for: TCAGATTTTAATTTTTCATTAACTGG (SEQ ID NO: 168)
g) Gap+51_Pi_for: ATAACTGAAGTAAAAAGAAAGTCA (SEQ ID NO: 169)
h) Gap+72_Pi_for: AAACAATATCACCACGAGTTA (SEQ ID NO: 170)
45 i) Gap+93_Pi_for: CAGTTAGCGAATAAAATTTTTAAAC (SEQ ID NO: 171)
Además, en el vector de longitud completa pSU-HlyA (SEQ ID NO: 62) se eliminó el promotor lac para investigar si el alargamiento 5' de HlyC es suficiente para la expresión y secreción y si representa un promotor independiente. Para la eliminación del promotor lac se usaron los siguientes cebadores:
Directo: MinLaPro_Pi_for: ATGATTACGAATTCGAGCTCCCAA (SEQ ID NO: 172)
50 Inverso: MinLaPro_Pi_rev: CCAACGCGCGGGGA (SEQ ID NO: 173)
5
10
15
20
25
30
35
40
45
50
Las construcciones que comprendían una eliminación del fragmento HlyC comprendían un codón ATG en el marco adicional que se eliminó por mutación para evitar la presencia de aminoácidos adicionales en el extremo N de la proteína. Los cebadores oligonucleótidos de mutación (no fosforilados) tenían la secuencia:
Del_ATG_minC_for: CAGGAAACAGCTATGACATTATTACGAATTCGAGCATGG (SEQ ID NO: 174)
Del_ATG_minC_rev: CCATGCTCGAATTCGTAATAATGTCATAGCTGTTTCCTG (SEQ ID NO:175)
pSU-HlyA1 se amplificó con el oligonucleótido A1minC_Pi_rev en combinación con cada uno de los oligonucleótidos «directos». pSU-HlyAfull se amplificó para el truncamiento de la elongación 5' con los oligonucleótidos ya usados para pSU-HlyA1 con la excepción de pSU-HlyAfull minC y pSU-HlyAfull + gap para los que se usaron los siguientes cebadores oligonucleótidos directos:
AfullminC_Pi_for: ATGACAACAATAACCACTGC (SEQ ID NO: 337)
Afull_+ Gap_Pi_for: GAGGTAATTAAATGACAACAATAAC (SEQ ID NO: 338)
Los oligonucleótidos «MinLaPro_Pi_for» y «MinLaPro_Pi_rev» se usaron para eliminar el promotor lac. Los productos de PCR se digirieron con DpnI para inactivar el ADN molde, se extrajeron en gel y se ligaron 50 ng de plásmidos linealizados durante la noche a 4 °C. Se usaron muestras de ligado para las transformaciones de células E. coli DH5a químicamente competentes y se aislaron los plásmidos de las colonias cultivadas. Todos los plásmidos se verificaron por secuenciación.
La construcción pSU-HlyA1 menos HlyC ya se usó para estudios de secreción, y se pudo detectar una pequeña señal de proteína en el líquido sobrenadante de cultivos celulares mediante tinción con CBB (véase la Fig. 4A, banda 6 y 7). Sin embargo, la proteína se desplaza ligeramente por encima de las otras, lo que indica una mayor masa molecular. En esta construcción, la eliminación del alargamiento 5' de HlyC cambió el marco de lectura y se creó un nuevo codón de inicio en el marco dando como resultado HlyA1 más 6 aminoácidos N-terminales adicionales. Por lo tanto, se usaron los oligonucleótidos Del_ATG_minC_for y Del_ATG_minC_rev en combinación con el kit de mutagénesis dirigida al sitio (Stratagene) para mutar el codón de inicio artificial. El nuevo plásmido se denominó «pSU-HlyA1 menos HlyC AATG» y la inserción de la mutación se verificó por secuenciación.
Se generaron los siguientes plásmidos: pSU-HlyA1 (SEQ ID NO: 63), pSU-HlyA1 menos HlyC (SEQ ID NO: 176), pSU-HlyA1 menos HlyC AATG (SEQ ID NO: 177), pSU-HlyA1 5/11 gap (SEQ ID NO: 178), pSU-HlyA1 8/11 gap (SEQ ID NO: 179), pSU-HlyA1 + gap (SEQ ID NO: 180), pSU-HlyA1 +gap+ 6 (SEQ ID NO: 181 ), pSU-HlyA1 +gap+12 (SEQ ID NO: 182), pSU-HlyA1 +gap+21 (SEQ ID NO: 183), pSU-HlyA1 +gap+30 (SEQ ID NO: 184), pSU- HlyA1 +gap+51 (SEQ ID NO: 185), pSU-HlyA1 +gap+72 (SEQ ID NO: 186), pSU-HlyA1 +gap+93 (SEQ ID NO: 187), pSU-HlyAfull (SEQ ID NO : 62), pSU-HlyAfull minC (SEQ ID NO: 188), pSU-HlyAfull +gap (SEQ ID NO: 189), pSU- HlyA full +30 (SEQ ID NO: 190), pSU-HlyA full +51 (SEQ ID NO: 191), pSU-HlyA full +72 (SEQ ID NO: 192), pSU- HlyAfull +93 (SEQ ID NO: 193), y pSU-HlyAfull menos Promotor lac (SEQ ID NO: 194).
La figura 13Ay B ilustra esquemáticamente los diferentes insertos en el vector pSU.
Las células de E. coli DH5a se transformaron con las diferentes construcciones y pSJ37 HlyB/D y las respectivas proteínas se expresaron y secretaron, como se ha detallado antes. Los resultados de estos experimentos se muestran en la figura 14A y B (HlyA1) y figura 15A y B (HlyA de longitud completa). El alargamiento 5' de HlyC de hlyA1 tiene un efecto drástico en los niveles de expresión y secreción de HlyA1 (14). Este alargamiento codifica los últimos 148 nucleótidos de la parte 3' de hlyC y 11 nucleótidos intergenéticos (hueco (Gap)) entre hlyC y hlyA1, sin embargo, esta secuencia no es traducida. Los niveles más altos de expresión y secreción se obtienen con las construcciones pSU-HlyA1 Gap + 30/+ 51/+72 y pSU-HlyA1. Sin embargo, como los niveles de expresión y secreción se pueden controlar mediante variaciones del alargamiento 5', otras construcciones podrían ser beneficiosas en algunos casos.
El promotor, en este caso un promotor lac, es un elemento esencial del plásmido pSU-HlyAfull para la expresión y secreción de HlyA.
La figura 14A muestra una SDS-Page de lisados celulares, la figura 14B muestra una SDS-Page de los líquidos sobrenadantes.
HlyAfull (110 kDA) es secretada con altos rendimientos con el sistema de secreción inventado con rendimientos de hasta 600 mg por litro de cultivo celular. El truncamiento del alargamiento 5' delante de hlyA que consiste en un fragmento de hlyC y gap reducía drásticamente los niveles de secreción. La adición de gap, gap +30, gap +51 y gap +72 recuperó la secreción de HlyAfull hasta aproximadamente el mismo nivel que con el plásmido pSU-HlyAfull. (Figura 15A: lisados celulares; Figura 15B: líquido sobrenadante celular).
Como se ha mostrado antes, el alargamiento 5' delante de los genes que codifican las proteínas secretadas de interés es muy importante para su expresión. Dado que el alargamiento 5' corresponde al gen de HlyC, se investigó a continuación en una proteína que forma parte del Operón Hly en E. coli, si la inserción del gen de HlyC entero
5
10
15
20
25
30
35
40
45
frente a las construcciones de secreción influye en los niveles de secreción. El plásmido generado pSU-HlyC-HlyA1 se truncó posteriormente por partes 5' del gen de HlyC.
Como molde se usaron pSU-HlyA1 (SEQ ID NO: 63) y un gen sintético de HlyC (GenScript), que corresponde al gen hlyC del plásmido pHly152. El gen hlyC de longitud completa tenía la secuencia de nucleótidos expuesta en la SEQ ID NO: 195 y la proteína HlyC correspondiente la secuencia de aminoácidos expuesta en la SEQ ID NO: 196.
Para el procedimiento de amplificación y clonación, se usaron los siguientes oligonucleótidos:
Linealización y amplificación de pSU-HlyA1:
a) pSU-A1 + Gap_lin_for: GAGGTAATTAAATGGGAAATTCTC (SEQ ID NO: 197)
b) A1minC_lin_rev: GCTCGAATTCGTAATCATG (SEQ ID NO: 198)
Amplificación del gen de HlyC:
a) HlyC_inpSU_for: ATTACGAATTCGAGCATGAATATAAACAAACCATTAGAGAT (SEQ ID NO: 199)
b) HlyC_befGap_rev: CCATTTAATTACCTCTTAACCAGTTAATGAAAAATTAAAATC (SEQ ID NO: 200) Truncamientos 5' de pSU-HlyC-HlyA1:
a) A1minC_lin_rev: GCTCGAATTCGTAATCATG (SEQ ID NO: 201)
b) pSU-511_A1_for: GAATATAAACAAACCATTAGAGATTC (SEQ ID NO: 202)
c) pSU-448_A1_for: ACACAGAAACTGGCCA (SEQ ID NO: 203)
d) pSU-388_A1_for: CCAATATGTTTTATTAACCCGG (SEQ ID NO: 204)
e) pSU-328_A1_for: AAGTTTAGAAAATGAAATTAAATATCTATAT (SEQ ID NO: 205)
f) pSU-268_A1_for: GACTTCAGGTGATCGTAAAT (SEQ ID NO: 206)
g) pSU-208_A1_for: CCTGTACAAATATATGCGAAAAA (SEQ ID NO: 207)
Mutagénesis dirigida al sitio de codón de inicio artificial
a) HlyCA1_DelATG_for: GAAACAGCTATGACATTATTACGAATTCGAGCATG (SEQ ID NO: 208)
b) HlyCA1_DelATG_rev: CATGCTCGAATTCGTAATAATGTCATAGCTGTTTC (SEQ ID NO: 209)
pSU-HlyA1 se linealizó y se amplificó con los oligonucleótidos pSU-A1+Gap_lin_for y A1minC_lin_rev. El gen de HlyC se amplificó con los oligonucleótidos HlyC_inpSU_for y HlyC_befGap_rev que llevaban segmentos protuberantes de 15 nucleótidos de longitud (véase antes) para la posterior reacción de In-Fusion. La reacción de In- Fusion se llevó a cabo con el kit de clonación In-Fusion HD (ClonTech) como se describe en el manual. E. coli DH5a, XL1 o cepas similares se transformaron con la reacción de In-Fusion, se sembraron en placas de agar LB que contenían el antibiótico deseado y los plásmidos se aislaron de colonias individuales con procedimientos bien conocidos. El plásmido pSU-HlyC-HlyA1 se verificó por secuenciación.
La mutagénesis se llevó a cabo con el kit de mutagénesis dirigida al sitio (Stratagene) según el manual o manualmente usando estrategias bien conocidas que incluyen PCR con oligonucleótidos complementarios que llevan la mutación deseada, digestión con DpnI del ADN molde y posterior transformación de células de E. coli químicamente competentes y preparación de plásmido de colonias cultivadas.
pSU-HlyC-HlyA1 se amplificó con el oligonucleótido fosforilado A1minC_lin_rev en combinación con cada uno de los oligonucleótidos «directos». Los productos de la PCR se digirieron con Dpnl, se extrajeron en gel y se ligaron 50 ng de plásmidos linealizados durante la noche a 4 °C. Los plásmidos ligados se usaron para las transformaciones de células de E. coli DH5a químicamente competentes. Todos los plásmidos se aislaron y se verificaron por secuenciación.
La construcción pSU-HlyA1 menos HlyC ya se usó para estudios de secreción, y se pudo detectar una pequeña señal de proteína en el líquido sobrenadante de cultivos celulares mediante tinción con CBB (véase la figura 4A, banda 6 y 7 en la solicitud de patente). Sin embargo, la proteína se desplaza ligeramente por encima de las otras, lo que indica una mayor masa molecular. En esta construcción, la eliminación del alargamiento 5' de HlyC cambió el marco de lectura y se creó un nuevo codón de inicio en el marco dando como resultado HlyA1 más 6 aminoácidos N- terminales adicionales. El mismo desplazamiento del marco de lectura se produjo en el plásmido pSU-HlyC-HlyA1. Por lo tanto, los oligonucleótidos HlyCA1_DelATG_for y HlyCA1_DelATG_rev se usaron para mutar el codón de inicio artificial. El nuevo plásmido se denominó «pSU-HlyC-HlyA1 AATG» y la inserción de la mutación se verificó por
5
10
15
20
25
30
35
40
45
50
secuenciación.
genes de Gap y hlyA1 o
pSU-HlyA1 Gap+511
(SEQ ID NO: 212), pSU-HlyA1 Gap+448 (SEQ ID NO: 213), pSU-HlyA1 Gap+388 (SEQ ID NO: 214), pSU-HlyA1 Gap+328 (SEQ ID NO: 215), pSU-HlyA1 Gap+268 (SEQ ID NO: 216), y pSU-HlyA1 Gap+208 (SEQ ID NO: 217).
La figura 16 ilustra esquemáticamente las diversas inserciones en el vector pSU.
Los experimentos de expresión y secreción se llevaron a cabo de manera similar a los descritos anteriormente y los resultados se muestran en figura 17A (líquidos sobrenadantes celulares) y B (lisados celulares).
El gran impacto del alargamiento 5' de hlyA1 por el gap y hlyC demostrado antes se muestra de nuevo en las figuras 17A y C. Además de los truncamientos, hlyC se alargó paso a paso hasta que se insertó hlyC completo delante de gap y hlyA1. Los resultados del análisis de secreción correspondiente se muestran en la figura 17 B y D. Los niveles máximos de secreción de HlyA1 se obtuvieron con plásmidos pSU-HlyA1 Gap +30, pSU-HlyA1 Gap +51, pSU-HlyA1 Gap +72, pSU-HlyA1, pSU-HlyA1 Gap +208 y pSU-HlyA1 Gap + 268 alcanzando aproximadamente 1 g de HlyA1/litro de medio de cultivo.
Los resultados muestran además que a pesar de los truncamientos y alargamientos de la región 5' no traducida en pSU-HlyA1 delante de hlyA1, es secretada una proteína con un peso molecular idéntico, en concreto HlyA1 (sin embargo, con rendimientos muy diferentes). Esto significa que la traducción comienza siempre en el mismo codón de inicio independientemente de las secuencias insertadas/eliminadas. Sin desear estar ligado a ninguna teoría particular, una explicación de esto puede ser una eficacia de transcripción alterada del gen, una estabilidad del ARNm alterada, velocidades de traducción mayores del ARNm u otras características alteradas del sistema de expresión.
Ejemplo 11: construcción y expresión de diferentes proteínas de fusión de HlyA1
Los experimentos de secreción se llevaron a cabo con proteína de unión a maltosa (MBP), Candida antárctica Lipasa B (CalB), IFNa2, IFNy, IFABP G121V, Zab3, Nisin, HCRF, Mab40, Fuzeon y HCRF/2xHCRF, se clonaron y se expresaron como se ha detallado en los ejemplos 7 y 8 antes. Los lisados celulares y los líquidos sobrenadantes celulares resultantes se analizaron por SDS-PAGE con los resultados que se muestran en la figura 18A y B. Los asteriscos indican las proteínas de fusión de HlyA1 secretadas. Las bandas a la izquierda del marcador son los lisados celulares y las bandas a la derecha del marcador son los líquidos sobrenadantes celulares.
MBP
50 ml de cultivos de células E. coli que llevaban pK184-HlyB,D (véase antes) y PSU-MBP se indujeron a una DO600 de 0,5 con IPTG 1 mM y se cultivaron durante 6 horas adicionales. Los cultivos se centrifugaron (20 min, 50.000 x g, 4 °C) y se cargaron 25 ml de líquido sobrenadante en la resina de amilosa (NEB) preequilibrada en tampón (HEPES 20 mM, NaCl 150 mM, CaC^5 mM, pH 7,4) mediante flujo por gravedad. La columna se lavó exhaustivamente con el mismo tampón y la proteína de fusión de MBP se eluyó con un tampón que contenía maltosa 10 mM. Se encontró que MBP-HlyA1 es secretada en el líquido sobrenadante de cultivo (Figura 18), es biológicamente activa en la unión a amilosa inmovilizada y es eluida de la resina por maltosa (no se muestran los datos).
CalB
Se emulsionaron 15 ml de agar LB líquido (1,5 %) con tributirato de glicerol al 1 % (Fluka) mediante tratamiento con ultrasonidos y se complementaron con IPTG 1 mM y los antibióticos adecuados (placas GT). Las células de E. coli BL21 (DE3) se transformaron con pK184-HlyBD, pSU-CalB o ambos plásmidos y se cultivaron en placas GT durante 36 horas a 37 °C. CalB es secretada con el sistema de la invención (Figura 18). La actividad lipolítica de CalB-HlyA1 secretada se investigó con un ensayo de agar en placa. Aquí, se emulsionó un sustrato de lipasas (tributirin-glicerol) en agar LB y las células se cultivaron en dichas placas. Solo las células que llevaban ambos plásmidos, pSU-CalB y pK184-HlyBD, formaron halos. Estos resultados demuestran que 1.) CalB-HlyA1 es secretada fuera de las células al exterior y 2.) CalB es biológicamente activa incluso como proteína de fusión con HlyA1.
LipA
Todos los medios de crecimiento contenían kanamicina (30 pg/ml) y ampicilina (100 pg/ml). Para los experimentos de secreción se usó medio 2xYT complementado con CaCh 5 mM. Se cultivaron cultivos de 50 ml de células que llevaban pK184-HlyBD y pSU-LipA con una DO600 de inicio de 0,1 a 37 °C y 160 rpm. La expresión se indujo con IPTG 1 mM a una DO600 de 0,4-0,6 durante 6 h. Los cultivos se centrifugaron (20 min, 50,000 xg, 4 °C) y las muestras de líquido sobrenadante (16 pl) y las células (DOeq = 0,08) se analizaron por SDS-PAGE y tinción con azul brillante Coomassie (CBB). Se emulsionaron 10 ml de agar LB líquido (1,0%) con tributirato de glicerol al 1 % (Fluka) por tratamiento con ultrasonidos y se complementaron con CaCl2 5 mM o con CaCl2 5 mM en combinación
Se generaron los siguientes plásmidos que contienen el gen entero de HlyC frente a los hlyC truncado.
pSU-HlyC-HlyA1 (SEQ ID NO: 210), pSU-HlyC-HlyA1 AATG (SEQ ID NO: 211),
5
10
15
20
25
30
35
40
45
50
55
con IPTG 1 mM y los antibióticos adecuados. Las células de E. coli BL21 (DE3) se transformaron con pSU-LipA solo
0 pSU-LipA y pK184-HlyBD y se cultivaron en las placas de agar durante 18 horas a 37 °C. Se encontró que LipA es secretada con el sistema de secreción de la invención y que la LipA secretada es lipolíticamente activa (no se muestran los datos).
SprP
Todos los medios de crecimiento contenían kanamicina (30 pg/ml) y ampicilina (100 pg/ml). Para los experimentos de secreción se usó medio 2xYT complementado con CaCh 5 mM. Se cultivaron cultivos de 50 ml de células que llevaban pK184-HlyBD y pSU-SprPminLS con una DO600 de inicio de 0,1 a 37 °C y 160 rpm. La expresión se indujo con IPTG 1 mM a una DO600 de 0,4- 0,6 durante 6 h. Los cultivos se centrifugaron (20 min, 50,000 x g, 4 °C) y las muestras de líquido sobrenadante (16 pl) y las células (DOeq = 0,08) se analizaron por SDS-PAGE y tinción con azul brillante Coomassie (CBB). Se concentraron 100 ml de líquido sobrenadante a ~2 ml por ultrafiltración (dispositivo de filtro Amicon, MWCO de 50 kDA). El concentrado se purificó por cromatografía de exclusión por tamaño molecular (Superdex 200 16/60, GE Healthcare) equilibrado en tampón SeC (Tris-HCl 10 mM, NaCl 120 mM, Ca2Cl 5 mM, pH
7.3) usando un sistema de FPLC (GE Healthcare). Las fracciones de elución deseadas se concentraron por ultrafiltración. Se supone que la SprP es una proteasa, sin embargo, hasta ahora no se podía producir y analizar. Se aplicó un ensayo colorimétrico para investigar una potencial actividad proteolítica de la SprP secretada con el sustrato incoloro hidrocloruro de 4-nitroanilida de Na-Benzoil-D,L-arginina (Sigma-Aldrich). Si la SprP secretada escinde proteolíticamente el sustrato, se forma un producto amarillo que posteriormente se puede detectar por espectroscopía UV-VIS. Se demostró que la SprP secretada escinde el sustrato y produce el producto amarillo (no se muestran los datos). Por lo tanto, la SprP es una proteasa y es secretada en una forma activa con el sistema de secreción descrito en la presente memoria. SprP minLS es secretada con el sistema de la invención. También es secretada una versión truncada N-terminal de SprP (SprP_ORF2). Además, se secreta SprPminLS con un marcador de his N-terminal o C-terminal en combinación con sitios de escisión de proteasa específicos del sitio. Los análisis computacionales clasifican la SprP como serina proteasa y se investigó una potencial actividad catalítica de SprP. Se podía mostrar que la SprP es una proteasa y es secretada en una forma activa con el sistema de la invención (datos no mostrados).
Vif
Todos los medios de crecimiento contenían kanamicina (30 pg/ml) y ampicilina (100 pg/ml). Para los experimentos de secreción se usó medio 2xYT complementado con CaCh 5 mM. Se cultivaron cultivos de 50 ml de células que llevaban pK184-HlyBD y pSU-Vif con una DO600 de inicio de 0,1 a 37 °C y 160 rpm. La expresión se indujo con IPTg
1 mM a una DO600 de 0,4- 0,6 durante 6 h. Los cultivos se centrifugaron (20 min, 50.000 x g, 4 °C) y las muestras de líquido sobrenadante (16 pl) y las células (DOeq = 0,08) se analizaron por SDS-PAGE y tinción con azul brillante Coomassie (CBB). Se concentraron 100 ml de líquido sobrenadante a ~2 ml por ultrafiltración (dispositivo de filtro Amicon, MWCO de 50 kDA). El concentrado se purificó por cromatografía de exclusión por tamaño molecular (Superdex 200 16/60, GE Healthcare) equilibrada en tampón SEC (Tris-HCl 10 mM, NaCl 120 mM, Ca2Cl 5 mM, pH
7.3) usando un sistema FPLC (GE Healthcare) Las fracciones de elución deseadas se concentraron por ultrafiltración. La Vif secretada se escindió proteolíticamente con tripsina y los fragmentos peptídicos resultantes se analizaron por espectrometría de masas. La Vif secretada se podía identificar claramente (cobertura: 72,20 %) (datos no mostrados).
Purificación y escisión con el factor Xa del IFN2a marcado con his
Todos los medios de crecimiento contenían kanamicina (30 pg/ml) y ampicilina (100 pg/ml). Para los experimentos de secreción se usó medio 2xYT complementado con CaCh 5 mM. Se cultivaron cultivos de 50 ml de células que llevaban pK184-HlyBD y pSU-HisTEV_IFN2a o pSU-IFN2aXaHis con una DO600 de inicio de 0,1 a 37 °C y 160 rpm. La expresión se indujo con IPTG 1 mM a una DO600 de 0,4-0,6 durante 6 h. Los cultivos se centrifugaron (20 min, 50.000 x g, 4 °C) y las muestras de líquido sobrenadante (16 pl) y las células (DOeq = 0,08) se analizaron por SDS- PAGE y tinción con azul brillante Coomassie (CBB). Las células se separaron del IFN2a secretado mediante centrifugación durante 20 min y 14.000 xg a 4 °C. El líquido sobrenadante se complementó con imidazol 10 mM y MgCl2 20 mM. Para la posterior cromatografía de afinidad con iones metálicos inmovilizados (IMAC), el líquido sobrenadante se cargó en una columna HiTrap IMAC HP (5 ml, GE Healthcare) precargada con Ni2+ y preequilibrada en tampón (Tris-HCl 10 mM, NaCl 150 mM, imidazol 10 mM, pH 8,0) usando un sistema de FPLC (ÁktaSystem, GE Healthcare). Después del lavado de la columna con el mismo tampón, se eluyó el IFN2a secretado mediante un gradiente lineal de 10 volúmenes de columna de imidazol 10 - 250 mM. Las fracciones que contenían proteína se reunieron y se concentraron por ultrafiltración (dispositivos de filtro Amicon, MWCO de 10 kDA). 50 pg de IFN2a secretado se escindieron con 1 pg de Factor Xa (NEB) a 25 °C. Las muestras se tomaron en los tiempos de medición indicados y se analizaron por SDS-PAGE y posterior tinción con CBB (Figura 19). El IFN2a secretado se extrajo y se purificó del líquido sobrenadante del cultivo por IMAC y la señal de secreción se escindió proteolíticamente con Factor Xa.
Nisina
Todos los medios de crecimiento contenían kanamicina (30 pg/ml) y ampicilina (100 pg/ml). Para los experimentos
5
10
15
20
25
30
de secreción se usó medio 2xYT complementado con CaCh 5 mM. Se cultivaron cultivos de 50 ml de células que llevaban pK184-HlyBD y pSU-NisinXa con una DO600 de inicio de 0,1 a 37 °C y 160 rpm. La expresión se indujo con IPTG 1 mM a una DO600 de 0,4-0,6 durante 6 h. Los cultivos se centrifugaron (20 min, 50.000 xg, 4 °C) y las muestras de líquido sobrenadante (16 jl) y las células (DOeq = 0,08) se analizaron por SDS-PAGE y tinción con azul brillante Coomassie (CBB). Se concentraron 100 ml de líquido sobrenadante a ~2 ml por ultrafiltración (dispositivo de filtro Amicon, MWCO de 50 kDA). El concentrado se purificó por cromatografía de exclusión por tamaño molecular (Superdex 200 16/60, GE Healthcare) equilibrado en tampón SeC (Tris-HCl 10 mM, NaCl 120 mM, Ca2Cl 5 mM, pH
7,3) usando un sistema de FPLC (GE Healthcare). Las fracciones de elución deseadas se concentraron por ultrafiltración. La RP-HPLC analítica se llevó a cabo con una columna con cápsula en el extremo LiChrospher Wp 300 RP-18 (Merck) a temperatura ambiente. Las muestras se inyectaron y se eluyeron mezclando el tampón acuoso A (10% de acetonitrilo, 0,1 % (v/v) de ácido trifluoroacético) con el tampón B de disolvente orgánico (90% de acetonitrilo, 0,1 % (v/v) de ácido trifluoroacético). La elución se realizó aplicando un gradiente de 0 - 100% de tampón B en el transcurso de 60 minutos, con un caudal de 1 ml/min. El eluyente se detectó midiendo la absorbancia a 220 nm. La NisA secretada se purificó por SEC (Superdex 75 16/60, GE Healthcare) y se concentró por ultrafiltración (Amicon Filter Devices, MWCO de 10 kDA). Se añadió 1 jg de Factor Xa a 50 jg de NisA-HlyAl y se incubó a 25 °C durante el período indicado. Después de 1,5 h, la reacción se cargó en una columna de HPLC y la NisA eluyó a los 19 min. La NisA podía identificarse por transferencia Western con un anticuerpo contra NisA y por espectrometría de masas. (Datos no mostrados).
Calcitonina humana
Todos los medios de crecimiento contenían kanamicina (30 jg/ml) y ampicilina (100 jg/ml). Para los experimentos de secreción se usó medio 2xYT complementado con CaCh 5 mM. Se cultivaron 50 ml de cultivos de células que llevaban pK184-HlyBD y pSU-Human Calcitonin con una DO600 de inicio de 0,1 a 37 °C y 160 rpm. La expresión se indujo con IPTG 1 mM a una DO600 de 0,4-0,6 durante 6 h. Los cultivos se centrifugaron (20 min, 50.000 x g, 4 °C) y las muestras de líquido sobrenadante (16 jl) y las células (DOeq = 0,08) se analizaron por SDS-PAGE y tinción con azul brillante Coomassie (CBB). Se concentraron 100 ml de líquido sobrenadante a ~2 ml por ultrafiltración (dispositivo de filtro Amicon, MWCO de 50 kDA). El concentrado se purificó por cromatografía de exclusión por tamaño molecular (Superdex 200 16/60, GE Healthcare) equilibrada en tampón SEC (Tris-HCl 10 mM, NaCl 120 mM, Ca2Cl 5 mM, pH 7,3) usando un sistema FPLC (GE Healthcare). Las fracciones de elución deseadas se concentraron por ultrafiltración y se incubaron con proteasa TEV (también se añadió DTT 10 mM). La mezcla de digestión se purificó por cromatografía de exclusión por tamaño molecular (columna de péptidos, GE Healthcare) en Tris-HCl 10 mM, NaCl 120 mM, CaCl2 5 mM., DTT 10 mM, pH 7,3. (Datos no mostrados).
Péptido/proteína de interés
Construcción Cebador directo Cebador inverso Secuencia de inserción del vector/secuencia codificante SEQ ID NO: Secuencia de proteína/SEQ ID NO:
IFNa2
pSU- HisTEV IFN 2a 218 219 220/221 222
IFNa2
PSU- IFN2aXaHis 225 226 227/228 229
CalB
PSU-cCalB + sitio Xa 232 233 234/235 236
Nisina
pSU-Nisin + sitio Xa 237 238 239/240 241
SprP
PSU- SprPminLS 242 243 244/245 246
SprP
pSU-HisTEV SprP 247 248 249/250 251
SprP
PSU- SprPXaHis 252 253 254/255 256
SprP
PSU- SprP ORF2 257 258 259/260 261
SprP
PSU- SprP Sub 262 263 264/265 266
PlaB (proteína PAO1 sin nombre de Pseudomonas aeruginosa)
pSU-PlaB 267 268 269/270 271
PlaK (proteína PAO1 sin nombre de Pseudomonas aeruginosa)
pSU-PlaK 272 273 274/275 276
Péptido/proteína de interés
Construcción Cebador directo Cebador inverso Secuencia de inserción del vector/secuencia codificante SEQ ID NO: Secuencia de proteína/SEQ ID NO:
PlbF (proteína PAO1 sin nombre de Pseudomonas aeruginosa)
pSU-PlbF 277 278 279/280 281
producto del gen tesA (proteína PAO1 de Pseudomona aeruginosa)
pSU-TesA 282 283 284/285 286
MBP
pSU-MBP 287 288 289/290 291
Vif
pSU-Vif 292 293 294/295 296
LipA
pSU-LipA 297 298 299/300 301
2xHCRF
pSU-2xHCRF 302 303 304/305 306
La construcción de IFNa2 pSU-HisTEV_IFN2a se clonó usando la siguiente estrategia: el gen sintético se amplificó con los oligonucleótidos indicados (SEQ ID NO: 218 y 219). El vector pSU se amplificó y linealizó por PCR con los oligonucleótidos de SEQ ID NO: 223 y 224. Se usaron productos de PCR extraídos con gel para la reacción de In- 5 Fusion. Para la construcción pSU-IFN2aXaHis se usó una estrategia similar solo que se usaron diferentes cebadores de oligonucleótidos (véase la tabla, y para la amplificación y linealización del vector: SEQ ID NO: 230 y 231). Todas las demás construcciones se clonaron de forma similar usando las secuencias indicadas en la tabla.
Para la linealización y amplificación de pSU-HCRF, se usaron los siguientes oligonucleótidos
pSU HlyA1_lin_rev: CATTTAATTACCTCTTAACCAGTTAATG (SEQ ID NO: 307)
10 pSU_Cortico_lin_for: AGCGAAGAACCGCCG (SEQ ID NO: 308)
Para la linealización y amplificación de pSU-HisTEV SprP, se usaron los siguientes oligonucleótidos:
pSU HlyA1_lin_for: GGAAATTCTCTTGCAAAAAATGTATTA (SEQ ID NO: 309)
pSU_A1_lin_HisTEV_rev:
GCCCTGAAAATACAGGTTTTCGTGGTGGTGGTGGTGGTGCATTTAATTACCTCTTAACCAG 15 TTAATG (SEQ ID NO: 310)
Ejemplo 12: alargamiento N-terminal de proteínas de fusión de IFN2a por el dominio RTX de pSU-HlyA1
Los procedimientos de clonación se realizan con el kit de clonación Infusion (ClonTech) como se ha descrito antes para otros ejemplos, dando el plásmido pSU-GG_IFN2a. La secuencia de nucleótidos codificante se expone en la SEQ ID NO: 315 y la secuencia de proteínas en la SEQ ID NO: 316.
20 Oligonucleótidos:
IFN2a_lin_for: TGTGATCTGCCGCAGAC (SEQ ID NO: 311)
IFN2a_lin_rev: CATTTAATTACCTCTTAACCAGTTAATGAAAA (SEQ ID NO: 312)
GGfor2a_for: AGAGGTAATTAAATGGGAAATTCTCTTG (SEQ ID NO: 313)
GGfor2a_rev: CTGCGGCAGATCACAATCAATATCAGCCAAACTGAGTTTATC (SEQ ID NO: 314)
25 Todos los medios de crecimiento contenían kanamicina (30 pg/ml) y ampicilina (100 pg/ml). Para los experimentos de secreción se usó medio 2xYT complementado con CaCh 5 mM. Se cultivaron cultivos de 50 ml de células que llevaban pK184-HlyBD y pSU-GG_IFN2a con una DO600 de inicio de 0,1 a 37 °C y 160 rpm. La expresión se indujo con IPTG 1 mM a una DO600 de 0,4-0,6 durante 6 h. Los cultivos se centrifugaron (20 min, 50.000 xg, 4 °C) y las muestras de líquido sobrenadante (16 pl) y las células (DOeq = 0,08) se analizaron por SDS-PAGE y tinción con azul 30 brillante Coomassie (CBB).
Como se muestra en la figura 20, GG_IFN2a es secretado en cantidades similares al IFN2a. Estos resultados demuestran que también podría insertarse una proteína o péptido de interés dentro de HlyA1, si se desea.
Ejemplo 13: análisis de secreción con diferentes interferones
Las proteínas de fusión IFNA1-HlyA1, IFNA8-HlyA1, IFNA16-HlyA1 e IFNA21-HlyA1 se producen y secretan con el 35 sistema de secreción de la invención (Figura 21) La identidad de las proteínas de fusión secretadas se confirmó por
análisis de transferencia Western con un anticuerpo contra HlyA1 (Figura 22).
Péptido/proteína de interés
proteína de tipo natural N.° de acceso, N.° de versión, fecha Construcción Cebador directo SEQ ID NO: Cebador inverso SEQ ID NO: Secuencia de inserción del vector/secuencia codificante SEQ ID NO: Secuencia de proteína/ SEQ ID NO:
IFNalfa1 Humano
NM_024013 Versión: NM 024013.2 Gi: 345441760 PSU-IFNA1 317 318 325/326 333
IFNalfa8 Humano
NM_002170 Versión: NM 002170.3 Gi: 115583655 PSU-IFNA8 319 320 327/328 334
IFNalfa16 Humano
NM_002173 Versión: NM 002173.2 Gi: 141802732 PSU-IFNA16 321 322 329/330 335
IFNalfa21 Humano
NM_002175 Versión: NM 002175.2 Gi: 169791012 PSU-IFNA21 323 324 331/332 336
La clonación se llevó a cabo como se ha descrito antes.
5

Claims (13)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    REIVINDICACIONES
    1. Molécula de ácido nucleico aislada que comprende una primera y una segunda secuencia de ácido nucleico para la producción eficaz de un péptido recombinante o proteína de interés, en la que la primera secuencia de ácido nucleico comprende un fragmento de hemolisina C (HlyC) y
    (i) tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 1 o uno de sus fragmentos 3', en la que el fragmento comprende al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 5, o su complementaria, o
    ii) tiene una secuencia de nucleótidos que tiene al menos 70 % de identidad de secuencia con la secuencia de nucleótidos como se define en i); y
    la segunda secuencia de ácido nucleico codifica al menos un péptido o proteína de interés y está situada 3' de la primera secuencia de ácido nucleico,
    en la que la primera secuencia de ácido nucleico no es una secuencia que codifica HlyC de longitud completa y mejora la expresión de al menos uno péptido o proteína de interés y la molécula de ácido nucleico aislada no incluye una secuencia de nucleótidos que codifica HlyC de longitud completa, en la que los fragmentos de la secuencia que codifica HlyC no son expresados ya que no se transcriben y/o traducen en una secuencia de proteína.
  2. 2. La molécula de ácido nucleico aislada de la reivindicación 1, en la que la primera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 5-27 y sus fragmentos 3', en la que los fragmentos comprenden al menos la secuencia como se expone en la SEQ ID NO: 5, y sus complementarias.
  3. 3. La molécula de ácido nucleico aislada de la reivindicación 1 o 2, en la que la molécula de ácido nucleico comprende además una tercera secuencia de ácido nucleico situada en 3' de la primera secuencia de ácido nucleico y 5' o 3' de la segunda secuencia de ácido nucleico o la segunda secuencia de ácido nucleico se inserta en la tercera secuencia de ácido nucleico, en la que el tercer ácido nucleico está operativamente unido a la segunda secuencia de ácido nucleico, codifica hemolisina A (HlyA) o uno de sus fragmentos, y
    i) tiene la secuencia de nucleótidos como se expone en la SEQ ID NO: 29 o uno de sus fragmentos, en la que el fragmento comprende al menos la secuencia de nucleótidos como se expone en la SEQ ID NO: 30, o su complementaria, o
    ii) tiene una secuencia de nucleótidos que tiene al menos 70 % de identidad de secuencia con la secuencia de nucleótidos como se define en i); o
    iii) tiene una secuencia de nucleótidos que codifica un polipéptido que tiene al menos 91 % de homología de secuencia con el polipéptido codificado por la secuencia de nucleótidos de (i).
  4. 4. La molécula de ácido nucleico aislada de la reivindicación 3, en la que la tercera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 30-40, y sus fragmentos, en la que los fragmentos comprenden al menos la secuencia como se expone en la SEQ. ID NO: 30, o sus complementarias.
  5. 5. La molécula de ácido nucleico aislada de una cualquiera de las reivindicaciones 3-4, en la que la primera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 1 y 5-27 o sus complementarias y la tercera secuencia de ácido nucleico tiene una secuencia de nucleótidos seleccionada del grupo que consiste en las SEQ ID NO: 29-40.
  6. 6. La molécula de ácido nucleico aislada de una cualquiera de las reivindicaciones 1-5, en la que la molécula de ácido nucleico comprende además al menos una cuarta secuencia de ácido nucleico que codifica
    (i) un marcador de afinidad, en el que la secuencia de nucleótidos que codifica el marcador de afinidad está operativamente unida al extremo 5' o 3' de la segunda o tercera secuencia de ácido nucleico; y/o
    (ii) un sitio de escisión de proteasa, en el que la secuencia de nucleótidos que codifica el sitio de escisión de proteasa está operativamente unida a la segunda molécula de ácido nucleico y a la tercera molécula de ácido nucleico de manera que está situada entre la segunda y la tercera secuencia de ácido nucleico.
  7. 7. La molécula de ácido nucleico aislada de una cualquiera de las reivindicaciones 1-6, en la que la molécula de ácido nucleico comprende o consiste en una secuencia de ácido nucleico como se expone en cualquiera de las SEQ ID NO: 66, 71, 74, 79, 84, 89, 93, 98, 103, 110, 115, 120, 125, 130, 135, 140, 145, 220, 227, 234, 239, 244, 249, 254, 259, 264, 269, 274, 279, 284, 289, 294, 299, 304, 325, 327, 329 y 331.
  8. 8. Vector que comprende una molécula de ácido nucleico según una cualquiera de las reivindicaciones 1-7.
    5
    10
    15
    20
    25
  9. 9. Célula hospedante que comprende una molécula de ácido nucleico según una cualquiera de las reivindicaciones 1-7 o un vector según la reivindicación 8.
  10. 10. Un procedimiento para la expresión de un péptido o proteína recombinante, en el que el procedimiento comprende:
    (a) introducir una molécula de ácido nucleico según una cualquiera de las reivindicaciones 1-7 o un vector según la reivindicación 8, en la que la molécula de ácido nucleico o vector codifica el péptido o proteína recombinante, en una célula hospedante adecuada; y
    (b) cultivar la célula hospedante en un medio de cultivo en condiciones que permitan la expresión del péptido o proteína recombinante.
  11. 11. El procedimiento según la reivindicación 10, en el que el procedimiento comprende además recuperar el péptido o proteína expresado de la célula hospedante y/o el medio de cultivo.
  12. 12. El procedimiento según la reivindicación 10 u 11, en el que la célula hospedante expresa HlyB y HlyD y el procedimiento comprende opcionalmente además la secreción del péptido o proteína recombinante expresado en el medio de cultivo, cultivando la célula hospedante en condiciones que permiten la secreción del péptido o proteína recombinante en el medio de cultivo.
  13. 13. El procedimiento según una cualquiera de las reivindicaciones 10-12, en el que:
    (a) la célula hospedante es una célula procariota; y/o
    (b) la expresión se lleva a cabo en medio de cultivo mínimo; y/o
    (c) el medio de cultivo comprende Ca2+ 1-40 mM; y/o
    (d) el péptido o proteína recombinante se purifica usando un procedimiento seleccionado de cromatografía de afinidad, cromatografía de intercambio iónico, cromatografía de fase inversa, cromatografía de exclusión por tamaño molecular y combinaciones de los mismos; y/o
    (e) el procedimiento comprende el tratamiento del péptido o proteína recombinante con una proteasa adecuada para la escisión de un sitio de escisión de proteasa dentro del péptido o proteína recombinante; y/o
    (f) el procedimiento comprende una etapa como se define en (e) seguido de purificación del péptido o proteína recombinante.
    imagen1
    imagen2
    Figura 4A
    imagen3
    Figura 411
    imagen4
    imagen5
    Figura 7
    }fn2aifa Ifn2alfa Ifn2alfa
    imagen6
    Figura 8
    imagen7
    de salmón
    Factor liberador de corticotropina humano
    Calcitonina humana % ¡
    Figura 9
    IFABP IFABP
    Al A G80V IFN2alfa
    imagen8
    Figura 10
    imagen9
    imagen10
    Wt/U uoisniiQ
    b£C
    imagen11
    £0-3'I.
    URL
    imagen12
    + 6 nucleótidos
    HlyC-Fragm
    pSU-HIyAl minC (AATG): pSU-HlyA1 5/11 Gap: pSU-HlyA1 8/11 Gap: pSU‘HlyA1 +Gap: pSU-HlyA1 Gap +6:
    pSU-HlyA1 Gap +12: pSU-HIyAl Gap +21:
    pSU-HlyA1 Gap +30: pSU-HlyA1 Gap +51: pSU-HlyA1 Gap +72: pSU-HlyA1 Gap +93: pSU-HlyA1:
    5/11
    —i HlyA1
    6/11
    H Gap
    - HtyAl
    11 nucleótidos
    Gap
    HtyAl
    11 nucleótidtos
    Gap
    —[r HtyAl
    + 13 nucleótidos 11 nucleótidos
    + 21 nucleótidos 11 nucleótidos
    + 30 nucleótidos 11 nucleótidos
    + 51 nucleótidos 11 nucleótidos
    + 72 nucleótidos 11 nucleótidos
    + 93 nucleótidos 11 nucleótidos
    14B nucleótidos 11 nucleótidos
    Figura 13A
    imagen13
    imagen14
    imagen15
    8
    i
    ¿i
    <3
    §
    &
    &
    3
    3
    i
    X
    s:
    y
    2
    <n
    ■■■■ -
    Fiuurc 15
    148 nudeótidoa 11 nudedbdoa
    pSU-HlyA1
    HlyC-Fiffeym
    HlyAl
    2(115 ni irleolidos 11 nn.-ipnlirtoE
    HlyC'Ffagnn.
    p5U-HlyA1 Gap +208;
    — HlyAl
    268 nuaaotMt» 11 nuüaüMBa
    pSU-HlvAl Gap +265
    HlyC-Fragm.
    HlyAl
    320 nuricoiidos 11 niiirlooiidoj
    pSU-HlyA1 Gap +328;
    HlyC-Ffagm.
    ■ H|yAl
    3BB mjrlnnlidns 11 nunlnnlidijs
    HlyC-Ffigitv :;.j—
    pSU-HIyA! Gap +388:
    HlyAl
    *40 nucleoiidos 11 ruirleoiidos
    pSU-HlyA1 Gap +448
    HlyC-Fragm
    HlyAl
    S11 nucICOHdOS 11 niirlcolidOS
    p5U-HlyA1 Gap +511:
    HtyC-Fngrt.
    HlyAl
    S13 nutínúlido* 11 nudEiijlickii
    pSU-HlyC-HlyA1 (¿AT G ¡£
    HlyC
    Figura 16
    imagen16
    Mtq
    imagen17
    351
    A
    cE'
    e
    ■=i
    sa
    i
    y
    jf &
    £ &
    $ + Factor Xa
    ^ # 1h 2h 3h eti
    50
    30
    20 -t
    15
    m
    H1yA1 ■ ÍFN2a
    B
    & í
    # #
    £ .6
    $
    ii
    i 4 é
    Factor Xa
    ih 2h 3h &h
    imagen18
    imagen19
    353
    Z!
    t¡E'
    N
    pSU-IFNAB pSU-IFNA16
    A
    -í? s 21 Í5 ¡Q .£# ^ 03
    ,o cr
    O C:
    3
    'O M jzj ^ e -o
    $
    5 i o í*
    PSU-IFNA21
    pSU-lFNA1
    jQí
    O £ ■3 3?
    £ t?
    JH 3
    j» 3 ’-Q
    i
    co 3 £
    imagen20
    354
    imagen21
ES12777908.0T 2011-10-21 2012-10-22 Agentes y procedimientos para la expresión y secreción de péptidos y proteínas Active ES2689245T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11186225.6A EP2583975A1 (en) 2011-10-21 2011-10-21 Agents and methods for the expression and secretion of peptides and proteins
EP11186225 2011-10-21
PCT/EP2012/070880 WO2013057312A1 (en) 2011-10-21 2012-10-22 Agents and methods for the expression and secretion of peptides and proteins

Publications (1)

Publication Number Publication Date
ES2689245T3 true ES2689245T3 (es) 2018-11-12

Family

ID=47073445

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12777908.0T Active ES2689245T3 (es) 2011-10-21 2012-10-22 Agentes y procedimientos para la expresión y secreción de péptidos y proteínas

Country Status (7)

Country Link
US (1) US9493804B2 (es)
EP (3) EP2583975A1 (es)
DK (1) DK2768848T3 (es)
ES (1) ES2689245T3 (es)
PL (1) PL2768848T3 (es)
PT (1) PT2768848T (es)
WO (1) WO2013057312A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2792686A1 (en) * 2013-04-17 2014-10-22 Heinrich-Heine-Universität Düsseldorf Methods for the expression of peptides and proteins
WO2017087827A1 (en) * 2015-11-19 2017-05-26 President And Fellows Of Harvard College Method of making recombinant silk andsilk-amyloid hybrid proteins using bacteria
WO2018218137A1 (en) 2017-05-25 2018-11-29 Leidos, Inc. Pd-1 and ctla-4 dual inhibitor peptides
WO2020237050A1 (en) 2019-05-22 2020-11-26 Leidos, Inc. Lag3 binding peptides
WO2022194375A1 (en) 2020-03-18 2022-09-22 Numaferm Gmbh Fusion proteins comprising gg repeat sequences
EP3882260A1 (en) * 2020-03-18 2021-09-22 NUMAFERM GmbH Fragments of hlya and uses thereof
EP3892290A1 (en) 2020-04-08 2021-10-13 NUMAFERM GmbH Variants of hlya and uses thereof
CA3189692A1 (en) 2020-07-31 2022-02-03 Leidos, Inc. Lag3 binding peptides
WO2022194403A1 (en) 2021-03-18 2022-09-22 Numaferm Gmbh Fusion proteins comprising gg repeat sequences
CN113354723A (zh) * 2021-04-29 2021-09-07 中山大学 吉富罗非鱼神经分泌肽gl及其应用
EP4339202A1 (en) 2022-09-16 2024-03-20 NUMAFERM GmbH Fusion proteins comprising gg repeat sequences ii

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8611832D0 (en) * 1986-05-15 1986-06-25 Holland I B Polypeptide
US20030165870A1 (en) * 2002-03-01 2003-09-04 Blattner Frederick R. Novel sequences of E. coli CFT073
US20060094034A1 (en) * 2003-04-30 2006-05-04 Roland Brousseau Virulence and antibiotic resistance array and uses thereof
CA2428646A1 (en) * 2003-04-30 2004-10-30 National Research Council Of Canada Array and uses thereof
EP1921149A1 (en) * 2006-11-13 2008-05-14 AEterna Zentaris GmbH Microorganisms as carriers of nucleotide sequences coding for antigens and protein toxins, process of manufacturing and uses thereof

Also Published As

Publication number Publication date
DK2768848T3 (en) 2018-10-08
EP2583975A1 (en) 2013-04-24
PL2768848T3 (pl) 2019-01-31
EP2768848B1 (en) 2018-07-04
EP3210997B1 (en) 2023-07-26
EP3210997C0 (en) 2023-07-26
EP3210997A1 (en) 2017-08-30
US20140343251A1 (en) 2014-11-20
EP2768848A1 (en) 2014-08-27
US9493804B2 (en) 2016-11-15
WO2013057312A1 (en) 2013-04-25
PT2768848T (pt) 2018-10-26

Similar Documents

Publication Publication Date Title
ES2689245T3 (es) Agentes y procedimientos para la expresión y secreción de péptidos y proteínas
JP6714902B2 (ja) ペプチドおよびタンパク質の発現のための方法
US9879249B2 (en) Aldehyde-tagged protein-based drug carriers and methods of use
KR101861872B1 (ko) 항암 융합 단백질
ES2343061T3 (es) Metodos y constructos de dna para produccion de polipeptidos con rendimiento alto.
EP1924601B1 (en) Expression of proteins in e.coli
CN113481226B (zh) 信号肽相关序列及其在蛋白质合成中的应用
Alishah et al. Utilizing intein-mediated protein cleaving for purification of uricase, a multimeric enzyme
KR101373297B1 (ko) 대장균 포스포글리세르산 인산화효소 유전자를 융합 파트너로서 포함하는 발현벡터
Ahn et al. Synthesis of Mycoplasma arginine deiminase in E. coli using stress-responsive proteins
US20100041153A1 (en) Expression of Proteins in E. Coli
US9487576B2 (en) Method for reduction of 1-&gt;2 reading frame shifts
EP1674567B1 (en) METHOD OF CLEAVING POLYPEPTIDE BY USING OmpT PROTEASE MUTANT
MX2014009979A (es) Metodo para la reduccion del desplazamiento de los marcos de lectura 1-&gt;3.
ES2800925T3 (es) Utilización diagnóstica de un polipéptido de fusión que comprende una proteína vírica y un enzima MGMT
BR112015026384B1 (pt) Método para produzir peptídeo recombinante (peoi) ou proteína de interesse (proi)