ES2906807T3

ES2906807T3 - Replicón de ARN para una expresión génica versátil y eficiente

Info

Publication number: ES2906807T3
Application number: ES20156693T
Authority: ES
Inventors: Tim Beissert; Ugur Sahin; Mario Perkovic
Original assignee: TRON Translationale Onkologie an der Universitaetsmedizin der Johannes Gutenberg Universitaet Mainz gGmbH; Biontech SE
Current assignee: TRON Translationale Onkologie an der Universitaetsmedizin der Johannes Gutenberg Universitaet Mainz gGmbH; Biontech SE
Priority date: 2016-03-21
Filing date: 2017-03-13
Publication date: 2022-04-20
Anticipated expiration: 2037-03-13
Also published as: JP2022169553A; RU2748892C2; RS62864B1; DK3433369T3; IL291100B2; EP3701959A1; ZA201805519B; JP7121443B2; HK1259449A1; RU2018131966A; AU2017236239B2; HRP20220044T1; IL261379A; SI3433369T1; IL291100A; SI3701959T1; PT3701959T; PL3701959T3; CA3017272A1; LT3701959T

Abstract

Una composición farmacéutica que comprende un replicón de ARN y, opcionalmente, un diluyente farmacéuticamente aceptable y/o un excipiente farmacéuticamente aceptable y/o un portador farmacéuticamente aceptable y/o un vehículo farmacéuticamente aceptable, comprendiendo dicho replicón una secuencia de reconocimiento de replicación 5' modificada de alfavirus, en donde la secuencia de reconocimiento de replicación 5' modificada se caracteriza porque todos los codones de iniciación se han eliminado del elemento de secuencia conservada 2 (CSE 2) de la secuencia de reconocimiento de replicación 5' de alfavirus nativo y en donde la secuencia de reconocimiento de replicación 5' modificada comprende uno o más cambios de nucleótidos adicionales que compensan las alteraciones del emparejamiento de nucleótidos dentro de uno o más bucles de tallo (SL) introducidas por la eliminación de los codones de iniciación, en donde dicho CSE 2 abarca desde SL2 a SL4 y comprende el codón de iniciación nativo que codifica los primeros residuos de aminoácidos de la proteína no estructural de alfavirus nsP1, y en donde la secuencia de reconocimiento de replicación 5' modificada se caracteriza por una estructura secundaria predicha que es equivalente a la estructura secundaria predicha de la secuencia de reconocimiento de replicación 5' del ARN genómico alfaviral.

Description

DESCRIPCIÓN

Replicón de ARN para una expresión génica versátil y eficiente

Campo técnico

La presente enseñanza abarca un replicón de ARN que puede ser replicado por una replicasa de origen alfavirus. El replicón de ARN comprende elementos de secuencia requeridos para la replicación por la replicasa, pero estos elementos de secuencia no codifican ninguna proteína o fragmento de esta, tal como una proteína no estructural de alfavirus o un fragmento de esta. Por lo tanto, en el replicón de ARN de acuerdo con la enseñanza, los elementos de secuencia requeridos para la replicación por la replicasa y las regiones codificantes de proteínas están desacoplados. De acuerdo con la presente enseñanza, el desacoplamiento se logra mediante la eliminación de al menos un codón de iniciación en comparación con un ARN genómico de alfavirus nativo. El replicón de ARN puede comprender un gen que codifica una proteína de interés, tal como una proteína farmacéuticamente activa. La replicasa puede estar codificada por el replicón de ARN o por una molécula de ácido nucleico separada.

Antecedentes

Las moléculas de ácido nucleico que comprenden información genética extraña que codifica uno o más polipéptidos con fines profilácticos y terapéuticos se han estudiado en la investigación biomédica durante muchos años. Los enfoques de la técnica anterior comparten el suministro de una molécula de ácido nucleico a una célula u organismo diana, pero difieren en el tipo de molécula de ácido nucleico y/o sistema de suministro: influenciado por las preocupaciones de seguridad asociadas con el uso de moléculas de ácido desoxirribonucleico (ADN), las moléculas de ácido ribonucleico (ARN) han recibido una atención en aumento en los últimos años. Se han propuesto varios enfoques, incluida la administración de ARN monocatenario o bicatenario, en forma de ARN desnudo, o en forma de complejo o empaquetada, por ejemplo, en vehículos de suministro no virales o virales. En los virus y en los vehículos de suministro viral, la información genética está típicamente encapsulada por proteínas y/o lípidos (partícula de virus). Por ejemplo, se han propuesto partículas de virus con ARN modificado por ingeniería genética derivadas de virus de ARN como vehículo de suministro para el tratamiento de plantas (documento WO 2000/053780 A2) o para la vacunación de mamíferos (Tubulekas et al., 1997, Gene, vol. 190, páginas 191-195). En general, los virus de ARN son un grupo diverso de partículas infecciosas con un genoma de ARN. Los virus de ARN pueden subagruparse en virus de ARN monocatenario (ARNmc) y de ARN bicatenario (ARNbc), y los virus de ARNmc pueden dividirse aún más generalmente en virus de cadena positiva [de cadena (+)] y/o de cadena negativa [de cadena (-)]. Los virus de ARN de cadena positiva son a primera vista atractivos como un sistema de suministro en biomedicina porque su ARN puede servir directamente como plantilla para la traducción en la célula huésped.

Los alfavirus son representantes típicos de los virus de ARN de cadena positiva. Los huéspedes de los alfavirus incluyen una amplia gama de organismos, que comprenden insectos, peces y mamíferos, tales como animales domésticos y seres humanos. Los alfavirus se replican en el citoplasma de las células infectadas (para una revisión del ciclo de vida alfaviral ver Jose et al., Future Microbiol., 2009, vol. 4, páginas 837-856). La longitud total del genoma de muchos alfavirus generalmente varía entre 11 000 y 12000 nucleótidos, y el ARN genómico típicamente tiene una caperuza 5' y una cola de poli(A) 3'. El genoma de los alfavirus codifica proteínas no estructurales (implicadas en la transcripción, modificación y replicación del ARN viral y en la modificación de proteínas) y proteínas estructurales (que forman la partícula viral). Típicamente, el genoma tiene dos marcos de lectura abiertos (ORF). Las cuatro proteínas no estructurales (nsP1-nsP4) típicamente son codificadas juntas por un primer ORF que comienza cerca del extremo 5' del genoma, mientras que las proteínas estructurales del alfavirus son codificadas juntas por un segundo ORF que se encuentra corriente abajo del primer ORF y se extiende cerca del extremo 3' del genoma. Típicamente, el primer ORF es más grande que el segundo ORF, donde la relación es aproximadamente 2:1.

En las células infectadas por un alfavirus, solo la secuencia de ácidos nucleicos que codifica las proteínas no estructurales se traduce a partir del ARN genómico, mientras que la información genética que codifica las proteínas estructurales es traducible a partir de un transcrito subgenómico, que es una molécula de ARN que se parece al ARN mensajero eucariota (ARNm; Gould et al., 2010, Antiviral Res., vol. 87 páginas 111-124). Después de la infección, es decir, en las etapas tempranas del ciclo de vida viral, el ARN genómico de cadena (+) actúa directamente como un ARN mensajero para la traducción del marco de lectura abierto que codifica la poliproteína no estructural (nsP1234). En algunos alfavirus, existe un codón de parada opal entre las secuencias codificantes de nsP3 y nsP4: la poliproteína P123, que contiene nsP1, nsP2 y nsP3, se produce cuando la traducción termina en el codón de parada opal y la poliproteína P1234, que contiene además nsP4, se produce tras la lectura de este codón opal (Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562; Rupp et al., 2015, J. Gen. Virology, vol. 96, páginas 2483-2500). nsP1234 se escinde de manera autoproteolítica en los fragmentos nsP123 y nsP4. Los polipéptidos nsP123 y nsP4 se asocian para formar el complejo de replicasa de cadena (-) que transcribe el ARN de cadena (-), mediante el uso del ARN genómico de cadena (+) como plantilla. Típicamente en etapas posteriores, el fragmento nsP123 se escinde por completo en proteínas individuales nsP1, nsP2 y nsP3 (Shirako y Strauss, 1994, J. Virol., vol. 68, páginas 1874 1885). Las cuatro proteínas forman el complejo replicasa de cadena (+) que sintetiza nuevos genomas de cadena (+), mediante el uso del complemento de cadena (-) de ARN genómico como plantilla (Kim et al., 2004, Virology, vol. 323, páginas 153-163, Vasiljeva etal., 2003, J. Biol. Chemvol. 278, páginas 41636-41645).

En las células infectadas, el ARN subgenómico así como el nuevo ARN genómico se proporcionan con una caperuza 5' por nsP1 (Pettersson et al., 1980, Eur. J. Biochem. 105, 435-443; Rozanov et al., 1992, J. Gen. Virology, vol. 73, páginas 2129-2134), y se proporcionan con una cola de poli-adenilato [poli(A)] por nsP4 (Rubach et al., Virology, 2009, vol. 384, páginas 201-208). Por lo tanto, tanto el ARN subgenómico como el ARN genómico se parecen al ARN mensajero (ARNm).

Las proteínas estructurales de alfavirus (proteína C de nucleocápside central, proteína de envoltura E2 y proteína de envoltura E1, todos constituyentes de la partícula del virus) se codifican típicamente mediante un único marco de lectura abierto bajo el control de un promotor subgenómico (Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562). El promotor subgenómico es reconocido por proteínas no estructurales alfavirales que actúan en cis. En particular, la alfavirus replicasa sintetiza un transcrito subgenómico de cadena (+) mediante el uso del complemento de cadena (-) del ARN genómico como plantilla. El transcrito subgenómico de cadena (+) codifica las proteínas estructurales de alfavirus (Kim et al., 2004, Virology, vol. 323, páginas 153-163, Vasiljeva et al., 2003, J. Biol. Chem vol. 278, páginas 41636-41645). El transcrito de a Rn subgenómico sirve como plantilla para la traducción del marco de lectura abierto que codifica las proteínas estructurales como una poliproteína, y la poliproteína se escinde para producir las proteínas estructurales. En una etapa tardía de la infección por alfavirus en una célula huésped, una señal de empaquetamiento que se localiza dentro de la secuencia codificante de nsP2 asegura el empaquetamiento selectivo del ARN genómico en viriones en gemación, empaquetado por proteínas estructurales (White et al., 1998, J. Virol., vol. 72, páginas 4320-4326).

En las células infectadas, la síntesis del ARN de cadena (-) se observa típicamente solo en las primeras 3-4 h después de la infección, y es indetectable en etapas tardías, momento en el cual solo se observa la síntesis del ARN de cadena (+) (tanto genómica como subgenómica). De acuerdo con Frolov et al., 2001, RNA, vol. 7, páginas 1638-1651, el modelo predominante para la regulación de la síntesis de ARN sugiere una dependencia con el procesamiento de la poliproteína no estructural: la escisión inicial de la poliproteína no estructural nsP1234 produce nsP123 y nsP4; nsP4 actúa como una ARN polimerasa dependiente de ARN (RdRp) que es activa para la síntesis de cadena (-), pero ineficiente para la generación de los ARN de cadena (+). El procesamiento adicional de la poliproteína nsP123, incluida la escisión en la unión nsP2/nsP3, cambia la especificidad de plantilla de la replicasa para aumentar la síntesis de ARN de cadena (+) y para disminuir o terminar la síntesis de ARN de cadena (-).

La síntesis de ARN alfaviral también está regulada por elementos de ARN de acción cis, incluidos cuatro elementos de secuencia conservada (CSE; Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562; y Frolov, 2001, ARN, vol. 7, páginas 1638-1651).

En general, la secuencia de reconocimiento de replicación 5' del genoma de alfavirus se caracteriza por una baja homología general entre diferentes alfavirus, pero tiene una estructura secundaria predicha conservada. La secuencia de reconocimiento de replicación 5' del genoma de alfavirus no solo está implicada en el inicio de la traducción, sino que también comprende la secuencia de reconocimiento de replicación 5' que comprende dos elementos de secuencia conservada implicados en la síntesis de ARN viral, CSE 1 y CSE 2. Para la función de CSE 1 y 2, se considera que la estructura secundaria es más importante que la secuencia lineal (Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562).

Al contrario, la secuencia terminal 3' del genoma del alfavirus, es decir, la secuencia inmediatamente corriente arriba de la secuencia de poli(A), se caracteriza por una estructura primaria conservada, particularmente por el elemento de secuencia conservada 4 (CSE 4), también denominado "secuencia conservada de 19-nt", que es importante para el inicio de la síntesis de la cadena (-).

CSE 3, también denominado "secuencia de unión" es un elemento de secuencia conservada en la cadena (+) de ARN genómico alfaviral, y el complemento de CSE 3 en la cadena (-) actúa como promotor de la transcripción de ARN subgenómico (Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562; Frolov et al., 2001, RNA, vol. 7, páginas 1638-1651). CSE 3 típicamente se superpone con la región que codifica el fragmento C-terminal de nsP4.

Además de las proteínas de alfavirus, también los factores de la célula huésped, presumiblemente proteínas, pueden unirse a elementos de secuencia conservada (Strauss & Strauss, más arriba).

Se han propuesto vectores derivados de alfavirus para el suministro de información genética extraña en células diana u organismos diana. En enfoques simples, el marco de lectura abierto que codifica proteínas estructurales alfavirales se reemplaza por un marco de lectura abierto que codifica una proteína de interés. Los sistemas de trans-replicación basados en alfavirus se basan en elementos de secuencia de nucleótidos de alfavirus en dos moléculas de ácido nucleico separadas: una molécula de ácido nucleico codifica una replicasa viral (típicamente como poliproteína nsP1234), y la otra molécula de ácido nucleico es capaz de ser replicada por dicha replicasa en trans (de ahí la designación sistema de trans-replicación). La trans- replicación requiere la presencia de estas dos moléculas de ácido nucleico en una célula huésped dada. La molécula de ácido nucleico capaz de ser replicada por la replicasa en trans debe comprender ciertos elementos de secuencia alfaviral que permitan el reconocimiento y la síntesis de ARN por la replicasa alfaviral. Un replicón respectivo se ilustra como "ARN plantilla WT-RRS" en la Figura 1. Tal replicón está asociado con la ventaja de permitir la amplificación de un gen de interés bajo el control de un promotor subgenómico; sin embargo, los vectores más versátiles son difíciles de desarrollar porque el marco de lectura abierto que codifica nsP1234 se superpone con la secuencia de reconocimiento de replicación 5' del genoma de alfavirus (secuencia codificante para nsP1) y típicamente también con el promotor subgenómico que comprende CSE 3 (secuencia codificante para nsP4).

Por ejemplo, Michel et al., (2007, Virology, vol. 362, páginas 475-487) describen que la introducción de 95 mutaciones silenciosas (es decir, mutaciones que no afectan la secuencia de la proteína codificada) en la región codificante de nsP1 del virus alfavirus de la encefalitis venezolana (VEEV) abolió por completo la capacidad de VEEV de replicarse en las células, presumiblemente porque las mutaciones silenciosas destruyeron la estructura secundaria del ARN. El documento WO 2008/156829 A2 y Kamrud et al., (2010, J. Gen. Virol., vol. 91, páginas 1723-1727) describen los ARN auxiliares (es decir, ARN de trans-replicación que expresa la cápside y la envoltura de VEEV) que se modificaron de manera que el triplete de bases AUG específico que sirve como codón de inicio para nsP1 de VEEV encontrado en la naturaleza pueda eliminarse (mediante la conversión en un codón de parada) para crear constructos modificados. De acuerdo con Kamrud et al., la conversión del codón de inicio de nsP1 en un codón de parada conservó el potencial replicativo del ARN y estos ARN auxiliares modificados produjeron partículas de VEEV de título ligeramente reducido. Sin embargo, los autores observaron que la conversión de todos los AUG encontrados dentro de la región CSE1/2 en codones de parada dio como resultado un ARN auxiliar que se replicó muy poco en presencia de la replicasa de alfavirus. Los autores atribuyen la pobre replicación a una supuesta alteración de la estructura secundaria del ARN subyacente. Una estructura secundaria comprometida es una explicación bastante probable ya que los autores no mencionaron que controlaron el plegamiento correcto de ARN de su ARN auxiliar modificado.

El hecho de que la secuencia de reconocimiento de replicación 5' requerida para la replicación del ARN comprende un codón de inicio AUG para nsP1 y, por lo tanto, se superpone con la secuencia codificante para el fragmento N-terminal de la proteína no estructural de alfavirus representa un cuello de botella serio para la ingeniería genética de vectores basados en alfavirus porque un replicón que comprende la secuencia de reconocimiento de replicación 5' típicamente codificará (al menos) una parte de la proteína no estructural de alfavirus, típicamente el fragmento N-terminal de nsP1. Esto es desventajoso en varios aspectos:

En el caso de los cis-replicones, esta superposición limita, por ejemplo, la adaptación del uso de codones del ORF de replicasa a diferentes células diana de mamíferos (seres humanos, ratones, animales de granja). Es concebible que la estructura secundaria de la secuencia de reconocimiento de replicación 5' tal como se encuentra en los virus no sea óptima en cada célula diana. Sin embargo, la estructura secundaria no puede alterarse libremente, ya que los posibles cambios de aminoácidos en el ORF de replicasa deben considerarse y probarse para determinar el efecto sobre la función replicasa. Tampoco es posible intercambiar el ORF de replicasa completo por replicasas de origen heterólogo ya que esto puede provocar la alteración de la estructura de secuencia de reconocimiento de replicación 5'.

En el caso de los trans-replicones, esta superposición da como resultado la síntesis de un fragmento de proteína nsP1 ya que la secuencia de reconocimiento de replicación 5' debe mantenerse en los replicones trans. Típicamente, no se requiere ni se desea un fragmento de nsP1: la traducción no deseada impone una carga innecesaria sobre la célula huésped, y los replicones de ARN destinados a aplicaciones terapéuticas que codifican, además de una proteína farmacéuticamente activa, un fragmento de nsP1, pueden enfrentar preocupaciones de regulación. Por ejemplo, será necesario demostrar que el nsP1 truncado no genera efectos secundarios no deseados. Además, la presencia de un codón de inicio AUG para nsP1 dentro de la secuencia de reconocimiento de replicación 5' ha impedido el diseño de frans-replicones que codifican un gen heterólogo de interés de una manera en donde el codón de inicio para la traducción del gen de interés está como máximo en la posición 5' que es accesible para el inicio de la traducción ribosomal. A su vez, la traducción dependiente de caperuza 5' de los transgenes a partir del ARN del frans-replicón de la técnica anterior es un desafío, a menos que se clone como proteína de fusión en el marco del codón de inicio de nsP1 (tales constructos de fusión son descritos, por ejemplo, por Michel et al., 2007, Virology, vol. 362, páginas 475 487). Tales constructos de fusión conducen a la misma traducción innecesaria del fragmento nsP1 mencionado anteriormente, lo que plantea las mismas preocupaciones anteriores. Además, las proteínas de fusión provocan preocupaciones adicionales, ya que podrían alterar la función o actividad del transgén fusionado de interés, o cuando se usan como vector de vacuna, los péptidos que abarcan la región de fusión podrían alterar la inmunogenicidad del antígeno fusionado.

Es necesario superar estas desventajas. Por ejemplo, existe la necesidad de proporcionar replicones mejorados para expresar un ácido nucleico que codifique una proteína de interés, tal como una proteína farmacéuticamente activa, de una manera segura y eficiente. Como se describe en la presente descripción, los aspectos y realizaciones de la presente enseñanza abordan esta necesidad.

Resumen

La invención está definida por las reivindicaciones adjuntas. Las estrategias inmunoterapéuticas representan opciones prometedoras para la prevención y terapia de, por ejemplo, enfermedades infecciosas y enfermedades cancerosas. La identificación de un número creciente de antígenos asociados a patógenos y tumores condujo a una amplia colección de dianas adecuadas para la inmunoterapia. La presente enseñanza abarca agentes y métodos mejorados adecuados para la expresión eficiente de antígenos, adecuados para el tratamiento inmunoterapéutico para la prevención y terapia de enfermedades.

En un primer aspecto, la presente enseñanza proporciona un replicón de ARN que comprende una secuencia de reconocimiento de replicación 5', en donde la secuencia de reconocimiento de replicación 5' se caracteriza porque comprende la eliminación de al menos un codón de iniciación en comparación con una secuencia de reconocimiento de replicación 5' de alfavirus nativa.

En una realización, el replicón de ARN de la enseñanza comprende una secuencia de reconocimiento de replicación 5' (modificada) y un primer marco de lectura abierto que codifica una proteína de interés, por ejemplo, proteína no estructural de alfavirus funcional o un transgén que preferentemente no se deriva de un alfavirus, en particular una proteína no estructural de alfavirus, ubicada corriente abajo de la secuencia de reconocimiento de replicación 5', en donde la secuencia de reconocimiento de replicación 5' y el primer marco de lectura abierto que codifica una proteína de interés no se superponen y preferentemente la secuencia de reconocimiento de replicación 5' no se solapa con ningún marco de lectura abierto del replicón de ARN, por ejemplo, la secuencia de reconocimiento de replicación 5' no contiene un codón de iniciación funcional y preferentemente no contiene ningún codón de iniciación. Con la máxima preferencia, el codón de iniciación del primer marco de lectura abierto que codifica una proteína de interés está en la dirección 5' ^ 3' del replicón de ARN y es el primer codón de iniciación funcional, preferentemente el primer codón de iniciación. En una realización, el primer marco de lectura abierto que codifica una proteína de interés codifica la proteína no estructural de alfavirus funcional. En una realización, el primer marco de lectura abierto que codifica una proteína de interés y preferentemente el replicón de ARN completo no expresa la proteína no estructural de alfavirus no funcional, tal como un fragmento de proteína no estructural de alfavirus, en particular un fragmento de nsP1 y/o nsP4. En una realización, la proteína no estructural de alfavirus funcional es heteróloga a la secuencia de reconocimiento de replicación 5'. En una realización, el primer marco de lectura abierto que codifica una proteína de interés no está bajo el control de un promotor subgenómico. En una realización, el replicón de ARN comprende al menos un marco de lectura abierto adicional que codifica una proteína de interés que está bajo control de un promotor subgenómico. En una realización, el promotor subgenómico y el primer marco de lectura abierto que codifica una proteína de interés no se solapan.

En una realización, la secuencia de reconocimiento de replicación 5' del replicón de ARN que se caracteriza por la eliminación de al menos un codón de iniciación comprende una secuencia homóloga a alrededor de 250 nucleótidos en el extremo 5' de un alfavirus. En una realización preferida, esta comprende una secuencia homóloga a alrededor de 300 a 500 nucleótidos en el extremo 5' de un alfavirus. En una realización preferida esta comprende la secuencia 5'-terminal requerida para la replicación eficiente de la especie de alfavirus específica que es parental al sistema del vector.

En una realización, la secuencia de reconocimiento de replicación 5' del replicón de ARN comprende secuencias homólogas al elemento de secuencia conservada 1 (CSE i) y al elemento de secuencia conservada 2 (CSE 2) de un alfavirus.

En una realización preferida, el replicón de ARN comprende CSE 2 y se caracteriza además porque comprende un fragmento de un marco de lectura abierto de una proteína no estructural de un alfavirus. En una realización más preferida, dicho fragmento de un marco de lectura abierto de una proteína no estructural no comprende ningún codón de iniciación.

En una realización, la secuencia de reconocimiento de replicación 5' comprende una secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus, en donde la secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus se caracteriza porque comprende la eliminación de al menos un codón de iniciación en comparación con la secuencia de alfavirus nativa.

En una realización preferida, la secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus se caracteriza porque comprende la eliminación de al menos el codón de inicio nativo del marco de lectura abierto de una proteína no estructural.

En una realización preferida, la secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de la misma de un alfavirus se caracteriza porque comprende la eliminación de uno o más codones de iniciación distintos del codón de inicio nativo del marco de lectura abierto de una proteína no estructural. En una realización más preferida, dicha secuencia de ácidos nucleicos se caracteriza adicionalmente por la eliminación del codón de inicio nativo del marco de lectura abierto de una proteína no estructural, preferentemente de nsPI.

En una realización preferida, la secuencia de reconocimiento de replicación 5' comprende uno o más bucles de tallo que proporcionan la funcionalidad de la secuencia de reconocimiento de replicación 5' con respecto a la replicación del ARN. En una realización preferida, uno o más bucles de tallo de la secuencia de reconocimiento de replicación 5' no se delecionan o alteran. Con mayor preferencia, uno o más de los bucles de tallo 1, 3 y 5, preferentemente todos los bucles de tallo 1, 3 y 4, o los bucles de tallo 3 y 4 no se delecionan o alteran. Con mayor preferencia, ninguno de los bucles de tallo de la secuencia de reconocimiento de replicación 5' se deleciona o altera.

En una realización preferida, el replicón de ARN comprende uno o más cambios de nucleótidos que compensan las alteraciones del emparejamiento de nucleótidos dentro de uno o más bucles de tallo introducidas mediante la eliminación de al menos un codón de iniciación.

En una realización, el replicón de ARN no comprende un marco de lectura abierto que codifica una proteína no estructural de alfavirus truncada.

En una realización, el replicón de ARN comprende una secuencia de reconocimiento de replicación 3'.

En una realización, el replicón de ARN comprende un primer marco de lectura abierto que codifica una proteína de interés.

En una realización, el replicón de ARN se caracteriza porque la proteína de interés codificada por el primer marco de lectura abierto puede expresarse a partir del replicón de ARN como una plantilla.

En una realización, el replicón de ARN se caracteriza porque comprende un promotor subgenómico. Típicamente, el promotor subgenómico controla la producción de ARN subgenómico que comprende un marco de lectura abierto que codifica una proteína de interés.

En una realización preferida, la proteína de interés codificada por el primer marco de lectura abierto puede expresarse a partir del replicón de ARN como una plantilla. En una realización más preferida, la proteína de interés codificada por el primer marco de lectura abierto puede expresarse adicionalmente a partir del ARN subgenómico.

En una realización preferida, el replicón de ARN se caracteriza además porque comprende un promotor subgenómico que controla la producción de ARN subgenómico que comprende un segundo marco de lectura abierto que codifica una proteína de interés. La proteína de interés puede ser una segunda proteína que es idéntica o diferente de la proteína de interés codificada por el primer marco de lectura abierto.

En una realización más preferida, el promotor subgenómico y el segundo marco de lectura abierto que codifica una proteína de interés se localizan corriente abajo del primer marco de lectura abierto que codifica una proteína de interés. En una realización, la proteína de interés codificada por el primer y/o segundo marco de lectura abierto es una proteína no estructural de alfavirus funcional.

En una realización, el replicón de ARN comprende un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional.

En una realización, el marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional no se solapa con la secuencia de reconocimiento de replicación 5'.

En una realización, el replicón de ARN que codifica la proteína no estructural de alfavirus funcional puede ser replicado por la proteína no estructural de alfavirus funcional.

En una realización, el replicón de ARN no comprende un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional. En esta realización, puede proporcionarse en trans la proteína no estructural de alfavirus funcional para la replicación del replicón como se describe en la presente descripción.

En un segundo aspecto, la presente enseñanza proporciona un sistema que comprende:

un constructo de ARN para expresar la proteína no estructural de alfavirus funcional,

el replicón de ARN de acuerdo con el primer aspecto de la enseñanza, que puede ser replicado por la proteína no estructural funcional de alfavirus en trans. Preferentemente, el replicón de ARN se caracteriza además porque no codifica una proteína no estructural de alfavirus funcional.

En una realización, el replicón de ARN de acuerdo con el primer aspecto o el sistema de acuerdo con el segundo aspecto se caracteriza porque el alfavirus es el virus del bosque Semliki.

En un tercer aspecto, la presente enseñanza proporciona un ADN que comprende una secuencia de ácidos nucleicos que codifica el replicón de ARN de acuerdo con el primer aspecto de la presente enseñanza.

En un cuarto aspecto, la presente enseñanza proporciona un método para producir una proteína de interés en una célula que comprende las etapas de:

(a) obtener el replicón de ARN de acuerdo con el primer aspecto de la enseñanza, que comprende un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional, que puede ser replicado por la proteína no estructural de alfavirus funcional y que además comprende un marco de lectura abierto que codifica la proteína de interés, y

(b) inocular el replicón de ARN en la célula.

En diversas realizaciones del método, el replicón de ARN es como se definió anteriormente para el replicón de la enseñanza.

En un quinto aspecto, la presente enseñanza proporciona un método para producir una proteína de interés en una célula que comprende las etapas de:

(a) obtener un constructo de ARN para expresar la proteína no estructural de alfavirus funcional,

(b) obtener el replicón de ARN de acuerdo con el primer aspecto de la enseñanza, que puede ser replicado por la proteína no estructural de alfavirus funcional de acuerdo con (a) en trans y que comprende un marco de lectura abierto que codifica la proteína de interés, y

(c) coinocular el constructo de ARN para expresar la proteína no estructural de alfavirus funcional y el replicón de ARN en la célula.

En diversas realizaciones del método, el constructo de ARN para expresar la proteína no estructural de alfavirus funcional y/o el replicón de ARN son como se definieron anteriormente para el sistema de la enseñanza. De acuerdo con el quinto aspecto, el replicón de ARN típicamente no codifica por sí mismo la proteína no estructural de alfavirus funcional.

En un sexto aspecto, la enseñanza proporciona una célula que contiene el replicón del primer aspecto o el sistema del segundo aspecto. En una realización, la célula se inocula de acuerdo con el método del cuarto aspecto, o de acuerdo con el método del quinto aspecto de la enseñanza. En una realización, la célula puede obtenerse por el método del cuarto aspecto o por el método del quinto aspecto de la enseñanza. En una realización, la célula es parte de un organismo.

En un séptimo aspecto, la presente enseñanza proporciona un método para producir una proteína de interés en un sujeto que comprende las etapas de:

(b) administrar el replicón de ARN al sujeto.

En un octavo aspecto, la presente enseñanza proporciona un método para producir una proteína de interés en un sujeto que comprende las etapas de:

(c) administrar el constructo de ARN para expresar la proteína no estructural de alfavirus funcional y el replicón de ARn al sujeto.

En diversas realizaciones del método, el constructo de ARN para expresar la proteína no estructural de alfavirus funcional y/o el replicón de ARN son como se definieron anteriormente para el sistema de la enseñanza. De acuerdo con el octavo aspecto, el replicón de ARN típicamente no codifica por sí mismo la proteína no estructural de alfavirus funcional.

Breve descripción de las figuras

Figura 1: Representación esquemática de replicones de ARN que comprenden una secuencia de reconocimiento de replicación 5' no modificada o modificada

Abreviaturas: AAAA = Cola de poli(A); ATG = codón de inicio/codón de iniciación (ATG en el nivel de ADN; AUG en el nivel de ARN); 5x ATG = secuencia de ácidos nucleicos que comprende todos los codones de inicio en la secuencia de ácidos nucleicos que codifica nsP1* (en el caso de la secuencia de ácidos nucleicos que codifica nsP1* del virus del bosque Semliki 5x ATG corresponde a cinco codones de inicio específicos, ver el Ejemplo 1); A5ATG = secuencia de ácidos nucleicos que corresponde a una secuencia de ácidos nucleicos que codifica nsP1*; sin embargo, no comprende ningún codón de inicio de la secuencia de ácidos nucleicos que codifica nsP1* en el alfavirus encontrado en la naturaleza (en el caso de nsP1* derivada del virus del bosque Semliki, "A5ATG" corresponde a la eliminación de cinco codones de inicio específicos en comparación con el virus del bosque Semliki encontrado en la naturaleza, ver el Ejemplo 1); EcoRV = sitio de restricción para EcoRV; nsP = secuencia de ácidos nucleicos que codifica una proteína no estructural de alfavirus (por ejemplo, nsP1, nsP2, nsP3, nsP4); nsP1* = secuencia de ácidos nucleicos que codifica un fragmento de nsP1, en donde el fragmento no comprende el fragmento C-terminal de nsP1; *nsP4 = secuencia de ácidos nucleicos que codifica un fragmento de nsP4, en donde el fragmento no comprende el fragmento N-terminal de nsP4; RRS = secuencia de reconocimiento de replicación 5'; Sa/l = sitio de restricción para Sa/l; SGP = promotor subgenómico; SL = bucle de tallo (por ejemplo, SL1, SL2, SL3, SL4); las posiciones de SL1-4 se ilustran gráficamente; UTR = región no traducida (por ejemplo, 5'-UTR, 3'-UTR); WT = de tipo silvestre.

c/sReplicón WT-RRS: Replicón de ARN que corresponde esencialmente al genoma de un alfavirus, excepto que la secuencia de ácidos nucleicos que codifica las proteínas estructurales del alfavirus ha sido reemplazada por un marco de lectura abierto que codifica un gen de interés ("Transgén"). Cuando se introduce el "Replicón WT-RRS" en una célula, el producto de traducción del marco de lectura abierto que codifica la replicasa (nsP1234 o fragmento(s) de esta) puede impulsar la replicación del replicón de ARN en c/s e impulsar la síntesis de una secuencia de ácidos nucleicos (el transcrito subgenómico) corriente abajo del promotor subgenómico (SGP).

Trans-replicón o ARN plantilla WT-RRS: Replicón de ARN que corresponde esencialmente al "Replicón WT-RRS", excepto que la mayor parte de la secuencia de ácidos nucleicos que codifica las proteínas no estructurales del alfavirus nsP1-4 se han eliminado. Más específicamente, la secuencia de ácidos nucleicos que codifica nsP2 y nsP3 se ha eliminado por completo; la secuencia de ácidos nucleicos que codifica nsP1 se ha truncado de manera que el "ARN plantilla WT-RRS" codifica un fragmento de nsP1, cuyo fragmento no comprende el fragmento C-terminal de nsP1 (pero comprende el fragmento N-terminal de nsP1; nsPl*); la secuencia de ácidos nucleicos que codifica nsP4 se ha truncado de manera que el "ARN plantilla WT-RRS" codifica un fragmento de nsP4, cuyo fragmento no comprende el fragmento N-terminal de nsP4 (pero comprende el fragmento C-terminal de nsP4; *nsP4). Esta secuencia truncada de nsP4 se superpone parcialmente con el promotor subgenómico completamente activo. La secuencia de ácidos nucleicos que codifica nsP1* comprende todos los codones de iniciación de la secuencia de ácidos nucleicos que codifica nsP1* en el alfavirus encontrado en la naturaleza (en el caso de nsP1* del virus del bosque Semliki, cinco codones de iniciación específicos).

A5ATG-RRS: El replicón de ARN corresponde esencialmente al "ARN de plantilla WT-RRS", excepto que no comprende ningún codón de iniciación de la secuencia de ácidos nucleicos que codifica nsP1* en el alfavirus encontrado en la naturaleza (en el caso del virus del bosque Semliki, "A5ATG-RRS" corresponde a la eliminación de cinco codones de iniciación específicos en comparación con el virus del bosque Semliki encontrado en la naturaleza). Todos los cambios de nucleótidos introducidos para eliminar los codones de inicio fueron compensados por cambios de nucleótidos adicionales para conservar la estructura secundaria predicha del ARN.

A5ATG-RRSASGP: Replicón de ARN que corresponde esencialmente a "A5ATG-RRS", excepto que no comprende el promotor subgenómico (SGP) y no comprende la secuencia de ácidos nucleicos que codifica *nsP4. "Transgén 1" = un gen de interés.

A5ATG-RRS - bicistrónico: Replicón de ARN que corresponde esencialmente a "A5ATG-RRS", excepto que comprende un primer marco de lectura abierto que codifica un primer gen de interés ("Transgén 1") corriente arriba del promotor subgenómico, y un segundo marco de lectura abierto que codifica un segundo gen de interés ("Transgén 2") corriente abajo del promotor subgenómico. La localización del segundo marco de lectura abierto corresponde a la localización del gen de interés ("Transgén") en el replicón de ARN "A5ATG-RRS".

c/sReplicón A5ATG-RRS: Replicón de ARN que corresponde esencialmente a "A5ATG-RRS - bicistrónico", excepto que el marco de lectura abierto que codifica un primer gen de interés codifica la proteína no estructural de alfavirus funcional (típicamente un marco de lectura abierto que codifica la poliproteína nsP1-nsP2-nsP3-nsP4, es decir, nsP1234). "Transgén" en "cisReplicón A5ATG-RRS" corresponde al "Transgén 2" en "A5ATG-RRS - bicistrónico". La proteína no estructural de alfavirus funcional es capaz de reconocer el promotor subgenómico y de sintetizar transcritos subgenómicos que comprenden la secuencia de ácidos nucleicos que codifica el gen de interés ("Transgén"). "cisReplicón A5ATG-RRS" codifica una proteína no estructural de alfavirus funcional en c/s al igual que "cisReplicón WT-RRS"; sin embargo, no se requiere que la secuencia codificante para nsP1 codificada por "cisReplicón A5ATG-RRS" comprenda la secuencia de ácidos nucleicos exacta de "cisReplicón WT-RRS" incluyendo todos los bucles de tallo.

Figura 2: La eliminación de codones de inicio dentro de la secuencia de reconocimiento de replicación 5' no afecta la replicación de los ARN de frans-replicón. A: ilustración de las moléculas de ácido nucleico usadas en el Ejemplo 2. B: Expresión de luciferasa medida de células BHK21 electroporadas. Para detalles, ver el Ejemplo 2. Se muestra la media ± DE de 2 experimentos independientes con 2 lotes producidos independientemente de replicón de ARN ("plantilla"); (N=4).

Figura 3: La eliminación de los codones de inicio dentro de la secuencia de reconocimiento de replicación 5' permite la traducción dependiente de caperuza. Izquierda: ilustración de moléculas de ácido nucleico (replicones de ARN) usadas en el Ejemplo 3. Derecha: Expresión de luciferasa medida de fibroblastos de prepucio humano electroporados. Para detalles, ver el Ejemplo 3. Se muestra la media ± DE de un experimento realizado por triplicado.

Figura 4: Justo después de la transfección, la traducción dependiente de caperuza del trans-replicón caracterizada por la eliminación de los codones de inicio dentro de la secuencia de reconocimiento de replicación 5' es más fuerte que la traducción de un transcrito subgenómico. Izquierda: ilustración de moléculas de ácido nucleico. Los replicones de ARN usados en el Ejemplo 4 se ilustran como "A5ATG-RRS" y "A5ATG-RRSASGP". Derecha: Expresión de luciferasa medida de células BHK21 electroporadas. Para detalles, ver el Ejemplo 4. Se muestra la media de un experimento realizado por triplicado.

Figura 5: Un trans-replicón protegido caracterizado por la eliminación de los codones de inicio dentro de la secuencia de reconocimiento de replicación 5' permite la expresión de un transgén en etapas tempranas. Izquierda: ilustración de la molécula de ácido nucleico "A5ATG-RRSASGP" usada en el Ejemplo 5. Derecha: Expresión de luciferasa medida de células BHK21 electroporadas. Para detalles, ver el Ejemplo 5. Se muestra la media ± DE de un experimento realizado por triplicado.

Figura 6. Estructuras de los dinucleótidos caperuza. Arriba: un dinucleótido caperuza natural, m7GpppG. Abajo: Dinucleótido beta-S-ARCA análogo de caperuza de fosforotioato: Existen dos diastereómeros de beta-S-ARCA debido al centro estereogénico P, que se designan D1 y D2 de acuerdo con sus características de elución en HPLC de fase inversa.

Figura 7. Los cis-replicones reconstruidos con un RRS con ATG delecionado son funcionales. El ORF de replicasa de SFV se insertó en "A5ATG-RRS" que codifica luciferasa de luciérnaga corriente abajo del promotor subgenómico (SGP). Dentro de la replicasa insertada, las regiones correspondientes a CSE2 y al SGP central fueron alteradas mediante intercambios de nucleótidos (recuadros rayados) para evitar la duplicación de estas regiones reguladoras. Esto dio como resultado un cis-replicón reconstruido. Las células BHK21 se coelectroporaron con 2,5 |jg ya sea de "cis-replicón WT-RRS" o "cis-replicón A5ATG-RRS". 24 h después de la electroporación se midió la expresión de luciferasa. Media ± DE de un experimento por triplicado.

Figura 8. Los trans-replicones bicistrónicos expresan ambos transgenes. La nano-luciferasa secretable (SNL) se clonó corriente abajo del promotor subgenómico (SGP) de un trans-replicón WT-RSS. La posición corriente arriba del SGP no codifica un transgén (-)SGP(SNL). En el constructo inferior, se clonó SNL corriente abajo de AATG-RSS, y se insertó luciferasa de luciérnaga (Luc) corriente abajo del SGP (SNL)SGP(Luc). Las células BHK21 se coelectroporaron con 0,9 jg de ARN de trans-replicación y 5 jg de ARNm codificante de replicasa de SFV, 48 horas después de la electroporación, se midieron la expresión de SNL y Luc. Datos de un experimento.

Figura 9. Los frans-replicones de virus Sindbis que carecen de codones de inicio en la secuencia de reconocimiento de replicación se replican de manera eficiente. Los trans-replicones se diseñaron a partir del genoma del virus Sindbis mediante síntesis génica y se insertó GFP corriente abajo del promotor subgenómico (SGP). Además de este trans replicón con secuencia de reconocimiento de replicación no modificada (WT-RSS), se generaron dos variantes de este. En AATG-RRS el codón de inicio original más 4 ATG adicionales se eliminaron del WT-RRS. Los cambios compensatorios de nucleótidos para mantener la estructura secundaria de ARN también se introdujeron según fue necesario. Para generar AATG-RRSASGP, la región correspondiente al promotor subgenómico se eliminó del AATG-RRS dando como resultado un vector con GFP directamente corriente abajo de la 5'RRS con ATG delecionado. Las células BHK21 se coelectroporaron con 0,1 jg de ARN de trans-replicación y 2,4 jg de ARNm codificante de replicasa de SFV. 24 horas después de la electroporación, se evaluó la expresión de GFP (tasa de transfección [%] e intensidad de fluorescencia media (MFI)). Datos de un experimento.

Descripción detallada

Aunque la presente invención se describe en detalle más abajo, debe entenderse que esta invención no se limita a las metodologías, protocolos y reactivos particulares descritos en la presente descripción, ya que pueden variar. Debe entenderse, también, que la terminología usada en la presente descripción es para el propósito de describir realizaciones particulares solamente, y no pretende limitar el alcance de la presente invención la cual se limitará solamente por las reivindicaciones anexas. A menos que se defina de otra manera, todos los términos técnicos y científicos que se usan en la presente descripción tienen el mismo significado que el que entiende comúnmente un experto en la técnica.

Preferentemente, los términos que se usan en la presente descripción se definen como se describe en "A multilingual glossary of biotechnological terms: (IUPAC Recommendations)", H.G.W. Leuenberger, B. Nagel, y H. Kolbl, Eds., Helvetica Chimica Acta, CH-4010 Basel, Suiza, (1995).

La práctica de la presente enseñanza empleará, a menos que se indique de cualquier otra manera, métodos convencionales de química, bioquímica, biología celular, inmunología y técnicas de ADN recombinante que se explican en la literatura del campo (consultar, por ejemplo, Molecular Cloning: A Laboratory Manual, 2da Edición, J. Sambrook et al., eds., Cold Spring Harbor Laboratory Press, Cold Spring Harbor 1989).

A continuación, se describirán los elementos de la presente invención. Estos elementos se enumeran con realizaciones específicas, sin embargo, debe entenderse que pueden combinarse de cualquier manera y en cualquier número para crear realizaciones adicionales. Los ejemplos descritos de diversas maneras y las realizaciones preferidas no deben interpretarse para limitar la presente invención a solamente las realizaciones descritas explícitamente. Debe entenderse que esta descripción describe y abarca realizaciones que combinan las realizaciones descritas explícitamente con cualquier cantidad de elementos descritos y/o preferidos. Además, cualquiera de las permutaciones y combinaciones de todos los elementos descritos en esta solicitud deben considerarse descritas por esta descripción a menos que el contexto lo indique de cualquier otra manera.

La expresión "alrededor de" significa aproximadamente o casi y en el contexto de un valor numérico o intervalo establecido en la presente descripción significa ± 10 % del valor numérico o intervalo enumerado o reivindicado.

Los términos "un" y "una" y "el/la" y referentes similares usados en el contexto para describir la enseñanza (especialmente en el contexto de las reivindicaciones) deben interpretarse para cubrir tanto el singular como el plural, a menos que se indique de cualquier otra manera en la presente descripción, o claramente se contradiga por el contexto. La enumeración de los intervalos de valores en la presente descripción pretende servir simplemente como un método abreviado para referirse individualmente a cada valor separado que se encuentra dentro del intervalo. A menos que se indique de cualquier otra manera en la presente descripción, cada valor individual se incorpora en la descripción como si se enumerara individualmente en la presente descripción. Todos los métodos que se describen en la presente descripción pueden llevarse a cabo en cualquier orden adecuado a menos que se indique de otra manera en la presente descripción o que el contexto lo contradiga claramente de otra manera. El uso de cualquiera y de todos los ejemplos, o de lenguaje ilustrativo (por ejemplo, “tal como”) proporcionados en la presente descripción, sólo tiene la intención de aclarar mejor la invención y no plantea una limitación en el alcance de la invención a menos que se declare de cualquier otra manera.

De ninguna manera el lenguaje en la descripción debe interpretarse como indicación de cualquier elemento no reivindicado esencial para la práctica de la invención.

A menos que se especifique expresamente de cualquier otra manera, el término "que comprende" se usa en el contexto del presente documento para indicar que otros miembros pueden estar presentes opcionalmente además de los miembros de la lista introducida por "que comprende". Sin embargo, se contempla como una realización específica de la presente enseñanza que el término "que comprende" abarca la posibilidad de que no haya más miembros presentes, es decir, para el propósito de esta realización, "que comprende" debe entenderse como que tiene el significado de "que consiste en".

Las indicaciones de cantidades relativas de un componente caracterizado por un término genérico pretenden referirse a la cantidad total de todas las variantes o miembros específicos cubiertos por dicho término genérico. Si se especifica que un cierto componente definido por un término genérico está presente en una cierta cantidad relativa, y si este componente se caracteriza además por ser una variante específica o miembro cubierto por el término genérico, significa que no están presentes otras variantes o miembros cubiertos por el término genérico adicionalmente de manera que la cantidad relativa total de componentes cubiertos por el término genérico excede la cantidad relativa especificada; con mayor preferencia, no están presentes otras variantes o miembros cubiertos por el término genérico en absoluto.

Como se usa en la presente descripción "reducir" o "inhibir" significa la capacidad de provocar una disminución global, preferentemente de 5 % o mayor, 10 % o mayor, 20 % o mayor, con mayor preferencia de 50 % o mayor, y con la máxima preferencia de 75 % o mayor en el nivel, por ejemplo, en el nivel. El término "inhibir" o frases similares incluye una inhibición completa o esencialmente completa, es decir, una reducción a cero o esencialmente a cero.

Los términos tales como "aumentar" o "potenciar", preferentemente se refieren a un aumento o potenciación en alrededor de al menos un 10 %, preferentemente al menos 20 %, preferentemente al menos 30 %, con mayor preferencia al menos 40 %, con mayor preferencia al menos 50 %, incluso con mayor preferencia al menos 80 %, y con la máxima preferencia al menos 100 %.

La expresión "carga neta" se refiere a la carga sobre un objeto completo, como un compuesto o partícula.

Un ion que tiene una carga positiva neta general es un catión, mientras que un ion que tiene una carga negativa neta general es un anión. Así, de acuerdo con la enseñanza, un anión es un ion con más electrones que protones, lo que le da una carga negativa neta; y un catión es un ion con menos electrones que protones, lo que le da una carga positiva neta.

Los términos "cargado", "carga neta", "cargado negativamente" o "cargado positivamente", con referencia a un compuesto o partícula dada, se refieren a la carga neta eléctrica del compuesto o partícula dada cuando se disuelve o suspende en agua a pH 7,0.

La expresión "ácido nucleico" de acuerdo con la enseñanza también comprende una derivatización química de un ácido nucleico en una base de nucleótidos, en el azúcar o en el fosfato, y ácidos nucleicos que contienen nucleótidos y análogos de nucleótidos no naturales. En algunas realizaciones, el ácido nucleico es un ácido desoxirribonucleico (ADN) o un ácido ribonucleico (ARN). En general, una molécula de ácido nucleico o una secuencia de ácidos nucleicos se refiere a un ácido nucleico que es preferentemente ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN). De acuerdo con la enseñanza, los ácidos nucleicos comprenden ADN genómico, ADNc, ARNm, ARN viral, moléculas preparadas por vía recombinante y sintetizadas químicamente. De acuerdo con la enseñanza, un ácido nucleico puede estar en la forma de una molécula monocatenaria o bicatenaria y lineal o circular covalentemente cerrada.

De acuerdo con la enseñanza, "secuencia de ácidos nucleicos" se refiere a la secuencia de nucleótidos en un ácido nucleico, por ejemplo, un ácido ribonucleico (ARN) o un ácido desoxirribonucleico (ADN). La expresión puede referirse a una molécula completa de ácido nucleico (tal como a la cadena sencilla de una molécula completa de ácido nucleico) o a una parte (por ejemplo, un fragmento) de esta.

De acuerdo con la presente enseñanza, el término "ARN" o "molécula de ARN" se refiere a una molécula que comprende residuos de ribonucleótidos y que preferentemente está compuesta total o sustancialmente de residuos de ribonucleótidos. El término "ribonucleótido" se refiere a un nucleótido con un grupo hidroxilo en la posición 2' de un grupo p-D-ribofuranosilo. El término "ARN" incluye ARN bicatenario, ARN monocatenario, ARN aislado tal como ARN parcialmente o completamente purificado, ARN esencialmente puro, ARN sintético, ARN generado de manera recombinante tal como ARN modificado que difiere del ARN de origen natural por adición, deleción, sustitución y/o alteración de uno o más nucleótidos. Dichas alteraciones pueden incluir la adición de material no nucleotídico, tal como al(los) extremo(s) de un ARN o internamente, por ejemplo, a uno o más nucleótidos del ARN. Los nucleótidos en las moléculas de ARN pueden comprendertambién nucleótidos no estándar, tales como nucleótidos que no son de origen natural o nucleótidos o desoxinucleótidos sintetizados químicamente. Estos ARN alterados pueden denominarse análogos, particularmente análogos de ARN de origen natural.

De acuerdo con la enseñanza, el ARN puede ser monocatenario o bicatenario. En algunas realizaciones de la presente enseñanza, se prefiere el ARN monocatenario. La expresión "ARN monocatenario" generalmente se refiere a una molécula de ARN a la que no se asocia una molécula de ácido nucleico complementaria (típicamente ninguna molécula de ARN complementaria). El ARN monocatenario puede contener secuencias autocomplementarias que permiten que partes del a Rn se plieguen y formen motivos de estructura secundaria que incluyen, sin limitación, pares de bases, tallos, bucles de tallo y protuberancias. El ARN monocatenario puede existir como cadena negativa [cadena (-)] o como cadena positiva [cadena (+)]. La cadena (+) es la cadena que comprende o codifica información genética. La información genética puede ser, por ejemplo, una secuencia de polinucleótidos que codifica una proteína. Cuando el ARN de cadena (+) codifica una proteína, la cadena (+) puede servir directamente como plantilla para la traducción (síntesis de proteínas). La cadena (-) es el complemento de la cadena (+). En el caso del ARN bicatenario, la cadena (+) y la cadena (-) son dos moléculas de ARN separadas, y ambas moléculas de ARN se asocian entre sí para formar un A r N bicatenario ("ARN dúplex").

El término "estabilidad" del ARN se refiere a la "vida media" del ARN. La "vida media" se refiere al período de tiempo que se necesita para eliminar la mitad de la actividad, cantidad, o número de moléculas. En el contexto de la presente enseñanza, la vida media de un ARN es indicativo de la estabilidad de dicho ARN. La vida media del ARN puede influenciar la "duración de la expresión" del ARN. Puede esperarse que el ARN que tiene una vida media larga se expresará por un período de tiempo prolongado.

La expresión "eficiencia de traducción" se refiere a la cantidad de producto de traducción proporcionado por una molécula de ARN dentro de un período de tiempo particular.

"Fragmento", con referencia a una secuencia de ácidos nucleicos, se refiere a una parte de una secuencia de ácidos nucleicos, es decir, una secuencia que representa la secuencia de ácidos nucleicos acortada en el(los) extremo(s) 5' y/o 3'. Preferentemente, un fragmento de una secuencia de ácidos nucleicos comprende al menos 80 %, preferentemente al menos 90 %, 95 %, 96 %, 97 %, 98 % o 99 % de los residuos de nucleótidos de dicha secuencia de ácidos nucleicos. En la presente enseñanza se prefieren aquellos fragmentos de moléculas de ARN que retienen la estabilidad y/o la eficiencia traduccional del ARN.

"Fragmento", con referencia a una secuencia de aminoácidos (péptido o proteína), se refiere a una parte de una secuencia de aminoácidos, es decir, una secuencia que representa la secuencia de aminoácidos acortada en el extremo N y/o el extremo C. Puede obtenerse un fragmento acortado en el extremo C (fragmento N-terminal), por ejemplo, mediante la traducción de un marco de lectura abierto truncado que carece del extremo 3' del marco de lectura abierto. Puede obtenerse un fragmento acortado en el extremo N (fragmento C-terminal), por ejemplo, mediante la traducción de un marco de lectura abierto truncado que carece del extremo 5' del marco de lectura abierto, siempre que el marco de lectura abierto truncado comprenda un codón de inicio que sirve para iniciar la traducción. Un fragmento de una secuencia de aminoácidos comprende, por ejemplo, al menos 1 %, al menos 2 %, al menos 3 %, al menos 4 %, al menos 5 %, al menos 10 %, al menos 20 %, al menos 30 %, al menos 40 %, al menos 50 %, al menos 60 %, al menos 70 %, al menos 80 %, al menos 90 % de los residuos de aminoácidos de una secuencia de aminoácidos.

El término "variante" con respecto a, por ejemplo, secuencias de ácidos nucleicos y de aminoácidos, de acuerdo con la enseñanza incluye cualesquiera de las variantes, en particular mutantes, variantes de cepas virales, variantes de empalme, conformaciones, isotermas, variantes alélicas, variantes de especies y homólogos de especies, en particular aquellos que son de origen natural. Una variante alélica se refiere a una alteración en la secuencia normal de un gen, cuya relevancia frecuentemente no está clara. La secuenciación génica completa frecuentemente identifica numerosas variantes alélicas para un gen determinado. Con respecto a las moléculas de ácido nucleico, el término "variante" incluye secuencias de ácidos nucleicos degeneradas, en donde un ácido nucleico degenerado de acuerdo con la enseñanza es un ácido nucleico que difiere de un ácido nucleico de referencia en la secuencia de codones debido a la degeneración del código genético. Un homólogo de especie es una secuencia de ácidos nucleicos o de aminoácido con un origen de especie diferente del de una secuencia de ácidos nucleicos o de aminoácidos dada. Un homólogo de virus es una secuencia de ácidos nucleicos o de aminoácidos con un origen viral diferente del de una secuencia de ácidos nucleicos o de aminoácidos dada.

De acuerdo con la enseñanza, las variantes de ácido nucleico incluyen deleciones, adiciones, mutaciones, sustituciones y/o inserciones de nucleótidos simples o múltiples en comparación con el ácido nucleico de referencia. Las deleciones incluyen la eliminación de uno o más nucleótidos del ácido nucleico de referencia. Las variantes de adición comprenden fusiones 5' y/o 3'-terminal de uno o más nucleótidos, tales como 1, 2, 3, 5, 10, 20, 30, 50 o más nucleótidos. En el caso de las sustituciones, se elimina al menos un nucleótido de la secuencia y se inserta al menos otro nucleótido en su lugar (tales como transversiones y transiciones). Las mutaciones incluyen sitios abásicos, sitios reticulados y bases químicamente alteradas o modificadas. Las inserciones incluyen la adición de al menos un nucleótido en el ácido nucleico de referencia.

De acuerdo con la enseñanza, "cambio de nucleótidos" puede referirse a deleciones, adiciones, mutaciones, sustituciones y/o inserciones de nucleótidos simples o múltiples en comparación con el ácido nucleico de referencia. En algunas realizaciones, se selecciona un "cambio de nucleótido" del grupo que consiste en una deleción de un nucleótido único, la adición de un nucleótido único, la mutación de un nucleótido único, la sustitución de un nucleótido único y/o la inserción de un nucleótido único, en comparación con el ácido nucleico de referencia. De acuerdo con la enseñanza, una variante de ácido nucleico puede comprender uno o más cambios de nucleótidos en comparación con el ácido nucleico de referencia.

Las variantes de secuencias de ácidos nucleicos específicas tienen preferentemente al menos una propiedad funcional de dichas secuencias específicas y preferentemente son funcionalmente equivalentes a dichas secuencias específicas, por ejemplo, secuencias de ácidos nucleicos que exhiben propiedades idénticas o similares a las de las secuencias de ácidos nucleicos específicas.

Como se describe más adelante, algunas realizaciones de la presente enseñanza se caracterizan entre otros por secuencias de ácidos nucleicos que son homólogas a las secuencias de ácidos nucleicos de un alfavirus, tal como un alfavirus encontrado en la naturaleza. Estas secuencias homólogas son variantes de secuencias de ácidos nucleicos de un alfavirus, tal como un alfavirus encontrado en la naturaleza.

Preferentemente, el grado de identidad entre una secuencia de ácidos nucleicos dada y una secuencia de ácidos nucleicos que es una variante de dicha secuencia de ácidos nucleicos dada será al menos 70 %, preferentemente al menos 75 %, preferentemente al menos 80 %, con mayor preferencia al menos 85 %, incluso con mayor preferencia al menos 90 % o con la máxima preferencia al menos 95 %, 96 %, 97 %, 98 % o 99 %. El grado de identidad se da preferentemente para una región de al menos alrededor de 30, al menos alrededor de 50, al menos alrededor de 70, al menos alrededor de 90, al menos alrededor de 100, al menos alrededor de 150, al menos alrededor de 200, al menos alrededor de 250, al menos alrededor de 300 o al menos alrededor de 400 nucleótidos. En realizaciones preferidas, el grado de identidad está dado por la longitud completa de la secuencia del ácido nucleico de referencia.

"Similitud de secuencia" indica el porcentaje de aminoácidos que son idénticos o que representan sustituciones conservadoras de aminoácidos. "Identidad de secuencia" entre dos secuencias de polipéptidos o de ácidos nucleicos indica el porcentaje de aminoácidos o nucleótidos que son idénticos entre las secuencias.

La expresión "% idéntico" pretende referirse, en particular, a un porcentaje de nucleótidos que son idénticos en una alineación óptima entre dos secuencias a comparar, donde dicho porcentaje es puramente estadístico, y las diferencias entre las dos secuencias pueden distribuirse aleatoriamente en toda la longitud de la secuencia y la secuencia a comparar puede comprender adiciones o deleciones en comparación con la secuencia de referencia, para obtener una alineación óptima entre dos secuencias. Las comparaciones de dos secuencias generalmente se llevan a cabo al comparar dichas secuencias, después de una alineación óptima, con respecto a un segmento o "ventana de comparación", para identificar regiones locales de secuencias correspondientes. El alineamiento óptimo para una comparación puede llevarse a cabo manualmente o con la ayuda del algoritmo de homología local de Smith y Waterman, 1981, Ads App. Math. 2, 482, con la ayuda del algoritmo de homología local de Needleman y Wunsch, 1970, J. Mol. Biol. 48, 443, y con la ayuda del algoritmo de búsqueda de similitudes de Pearson y Lipman, 1988, Proc. Natl Acad. Sci. USA 85, 2444 o con la ayuda de programas informáticos que usan dichos algoritmos (GAP, BESTFIT, FASTA, BLAST P, BLAST N y TFASTA en Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Drive, Madison, Wis.).

El porcentaje de identidad se obtiene mediante la determinación del número de posiciones idénticas en las que corresponden las secuencias a comparar, dividiendo este número entre el número de posiciones comparadas y multiplicando este resultado por 100.

Por ejemplo, puede usarse el programa BLAST "BLAST 2 sequences" que está disponible en el sitio web http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi.

Un ácido nucleico es "capaz de hibridarse" o "se hibrida" con otro ácido nucleico si las dos secuencias son complementarias entre sí. Un ácido nucleico es "complementario" a otro ácido nucleico si las dos secuencias son capaces de formar un dúplex estable entre sí. De acuerdo con la enseñanza, la hibridación se lleva a cabo, preferentemente, en condiciones que permiten la hibridación específica entre polinucleótidos (condiciones rigurosas). Las condiciones rigurosas se describen, por ejemplo, en Molecular Cloning: A Laboratory Manual, J. Sambrook et al., Editores, 2a Edición, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nueva York, 1989 o Current Protocols in Molecular Biology, F.M. Ausubel et al., Editores, John Wiley & Sons, Inc., Nueva York y se refieren, por ejemplo, a una hibridación a 65 °C en un tampón de hibridación (3,5 x SSC, Ficoll al 0,02 %, polivinilpirrolidona al 0,02 %, albúmina de suero bovino al 0,02 %, NaH2PO42,5 mM (pH 7), SDS al 0,5 %, EDTA 2 mM). Ss C es cloruro de sodio 0,15 M/citrato de sodio 0,15 M, pH 7. Después de la hibridación, se lava la membrana a la que se ha transferido el ADN, por ejemplo, en 2 x SSC a temperatura ambiente y después en 0,1-0,5 x SSC/0,1 x SDS a temperaturas de hasta 68 °C.

Un porcentaje de complementariedad indica el porcentaje de residuos contiguos en una molécula de ácido nucleico que pueden formar enlaces de hidrógeno (por ejemplo, apareamiento de bases de Watson-Crick) con una segunda secuencia de ácidos nucleicos (por ejemplo, 5, 6, 7, 8, 9, 10 de 10 que son 50 %, 60 %, 70 %, 80 %, 90 % y 100 % complementarias). "Perfectamente complementario" o "completamente complementario" significa que todos los residuos contiguos de una secuencia de ácidos nucleicos se unirán por enlaces de hidrógeno con la misma cantidad de residuos contiguos en una segunda secuencia de ácidos nucleicos. Preferentemente, el grado de complementariedad de acuerdo con la enseñanza es al menos 70 %, preferentemente, al menos 75 %, preferentemente, al menos 80 %, con mayor preferencia, al menos 85 %, aún con mayor preferencia, al menos 90 % o con la máxima preferencia, al menos 95 %, 96 %, 97 %, 98 % o 99 %. Con la máxima preferencia, el grado de complementariedad de acuerdo con la enseñanza es del 100 %.

El término "derivado" comprende la formación de un derivado químico de un ácido nucleico en una base nucleotídica, en el azúcar o en el fosfato. El término "derivado" comprende, además, ácidos nucleicos que contienen nucleótidos y análogos de nucleótidos que no son de origen natural. Preferentemente, la formación de un derivado de un ácido nucleico aumenta su estabilidad.

De acuerdo con la enseñanza, una "secuencia de ácidos nucleicos que se deriva de una secuencia de ácidos nucleicos" se refiere a un ácido nucleico que es una variante del ácido nucleico del que se deriva. Preferentemente, una secuencia que es una variante con respecto a una secuencia específica, cuando reemplaza la secuencia específica en una molécula de ARN, retiene la estabilidad y/o la eficiencia traduccional del ARN.

"nt" es una abreviatura para nucleótido; o para nucleótidos, preferentemente nucleótidos consecutivos en una molécula de ácido nucleico.

De acuerdo con la enseñanza, el término "codón" se refiere a un triplete de bases en un ácido nucleico codificante que especifica qué aminoácido se añadirá a continuación durante la síntesis de proteínas en el ribosoma.

Los términos "transcripción" y "síntesis de ARN" se refieren a un proceso durante el cual una molécula de ácido nucleico con una secuencia de ácidos nucleicos particular (la "plantilla de ácido nucleico") es leída por una ARN polimerasa para que la ARN polimerasa produzca una molécula de ARN monocatenario. Durante la transcripción, se transcribe la información genética en una plantilla de ácido nucleico. La plantilla de ácido nucleico puede ser ADN; sin embargo, por ejemplo, en el caso de la transcripción de una plantilla de ácido nucleico alfaviral, la plantilla es típicamente ARN. Posteriormente, el ARN transcrito puede traducirse en proteína. De acuerdo con la presente enseñanza, el término "transcripción" comprende "transcripción in vitro", en donde el término transcripción "in vitro" se refiere a un proceso en donde el ARN, en particular el ARNm, se sintetiza in vitro en un sistema libre de células. Preferentemente, los vectores de clonación se aplican para la generación de transcritos. Estos vectores de clonación se designan generalmente como vectores de transcripción y son abarcados, de acuerdo con la presente enseñanza, por el término "vector". Los vectores de clonación son preferentemente plásmidos. De acuerdo con la presente enseñanza, el ARN preferentemente es ARN transcrito in vitro (ARN-IVT) y puede obtenerse mediante transcripción in vitro de una plantilla de ADN apropiada. El promotor para controlar la transcripción puede ser cualquier promotor para cualquier ARN polimerasa. Una plantilla de ADN para la transcripción in vitro puede obtenerse clonando un ácido nucleico, en particular ADNc, e introduciéndolo en un vector apropiado para la transcripción in vitro. El ADNc puede obtener se por transcripción inversa del ARN.

La molécula de ácido nucleico monocatenario producida durante la transcripción típicamente tiene una secuencia de ácidos nucleicos que es la secuencia complementaria de la plantilla.

De acuerdo con la enseñanza, las expresiones "plantilla" o "plantilla de ácido nucleico" o "ácido nucleico plantilla" generalmente se refieren a una secuencia de ácidos nucleicos que puede replicarse o transcribirse.

"Secuencia de ácido nucleico transcrita a partir de una secuencia de ácidos nucleicos" y términos similares se refieren a una secuencia de ácidos nucleicos, cuando corresponde, como parte de una molécula de ARN completa, que es un producto de transcripción de una secuencia de ácidos nucleicos plantilla. Típicamente, la secuencia de ácidos nucleicos transcrita es una molécula de ARN monocatenario.

El "extremo 3' de un ácido nucleico" se refiere de acuerdo con la enseñanza a ese extremo que tiene un grupo hidroxilo libre. En una representación esquemática de ácidos nucleicos bicatenarios, en particular ADN, el extremo 3' siempre está en el lado derecho. "El extremo 5' de un ácido nucleico" se refiere de acuerdo con la enseñanza a ese extremo que tiene un grupo fosfato libre. En una representación esquemática de ácidos nucleicos bicatenarios, en particular ADN, el extremo 5' siempre está en el lado izquierdo.

extremo 5' 5'--P-NNNNNNN-OH-3' extremo 3'

3'-HO-NNNNNNN-P--5'

"Corriente arriba" describe la posición relativa de un primer elemento de una molécula de ácido nucleico con respecto a un segundo elemento de esa molécula de ácido nucleico, en donde ambos elementos están comprendidos en la misma molécula de ácido nucleico, y en donde el primer elemento está ubicado más cerca del extremo 5' de la molécula de ácido nucleico que el segundo elemento de esa molécula de ácido nucleico. A continuación, se dice que el segundo elemento está "corriente abajo" del primer elemento de esa molécula de ácido nucleico. Un elemento que se localiza "corriente arriba" de un segundo elemento puede denominarse de igual manera que se localiza "5'" de ese segundo elemento. Para una molécula de ácido nucleico bicatenario, se dan indicaciones como "corriente arriba" y "corriente abajo" con respecto a la cadena (+).

De acuerdo con la enseñanza, "enlace funcional" o "unido funcionalmente" se refiere a una conexión dentro de una relación funcional. Un ácido nucleico está "unido funcionalmente" si está funcionalmente relacionado con otra secuencia de ácidos nucleicos. Por ejemplo, un promotor está unido funcionalmente a una secuencia codificante si influye en la transcripción de dicha secuencia codificante. Los ácidos nucleicos unidos funcionalmente son típicamente adyacentes entre sí, cuando es apropiado, separados por secuencias adicionales de ácido nucleico, y, en realizaciones particulares, son transcritos por la ARN polimerasa para dar una molécula de ARN única (transcrito común).

En realizaciones particulares, un ácido nucleico está unido funcionalmente, de acuerdo con la enseñanza, a secuencias de control de expresión que pueden ser homólogas o heterólogas con respecto al ácido nucleico.

La expresión "secuencia de control de expresión" comprende, de acuerdo con la enseñanza, promotores, secuencias de unión a ribosomas y otros elementos de control que controlan la transcripción de un gen o la traducción del ARN derivado. En realizaciones particulares de la descripción, pueden regularse las secuencias de control de la expresión. La estructura precisa de las secuencias de control de expresión puede variar dependiendo de la especie o el tipo de célula, pero generalmente incluye secuencias no transcritas 5' y no traducidas 5' y 3' implicadas en el inicio de la transcripción y traducción, respectivamente. Más específicamente, las secuencias de control de expresión no transcritas 5' incluyen una región promotora que abarca una secuencia promotora para el control de la transcripción del gen unido funcionalmente. Las secuencias de control de expresión también pueden incluir secuencias potenciadoras o secuencias activadoras corriente arriba. Una secuencia de control de expresión de una molécula de ADN generalmente incluye secuencias no transcritas 5' y no traducidas 5' y 3' tal como la caja TATA, la secuencia de caperuza o una secuencia CAAT. Una secuencia de control de expresión de ARN alfaviral puede incluir un promotor subgenómico y/o uno o más elementos de secuencia conservados. Una secuencia de control de expresión específica de acuerdo con la presente enseñanza es un promotor subgenómico de un alfavirus, como se describe en la presente descripción.

Las secuencias de ácidos nucleicos especificadas en la presente descripción, en particular secuencias de ácidos nucleicos transcribibles y codificantes, pueden combinarse con cualquiera de las secuencias de control de expresión, en particular promotores, que pueden ser homólogos o heterólogos a dichas secuencias de ácidos nucleicos, con el término "homólogo" que se refiere al hecho de que una secuencia de ácidos nucleicos también está funcionalmente unida naturalmente a la secuencia de control de expresión, y el término "heterólogo" se refiere al hecho de que una secuencia de ácidos nucleicos no está naturalmente unida funcionalmente a la secuencia de control de expresión.

Una secuencia de ácidos nucleicos transcribible, en particular una secuencia de ácidos nucleicos que codifica un péptido o proteína, y una secuencia de control de expresión están unidas "funcionalmente" entre sí, si están unidas covalentemente entre sí de tal manera que la transcripción o expresión de la secuencia de ácidos nucleicos transcribible y en particular codificante está bajo el control o bajo la influencia de la secuencia de control de expresión. Si la secuencia de ácidos nucleicos debe traducirse en un péptido o proteína funcional, la inducción de una secuencia de control de expresión unida funcionalmente a la secuencia codificante da como resultado la transcripción de dicha secuencia codificante, sin provocar un desplazamiento de marco en la secuencia codificante o sin que la secuencia codificante pueda traducirse en el péptido o proteína deseada.

El término "promotor" o "región promotora" se refiere a una secuencia de ácidos nucleicos que controla la síntesis de un transcrito, por ejemplo, un transcrito que comprende una secuencia codificante, proporcionando un sitio de reconocimiento y unión para la ARN polimerasa. La región promotora puede incluir sitios de reconocimiento o de unión adicionales para otros factores implicados en la regulación de la transcripción de dicho gen. Un promotor puede controlar la transcripción de un gen procariota o eucariota. Un promotor puede ser "inducible" y puede iniciar la transcripción en respuesta a un agente inductor, o puede ser "constitutivo" si la transcripción no está controlada por un inductor. Un promotor inducible se expresa solo en un grado muy pequeño o nada en absoluto, si un inductor está ausente. En presencia del inductor, el gen se "enciende" o se aumenta el nivel de transcripción. Esto está mediado, generalmente, por la unión de un factor de transcripción específico. Un promotor específico de acuerdo con la presente enseñanza es un promotor subgenómico de un alfavirus, como se describe en la presente descripción. Otros promotores específicos son los promotores genómicos de cadena positiva o cadena negativa de un alfavirus.

La expresión "promotor central" se refiere a una secuencia de ácidos nucleicos que está comprendida por el promotor. El promotor central es típicamente la porción mínima del promotor requerida para iniciar adecuadamente la transcripción. El promotor central típicamente incluye el sitio de inicio de la transcripción y un sitio de unión para la ARN polimerasa.

Una "polimerasa" generalmente se refiere a una entidad molecular capaz de catalizar la síntesis de una molécula polimérica a partir de componentes básicos monoméricos. Una "ARN polimerasa" es una entidad molecular capaz de catalizar la síntesis de una molécula de ARN a partir de componentes básicos de ribonucleótidos. Una "ADN polimerasa" es una entidad molecular capaz de catalizar la síntesis de una molécula de ADN a partir de componentes básicos de . Para el caso de las ADN polimerasas y las ARN polimerasas, la entidad molecular es típicamente una proteína o un conjunto o complejo de múltiples proteínas. Típicamente, una ADN polimerasa sintetiza una molécula de ADN en base a un ácido nucleico plantilla, que típicamente es una molécula de ADN. Típicamente, una ARN polimerasa sintetiza una molécula de a Rn en base a un ácido nucleico plantilla, que es una molécula de ADN (en ese caso, la ARN polimerasa es una ARN polimerasa dependiente de ADN, DdRP) o es una molécula de ARN (en ese caso la ARN polimerasa es una ARN polimerasa dependiente de ARN, RdRP).

Una "ARN polimerasa dependiente de ARN" o "RdRP", es una enzima que cataliza la transcripción de ARN a partir de una plantilla de ARN. En el caso de la ARN polimerasa dependiente de ARN alfaviral, la síntesis secuencial del complemento de la cadena (-) del ARN genómico y del ARN genómico de la cadena (+) conduce a la replicación del ARN. Por lo tanto, la ARN polimerasa dependiente de ARN alfaviral se denomina de igual manera "ARN replicasa". En la naturaleza, las ARN polimerasas dependientes de ARN están típicamente codificadas por todos los virus de ARN excepto los retrovirus. Los representantes típicos de los virus que codifican una ARN polimerasa dependiente de ARN son los alfavirus.

De acuerdo con la presente enseñanza, la "replicación del ARN" generalmente se refiere a una molécula de ARN sintetizada en base a la secuencia de nucleótidos de una molécula de ARN dada (molécula de ARN plantilla). La molécula de ARN que se sintetiza puede ser, por ejemplo, idéntica o complementaria a la molécula de ARN plantilla. En general, la replicación del ARN puede producirse mediante la síntesis de un intermedio de ADN, o puede producirse directamente por replicación del ARN dependiente de ARN mediada por una ARN polimerasa dependiente de ARN (RdRP). En el caso de los alfavirus, la replicación del ARN no se produce a través de un intermediario de ADN, sino que está mediada por una ARN polimerasa dependiente de ARN (RdRP): una cadena de ARN plantilla (primera cadena de ARN) - o una parte de esta - sirve como plantilla para la síntesis de una segunda cadena de ARN que es complementaria a la primera cadena de ARN o a una parte de esta. La segunda cadena de ARN - o una parte de esta - a su vez puede servir opcionalmente como plantilla para la síntesis de una tercera cadena de ARN que es complementaria a la segunda cadena de ARN o de una parte de esta. De este modo, la tercera cadena de ARN es idéntica a la primera cadena de ARN o a una parte de esta. Por lo tanto, la ARN polimerasa dependiente de ARN es capaz de sintetizar directamente una cadena de ARN complementaria de una plantilla, y de sintetizar indirectamente una cadena de ARN idéntica (a través de una cadena intermedia complementaria).

De acuerdo con la enseñanza, el término "ARN plantilla" se refiere al ARN que puede ser transcrito o replicado por una ARN polimerasa dependiente de ARN.

De acuerdo con la enseñanza, el término "gen" se refiere a una secuencia de ácidos nucleicos particular que es responsable de producir uno o más productos celulares y/o de lograr una o más funciones intercelulares o intracelulares. Más específicamente, dicho término se refiere a una sección de ácido nucleico (típicamente ADN; pero ARN en el caso de virus de ARN) que comprende un ácido nucleico que codifica una proteína específica o una molécula de ARN funcional o estructural.

Una "molécula aislada", como se usa en la presente descripción, pretende referirse a una molécula que está sustancialmente libre de otras moléculas tales como otro material celular. La expresión "ácido nucleico aislado" significa de acuerdo con la enseñanza que el ácido nucleico se ha (i) amplificado in vitro, por ejemplo, mediante la reacción en cadena de la polimerasa (PCR), (ii) producido por vía recombinante mediante clonación, (iii) purificado, por ejemplo, mediante escisión y fraccionamiento electroforético en gel, o (iv) sintetizado, por ejemplo, mediante síntesis química. Un ácido nucleico aislado es un ácido nucleico disponible para su manipulación mediante técnicas recombinantes.

El término "vector" se usa aquí en su significado más general y comprende cualquiera de los vehículos intermediarios para un ácido nucleico que permite, por ejemplo, que dicho ácido nucleico se introduzca en células procariotas y/o eucariotas y, cuando sea apropiado, se integre en un genoma. Preferentemente, tales vectores se replican y/o expresan en la célula. Los vectores comprenden plásmidos, fagémidos, genomas de virus y fracciones de estos.

El término "recombinante", en el contexto de la presente enseñanza, significa "producido mediante ingeniería genética". Preferentemente, un "objeto recombinante" tal como una célula recombinante en el contexto de la presente enseñanza no es de origen natural.

La expresión "de origen natural", como se usa en la presente, se refiere al hecho de que un objeto puede encontrarse en la naturaleza. Por ejemplo, es de origen natural un péptido o ácido nucleico que está presente en un organismo (lo que incluye los virus) y que puede aislarse a partir de una fuente en la naturaleza y que no se ha modificado intencionalmente por el hombre en el laboratorio. La expresión "encontrado en la naturaleza" significa "presente en la naturaleza" e incluye objetos conocidos así como objetos que aún no han sido descubiertos y/o aislados de la naturaleza, pero que pueden ser descubiertos y/o aislados en el futuro a partir de una fuente natural.

De acuerdo con la presente enseñanza, el término "expresión" se usa en su significado más general y comprende la producción de ARN o de ARN y proteína. Comprende también la expresión parcial de ácidos nucleicos. Además, la expresión puede ser transitoria o estable. Con respecto al ARN, el término "expresión" o "traducción" se refiere al proceso en los ribosomas de una célula mediante el cual una cadena de ARN codificante (por ejemplo, ARN mensajero) dirige el ensamblaje de una secuencia de aminoácidos para producir un péptido o proteína.

De acuerdo con la enseñanza, el término "ARNm" significa "ARN mensajero" y se refiere a un transcrito que se genera típicamente mediante el uso de una plantilla de ADN y codifica un péptido o proteína. Típicamente, el ARNm comprende una 5'-UTR, una región codificante de proteínas, una 3'-UTR y una secuencia de poli(A). El ARNm puede generarse mediante transcripción in vitro de una plantilla de ADN. La metodología de la transcripción in vitro es conocida por el experto. Por ejemplo, existe una variedad de kits de transcripción in vitro comercialmente disponibles. De acuerdo con la enseñanza, el ARNm puede modificarse mediante modificaciones de estabilización y caperuza.

De acuerdo con la enseñanza, la expresión "secuencia de poli(A)" o "cola de poli(A)" se refiere a una secuencia ininterrumpida o interrumpida de residuos de adenilato que se localiza típicamente en el extremo 3' de una molécula de ARN. Una secuencia ininterrumpida se caracteriza por residuos de adenilato consecutivos. En la naturaleza, una secuencia de poli(A) ininterrumpida es típica. Mientras que una secuencia de poli(A) normalmente no está codificada en el ADN eucariota, pero se une durante la transcripción eucariota en el núcleo celular al extremo 3' libre del ARN por una ARN polimerasa independiente de la plantilla después de la transcripción, la presente enseñanza abarca secuencias poli(A) codificadas por el ADN.

De acuerdo con la enseñanza, el término "estructura primaria", con referencia a una molécula de ácido nucleico, se refiere a la secuencia lineal de monómeros de nucleótidos.

De acuerdo con la enseñanza, el término "estructura secundaria", con referencia a una molécula de ácido nucleico, se refiere a una representación bidimensional de una molécula de ácido nucleico que refleja emparejamientos de bases; por ejemplo, en el caso de una molécula de ARN monocatenario, particularmente emparejamientos de bases intramoleculares. Aunque cada molécula de ARN tiene solo una única cadena de polinucleótidos, la molécula se caracteriza típicamente por regiones de pares de bases (intramoleculares). De acuerdo con la enseñanza, el término "estructura secundaria" comprende motivos estructurales que incluyen, sin limitación, pares de bases, tallos, bucles de tallos, protuberancias, lazos tales como lazos interiores y lazos de múltiples ramas. La estructura secundaria de una molécula de ácido nucleico puede representarse mediante un dibujo bidimensional (gráfico plano), que muestra emparejamientos de bases (para más detalles sobre la estructura secundaria de las moléculas de ARN, ver Auber et al., J. Graph Algorithms Appl., 2006, vol. 10, páginas 329-351). Como se describe en la presente descripción, la estructura secundaria de ciertas moléculas de ARN es relevante en el contexto de la presente enseñanza.

De acuerdo con la enseñanza, la estructura secundaria de una molécula de ácido nucleico, particularmente de una molécula de ARN monocatenario, se determina mediante predicción mediante el uso del servidor web para la predicción de la estructura secundaria de ARN (http://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html). Preferentemente, de acuerdo con la enseñanza, "estructura secundaria", con referencia a una molécula de ácido nucleico, se refiere específicamente a la estructura secundaria determinada por dicha predicción. La predicción también puede realizarse o confirmarse mediante el uso de la predicción de estructura MFOLD (http://unafold.rna.albany.edu/?q=mfold).

De acuerdo con la enseñanza, un "par de bases" es un motivo estructural de una estructura secundaria en donde dos bases de nucleótidos se asocian entre sí mediante enlaces de hidrógeno entre los sitios donantes y aceptores en las bases. Las bases complementarias, A:U y G:C, forman pares de bases estables mediante enlaces de hidrógeno entre los sitios donantes y aceptores en las bases; los pares de bases A:U y G:C se denominan pares de bases de Watson-Crick. Un par de bases más débil (llamado par de bases Wobble) está formado por las bases G y U (G:U). Los pares de bases A:U y G:C se denominan pares de bases canónicas. Otros pares de bases como G:U (que se producen con bastante frecuencia en el ARN) y otros pares de bases raras (por ejemplo, A:C; U:U) se denominan pares de bases no canónicas.

De acuerdo con la enseñanza, "emparejamiento de nucleótidos" se refiere a dos nucleótidos que se asocian entre sí para que sus bases formen un par de bases (par de bases canónicas o no canónicas, preferentemente pares de bases canónicas, con la máxima preferencia pares de bases de Watson-Crick).

De acuerdo con la enseñanza, los términos "bucle de tallo" u "horquilla" o "bucle de horquilla", con referencia a una molécula de ácido nucleico, se refieren indistintamente a una estructura secundaria particular de una molécula de ácido nucleico, típicamente una molécula de ácido nucleico monocatenario, tal como ARN monocatenario. La estructura secundaria particular representada por la horquilla consiste en una secuencia consecutiva de ácido nucleico que comprende un tallo y un lazo (terminal), también llamado lazo de horquilla, en donde el tallo está formado por dos elementos de secuencia vecinos completamente o parcialmente complementarios; que están separados por una secuencia corta (por ejemplo, 3-10 nucleótidos), que forma el lazo de la estructura de la horquilla. Las dos secuencias vecinas completamente o parcialmente complementarias pueden definirse como, por ejemplo, elementos de horquilla tallo 1 y tallo 2. La horquilla se forma cuando estas dos secuencias inversas vecinas completamente o parcialmente complementarias, por ejemplo, los elementos de la horquilla de tallo 1 y tallo 2, forman pares de bases entre sí, lo que conduce a una secuencia de ácidos nucleicos bicatenaria que comprende un lazo no apareado en su extremo terminal formado por la secuencia corta localizada entre los elementos de horquilla tallo 1 y tallo 2. Por lo tanto, una horquilla comprende dos tallos (tallo 1 y tallo 2), que - al nivel de la estructura secundaria de la molécula de ácido nucleico -forman pares de bases entre sí y que - al nivel de la estructura primaria de la molécula de ácido nucleico - están separadas por una secuencia corta que no forma parte del tallo 1 o el tallo 2. Por ejemplo, una representación bidimensional de la horquilla se asemeja a una estructura en forma de piruleta. La formación de una estructura de tallo requiere la presencia de una secuencia que pueda plegarse sobre sí misma para formar una doble cadena emparejada; la doble cadena emparejada está formada por el tallo 1 y el tallo 2. La estabilidad de los elementos de la horquilla emparejados se determina típicamente por la longitud, el número de nucleótidos del tallo 1 que son capaces de formar pares de bases (preferentemente, pares de bases canónicas, con mayor preferencia pares de bases de Watson-Crick) con nucleótidos del tallo 2, frente al cantidad de nucleótidos del tallo 1 que no son capaces de formar tales pares de bases con nucleótidos del tallo 2 (no coincidencias o protuberancias). De acuerdo con la presente enseñanza, la longitud óptima del lazo es de 3-10 nucleótidos, con mayor preferencia de 4 a 7 nucleótidos, tales como 4 nucleótidos, 5 nucleótidos, 6 nucleótidos o 7 nucleótidos. Si una secuencia de ácidos nucleicos dada se caracteriza por una horquilla, la secuencia de ácidos nucleicos complementaria respectiva también se caracteriza típicamente por una horquilla. Una horquilla está formada típicamente por moléculas de ARN monocatenarias. Por ejemplo, varias horquillas están presentes en la secuencia de reconocimiento de replicación 5' del ARN genómico alfaviral (ilustrado en la Figura 1).

De acuerdo con la enseñanza, "interrupción" o "interrumpir", con referencia a una estructura secundaria específica de una molécula de ácido nucleico (por ejemplo, una horquilla) significa que la estructura secundaria específica está ausente o alterada. Típicamente, una estructura secundaria puede interrumpirse como una consecuencia de un cambio de al menos un nucleótido que es parte de la estructura secundaria. Por ejemplo, una horquilla puede interrumpirse por el cambio de uno o más nucleótidos que forman el tallo, de manera que el emparejamiento de nucleótidos no es posible.

De acuerdo con la enseñanza, "compensa la alteración de la estructura secundaria" o "compensar la alteración de la estructura secundaria" se refiere a uno o más cambios de nucleótidos en una secuencia de ácidos nucleicos; más típicamente se refiere a uno o más cambios de segundo nucleótido en una secuencia de ácidos nucleicos, cuya secuencia de ácidos nucleicos también comprende uno o más cambios de primer nucleótido, caracterizados como sigue: mientras que uno o más cambios de primer nucleótido, en ausencia de uno o más cambios de segundo nucleótido, provocan una interrupción de la estructura secundaria de la secuencia de ácidos nucleicos, la coocurrencia de uno o más cambios de primer nucleótido y uno o más cambios de segundo nucleótido no provoca que la estructura secundaria del ácido nucleico se interrumpa. Coocurrencia significa la presencia de uno o más cambios de primer nucleótido y de uno o más cambios de segundo nucleótido. Típicamente, el uno o más cambios de primer nucleótido y el uno o más cambios de segundo nucleótido están presentes juntos en la misma molécula de ácido nucleico. En una realización específica, uno o más cambios de nucleótidos que compensan la alteración de la estructura secundaria es/son uno o más cambios de nucleótidos que compensan una o más alteraciones del emparejamiento de nucleótidos. Por lo tanto, en una realización, "compensar la alteración de la estructura secundaria" significa "compensar las alteraciones del emparejamiento de nucleótidos", es decir, una o más alteraciones del emparejamiento de nucleótidos, por ejemplo una o más alteraciones del emparejamiento de nucleótidos dentro de uno o más bucles de tallo. La una o más alteraciones del emparejamiento de nucleótidos pueden haberse introducido mediante la eliminación de al menos un codón de iniciación. Cada uno de los uno o más cambios de nucleótidos que compensa la alteración de la estructura secundaria es un cambio de nucleótidos, que cada uno puede seleccionarse independientemente de una deleción, una adición, una sustitución y/o una inserción de uno o más nucleótidos. En un ejemplo ilustrativo, cuando el emparejamiento de nucleótidos A:U se ha alterado por la sustitución de A a C (C y U no son típicamente adecuados para formar un par de nucleótidos); entonces un cambio de nucleótidos que compensa la alteración del emparejamiento de nucleótidos puede ser la sustitución de U por G, permitiendo así la formación del emparejamiento de nucleótidos C:G. La sustitución de U por G compensa, por lo tanto, la alteración del emparejamiento de nucleótidos. En un ejemplo alternativo, cuando el emparejamiento de nucleótidos A:U se ha alterado por la sustitución de A a C; entonces un cambio de nucleótidos que compensa la alteración del emparejamiento de nucleótidos puede ser la sustitución de C por A, restaurando así la formación del emparejamiento de nucleótidos A:U original. En general, en la presente enseñanza, se prefieren aquellos cambios de nucleótidos que compensan la alteración de la estructura secundaria que no restauren la secuencia de ácidos nucleicos original ni creen tripletes AUG nuevos. En el conjunto anterior de ejemplos, se prefiere la sustitución de U a G sobre la sustitución de C a A.

De acuerdo con la enseñanza, el término "estructura terciaria", con referencia a una molécula de ácido nucleico, se refiere a la estructura tridimensional de una molécula de ácido nucleico, como se define por las coordenadas atómicas.

De acuerdo con la enseñanza, un ácido nucleico como el ARN, por ejemplo, ARNm, puede codificar un péptido o proteína. En consecuencia, una secuencia de ácidos nucleicos transcribible o un transcrito de esta puede contener un marco de lectura abierto (ORF) que codifica un péptido o proteína.

De acuerdo con la enseñanza, el término "ácido nucleico que codifica un péptido o proteína" significa que el ácido nucleico, si está presente en el ambiente apropiado, preferentemente dentro de una célula, puede dirigir el ensamblaje de los aminoácidos para producir el péptido o proteína durante el proceso de traducción. Preferentemente, el ARN codificante de acuerdo con la enseñanza es capaz de interactuar con la maquinaria de traducción celular permitiendo que la traducción del ARN codificante produzca un péptido o proteína.

De acuerdo con la enseñanza, el término "péptido" comprende oligo y polipéptidos y se refiere a las sustancias que comprenden dos o más, preferentemente 3 o más, preferentemente 4 o más, preferentemente 6 o más, preferentemente 8 o más, preferentemente 10 o más, preferentemente 13 o más, preferentemente 16 o más, preferentemente 20 o más y hasta preferentemente 50, preferentemente 100 o preferentemente 150, aminoácidos consecutivos unidos entre sí a través de enlaces peptídicos. El término "proteína" se refiere a péptidos grandes, preferentemente péptidos que tienen al menos 151 aminoácidos, pero los términos "péptido" y "proteína" se usan en la presente descripción como sinónimos.

Los términos "péptido" y "proteína" comprenden, de acuerdo con la enseñanza, sustancias que contienen no solo componentes aminoacídicos sino también componentes no aminoacídicos tales como estructuras de azúcares y fosfatos, y también comprenden sustancias que contienen enlaces tales como enlaces éster, tioéter o disulfuro. De acuerdo con la enseñanza, las expresiones "codón de iniciación" y "codón de inicio" se refieren de igual manera a un codón (triplete de bases) de una molécula de ARN que es potencialmente el primer codón traducido por un ribosoma. Tal codón típicamente codifica el aminoácido metionina en eucariotas y una metionina modificada en procariotas. El codón de iniciación más común en eucariotas y procariotas es AUG. A menos que se indique específicamente en la presente descripción que se entiende un codón de iniciación distinto de AUG, las frases "codón de iniciación" y "codón de inicio", con referencia a una molécula de ARN, se refieren al codón AUG. De acuerdo con la enseñanza, las frases "codón de iniciación" y "codón de inicio" también se usan para referirse a un triplete de bases correspondiente de un ácido desoxirribonucleico, es decir, el triplete de bases que codifica el codón de iniciación de un ARN. Si el codón de iniciación del ARN mensajero es AUG, el triplete de bases que codifica el AUG es ATG. De acuerdo con la enseñanza, las expresiones "codón de iniciación" y "codón de inicio" se refieren preferentemente a un codón de iniciación funcional o codón de inicio, es decir, a un codón de iniciación o codón de inicio que un ribosoma usa o usaría como un codón para iniciar la traducción. Puede haber codones AUG en una molécula de ARN que no sean usados como codones por un ribosoma para comenzar la traducción, por ejemplo, debido a una corta distancia de los codones a la tapa. Estos codones no están abarcados por el término codón de iniciación o codón de inicio funcional.

De acuerdo con la enseñanza, las frases "codón de inicio del marco de lectura abierto" o "codón de iniciación del marco de lectura abierto" se refieren al triplete de bases que sirve como codón de iniciación para la síntesis de proteínas en una secuencia codificante, por ejemplo, en la secuencia codificante de una molécula de ácido nucleico encontrada en la naturaleza. En una molécula de ARN, el codón de inicio del marco de lectura abierto frecuentemente está precedido por una región no traducida 5' (5'-UTR), aunque esto no es estrictamente necesario.

De acuerdo con la enseñanza, la frase "codón de inicio nativo del marco de lectura abierto" o "codón de iniciación nativo del marco de lectura abierto" se refiere al triplete de bases que sirve como codón de iniciación para la síntesis de proteínas en una secuencia codificante nativa. Una secuencia codificante nativa puede ser, por ejemplo, la secuencia codificante de una molécula de ácido nucleico encontrada en la naturaleza. En algunas realizaciones, la presente enseñanza proporciona variantes de moléculas de ácido nucleico encontradas en la naturaleza, que se caracterizan porque el codón de inicio nativo (que está presente en la secuencia codificante nativa) se ha eliminado (de manera que no está presente en la variante de molécula de ácido nucleico).

De acuerdo con la enseñanza, "primer AUG" significa el triplete de bases AUG más arriba de una molécula de ARN mensajero, preferentemente el triplete de bases de AUG más corriente arriba de una molécula de ARN mensajero que un ribosoma usa o usaría como un codón para iniciar la traducción. En consecuencia, "primer ATG" se refiere al triplete de bases ATG de una secuencia de ADN codificante que codifica el primer AUG. En algunos casos, el primer AUG de una molécula de ARNm es el codón de inicio de un marco de lectura abierto, es decir, el codón que se usa como codón de inicio durante la síntesis de proteínas ribosomales.

De acuerdo con la enseñanza, las frases "comprende la eliminación" o "caracterizado por la eliminación" y términos similares, con referencia a cierto elemento de una variante de ácido nucleico, significan que dicho elemento no es funcional o no está presente en la variante de ácido nucleico, en comparación con una molécula de ácido nucleico de referencia. Sin limitación, una eliminación puede consistir en la deleción de todo o parte de cierto elemento, en la sustitución de todo o parte de cierto elemento, o en la alteración de las propiedades funcionales o estructurales de cierto elemento. La eliminación de un elemento funcional de una secuencia de ácidos nucleicos requiere que la función no se exhiba en la posición de la variante de ácido nucleico que comprende la eliminación. Por ejemplo, una variante de ARN caracterizada por la eliminación de un cierto codón de iniciación requiere que la síntesis de proteínas ribosomales no se inicie en la posición de la variante de ARN caracterizada por la eliminación. La eliminación de un elemento estructural de una secuencia de ácidos nucleicos requiere que el elemento estructural no esté presente en la posición de la variante de ácido nucleico que comprende la eliminación. Por ejemplo, una variante de ARN caracterizada por la eliminación de un cierto triplete de bases AUG, es decir, de un triplete de bases AUG en una determinada posición, puede caracterizarse, por ejemplo, por deleción de parte o la totalidad del triplete de bases AUG (por ejemplo, AAUG), o por sustitución de uno o más nucleótidos (A, U, G) del cierto triplete de bases AUG por uno o más nucleótidos diferentes, de manera que la secuencia de nucleótidos resultante de la variante no comprende dicho triplete de bases AUG. Las sustituciones adecuadas de un nucleótido son aquellas que convierten el triplete de bases a Ug en un triplete de bases GUG, CUG o UUG, o en un triplete de bases AAG, ACG o AGG, o en un triplete de bases AUA, AUC o AUU. Las sustituciones adecuadas de más nucleótidos pueden seleccionarse en consecuencia.

De acuerdo con la enseñanza, el término "alfavirus" debe entenderse ampliamente e incluye cualquier partícula de virus que tenga características de alfavirus. Las características del alfavirus incluyen la presencia de un ARN de cadena (+) que codifica la información genética adecuada para la replicación en una célula huésped, incluida la actividad de ARN polimerasa. Otras características de muchos alfavirus se describen, por ejemplo, en Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562. El término "alfavirus" incluye alfavirus encontrado en la naturaleza, así como cualquier variante o derivado de este. En algunas realizaciones, una variante o derivado no se encuentra en la naturaleza.

En una realización, el alfavirus es un alfavirus encontrado en la naturaleza. Típicamente, un alfavirus encontrado en la naturaleza es infeccioso para uno o más organismos eucariotas, tal como un animal (incluido un vertebrado tal como un ser humano y un artrópodo tal como un insecto).

Un alfavirus encontrado en la naturaleza se selecciona preferentemente del grupo que consiste en lo siguiente: complejo de virus del bosque Barmah (que comprende el virus del bosque Barmah); complejo de encefalitis equina del este (que comprende siete tipos antigénicos del virus de la encefalitis equina del este); complejo de virus Middelburg (que comprende el virus Middelburg); complejo de virus Ndumu (que comprende el virus Ndumu); complejo de virus del bosque Semliki (que comprende el virus Bebaru, el virus Chikungunya, el virus Mayaro y su subtipo virus Una, el virus O'Nyong Nyong y su subtipo virus Igbo-Ora, el virus Ross River y sus subtipos virus Bebaru, virus Getah, virus Sagiyama, virus del bosque Semliki y su subtipo virus Me Tri); complejo de encefalitis equina venezolana (que comprende el virus Cabassou, el virus Everglades, el virus Mosso das Pedras, el virus Mucambo, el virus Paramana, el virus Pixuna, el virus Río Negro, el virus Trocara y su subtipo virus Bijou Bridge, el virus de la encefalitis equina venezolana); complejo de encefalitis equina occidental (que comprende el virus Aura, el virus Babanki, el virus Kyzylagach, el virus Sindbis, el virus Ockelbo, el virus Whataroa, el virus Buggy Creek, el virus Fort Morgan, el virus Highlands J, el virus de la encefalitis equina occidental); y algunos virus no clasificados incluido el virus de la enfermedad pancreática del salmón; virus de la enfermedad del sueño; virus del elefante marino del sur; virus Tonate. Con mayor preferencia, el alfavirus se selecciona del grupo que consiste en el complejo de virus del bosque Semliki (que comprende los tipos de virus como se indicó anteriormente, incluido el virus del bosque Semliki), el complejo de la encefalitis equina occidental (que comprende los tipos de virus como se indicó anteriormente, incluido el virus Sindbis), virus de la encefalitis equina occidental (que comprende los tipos de virus como se indicó anteriormente), complejo de encefalitis equina venezolana (que comprende los tipos de virus como se indicó anteriormente, incluido el virus de la encefalitis equina venezolana).

En una realización preferida adicional, el alfavirus es el virus del bosque Semliki. En una realización alternativa preferida adicional, el alfavirus es el virus Sindbis. En una realización alternativa preferida adicional, el alfavirus es el virus de la encefalitis equina venezolana.

En algunas realizaciones de la presente enseñanza, el alfavirus no es un alfavirus encontrado en la naturaleza. Típicamente, un alfavirus no encontrado en la naturaleza es una variante o derivado de un alfavirus encontrado en la naturaleza, que se distingue de un alfavirus encontrado en la naturaleza por al menos una mutación en la secuencia de nucleótidos, es decir, el ARN genómico. La mutación en la secuencia de nucleótidos puede seleccionarse de una inserción, una sustitución o una deleción de uno o más nucleótidos, en comparación con un alfavirus encontrado en la naturaleza.

Una mutación en la secuencia de nucleótidos puede o no estar asociada con una mutación en un polipéptido o proteína codificada por la secuencia de nucleótidos. Por ejemplo, un alfavirus no encontrado en la naturaleza puede ser un alfavirus atenuado. Un alfavirus atenuado no encontrado en la naturaleza es un alfavirus que típicamente tiene al menos una mutación en su secuencia de nucleótidos por la cual se distingue de un alfavirus encontrado en la naturaleza, y que no es infeccioso en absoluto, o que es infeccioso, pero tiene una menor capacidad de producir enfermedades o ninguna capacidad de producir enfermedades. Como un ejemplo ilustrativo, TC83 es un alfavirus atenuado que se distingue del virus de la encefalitis equina venezolana (VEEV) encontrado en la naturaleza (McKinney et al., 1963, Am. J. Trop. Med. Hyg., 1963, vol. 12; páginas 597-603).

Los miembros del género alfavirus también pueden clasificarse en base a sus características clínicas relativas en seres humanos: alfavirus asociados principalmente con encefalitis y alfavirus asociados principalmente con fiebre, erupción cutánea y poliartritis.

El término "alfaviral" significa que se encuentra en un alfavirus, o que se origina de un alfavirus o se deriva de un alfavirus, por ejemplo, mediante ingeniería genética.

De acuerdo con la enseñanza, "SFV" representa el virus del bosque Semliki. De acuerdo con la enseñanza, "SIN" o "SINV" representa el virus Sindbis. De acuerdo con la enseñanza, "VEE" o "VEEV" representa el virus de la encefalitis equina venezolana.

De acuerdo con la enseñanza, el término "de un alfavirus" se refiere a una entidad de origen de un alfavirus. Por ejemplo, una proteína de un alfavirus puede referirse a una proteína que se encuentra en alfavirus y/o a una proteína codificada por alfavirus; y una secuencia de ácidos nucleicos de un alfavirus puede referirse a una secuencia de ácidos nucleicos que se encuentra en alfavirus y/o a una secuencia de ácidos nucleicos que está codificada por alfavirus. Preferentemente, una secuencia de ácidos nucleicos "de un alfavirus" se refiere a una secuencia de ácidos nucleicos "del genoma de un alfavirus" y/o "de ARN genómico de un alfavirus".

De acuerdo con la enseñanza, el término "ARN alfaviral" se refiere a uno o más de ARN genómico alfaviral (es decir, cadena (+)), complemento del ARN genómico alfaviral (es decir, cadena (-)) y el transcrito subgenómico (es decir cadena (+)), o un fragmento de cualquiera de estos.

De acuerdo con la enseñanza, "genoma de alfavirus" se refiere al ARN de la cadena genómica (+) de un alfavirus. De acuerdo con la enseñanza, la frase "secuencia de alfavirus nativo" y frases similares se refieren típicamente a una secuencia (por ejemplo, ácido nucleico) de un alfavirus de origen natural (alfavirus encontrado en la naturaleza). En algunas realizaciones, el término "secuencia de alfavirus nativo" también incluye una secuencia de un alfavirus atenuado.

De acuerdo con la enseñanza, el término "secuencia de reconocimiento de replicación 5'" se refiere preferentemente a una secuencia de ácidos nucleicos continua, preferentemente una secuencia de ácido ribonucleico, que es idéntica u homóloga a un fragmento 5' del genoma de alfavirus. La "secuencia de reconocimiento de replicación 5'" es una secuencia de ácidos nucleicos que puede ser reconocida por una replicasa alfaviral. El término secuencia de reconocimiento de replicación 5' incluye secuencias de reconocimiento de replicación 5' nativas, así como los equivalentes funcionales de estos, tales como, por ejemplo, variantes funcionales de una secuencia de reconocimiento de replicación 5' de alfavirus encontrado en la naturaleza. De acuerdo con la enseñanza, los equivalentes funcionales incluyen derivados de secuencias de reconocimiento de replicación 5' caracterizadas por la eliminación de al menos un codón de iniciación como se describe en la presente descripción. La secuencia de reconocimiento de replicación 5' se requiere para la síntesis del complemento de la cadena (-) del ARN genómico de alfavirus, y se requiere para la síntesis del ARN genómico viral de la cadena (+) en base a una plantilla de cadena (-). Una secuencia de reconocimiento de replicación 5' nativa típicamente codifica al menos el fragmento N-terminal de nsP1; pero no comprende todo el marco de lectura abierto que codifica nsP1234. En vista del hecho de que una secuencia de reconocimiento de replicación 5' nativa típicamente codifica al menos el fragmento N-terminal de nsP1, una secuencia de reconocimiento de replicación 5' nativa típicamente comprende al menos un codón de iniciación, típicamente AUG. En una realización, la secuencia de reconocimiento de replicación 5' comprende el elemento de secuencia conservada 1 de un genoma de alfavirus (CSE 1) o una variante de este y el elemento de secuencia conservada 2 de un genoma de alfavirus (CSE 2) o una variante de este. La secuencia de reconocimiento de replicación 5' es típicamente capaz de formar cuatro horquillas (SL), es decir, SL1, SL2, SL3, SL4. La numeración de estas horquillas comienza en el extremo 5' de la secuencia de reconocimiento de replicación 5'.

De acuerdo con la enseñanza, el término "en el extremo 5' de un alfavirus" se refiere al extremo 5' del genoma de un alfavirus. Una secuencia de ácidos nucleicos en el extremo 5' de un alfavirus abarca el nucleótido localizado en el extremo 5' del ARN genómico de alfavirus, más opcionalmente una secuencia consecutiva de nucleótidos adicionales. En una realización, una secuencia de ácidos nucleicos en el extremo 5' de un alfavirus es idéntica a la secuencia de reconocimiento de replicación 5' del genoma de alfavirus.

La frase "elemento de secuencia conservada" o "CSE" se refiere a una secuencia de nucleótidos que se encuentra en el ARN de alfavirus. Estos elementos de secuencia se denominan "conservados" porque los ortólogos están presentes en el genoma de diferentes alfavirus, y los CSE ortólogos de diferentes alfavirus preferentemente comparten un alto porcentaje de identidad de secuencia y/o una estructura secundaria o terciaria similar. El término CSE incluye CSE 1, CSE 2, CSE 3 y CSE 4.

De acuerdo con la enseñanza, las frases "CSE 1" o "CSE de 44 nt" se refieren a una secuencia de nucleótidos que se requiere para la síntesis de la cadena (+) a partir de una plantilla de cadena (-). El término "CSE 1" se refiere a una secuencia en la cadena (+); y la secuencia complementaria de CSE 1 (en la cadena (-)) funciona como un promotor para la síntesis de la cadena (+). Preferentemente, el término CSE 1 incluye la mayoría del nucleótido 5' del genoma del alfavirus. CSE 1 típicamente forma una estructura de horquilla conservada. Sin desear limitarse a una teoría particular, se considera que, para CSE 1, la estructura secundaria es más importante que la estructura primaria, es decir, la secuencia lineal. En el ARN genómico del virus alfavirus Sindbis modelo, CSE 1 consiste en una secuencia consecutiva de 44 nucleótidos, que está formada por la mayoría de los 44 nucleótidos 5' del ARN genómico (Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562).

De acuerdo con la enseñanza, las frases "CSE 2" o "CSE de 51-nt" se refieren a una secuencia de nucleótidos que se requiere para la síntesis de cadena (-) a partir de una plantilla de cadena (+). La plantilla de cadena (+) es típicamente ARN genómico de alfavirus o un replicón de ARN (nótese que el transcrito de ARN subgenómico, que no comprende CSE 2, no funciona como una plantilla para la síntesis de cadena (-)). En el ARN genómico de alfavirus, CSE 2 se localiza típicamente dentro de la secuencia codificante para nsP1. En el ARN genómico del virus Sindbis alfavirus modelo, el CSE de 51 nt se encuentra en las posiciones de nucleótidos 155-205 del ARN genómico (Frolov et al., 2001, RNA, vol. 7, páginas 1638-1651). CSE 2 forma típicamente dos estructuras de horquilla conservadas. Estas estructuras de horquilla se designan como horquilla 3 (SL3) y horquilla 4 (SL4) porque son la tercera y cuarta horquilla conservada, respectivamente, de ARN genómico de alfavirus, contados desde el extremo 5' del ARN genómico de alfavirus. Sin desear limitarse a una teoría particular, se considera que, para CSE 2, la estructura secundaria es más importante que la estructura primaria, es decir, la secuencia lineal.

De acuerdo con la enseñanza, las expresiones "CSE 3" o "secuencia de unión" se refieren a una secuencia de nucleótidos que se deriva del ARN genómico alfaviral y que comprende el sitio de inicio del ARN subgenómico. El complemento de esta secuencia en la cadena (-) actúa para promover la transcripción de ARN subgenómico. En el ARN genómico de alfavirus, CSE 3 se superpone típicamente con la región que codifica el fragmento C-terminal de nsP4 y se extiende a una región corta no codificante localizada corriente arriba del marco de lectura abierto que codifica las proteínas estructurales. De acuerdo con Strauss & Strauss (Microbiol. Rev., 1994, vol. 58, páginas 491 562), CSE 3 se caracteriza por la secuencia de consenso

ACCUCUACGGCGGUCCUAAAUAGG (SEQ ID NO: 1; secuencia de unión consenso (CSE 3 consenso); los nucleótidos subrayados representan los primeros cinco nucleótidos del transcrito subgenómico)

En una realización de la presente enseñanza, CSE 3 consiste o comprende la SEQ ID NO: 1 o una variante de esta, en donde la variante se caracteriza preferentemente por un grado de identidad de secuencia con la SEQ ID NO: 1 de 80 % o más, 85 % o más, 90 % o más, 95 % o más, 96 % o más, 97 % o más, 98 % o más, o 99 % o más.

De acuerdo con la enseñanza, las expresiones "CSE 4" o "secuencia conservada de 19 nt" o "CSE de 19 nt" se refieren de igual manera a una secuencia de nucleótidos del ARN genómico alfaviral, inmediatamente corriente arriba de la secuencia de poli(A) en la región no traducida 3' del genoma de alfavirus. CSE 4 típicamente consiste en 19 nucleótidos consecutivos. Sin desear limitarse a una teoría particular, se entiende que CSE 4 funciona como un promotor central para el inicio de la síntesis de cadenas (-) (Jose et al., Future Microbiol., 2009, vol. 4, páginas 837-856); y/o se entiende que CSE 4 y la cola de poli(A) del ARN genómico de alfavirus funcionan juntas para una síntesis de cadena (-) eficiente (Hardy & Rice, J. Virol., 2005, vol. 79, páginas 4630-4639).

De acuerdo con Strauss & Strauss, CSE 4 se caracteriza por la secuencia conservada

AUUUUGUUUUUAAUAUUUC (SEQ ID NO: 2; secuencia conservada de 19 nt)

En una realización de la presente enseñanza, CSE 4 consiste o comprende la SEQ ID NO: 2 o una variante de esta, en donde la variante se caracteriza preferentemente por un grado de identidad de secuencia con la SEQ ID NO: 2 de 80 % o más, 85 % o más, 90 % o más, 95 % o más, 96 % o más, 97 % o más, 98 % o más, o 99 % o más.

De acuerdo con la enseñanza, la frase "promotor subgenómico" o "SGP" se refiere a una secuencia de ácidos nucleicos corriente arriba (5') de una secuencia de ácidos nucleicos (por ejemplo, secuencia codificante), que controla la transcripción de dicha secuencia de ácidos nucleicos proporcionando un reconocimiento y sitio de unión para ARN polimerasa, típicamente ARN polimerasa dependiente de ARN, en particular proteína no estructural de alfavirus funcional. El SGP puede incluir sitios de reconocimiento o unión adicionales para factores adicionales. Un promotor subgenómico es típicamente un elemento genético de un virus de ARN de cadena positiva, tal como un alfavirus. Un promotor subgenómico de alfavirus es una secuencia de ácidos nucleicos comprendida en el ARN genómico viral. El promotor subgenómico se caracteriza generalmente porque permite la iniciación de la transcripción (síntesis de ARN) en presencia de una ARN polimerasa dependiente de ARN, por ejemplo, proteína no estructural de alfavirus funcional. Una cadena de ARN (-), es decir, el complemento del ARN genómico alfaviral, sirve como una plantilla para la síntesis de un transcrito subgenómico de cadena (+), y la síntesis del transcrito subgenómico de cadena (+) se inicia típicamente en o cerca del promotor subgenómico. La expresión "promotor subgenómico", como se usa en la presente descripción, no se limita a ninguna localización particular en un ácido nucleico que comprende tal promotor subgenómico. En algunas realizaciones, el SGP es idéntico a CSE 3 o se superpone con CSE 3 o comprende CSE 3.

Las frases "transcrito subgenómico" o "ARN subgenómico" se refieren de igual manera a una molécula de ARN que puede obtenerse como resultado de la transcripción mediante el uso de una molécula de ARN como plantilla ("ARN plantilla"), en donde el ARN plantilla comprende un promotor subgenómico que controla la transcripción del transcrito subgenómico. El transcrito subgenómico puede obtenerse en presencia de una ARN polimerasa dependiente de ARN, en particular proteína no estructural de alfavirus funcional. Por ejemplo, el término "transcrito subgenómico" puede referirse al transcrito de ARN que se prepara en una célula infectada por un alfavirus, mediante el uso del complemento de cadena (-) de ARN genómico de alfavirus como plantilla. Sin embargo, la frase "transcrito subgenómico", como se usa en la presente descripción, no está limitado a esto y también incluye transcritos obtenibles mediante el uso de ARN heterólogo como plantilla. Por ejemplo, los transcritos subgenómicos también pueden obtenerse mediante el uso del complemento de cadena (-) de replicones que contienen SGP de acuerdo con la presente enseñanza como plantilla. Por lo tanto, el término "transcrito subgenómico" puede referirse a una molécula de ARN que puede obtenerse al sintetizar un fragmento de ARN genómico de alfavirus, así como a una molécula de ARN que puede obtenerse al sintetizar un fragmento de un replicón de acuerdo con la presente enseñanza.

El término "autólogo" se usa para describir cualquier cosa que se derive del mismo sujeto. Por ejemplo, "célula autóloga" se refiere a una célula derivada del mismo sujeto. La introducción de células autólogas en un sujeto es ventajosa porque estas células superan la barrera inmunológica que de otro modo da como resultado el rechazo.

El término "alogénico" se usa para describir cualquier cosa que se derive de diferentes individuos de la misma especie. Se dice que dos o más individuos son alogénicos entre sí cuando los genes en uno o más loci no son idénticos.

El término "singénico" se usa para describir cualquier cosa que se deriva de individuos o tejidos que tienen genotipos idénticos, es decir, gemelos o animales idénticos de la misma cepa endogámica, o sus tejidos o células.

El término "heterólogo" se usa para describir algo que consta de múltiples elementos diferentes. Como ejemplo, la introducción de la célula de un individuo en un individuo diferente constituye un trasplante heterólogo. Un gen heterólogo es un gen derivado de una fuente distinta del sujeto.

Lo siguiente proporciona variantes específicas y/o preferidas de las características individuales de la enseñanza. La presente enseñanza también contempla como realizaciones particularmente preferidas aquellas realizaciones, que se generan al combinar dos o más de las variantes específicas y/o preferidas descritas para dos o más de las características de la presente enseñanza.

Replicón de ARN

En un primer aspecto, la presente enseñanza proporciona un replicón que comprende una secuencia de reconocimiento de replicación 5', en donde la secuencia de reconocimiento de replicación 5' se caracteriza porque comprende la eliminación de al menos un codón de iniciación en comparación con una secuencia de reconocimiento de replicación 5' de alfavirus nativo. El replicón es preferentemente un replicón de ARN.

La secuencia de reconocimiento de replicación 5' que se caracteriza porque comprende la eliminación de al menos un codón de iniciación en comparación con una secuencia de reconocimiento de replicación 5' de alfavirus nativo, de acuerdo con la presente enseñanza, puede denominarse en la presente descripción como "secuencia de reconocimiento de replicación 5' modificada" o "secuencia de reconocimiento de replicación 5' de acuerdo con la enseñanza". Como se describe a continuación en la presente descripción, la secuencia de reconocimiento de replicación 5' de acuerdo con la enseñanza puede caracterizarse opcionalmente por la presencia de uno o más cambios de nucleótidos adicionales.

Un constructo de ácido nucleico que es capaz de ser replicada por una replicasa, preferentemente una replicasa alfaviral, se denomina replicón. De acuerdo con la enseñanza, el término "replicón" define una molécula de a Rn que puede ser replicada por la ARN polimerasa dependiente de ARN, produciendo - sin intermediario de ADN - una o múltiples copias idénticas o esencialmente idénticas del replicón de ARN. "Sin ADN intermedio" significa que no se forma una copia de ácido desoxirribonucleico (ADN) o complemento del replicón en el proceso de formación de las copias del replicón de ARN, y/o que no se usa una molécula de ácido desoxirribonucleico (ADN) como una plantilla en el proceso de formación de las copias del replicón de ARN, o complemento de este. La función replicasa es típicamente proporcionada por la proteína no estructural de alfavirus funcional.

De acuerdo con la enseñanza, las frases "pueden ser replicados" y "capaces de ser replicados" generalmente describen que pueden prepararse una o más copias idénticas o esencialmente idénticas de un ácido nucleico. Cuando se usan junto con el término "replicasa", tal como en "capaz de ser replicado por una replicasa", las expresiones "pueden ser replicados" y "capaces de ser replicados" describen las características funcionales de una molécula de ácido nucleico, por ejemplo, un replicón de ARN, con respecto a una replicasa. Estas características funcionales comprenden al menos una de (i) la replicasa es capaz de reconocer el replicón y (ii) la replicasa es capaz de actuar como ARN polimerasa dependiente de ARN (RdRP). Preferentemente, la replicasa es capaz de (i) reconocer el replicón y (ii) actuar como ARN polimerasa dependiente de ARN.

La expresión "capaz de reconocer" describe que la replicasa es capaz de asociarse físicamente con el replicón, y preferentemente, que la replicasa es capaz de unirse al replicón, típicamente, de forma no covalente. El término "unión" puede significar que la replicasa tiene la capacidad de unirse a uno cualquiera o más de un elemento de secuencia conservada 1 (CSE 1) o secuencia complementaria de esta (si está comprendida por el replicón), elemento de secuencia conservada 2 (CSE 2) o secuencia complementaria de esta (si está comprendida por el replicón), elemento de secuencia conservada 3 (CSE 3) o secuencia complementaria de esta (si está compuesta por el replicón), elemento de secuencia conservada 4 (CSE 4) o secuencia complementaria de esta (si está compuesta por el replicón). Preferentemente, la replicasa es capaz de unirse a CSE 2 [es decir, a la cadena (+)] y/o a CSE 4 [es decir, a la cadena (+)], o de unirse al complemento de CSE 1 [es decir a cadena (-)] y/o al complemento de CSE 3 [es decir, a la cadena (-)].

La expresión "capaz de actuar como RdRP" significa que la replicasa es capaz de catalizar la síntesis del complemento de la cadena (-) del ARN de la cadena genómica alfaviral (+), en donde el ARN de cadena (+) tiene función de plantilla, y/o que la replicasa es capaz de catalizar la síntesis de ARN genómico alfaviral de cadena (+), en donde el ARN de cadena (-) tiene función de plantilla. En general, la expresión "capaz de actuar como RdRP" también puede incluir que la replicasa es capaz de catalizar la síntesis de un transcrito subgenómico de cadena (+) en donde un ARN de cadena (-) tiene función de plantilla, y en donde la síntesis del transcrito subgenómico de cadena (+) se inicia típicamente en un promotor subgenómico de alfavirus.

Las expresiones "capaz de unirse" y "capaz de actuar como RdRP" se refieren a la capacidad en condiciones fisiológicas normales. En particular, se refieren a las condiciones dentro de una célula, que expresa la proteína no estructural de alfavirus funcional o que se ha transfectado con un ácido nucleico que codifica la proteína no estructural de alfavirus funcional. La célula es, preferentemente, una célula eucariota. La capacidad de unión y/o la capacidad de actuar como RdRP puede probarse experimentalmente, por ejemplo, en un sistema in vitro sin células o en una célula eucariota. Opcionalmente, dicha célula eucariota es una célula de una especie a la que el alfavirus particular que representa el origen de la replicasa es infeccioso. Por ejemplo, cuando se usa la alfavirus replicasa de un alfavirus particular que es infeccioso para los seres humanos, las condiciones fisiológicas normales son condiciones en una célula humana. Con mayor preferencia, la célula eucariota (en un ejemplo, la célula humana) es del mismo tejido u órgano al que es infeccioso el alfavirus particular que representa el origen de la replicasa.

De acuerdo con la enseñanza, "en comparación con una secuencia de alfavirus nativo" y términos similares se refieren a una secuencia que es una variante de una secuencia de alfavirus nativo. La variante típicamente no es en sí misma una secuencia de alfavirus nativo.

En una realización, el replicón de ARN comprende una secuencia de reconocimiento de replicación 3'. Una secuencia de reconocimiento de replicación 3' es una secuencia de ácidos nucleicos que puede ser reconocida por la proteína no estructural de alfavirus funcional. En otras palabras, la proteína no estructural de alfavirus funcional es capaz de reconocer la secuencia de reconocimiento de replicación 3'. Preferentemente, la secuencia de reconocimiento de replicación 3' se encuentra en el extremo 3' del replicón (si el replicón no comprende una cola de poli(A)), o inmediatamente corriente arriba de la cola de poli(A) (si el replicón comprende una cola de poli(A). En una realización, la secuencia de reconocimiento de replicación 3' consiste o comprende CSE 4.

En una realización, la secuencia de reconocimiento de replicación 5' y la secuencia de reconocimiento de replicación 3' son capaces de dirigir la replicación del replicón de ARN de acuerdo con la presente enseñanza en presencia de proteína no estructural de alfavirus funcional. Por lo tanto, cuando están presentes solas o preferentemente juntas, estas secuencias de reconocimiento dirigen la replicación del replicón de ARN en presencia de proteína no estructural de alfavirus funcional.

Es preferible que se proporcione una proteína no estructural de alfavirus funcional en cis (codificado como proteína de interés por un marco de lectura abierto en el replicón) o en trans (codificada como proteína de interés por un marco de lectura abierto en un constructo de replicasa separado como se describe en el segundo aspecto), que es capaz de reconocer tanto la secuencia de reconocimiento de replicación 5' modificada como la secuencia de reconocimiento de replicación 3' del replicón. En una realización, esto se logra cuando la secuencia de reconocimiento de replicación 3' es nativa con respecto al alfavirus del que se deriva la proteína no estructural de alfavirus funcional, y cuando la secuencia de reconocimiento de replicación 5' modificada es una variante de la secuencia de reconocimiento de replicación 5' que es nativa con respecto al alfavirus del que se deriva la proteína no estructural de alfavirus funcional. Nativo significa que el origen natural de estas secuencias es el mismo alfavirus. En una realización alternativa, la secuencia de reconocimiento de replicación 5' modificada y/o la secuencia de reconocimiento de replicación 3' no son nativas con respecto al alfavirus del que se deriva la proteína no estructural de alfavirus funcional, siempre que la proteína no estructural de alfavirus funcional sea capaz de reconocer tanto la secuencia de reconocimiento de replicación 5' modificada como la secuencia de reconocimiento de replicación 3' del replicón. En otras palabras, la proteína no estructural de alfavirus funcional es compatible con la secuencia de reconocimiento de replicación 5' modificada y la secuencia de reconocimiento de replicación 3'. Cuando una proteína no estructural de alfavirus funcional no nativo es capaz de reconocer una secuencia o elemento de secuencia respectivo, se dice que la proteína no estructural de alfavirus funcional es compatible (compatibilidad cruzada con virus). Cualquier combinación de secuencias de reconocimiento de replicación (3'/5') y CSE, respectivamente, con proteína no estructural de alfavirus funcional es posible siempre que exista compatibilidad cruzada con virus. La compatibilidad cruzada con virus puede ser probada fácilmente por el experto que trabaja en la presente enseñanza al incubar una proteína no estructural de alfavirus funcional a probar junto con un ARN, en donde el ARN tiene secuencias de reconocimiento de replicación 3' y 5' (opcionalmente modificadas) a probar, en condiciones adecuadas para la replicación del ARN, por ejemplo, en una célula huésped adecuada. Si se produce la replicación, se determina que las secuencias de reconocimiento de replicación (3'/5') y la proteína no estructural de alfavirus funcional son compatibles.

La eliminación de al menos un codón de iniciación proporciona varias ventajas sobre los trans-replicones de la técnica anterior (tales como, por ejemplo, representados por"ARN plantilla WT-RRS" de la Figura 1). La ausencia de un codón de iniciación en la secuencia de ácidos nucleicos que codifica nsP1* provocará típicamente que nsP1* (fragmento N-terminal de nsP1) no se traduzca. Además, dado que nsP1* no se traduce, el marco de lectura abierto que codifica la proteína de interés ("Transgén") es el marco de lectura abierto más corriente arriba accesible al ribosoma; por lo tanto, cuando el replicón está presente en una célula, la traducción se inicia en el primer AUG del marco de lectura abierto (ARN) que codifica el gen de interés. Esto representa una ventaja sobre los trans-replicones de la técnica anterior, tales como los descritos por Spuul y et al., (J. Virol., 2011, vol. 85, páginas 4739-4751): replicones de acuerdo con Spuul et al., dirigen la expresión de la porción N-terminal de nsP1, un péptido de 74 aminoácidos. También se conoce de la técnica anterior que la construcción de replicones de ARN a partir de genomas de virus de longitud completa no es una cuestión trivial, ya que ciertas mutaciones pueden hacer que el ARN sea incapaz de replicarse (documento WO 2000/053780 A2), y la eliminación de algunas partes de la estructura 5' que es importante para la replicación del alfavirus afecta la eficiencia de la replicación (Kamrud et al., 2010, J. Gen. Virol., Vol. 91, páginas 1723-1727).

La ventaja sobre los cis-replicones de la técnica anterior es que la eliminación de al menos un codón de iniciación desacopla la región codificante para la proteína no estructural alfaviral de la secuencia de reconocimiento de replicación 5'. Esto permite una modificación genética adicional de los cis-replicones, por ejemplo, al intercambiar la secuencia de reconocimiento de replicación 5' nativa por una secuencia artificial, una secuencia mutada o una secuencia heteróloga tomada de otro virus de ARN. Tal manipulación de secuencia en los cis-replicones de la técnica anterior está restringida por la secuencia de aminoácidos de nsP1. Cualquier mutación puntual, o agrupaciones de mutaciones puntuales, requeriría una evaluación experimental si la replicación se afecta y las pequeñas inserciones o deleciones que conducen a mutaciones de desplazamiento de marco son imposibles debido a su efecto perjudicial sobre la proteína.

La eliminación de al menos un codón de iniciación de acuerdo con la presente enseñanza puede lograrse mediante cualquier método adecuado conocido en la técnica. Por ejemplo, puede diseñarse una molécula de ADN adecuada que codifique el replicón de acuerdo con la enseñanza, es decir, caracterizada por la eliminación de un codón de iniciación, in silico y posteriormente sintetizarse in vitro (síntesis de genes); alternativamente, puede obtenerse una molécula de ADN adecuada mediante mutagénesis dirigida al sitio de una secuencia de ADN que codifica un replicón. En cualquier caso, la molécula de ADN respectiva puede servir como plantilla para la transcripción in vitro, proporcionando así el replicón de acuerdo con la enseñanza.

La eliminación de al menos un codón de iniciación en comparación con una secuencia de reconocimiento de replicación 5' de alfavirus nativo no está particularmente limitada y puede seleccionarse de cualquier modificación de nucleótidos, incluida la sustitución de uno o más nucleótidos (que incluye, a nivel de ADN, una sustitución de A y/o T y/o G del codón de iniciación); deleción de uno o más nucleótidos (que incluye, a nivel de ADN, una deleción de A y/o T y/o G del codón de iniciación), e inserción de uno o más nucleótidos (que incluye, a nivel de ADN, una inserción de uno o más más nucleótidos entre A y T y/o entre T y G del codón de iniciación). Independientemente de si la modificación de nucleótidos es una sustitución, una inserción o una deleción, la modificación de nucleótidos no debe dar como resultado la formación de un nuevo codón de iniciación (como un ejemplo ilustrativo: una inserción, a nivel de ADN, no debe ser una inserción de un ATG).

La secuencia de reconocimiento de replicación 5' del replicón de ARN que se caracteriza por la eliminación de al menos un codón de iniciación (es decir, la secuencia de reconocimiento de replicación 5' modificada de acuerdo con la presente enseñanza) es preferentemente una variante de una secuencia de reconocimiento de replicación 5' del genoma de un alfavirus encontrado en la naturaleza. En una realización, la secuencia de reconocimiento de replicación 5' modificada de acuerdo con la presente enseñanza se caracteriza preferentemente por un grado de identidad de secuencia del 80 % o más, preferentemente del 85 % o más, con mayor preferencia del 90 % o más, incluso con mayor preferencia del 95 % o más, con la secuencia de reconocimiento de replicación 5' del genoma de al menos un alfavirus encontrado en la naturaleza.

En una realización, la secuencia de reconocimiento de replicación 5' del replicón de ARN que se caracteriza por la eliminación de al menos un codón de iniciación comprende una secuencia homóloga a alrededor de 250 nucleótidos en el extremo 5' de un alfavirus, es decir, en el extremo 5' del genoma alfaviral. En una realización preferida, comprende una secuencia homóloga de alrededor de 250 a 500, preferentemente de alrededor de 300 a 500 nucleótidos en el extremo 5' de un alfavirus, es decir, en el extremo 5' del genoma alfaviral. "En el extremo 5' del genoma alfaviral" significa una secuencia de ácidos nucleicos que comienza en, e incluye, el nucleótido más corriente arriba del genoma alfaviral. En otras palabras, el nucleótido más corriente arriba del genoma alfaviral se designa como nucleótido núm.

1 y, por ejemplo, "250 nucleótidos en el extremo 5' del genoma alfaviral" significa los nucleótidos 1 a 250 del genoma alfaviral. En una realización, la secuencia de reconocimiento de replicación 5' del replicón de ARN que se caracteriza por la eliminación de al menos un codón de iniciación se caracteriza por un grado de identidad de secuencia del 80 % o más, preferentemente del 85 % o más, con mayor preferencia del 90 % o más, incluso con mayor preferencia 95 % o más, con al menos 250 nucleótidos en el extremo 5' del genoma de al menos un alfavirus encontrado en la naturaleza. Al menos 250 nucleótidos incluye, por ejemplo, 250 nucleótidos, 300 nucleótidos, 400 nucleótidos, 500 nucleótidos.

La secuencia de reconocimiento de replicación 5' de un alfavirus encontrado en la naturaleza se caracteriza típicamente por al menos un codón de iniciación y/o por motivos estructurales secundarios conservados. Por ejemplo, la secuencia de reconocimiento de replicación 5' nativa del virus del bosque Semliki (SFV) comprende cinco tripletes de bases AUG específicos, correspondientes a los tripletes de bases ATG en el ADN de la SEQ ID NO: 4 (ver el Ejemplo 1). De acuerdo con Frolov et al., (2001, RNA, vol. 7, páginas 1638-1651) el análisis realizado por MFOLD reveló que se predice que la secuencia de reconocimiento de replicación 5' nativa del virus del bosque Semliki formará cuatro horquillas (SL), denominadas horquillas 1 a 4 (SL1, SL2, SL3, SL4). De acuerdo con Frolov et al., el análisis por MFOLD reveló que también se predice que la secuencia de reconocimiento de replicación 5' nativa de un alfavirus diferente, el virus Sindbis, formará cuatro horquillas: SL1, SL2, SL3, SL4. En el Ejemplo 1 de la presente enseñanza, dos servidores web para la predicción de la estructura secundaria del ARN (http://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html) (http://unafold.rna.albany.edu/?q=mfold) confirmaron la presencia predicha de cuatro horquillas en la secuencia de reconocimiento de replicación 5' nativa del virus de bosque Semliki.

Se conoce que el extremo 5' del genoma alfaviral comprende elementos de secuencia que permiten la replicación del genoma alfaviral por la proteína no estructural de alfavirus funcional. En una realización de la presente enseñanza, la secuencia de reconocimiento de replicación 5' del replicón de ARN comprende una secuencia homóloga al elemento de secuencia conservada 1 (CSE 1) y/o una secuencia homóloga al elemento de secuencia conservada 2 (CSE 2) de un alfavirus.

El elemento de secuencia conservada 2 (CSE 2) del ARN genómico de alfavirus típicamente está representado por SL3 y SL4 que está precedido por SL2 que comprende al menos el codón de iniciación nativo que codifica el primer residuo de aminoácido de la proteína no estructural de alfavirus nsP1. Sin embargo, en esta descripción, en algunas realizaciones, el elemento de secuencia conservada 2 (CSE 2) del ARN genómico de alfavirus se refiere a una región que abarca desde SL2 a SL4 y que comprende el codón de iniciación nativo que codifica el primer residuo de aminoácido de la proteína no estructural de alfavirus nsP1. En una realización preferida, el replicón de ARN comprende CSE 2 o una secuencia homóloga a CSE 2. En una realización, el replicón de ARN comprende una secuencia homóloga a CSE 2 que se caracteriza preferentemente por un grado de identidad de secuencia de 80 % o más, preferentemente 85 % o más, con mayor preferencia 90 % o más, incluso con mayor preferencia 95 % o más, a la secuencia de CSE 2 de al menos un alfavirus encontrado en la naturaleza.

En una realización preferida, la secuencia de reconocimiento de replicación 5' comprende una secuencia que es homóloga a CSE 2 de un alfavirus. La CSE 2 de un alfavirus puede comprender un fragmento de un marco de lectura abierto de una proteína no estructural de un alfavirus.

Por lo tanto, en una realización preferida, el replicón de ARN se caracteriza porque comprende una secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus. La secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta es típicamente una variante de un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus encontrado en la naturaleza. En una realización, la secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta se caracteriza preferentemente por un grado de identidad de secuencia de 80 % o más, preferentemente de 85 % o más, con mayor preferencia de 90 % o más, incluso con mayor preferencia de 95 % o más, con un marco de lectura abierto de una proteína no estructural o un fragmento de esta de al menos un alfavirus encontrado en la naturaleza.

En una realización más preferida, la secuencia homóloga a un marco de lectura abierto de una proteína no estructural que está comprendida por el replicón de la presente enseñanza no comprende el codón de iniciación nativo de una proteína no estructural, y con mayor preferencia no comprende cualquier codón de iniciación de una proteína no estructural. En una realización preferida, la secuencia homóloga a CSE 2 se caracteriza por la eliminación de todos los codones de iniciación en comparación con una secuencia CSE 2 de alfavirus nativo. Por lo tanto, la secuencia homóloga a CSE 2 preferentemente no comprende ningún codón de iniciación.

Cuando la secuencia homóloga a un marco de lectura abierto no comprende ningún codón de iniciación, la secuencia homóloga a un marco de lectura abierto no es en sí misma un marco de lectura abierto ya que no sirve como plantilla para la traducción.

En una realización preferida, la secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus se caracteriza porque comprende la eliminación de al menos el codón de inicio nativo del marco de lectura abierto de una proteína no estructural. Preferentemente, se caracteriza porque comprende la eliminación de al menos el codón de inicio nativo del marco de lectura abierto que codifica nsP1.

El codón de inicio nativo es el triplete de bases AUG en el que comienza la traducción en los ribosomas en una célula huésped cuando está presente un ARN en una célula huésped. En otras palabras, el codón de inicio nativo es el primer triplete de bases que se traduce durante la síntesis de proteínas ribosomales, por ejemplo, en una célula huésped que se ha inoculado con ARN que comprende el codón de inicio nativo. En una realización, la célula huésped es una célula de una especie eucariota que es un huésped natural del alfavirus específico que comprende la secuencia de reconocimiento de replicación 5' del alfavirus nativo. En una realización preferida, la célula huésped es una célula BHK21 de la línea celular "BHK21 [C13] (ATCC® CCL10™)", disponible de la Colección Americana de Cultivos Tipo, Manassas, Virginia, Estados Unidos.

Los genomas de muchos alfavirus se han secuenciado completamente y son accesibles públicamente, y las secuencias de proteínas no estructurales codificadas por estos genomas también son accesibles públicamente. Tal información de secuencia permite determinar el codón de inicio nativo in silico.

Por ejemplo, en el Ejemplo 1, se describe el triplete de bases de ADN correspondiente al codón de inicio nativo de nsP1 de SFV.

En una realización, el codón de inicio nativo está compuesto por una secuencia de Kozak o una secuencia funcionalmente equivalente. La secuencia de Kozak es una secuencia inicialmente descrita por Kozak (1987, Nucleic Acids Res., vol. 15, páginas 8125-8148). La secuencia de Kozak en una molécula de ARNm es reconocida por el ribosoma como el sitio de inicio de la traducción. De acuerdo con esta referencia, la secuencia de Kozak comprende un codón de inicio AUG, seguido inmediatamente por un nucleótido G altamente conservado: AUGG (ver también el codón de iniciación en la secuencia de ADN de acuerdo con la SEQ ID NO: 4 (Ejemplo 1)). En particular, se describió mediante esta referencia que una secuencia de Kozak puede identificarse por (gcc)gccRccAUGG (SEQ ID NO: 6), como sigue: (i) las letras minúsculas denotan la base más común en una posición donde la base puede variar; (ii) las letras mayúsculas indican bases altamente conservadas (por ejemplo, 'AUGG'); (iii) 'R' indica una purina (adenina o guanina); (iv) la secuencia entre paréntesis ((gcc)) es de importancia incierta; (v) el triplete de bases AUG subrayado representa el codón de inicio. En una realización de la presente enseñanza, la secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus se caracteriza porque comprende la eliminación de un codón de iniciación que es parte de una secuencia de Kozak.

En una realización de la presente enseñanza, la secuencia de reconocimiento de replicación 5' del replicón se caracteriza por la eliminación de al menos todos los codones de iniciación que, a nivel de ARN, son parte de una secuencia AUG.

En una realización preferida, la secuencia homóloga a un marco de lectura abierto de una proteína no estructural o un fragmento de esta de un alfavirus se caracteriza porque comprende la eliminación de uno o más codones de iniciación distintos del codón de inicio nativo del marco de lectura abierto de una proteína no estructural. En una realización más preferida, dicha secuencia de ácidos nucleicos se caracteriza adicionalmente por la eliminación del codón de inicio nativo. Por ejemplo, además de la eliminación del codón de inicio nativo, pueden eliminarse uno cualquiera o dos o tres o cuatro o más de cuatro (por ejemplo, cinco) codones de iniciación.

Si el replicón se caracteriza por la eliminación del codón de inicio nativo, y opcionalmente por la eliminación de uno o más codones de iniciación distintos del codón de inicio nativo, del marco de lectura abierto de una proteína no estructural, la secuencia homóloga a un marco de lectura abierto no es en sí un marco de lectura abierto, ya que no sirve como plantilla para la traducción.

El uno o más codones de iniciación distintos del codón de inicio nativo que se elimina, preferentemente además de la eliminación del codón de inicio nativo, se selecciona preferentemente de un triplete de bases AUG que tiene el potencial de iniciar la traducción. Un triplete de bases AUG que tiene el potencial de iniciar la traducción puede denominarse "codón de iniciación potencial". Puede determinarse si un triplete de bases AUG dado tiene el potencial de iniciar la traducción in silico o en un ensayo celular in vitro.

En una realización, se determina in silico si un triplete de bases AUG dado tiene el potencial de iniciar la traducción: en esa realización, se examina la secuencia de nucleótidos y se determina que un triplete de bases AUG tiene el potencial de iniciar la traducción si es parte de una secuencia AUGG, preferentemente parte de una secuencia de Kozak (SEQ ID NO: 6).

En una realización, se determina en un ensayo in vitro basado en células si un triplete de bases AUG dado tiene el potencial de iniciar la traducción: un replicón de ARN caracterizado por la eliminación del codón de inicio nativo y que comprende el triplete de bases AUG dado corriente abajo de la posición de la eliminación del codón de inicio nativo se introduce en un huésped célula. En una realización, la célula huésped es una célula de una especie eucariota que es un huésped natural del alfavirus específico que comprende la secuencia de reconocimiento de replicación 5' del alfavirus nativo. En una realización preferida, la célula huésped es una célula BHK21 de la línea celular "BHK21 [C13] (ATCC® CCL10™)", disponible de la Colección Americana de Cultivos Tipo, Manassas, Virginia, Estados Unidos. Es preferible que no haya un triplete de bases AUG adicional presente entre la posición de la eliminación del codón de inicio nativo y el triplete de bases AUG dado. Si, después de la transferencia del replicón de ARN - caracterizado por la eliminación del codón de inicio nativo y que comprende el triplete de bases AUG dado - a la célula huésped, se inicia la traducción en el triplete de bases AUG dado, se determina que el triplete de bases AUG dado tiene el potencial para iniciar la traducción. Si la traducción se inicia puede determinarse mediante cualquier método adecuado conocido en la técnica. Por ejemplo, el replicón puede codificar, corriente abajo del triplete de bases AUG dado y en marco con el triplete de bases AUG dado, una etiqueta que facilita la detección del producto de traducción (si existe), por ejemplo, una etiqueta myc o una etiqueta HA; si está presente o no un producto de expresión que tiene la etiqueta codificada puede determinarse, por ejemplo, mediante transferencia Western. En esta realización, es preferible que no esté presente un triplete de bases AUG adicional entre el triplete de bases AUG dado y la secuencia de ácidos nucleicos que codifica la etiqueta. El ensayo in vitro basado en células puede realizarse individualmente para más de un triplete de bases AUG dado: en cada caso, es preferible que no haya un triplete de bases AUG adicional presente entre la posición de la eliminación del codón de inicio nativo y el triplete de bases AUG dado. Esto puede lograrse eliminando todos los tripletes de base AUG (si los hay) entre la posición de la eliminación del codón de inicio nativo y el triplete de bases a Ug dado. De este modo, el triplete de bases AUG dado es el primer triplete de bases AUG corriente abajo de la posición de la eliminación del codón de inicio nativo.

Preferentemente, el replicón de acuerdo con la presente enseñanza se caracteriza por la eliminación de todos los codones de iniciación potenciales que están corriente abajo de la posición de la eliminación del codón de inicio nativo y que se encuentran dentro del marco de lectura abierto de la proteína no estructural de alfavirus o de un fragmento de este. Por lo tanto, de acuerdo con la enseñanza, la secuencia de reconocimiento de replicación 5' preferentemente no comprende un marco de lectura abierto que pueda traducirse en proteína.

En una realización preferida, la secuencia de reconocimiento de replicación 5' del replicón de ARN de acuerdo con la enseñanza se caracteriza por una estructura secundaria que es equivalente a la estructura secundaria de la secuencia de reconocimiento de replicación 5' del ARN genómico alfaviral. En una realización preferida, la secuencia de reconocimiento de replicación 5' del replicón de ARN de acuerdo con la enseñanza se caracteriza por una estructura secundaria predicha que es equivalente a la estructura secundaria predicha de la secuencia de reconocimiento de replicación 5' del ARN genómico alfaviral. De acuerdo con la presente enseñanza, el servidor web predice preferentemente la estructura secundaria de una molécula de ARN para la predicción de la estructura secundaria de ARN http://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html.

Al comparar la estructura secundaria o la estructura secundaria predicha de una secuencia de reconocimiento de replicación 5' de un replicón de ARN caracterizado por la eliminación de al menos un codón de iniciación en comparación con la secuencia de reconocimiento de replicación 5' del alfavirus nativo, la presencia o ausencia de una alteración del emparejamiento de nucleótidos puede identificarse. Por ejemplo, al menos un par de bases puede estar ausente en una posición dada, en comparación con una secuencia de reconocimiento de replicación 5' del alfavirus nativo, por ejemplo, un par de bases dentro de una horquilla, en particular el tallo de la horquilla.

En una realización preferida, uno o más bucles de tallo de la secuencia de reconocimiento de replicación 5' no se delecionan o alteran. Con mayor preferencia, las horquillas 3 y 4 no se delecionan ni se alteran. Con mayor preferencia, ninguna de las horquillas de la secuencia de reconocimiento de replicación 5' se deleciona o altera.

En una realización, la eliminación de al menos un codón de iniciación no interrumpe la estructura secundaria de la secuencia de reconocimiento de replicación 5'. En una realización alternativa, la eliminación de al menos un codón de iniciación altera la estructura secundaria de la secuencia de reconocimiento de replicación 5'. En esta realización, la eliminación de al menos un codón de iniciación puede ser causante de la ausencia de al menos un par de bases en una posición dada, por ejemplo, un par de bases dentro de una horquilla, en comparación con una secuencia de reconocimiento de replicación 5' del alfavirus nativo. Si un par de bases está ausente dentro de una horquilla, en comparación con una secuencia de reconocimiento de replicación 5' del alfavirus nativo, se determina que la eliminación de al menos un codón de iniciación introduce una alteración del emparejamiento de nucleótidos dentro de la horquilla. Un par de bases dentro de una horquilla es típicamente un par de bases en el tallo de la horquilla.

Si la eliminación de al menos un codón de iniciación introduce una alteración del emparejamiento de nucleótidos dentro de una horquilla, en comparación con una secuencia de reconocimiento de replicación 5' del alfavirus nativo, pueden introducirse uno o más cambios de nucleótidos que se espera que compensen la alteración del emparejamiento de nucleótidos, y la estructura secundaria o la estructura secundaria predicha obtenida de este modo pueden compararse con una secuencia de reconocimiento de replicación 5' de alfavirus nativo.

Con base en el conocimiento general común y en la descripción en la presente descripción, el experto puede esperar ciertos cambios de nucleótidos para compensar las alteraciones del emparejamiento de nucleótidos. Por ejemplo, si un par de bases se altera en una posición dada de la estructura secundaria o la estructura secundaria predicha de una secuencia de reconocimiento de replicación 5' dada de un replicón de ARN caracterizado por la eliminación de al menos un codón de iniciación, en comparación con la secuencia de reconocimiento de replicación 5' del alfavirus, se espera que un cambio de nucleótidos que restaura un par de bases en esa posición, preferentemente sin reintroducir un codón de iniciación, compense la alteración del emparejamiento de nucleótidos. En un ejemplo, la secuencia de reconocimiento de replicación 5' de un replicón que comprende uno o más cambios de nucleótidos que compensan las alteraciones del emparejamiento de nucleótidos dentro de uno o más bucles de tallo introducidas por la eliminación de al menos un codón de iniciación está codificada por una secuencia de ADN representada por la SEQ ID NO: 5 (Ejemplo 1).

En una realización preferida, la secuencia de reconocimiento de replicación 5' del replicón no se solapa con, o no comprende, una secuencia de ácidos nucleicos traducible, es decir, traducible en un péptido o proteína, en particular un nsP, en particular nsP1, o un fragmento de cualquiera de estos. Para que una secuencia de nucleótidos sea "traducible", se requiere la presencia de un codón de iniciación; el codón de iniciación codifica el residuo de aminoácido más N-terminal del péptido o proteína. En una realización, la secuencia de reconocimiento de replicación 5' del replicón no se solapa con, o no comprende, una secuencia de ácidos nucleicos traducible que codifica un fragmento N-terminal de nsP1.

En algunos escenarios, que se describen en detalle a continuación, el replicón de ARN comprende al menos un promotor subgenómico. En una realización preferida, el promotor subgenómico del replicón no se solapa con, o no comprende, una secuencia de ácidos nucleicos traducible, es decir, traducible en un péptido o proteína, en particular un nsP, en particular nsP4, o un fragmento de cualquiera de estos. En una realización, el promotor subgenómico del replicón no se solapa con, o no comprende, una secuencia de ácidos nucleicos traducible que codifica un fragmento C-terminal de nsP4. Un replicón de ARN que tiene un promotor subgenómico que no se superpone con, o no comprende, una secuencia de ácidos nucleicos traducible, por ejemplo, traducible en el fragmento C-terminal de nsP4, puede generarse delecionando parte de la secuencia codificante para nsP4 (típicamente la parte que codifica la parte N-terminal de nsP4), y/o eliminando tripletes de bases AUG en la parte de la secuencia codificante para nsP4 que no se ha delecionado. Si se eliminan los tripletes de bases AUG en la secuencia codificante para nsP4 o una parte de estos, los tripletes de bases AUG que se eliminan son preferentemente codones de iniciación potenciales. Alternativamente, si el promotor subgenómico no se solapa con una secuencia de ácidos nucleicos que codifica nsP4, puede delecionarse toda la secuencia de ácidos nucleicos que codifica nsP4.

En una realización, el replicón de ARN no comprende un marco de lectura abierto que codifica una proteína no estructural de alfavirus truncada. En el contexto de esta realización, es particularmente preferible que el replicón de ARN no comprenda un marco de lectura abierto que codifique el fragmento N-terminal de nsP1, y opcionalmente no comprenda un marco de lectura abierto que codifique el fragmento C-terminal de nsP4. El fragmento N-terminal de nsP1 es una proteína de alfavirus truncada; el fragmento C-terminal de nsP4 también es una proteína de alfavirus truncada.

En algunas realizaciones el replicón de acuerdo con la presente enseñanza no comprende la horquilla 2 (SL2) del extremo 5' del genoma de un alfavirus. De acuerdo con Frolov et al., más arriba, la horquilla 2 es una estructura secundaria conservada encontrada en el extremo 5' del genoma de un alfavirus, corriente arriba de CSE 2, pero es prescindible para la replicación.

En una realización, la secuencia de reconocimiento de replicación 5' del replicón no se solapa con una secuencia de ácidos nucleicos que codifica la proteína no estructural de alfavirus o un fragmento de esta. Por lo tanto, la presente enseñanza abarca replicones que se caracterizan, en comparación con el ARN alfaviral genómico, por la eliminación de al menos un codón de iniciación, como se describe en la presente descripción, opcionalmente combinado con la deleción de la región codificante para una o más proteínas no estructurales de alfavirus, o una parte de estas. Por ejemplo, la región codificante para nsP2 y nsP3 puede delecionarse, o la región codificante para nsP2 y nsP3 puede delecionarse junto con la deleción de la región codificante para el fragmento C-terminal de nsP1 y/o de la región codificante para el fragmento N-terminal de nsP4, y uno o más codones de iniciación restantes, es decir, restantes después de dicha eliminación, pueden eliminarse como se describe en la presente descripción.

La deleción de la región codificante para una o más proteínas no estructurales de alfavirus puede lograrse mediante métodos estándar, por ejemplo, a nivel de ADN, escisión con la ayuda de enzimas de restricción, preferentemente enzimas de restricción que reconocen sitios de restricción únicos en el marco de lectura abierto (para ilustración: ver el Ejemplo 1). Opcionalmente, pueden introducirse sitios de restricción únicos en un marco de lectura abierto mediante mutagénesis, por ejemplo, mutagénesis dirigida a sitio. El ADN respectivo puede usarse como plantilla para la transcripción in vitro.

Un sitio de restricción es una secuencia de ácidos nucleicos, por ejemplo, una secuencia de ADN, que es necesaria y suficiente para dirigir la restricción (escisión) de la molécula de ácido nucleico, por ejemplo, molécula de ADN, en la que está contenido el sitio de restricción, por una enzima de restricción específica. Un sitio de restricción es único para una molécula de ácido nucleico dada si una copia del sitio de restricción está presente en la molécula de ácido nucleico.

Una enzima de restricción es una endonucleasa que corta una molécula de ácido nucleico, por ejemplo, una molécula de ADN, en o cerca del sitio de restricción.

Alternativamente, puede obtenerse una secuencia de ácidos nucleicos caracterizada por la deleción de parte o la totalidad del marco de lectura abierto por métodos de síntesis.

El replicón de ARN de acuerdo con la presente enseñanza es preferentemente una molécula de ARN monocatenario. El replicón de ARN de acuerdo con la presente enseñanza es típicamente una molécula de ARN con cadena (+). En una realización, el replicón de ARN de la presente enseñanza es una molécula de ácido nucleico aislada.

Al menos un marco de lectura abierto compuesto por el replicón

En una realización, el replicón de ARN de acuerdo con la presente enseñanza comprende al menos un marco de lectura abierto que codifica un péptido de interés o una proteína de interés. Preferentemente, la proteína de interés está codificada por una secuencia de ácidos nucleicos heteróloga. El gen que codifica el péptido o la proteína de interés se denomina de igual manera "gen de interés" o "transgén". En diversas realizaciones, el péptido o proteína de interés está codificada por una secuencia de ácidos nucleicos heteróloga. De acuerdo con la presente enseñanza, el término "heterólogo" se refiere al hecho de que una secuencia de ácidos nucleicos no está ligada funcionalmente o estructuralmente de forma natural a una secuencia de ácidos nucleicos de alfavirus.

El replicón de acuerdo con la presente enseñanza puede codificar un polipéptido único o polipéptidos múltiples. Múltiples polipéptidos pueden codificarse como un polipéptido único (polipéptido de fusión) o como polipéptidos separados. En algunas realizaciones, el replicón de acuerdo con la presente enseñanza puede comprender más de un marco de lectura abierto, cada uno de los cuales puede seleccionarse independientemente para estar bajo el control de un promotor subgenómico o no. Alternativamente, una poliproteína o polipéptido de fusión comprende polipéptidos individuales separados por un sitio de escisión de proteasa opcionalmente autocatalítico (por ejemplo, proteína del virus de la fiebre aftosa 2A), o una inteína.

Las proteínas de interés pueden seleccionarse, por ejemplo, del grupo que consiste en proteínas reporteras, péptidos o proteínas farmacéuticamente activas, inhibidores de la señalización intracelular de interferón (IFN) y proteína funcional no estructural del alfavirus funcional.

Proteína reportera

En una realización, un marco de lectura abierto codifica una proteína reportera. En esa realización, el marco de lectura abierto comprende un gen reportero. Ciertos genes pueden elegirse como reporteros porque las características que confieren a las células u organismos que los expresan pueden identificarse y medirse fácilmente, o porque son marcadores seleccionables. Los genes reporteros frecuentemente se usan como una indicación de si cierto gen ha sido absorbido o expresado en la población de células u organismos. Preferentemente, el producto de expresión del gen reportero es detectable visualmente. Las proteínas reporteras detectables visualmente comunes típicamente poseen proteínas fluorescentes o luminiscentes. Los ejemplos de genes reporteros específicos incluyen el gen que codifica la proteína fluorescente verde (GFP) de medusa, que hace que las células que la expresan brillen de verde bajo la luz azul, la enzima luciferasa, que cataliza una reacción con luciferina para producir luz, y la proteína fluorescente roja (RFP). Son posibles variantes de cualquiera de estos genes reporteros específicos, siempre que las variantes posean propiedades visualmente detectables. Por ejemplo, eGFP es una variante mutante puntual de GFP.

La realización de la proteína reportera es particularmente adecuada para probar la expresión, ver, por ejemplo, los Ejemplos 2 a 5.

Péptido o proteína farmacéuticamente activa

De acuerdo con la enseñanza, en una realización, el ARN del replicón comprende o consiste en ARN farmacéuticamente activo. Un "ARN farmacéuticamente activo" puede ser ARN que codifica un péptido o proteína farmacéuticamente activa. Preferentemente, el replicón de ARN de acuerdo con la presente enseñanza codifica un péptido o proteína farmacéuticamente activa. Preferentemente, un marco de lectura abierto codifica un péptido o proteína farmacéuticamente activa. Preferentemente, el replicón de ARN comprende un marco de lectura abierto que codifica un péptido o proteína farmacéuticamente activa, opcionalmente bajo el control del promotor subgenómico.

Un "péptido o proteína farmacéuticamente activa" tiene un efecto positivo o ventajoso sobre el estado de afección o de enfermedad de un sujeto cuando se administra al sujeto en una cantidad terapéuticamente eficaz. Preferentemente, un péptido o proteína farmacéuticamente activa tiene propiedades curativas o paliativas y puede administrarse para mejorar, calmar, aliviar, revertir, retardar el inicio o disminuir la gravedad de uno o más síntomas de una enfermedad o trastorno. Un péptido o proteína farmacéuticamente activa puede tener propiedades profilácticas y puede usarse para retardar la aparición de una enfermedad o para disminuir la gravedad de tal enfermedad o afección patológica. La expresión "péptido o proteína farmacéuticamente activa" incluye proteínas o polipéptidos completos, y también puede referirse a fragmentos farmacéuticamente activos de estos. También puede incluir análogos farmacéuticamente activos de un péptido o proteína. La expresión "péptido o proteína farmacéuticamente activa" incluye péptidos y proteínas que son antígenos, es decir, el péptido o proteína provoca una respuesta inmunitaria en un sujeto que puede ser terapéutica o parcialmente o totalmente protectora.

En una realización, el péptido o proteína farmacéuticamente activa es o comprende un compuesto inmunológicamente activo o un antígeno o una epítrope.

De acuerdo con la enseñanza, el término "compuesto inmunológicamente activo" se refiere a cualquier compuesto que altere una respuesta inmunitaria, preferentemente induciendo y/o suprimiendo la maduración de las células inmunitarias, induciendo y/o suprimiendo la biosíntesis de citosinas, y/o alterando la inmunidad humoral estimulando la producción de anticuerpos por células B. En una realización, la respuesta inmunitaria implica la estimulación de una respuesta de anticuerpos (que generalmente incluye inmunoglobulina G (IgG)). Los compuestos inmunológicamente activos poseen una potente actividad inmunoestimulante que incluye, entre otros, actividad antiviral y antitumoral, y también pueden regular negativamente otros aspectos de la respuesta inmunitaria, por ejemplo, cambiar la respuesta inmunitaria de una respuesta inmunitaria TH2, que es útil para tratar una amplia gama de enfermedades mediadas por TH2.

De acuerdo con la enseñanza, el término "antígeno" o "inmunógeno" cubre cualquier sustancia que provocará una respuesta inmunitaria. En particular, un "antígeno" se refiere a cualquier sustancia que reacciona específicamente con anticuerpos o linfocitos T (células T). De acuerdo con la presente enseñanza, el término "antígeno" comprende cualquier molécula que comprenda al menos un epítopo. Preferentemente, un antígeno en el contexto de la presente enseñanza es una molécula que, opcionalmente después del procesamiento, induce una reacción inmunitaria, que es preferentemente específica para el antígeno. De acuerdo con la presente enseñanza, puede usarse cualquier antígeno adecuado, que sea candidato para una reacción inmunitaria, en donde la reacción inmunitaria puede ser tanto una reacción inmunitaria humoral como celular. En el contexto de las realizaciones de la presente enseñanza, el antígeno es presentado preferentemente por una célula, preferentemente por una célula presentadora de antígeno, en el contexto de moléculas de MHC, lo que da como resultado una reacción inmunitaria contra el antígeno. Un antígeno es preferentemente un producto que corresponde o se deriva de un antígeno de origen natural. Tales antígenos de origen natural pueden incluir o pueden derivarse de alérgenos, virus, bacterias, hongos, parásitos y otros agentes infecciosos y patógenos o un antígeno también puede ser un antígeno tumoral. De acuerdo con la presente enseñanza, un antígeno puede corresponder a un producto de origen natural, por ejemplo, una proteína viral o una parte de esta. En realizaciones preferidas, el antígeno es un polipéptido de superficie, es decir, un polipéptido que se muestra naturalmente en la superficie de una célula, un patógeno, una bacteria, un virus, un hongo, un parásito, un alérgeno o un tumor. El antígeno puede provocar una respuesta inmunitaria contra una célula, un patógeno, una bacteria, un virus, un hongo, un parásito, un alérgeno o un tumor.

El término "patógeno" se refiere a material biológico patógeno capaz de provocar enfermedad en un organismo, preferentemente un organismo vertebrado. Los patógenos incluyen microorganismos tales como bacterias, organismos eucariotas unicelulares (protozoos), hongos, así como virus.

Los términos "epítopo", "péptido antígeno", "epítopo antígeno", "péptido inmunogénico" y "péptido de unión a MHC" se usan indistintamente en la presente descripción y se refieren a un determinante antigénico en una molécula tal como un antígeno, es decir, a una parte de o fragmento de un compuesto inmunológicamente activo que es reconocido por el sistema inmunitaria, por ejemplo, que es reconocido por una célula T, en particular cuando se presenta en el contexto de moléculas de MHC. Un epítopo de una proteína comprende, preferentemente, una porción continua o discontinua de dicha proteína y tiene, preferentemente, entre 5 y 100, preferentemente, entre 5 y 50, con mayor preferencia, entre 8 y 30, con la máxima preferencia, entre 10 y 25 aminoácidos de longitud, por ejemplo, el epítopo puede tener, preferentemente 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24 o 25 aminoácidos de longitud. De acuerdo con la enseñanza, un epítopo puede unirse a moléculas de MHC tales como moléculas de MHC en la superficie de una célula y, por lo tanto, puede ser un "péptido de unión a MHC" o "péptido antígeno". La expresión "complejo principal de histocompatibilidad" y la abreviatura "MHC" incluyen moléculas de MHC de clase I y MHC de clase II y se relaciona con un complejo de genes que está presente en todos los vertebrados. Las proteínas o moléculas de MHC son importantes para la señalización entre linfocitos y células presentadoras de antígeno o células enfermas en reacciones inmunitarias, en donde las proteínas o moléculas de MHC se unen a péptidos y los presentan para su reconocimiento por los receptores de células T. Las proteínas codificadas por el MHC se expresan en la superficie de las células y muestran tanto autoantígenos (fragmentos de péptidos de la propia célula) como no autoantígenos (por ejemplo, fragmentos de microorganismos invasores) en una célula T. Tales porciones inmunogénicas preferidas se unen a una molécula MHC de clase I o clase II. Como se usa en la presente descripción, se dice que una porción inmunogénica se “une a” una molécula de MHC de clase I o clase II si dicha unión es detectable mediante el uso de cualquier ensayo conocido en la técnica. La expresión "péptido de unión a MHC" se refiere a un péptido que se une a una molécula de MHC de clase I y/o una molécula de m Hc de clase II. En el caso de los complejos de MHC clase I/péptido, los péptidos de unión son típicamente de 8-10 aminoácidos de longitud, aunque los péptidos más largos o más cortos pueden ser eficaces. En el caso de los complejos MHC de clase II/péptido, los péptidos de unión son típicamente de 10-25 aminoácidos de longitud y en particular de 13-18 aminoácidos de longitud, mientras que los péptidos más largos y más cortos pueden ser eficaces.

En una realización, la proteína de interés de acuerdo con la presente enseñanza comprende un epítopo adecuado para la vacunación de un organismo diana. Un experto en la técnica sabrá que uno de los principios de inmunobiología y vacunación se basa en el hecho de que se produce una reacción inmunoprotectora a una enfermedad al inmunizar un organismo con un antígeno, que es inmunológicamente relevante con respecto a la enfermedad a tratar. De acuerdo con la presente enseñanza, se selecciona un antígeno del grupo que comprende un antígeno propio y un antígeno no propio. Un antígeno no propio es preferentemente un antígeno bacteriano, un antígeno de virus, un antígeno de hongo, un alérgeno o un antígeno de parásito. Se prefiere que el antígeno comprenda un epítopo que sea capaz de provocar una respuesta inmunitaria en un organismo diana. Por ejemplo, el epítopo puede provocar una respuesta inmunitaria contra una bacteria, un virus, un hongo, un parásito, un alérgeno o un tumor.

En algunas realizaciones, el antígeno no propio es un antígeno bacteriano. En algunas realizaciones, el antígeno provoca una respuesta inmunitaria contra una bacteria que infecta a animales, incluidos pájaros, peces y mamíferos, incluidos animales domesticados. Preferentemente, la bacteria contra la cual se produce la respuesta inmunitaria es una bacteria patógena.

En algunas realizaciones, el antígeno no propio es un antígeno de virus. Un antígeno de virus puede ser, por ejemplo, un péptido de una proteína de superficie de virus, por ejemplo, un polipéptido de cápside o un polipéptido de espiga. En algunas realizaciones, el antígeno provoca una respuesta inmunitaria contra un virus que infecta animales, incluidos pájaros, peces y mamíferos, incluidos animales domesticados. Preferentemente, el virus contra el cual se produce la respuesta inmunitaria es un virus patógeno.

En algunas realizaciones, el antígeno no propio es un polipéptido o una proteína de un hongo. En algunas realizaciones, el antígeno provoca una respuesta inmunitaria contra un hongo que infecta animales, incluidos pájaros, peces y mamíferos, incluidos animales domesticados. Preferentemente, el hongo contra el cual se produce la respuesta inmunitaria es un hongo patógeno.

En algunas realizaciones, el antígeno no propio es un polipéptido o proteína de un parásito eucariota unicelular. En algunas realizaciones, el antígeno provoca una respuesta inmunitaria contra un parásito eucariota unicelular, preferentemente un parásito eucariota unicelular patógeno. Los parásitos eucariotas unicelulares patógenos pueden ser, por ejemplo, del género Plasmodium, por ejemplo P. falciparum, P. vivax, P. malariae o P. ovale, del género Leishmania, o del género Trypanosoma, por ejemplo T. cruzi o T. brucei.

En algunas realizaciones, el antígeno no propio es un polipéptido alergénico o una proteína alergénica. Una proteína alergénica o un polipéptido alergénico es adecuado para la inmunoterapia con alérgenos, también conocida como hipo-sensibilización.

En algunas realizaciones, el antígeno es un antígeno propio, particularmente un antígeno tumoral. Los antígenos tumorales y su determinación son conocidos por el experto.

En el contexto de la presente enseñanza, las expresiones "antígeno tumoral" o "antígeno asociado a tumor" se relacionan con proteínas que en condiciones normales se expresan específicamente en un número limitado de tejidos y/u órganos o en etapas específicas del desarrollo, por ejemplo, el antígeno tumoral puede expresarse en condiciones normales específicamente en tejido de estómago, preferentemente, en la mucosa gástrica, en órganos reproductores, por ejemplo, en testículos, en tejido trofoblástico, por ejemplo, en la placenta, o en células de la línea germinal, y se expresan o se expresan de manera aberrante en uno o más tejidos tumorales o cáncer. En este contexto, "un número limitado" significa, preferentemente, no más de 3, con mayor preferencia no más de 2. Los antígenos tumorales en el contexto de la presente enseñanza incluyen, por ejemplo, antígenos de diferenciación, preferentemente, antígenos de diferenciación específicos de tipo celular, es decir, proteínas que en condiciones normales se expresan específicamente en un cierto tipo de célula en una cierta etapa de diferenciación, antígenos de cáncer/testículos, es decir, proteínas que en condiciones normales se expresan específicamente en testículos y algunas veces en la placenta, y antígenos específicos de línea germinal. En el contexto de la presente enseñanza, el antígeno tumoral se asocia preferentemente con la superficie celular de una célula cancerosa y preferentemente, no se expresa o solo se expresa rara vez en tejidos normales. Preferentemente, el antígeno tumoral o la expresión aberrante del antígeno tumoral identifica células cancerosas. En el contexto de la presente enseñanza, el antígeno tumoral que es expresado por una célula cancerosa en un sujeto, por ejemplo, un paciente que padece una enfermedad cancerosa, es preferentemente una proteína propia en dicho sujeto. En realizaciones preferidas, el antígeno tumoral en el contexto de la presente invención se expresa en condiciones normales específicamente en un tejido u órgano que no es esencial, es decir, tejidos u órganos que cuando son dañados por el sistema inmunitario no conducen a la muerte del sujeto, o en órganos o estructuras del cuerpo que no son, o son difícilmente asequibles, al sistema inmunitario. Preferentemente, la secuencia de aminoácidos del antígeno tumoral es idéntica entre el antígeno tumoral que se expresa en tejidos normales y el antígeno tumoral que se expresa en tejidos cancerosos.

Los ejemplos de antígenos tumorales que pueden ser útiles en la presente enseñanza son p53, ART-4, BAGE, betacatenina/m, Bcr-abL CAMEL, CAP-1, Ca Sp -8, CDC27/m, CDK4/m, CEA, las proteínas de superficie celular de la familia de claudina, tal como CLAUDIN-6, CLAUDIN-18.2 y CLAUDIN-12, c-MYC, CT, Cyp-B, DAM, ELF2M, ETV6-AML1, G250, GAGE, GnT-V, Gap100, HAGE, HER-2/neu, HPV-E7, HPV-E6, HAST-2, hTERT (o hTRT), LAGE, LDLR/FUT, MAGE-A, preferentemente MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A5, MAGE-A6, MAGE-A7, MAGE-A8, MAGE-A9, MAGE-A10, MAGE-A11 o MAGE-A12, MAGE-B, MAGE-C, MART-1/Melan-A, MC1R, miosina/m, MUC1, MUM-1, -2, -3, NA88-A, NF1, NY-ESO-1, NY-BR-1, p190 menor BCR-abL, Pm1/RARa, PRAME, proteinasa 3, PSA, PSM, RAGE, RU1 o RU2, SAGE, SART-1 o SART-3, SCGB3A2, SCP1, SCP2, SCP3, SSX, SURVIVIN, TEL/AML1, TPI/m, TRP-1, TRP- 2, TRP-2/INT2, TPTE y WT. Los antígenos tumorales particularmente preferidos incluyen CLAUDIN-18.2 (CLDN18.2) y CLAUDIN-6 (CLDN6).

En algunas realizaciones, no se requiere que el péptido o proteína farmacéuticamente activa sea un antígeno que provoque una respuesta inmunitaria. Las proteínas o péptidos farmacéuticamente activos adecuados pueden seleccionarse del grupo que consiste en citocinas y proteínas del sistema inmunitario tales como compuestos inmunológicamente activos (por ejemplo, interleucinas, factor estimulante de colonias (CSF), factor estimulante de colonias de granulocitos (G-CSF), factor estimulante de colonias de granulocitos y macrófagos (GM-CSF), eritropoyetina, factor de necrosis tumoral (TNF), interferones, integrinas, addressinas, seletinas, receptores homing, receptores de células T, inmunoglobulinas), hormonas (tales como insulina, hormona tiroidea, catecolaminas, gonadotropinas, hormonas tróficas, prolactina, oxitocina, dopamina, somatotropina bovina o leptinas), hormonas de crecimiento (por ejemplo, hormona de crecimiento humana), factores de crecimiento (por ejemplo, factor de crecimiento epidérmico, factor de crecimiento nervioso o factor de crecimiento similar a la insulina), receptores del factor de crecimiento, enzimas (por ejemplo, activador de plasminógeno tisular, estreptoquinasa, colesterol biosintético o degradante, enzimas esteriodogénicas, quinasas, fosfodiesterasas, metilasas, desmetilasas, deshidrogenasas, celulasas, proteasas, lipasas, fosfolipasas, aromatasas, citocromos, adenilato o guanilato ciclasas o neuramidasas), receptores (receptores de hormonas esteroides, receptores de péptidos), proteínas de unión (por ejemplo, proteínas de unión a la hormona del crecimiento o al factor de crecimiento), factores de transcripción y traducción, proteínas supresoras del crecimiento tumoral (por ejemplo, proteínas que inhiben la angiogénesis), proteínas estructurales (tales como colágeno, fibroína, fibrinógeno, elastina, tubulina, actina y miosina), proteínas de la sangre (por ejemplo trombina, albúmina sérica, factor VII, factor VIII, insulina, Factor IX, Factor X, activador de plasminógeno tisular, proteína C, factor de von Wilebrand, antitrombina III, glucocerebrosidasa, factor estimulante de colonias de granulocitos eritropoyetínicos (GCSF) o Factor VIII modificado, o anticoagulantes. En una realización, la proteína farmacéuticamente activa de acuerdo con la enseñanza es una citocina que está implicada en la regulación de la homeostasis linfoide, preferentemente una citocina que está implicada y preferentemente induce o mejora el desarrollo, imprimación, expansión, diferenciación y/o supervivencia de las células T. En una realización, la citocina es una interleucina, por ejemplo, IL-2, IL-7, IL-12, iL-15 o IL-21.

Inhibidor de la señalización de interferón (IFN)

Una proteína de interés adecuada adicional codificada por un marco de lectura abierto es un inhibidor de la señalización de interferón (IFN). Si bien se ha informado que la viabilidad de las células en las que se ha introducido ARN para la expresión puede reducirse, en particular, si las células se transfectan varias veces con ARN, se encontró que los agentes inhibidores de IFN aumentan la viabilidad de las células en las que el ARN se va a expresar (documento WO 2014/071963 A1). Preferentemente, el inhibidor es un inhibidor de la señalización de IFN tipo I. Prevenir el acoplamiento del receptor de IFN por IFN extracelular e inhibir la señalización de IFN intracelular en las células permite la expresión estable de a Rn en las células. Alternativamente o adicionalmente, prevenir el acoplamiento del receptor de IFN por IFN extracelular e inhibir la señalización de IFN intracelular mejora la supervivencia de las células, en particular, si las células se transfectan repetidamente con ARN. Sin desear limitarse a la teoría, se prevé que la señalización intracelular de IFN puede dar como resultado la inhibición de la traducción y/o la degradación del ARN. Esto puede abordarse inhibiendo una o más proteínas efectoras antiviralmente activas inducibles por IFN. La proteína efectora antiviralmente activa inducible por IFN puede seleccionarse del grupo que consiste en proteína quinasa dependiente de ARN (PKR), 2',5'-oligoadenilato sintetasa (OAS) y RNasaL. Inhibir la señalización intracelular de IFN puede comprender inhibir la ruta dependiente de PKR y/o la ruta dependiente de OAS. Una proteína de interés adecuada es una proteína que es capaz de inhibir la ruta dependiente de PKR y/o la ruta dependiente de OAS. La inhibición de la ruta dependiente de PKR puede comprender inhibir la fosforilación de elF2-alfa. La inhibición de PKR puede comprender tratar la célula con al menos un inhibidor de PKR. El inhibidor de PKR puede ser un inhibidor viral de PKR. El inhibidor viral preferido de PKR es el virus vaccinia E3. Si un péptido o proteína (por ejemplo, E3, K3) inhibe la señalización intracelular de IFN, se prefiere la expresión intracelular del péptido o proteína. El virus vaccinia E3 es una proteína de unión a ARNbc de 25 kDa (codificada por el gen E3L) que se une y secuestra ARNbc para prevenir la activación de PKR y OAS. E3 puede unirse directamente a PKR e inhibe su actividad, dando como resultado una fosforilación reducida de elF2-alfa. Otros inhibidores adecuados de la señalización de IFN son el virus del herpes simple ICP34.5, el virus Toscana NS, nucleopolihedrovirus de Bombyx mori PK2 y HCV NS34A.

El inhibidor de la señalización de IFN puede proporcionarse a la célula en forma de una secuencia de ácidos nucleicos (por ejemplo, ARN) que codifica el inhibidor de la señalización de IFN.

En una realización, el inhibidor de la señalización intracelular o extracelular de IFN está codificado por una molécula de ARNm. Esa molécula de ARNm puede comprender una modificación modificadora de la secuencia no polipeptídica como se describe en la presente descripción, por ejemplo, caperuza, 5'-UTR, 3'-UTR, secuencia de poli(A), adaptación del uso del codón. Se ilustran realizaciones respectivas, por ejemplo, en el Ejemplo 3.

En una realización alternativa, el inhibidor de la señalización intracelular o extracelular de IFN está codificado por un replicón, preferentemente un trans-replicón o un trans-replicón como se describe en la presente descripción. El replicón comprende elementos de secuencia de ácidos nucleicos que permiten la replicación por alfavirus replicasa, típicamente CSE 1, CSE 2 y CSE 4; y preferentemente también elementos de secuencia de ácidos nucleicos que permiten la producción de un transcrito subgenómico, es decir, un promotor subgenómico, que comprende típicamente CSE 3. El replicón puede comprender adicionalmente una o más modificaciones modificadoras de la secuencia no polipeptídica como se describe en la presente descripción, por ejemplo, caperuza, secuencia poli(A), adaptación del uso del codón. Si están presentes múltiples marcos de lectura abiertos en el replicón, entonces cualquiera de ellos puede codificar un inhibidor de la señalización intracelular de IFN, opcionalmente bajo el control de un promotor subgenómico o no. En una realización preferida, el inhibidor de la señalización intracelular de IFN está codificado por el marco de lectura abierto más arriba del replicón de ARN. Cuando un inhibidor de la señalización intracelular de IFN está codificado por el marco de lectura abierto más arriba del replicón de ARN, la información genética que codifica el inhibidor de la señalización intracelular de IFN se traducirá temprano después de la introducción del replicón de ARN en una célula huésped y la proteína resultante posteriormente puede inhibir la señalización intracelular de IFN.

Proteína no estructural de alfavirus funcional

Una proteína de interés adecuada adicional codificada por un marco de lectura abierto es la proteína no estructural de alfavirus funcional. La expresión "proteína no estructural de alfavirus" incluye todas y cada una de las formas modificadas co o postraduccionalmente, incluidas las formas modificadas con carbohidratos (como glicosiladas) y las formas modificadas con lípidos de la proteína no estructural de alfavirus.

En algunas realizaciones, el término "proteína no estructural de alfavirus" se refiere a una cualquiera o más de proteínas no estructurales individuales de origen de alfavirus (nsP1, nsP2, nsP3, nsP4), o a una poliproteína que comprende la secuencia de polipéptidos de más de una proteína no estructural de origen alfavirus. En algunas realizaciones, "proteína no estructural de alfavirus" se refiere a nsP123 y/o a nsP4. En otras realizaciones, "proteína no estructural de alfavirus" se refiere a nsP1234. En una realización, la proteína de interés codificada por un marco de lectura abierto consiste en todos los nsP1, nsP2, nsP3 y nsP4 como una única poliproteína opcionalmente escindible: nsP1234. En una realización, la proteína de interés codificada por un marco de lectura abierto consiste en nsP1, nsP2 y nsP3 como una única poliproteína opcionalmente escindible: nsP123. En esa realización, nsP4 puede ser una proteína de interés adicional y puede ser codificada por un marco de lectura abierto adicional.

En algunas realizaciones, la proteína no estructural de alfavirus es capaz de formar un complejo o asociación, por ejemplo, en una célula huésped. En algunas realizaciones, "proteína no estructural de alfavirus" se refiere a un complejo o asociación de nsP123 (sinónimo de P123) y nsP4. En algunas realizaciones, "proteína no estructural de alfavirus" se refiere a un complejo o asociación de nsP1, nsP2 y nsP3. En algunas realizaciones, "proteína no estructural de alfavirus" se refiere a un complejo o asociación de nsP1, nsP2, nsP3 y nsP4. En algunas realizaciones, "proteína no estructural de alfavirus" se refiere a un complejo o asociación de cualquiera o más seleccionados del grupo que consiste en nsP1, nsP2, nsP3 y nsP4. En algunas realizaciones, la proteína no estructural de alfavirus comprende al menos nsP4.

Los términos "complejo" o "asociación" se refieren a dos o más moléculas de proteínas iguales o diferentes que están en proximidad espacial. Las proteínas de un complejo están preferentemente en contacto físico o fisicoquímico directo o indirecto entre sí. Un complejo o asociación puede consistir en múltiples proteínas diferentes (heteromultímero) y/o en múltiples copias de una proteína particular (homomultímero). En el contexto de la proteína no estructural de alfavirus, el término "complejo o asociación" describe una multitud de al menos dos moléculas de proteína, de las cuales al menos una es una proteína no estructural de alfavirus. El complejo o asociación puede consistir en múltiples copias de una proteína particular (homomultímero) y/o múltiples proteínas diferentes (heteromultímero). En el contexto de un multímero, "multi" significa más de uno, tal como dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez o más de diez.

La expresión "proteína no estructural de alfavirus funcional" incluye la proteína no estructural de alfavirus que tiene función replicasa. Por lo tanto, la "proteína no estructural de alfavirus funcional" incluye la alfavirus replicasa. La "función replicasa" comprende la función de una ARN polimerasa dependiente de ARN (RdRP), es decir, una enzima que es capaz de catalizar la síntesis de ARN de cadena (-) basada en una plantilla de ARN de cadena (+), y/o que es capaz para catalizar la síntesis de ARN de cadena (+) basada en una plantilla de ARN de cadena (-). Por lo tanto, el término "proteína no estructural de alfavirus funcional" puede referirse a una proteína o complejo que sintetiza ARN de cadena (-), mediante el uso del ARN de cadena (+) (por ejemplo, genómico) como plantilla, a una proteína o complejo que sintetiza nuevos ARN de cadena (+), mediante el uso del complemento de cadena (-) de ARN genómico como plantilla, y/o a una proteína o complejo que sintetiza un transcrito subgenómico, mediante el uso de un fragmento del complemento de cadena (-) de ARN genómico como plantilla. La proteína no estructural de alfavirus funcional puede tener adicionalmente una o más funciones adicionales, tales como, por ejemplo, una proteasa (para autoescisión), helicasa, adeniltransferasa terminal (para adición de cola de poli(A)), metiltransferasa y guanililtransferasa (para proporcionar un nucleico ácido con una caperuza 5'), sitios de localización nuclear, trifosfatasa (Gould et al., 2010, Antiviral Res., vol. 87 páginas 111-124; Rupp et al., 2015, J. Gen. Virol., vol. 96, páginas 2483 500).

De acuerdo con la enseñanza, la expresión "alfavirus replicasa" se refiere a la ARN polimerasa dependiente de ARN alfaviral, que incluye una ARN polimerasa dependiente de ARN de un alfavirus natural (alfavirus encontrado en la naturaleza) y una ARN polimerasa dependiente de ARN de una variante o derivado de un alfavirus, tal como el de un alfavirus atenuado. En el contexto de la presente enseñanza, los términos "replicasa" y "alfavirus replicasa" se usan indistintamente, a menos que el contexto dicte que cualquier replicasa particular no es una alfavirus replicasa.

El término "replicasa" comprende todas las variantes, en particular las variantes, conformaciones, isoformas y homólogos de alfavirus replicasa modificados postraduccionalmente, que son expresados por células infectadas por alfavirus o que son expresados por células que se han transfectado con un ácido nucleico que codifica para la alfavirus replicasa. Además, el término "replicasa" comprende todas las formas de replicasa que se han producido y pueden producirse mediante métodos recombinantes. Por ejemplo, una replicasa que comprende una etiqueta que facilita la detección y/o purificación de la replicasa en el laboratorio, por ejemplo, una etiqueta myc, una etiqueta HA o una etiqueta oligohistidina (etiqueta His) pueden producirse mediante métodos recombinantes.

Opcionalmente, la alfavirus replicasa adicionalmente se define funcionalmente por la capacidad de unirse a uno o más de los elementos de secuencia conservada de alfavirus 1 (CSE 1) o secuencia complementaria de este, elemento de secuencia conservada 2 (CSE 2) o secuencia complementaria de este, elemento de secuencia conservada 3 (CSE 3) o secuencia complementaria de este, elemento de secuencia conservada 4 (CSE 4) o secuencia complementaria de este. Preferentemente, la replicasa es capaz de unirse a CSE 2 [es decir, a la cadena (+)] y/o a CSE 4 [es decir, a la cadena (+)], o de unirse al complemento de CSE 1 [es decir a cadena (-)] y/o al complemento de CSE 3 [es decir, a la cadena (-)].

El origen de la replicasa no se limita a ningún alfavirus particular. En una realización preferida, la alfavirus replicasa comprende proteína no estructural del virus del bosque Semliki, que incluye un virus del bosque Semliki natural y una variante o derivado del virus del bosque Semliki, tal como un virus del bosque Semliki atenuado. En una realización preferida alternativa, la alfavirus replicasa comprende la proteína no estructural del virus Sindbis, que incluye un virus Sindbis de origen natural y una variante o derivado del virus Sindbis, tal como un virus Sindbis atenuado. En una realización preferida alternativa, la alfavirus replicasa comprende proteína no estructural del virus de la encefalitis equina venezolana (VEEV), que incluye un VEEv de origen natural y una variante o derivado de VEEV, tal como un VEEV atenuado. En una realización preferida alternativa, la alfavirus replicasa comprende la proteína no estructural del virus de chikungunya (CHIKV), que incluye un CHIKV de origen natural y una variante o derivado de CHIKV, tal como un CHIKV atenuado.

Una replicasa también puede comprender proteínas no estructurales de más de un alfavirus. Por lo tanto, los complejos o asociaciones heterólogas que comprenden la proteína no estructural de alfavirus y que tienen función replicasa están igualmente comprendidos en la presente enseñanza. Simplemente con fines ilustrativos, la replicasa puede comprender una o más proteínas no estructurales (por ejemplo, nsP1, nsP2) de un primer alfavirus, y una o más proteínas no estructurales (nsP3, nsP4) de un segundo alfavirus. Las proteínas no estructurales de más de un alfavirus diferente pueden codificarse mediante marcos de lectura abiertos separados, o pueden codificarse mediante un único marco de lectura abierto como poliproteína, por ejemplo, nsP1234.

En algunas realizaciones, la proteína no estructural de alfavirus funcional es capaz de formar complejos de replicación membranosa y/o vacuolas en células en las que se expresa la proteína no estructural de alfavirus funcional.

Si la proteína no estructural de alfavirus funcional, es decir, la proteína no estructural de alfavirus con función replicasa, está codificada por una molécula de ácido nucleico de acuerdo con la presente enseñanza, es preferible que el promotor subgenómico del replicón, si está presente, sea compatible con dicha replicasa. Compatible en este contexto significa que la alfavirus replicasa es capaz de reconocer el promotor subgenómico, si está presente. En una realización, esto se logra cuando el promotor subgenómico es nativo del alfavirus del que se deriva la replicasa, es decir, el origen natural de estas secuencias es el mismo alfavirus. En una realización alternativa, el promotor subgenómico no es nativo con respecto al alfavirus del que deriva la alfavirus replicasa, siempre que la alfavirus replicasa sea capaz de reconocer el promotor subgenómico. En otras palabras, la replicasa es compatible con el promotor subgenómico (compatibilidad cruzada con virus). En la técnica se conocen ejemplos de compatibilidad cruzada con virus con respecto al promotor subgenómico y la replicasa que se origina de diferentes alfavirus. Cualquier combinación de promotor subgenómico y replicasa es posible mientras exista compatibilidad cruzada con virus. La compatibilidad cruzada con virus puede ser probada fácilmente por el experto que trabaja en la presente enseñanza incubando una replicasa a probar junto con un ARN, en donde el ARN tiene un promotor subgenómico a probar, en condiciones adecuadas para la síntesis de ARN a partir de un promotor subgenómico. Si se prepara una transcrito subgenómico, se determina que el promotor subgenómico y la replicasa son compatibles. Se conocen varios ejemplos de compatibilidad cruzada con virus (revisado por Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562).

En una realización, la proteína no estructural de alfavirus no está codificada como proteína de fusión con una proteína heteróloga, por ejemplo, ubiquitina.

En la presente enseñanza, puede proporcionarse un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional en el replicón de ARN, o alternativamente, puede proporcionarse como una molécula de ácido nucleico separada, por ejemplo, una molécula de ARNm. Una molécula de ARNm separada puede comprender opcionalmente, por ejemplo, caperuza, 5'-UTR, 3'-UTR, secuencia de poli(A), y/o adaptación del uso del codón. Puede proporcionarse la molécula de ARNm separada en trans, como se describe en la presente descripción para el sistema de la presente enseñanza.

Cuando se proporciona un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional en el replicón de ARN, el replicón puede ser replicado preferentemente por la proteína no estructural de alfavirus funcional. En particular, el replicón de ARN que codifica la proteína no estructural de alfavirus funcional puede ser replicado por la proteína no estructural de alfavirus funcional codificada por el replicón. Esta realización es altamente preferida cuando no se proporciona una molécula de ácido nucleico que codifique una proteína no estructural de alfavirus funcional en trans. En esta realización, se apunta a la replicación cis del replicón. En una realización preferida, el replicón de ARN comprende un marco de lectura abierto que codifica una proteína no estructural de alfavirus funcional, así como un marco de lectura abierto adicional que codifica una proteína de interés, y puede ser replicado por la proteína no estructural de alfavirus funcional. Esta realización es particularmente adecuada en algunos métodos para producir una proteína de interés de acuerdo con la presente enseñanza. Un ejemplo de un replicón respectivo se ilustra en la Figura 1 ("cisReplicón A5ATG-RRS").

Si el replicón comprende un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional, es preferible que el marco de lectura abierto que codifique la proteína no estructural de alfavirus funcional no se solape con la secuencia de reconocimiento de replicación 5'. En una realización, el marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional no se solapa con el promotor subgenómico, si está presente. Un ejemplo de un replicón respectivo se ilustra en la Figura 1 ("cisReplicón A5ATG-RRS").

Si están presentes múltiples marcos de lectura abiertos en el replicón, entonces la proteína no estructural de alfavirus funcional puede estar codificada por cualquiera de ellos, opcionalmente bajo el control de un promotor subgenómico o no, preferentemente no bajo el control de un promotor subgenómico. En una realización preferida, la proteína no estructural de alfavirus funcional está codificada por el marco de lectura abierto corriente arriba del replicón de ARN. Cuando la proteína no estructural de alfavirus funcional está codificada por el marco de lectura abierto corriente arriba del replicón de ARN, la información genética que codifica la proteína no estructural de alfavirus funcional se traducirá pronto después de la introducción del replicón de ARN en una célula huésped, y la proteína resultante puede posteriormente conducir la replicación y, opcionalmente, la producción de un transcrito subgenómico en la célula huésped. Un ejemplo de un replicón respectivo se ilustra en la Figura 1 ("cisReplicón A5ATG-RRS").

La presencia de un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional, comprendida por el replicón o comprendida por una molécula de ácido nucleico separada que se proporciona en trans, permite que el replicón se replique y, en consecuencia, que un gen de interés codificado por el replicón, opcionalmente bajo el control de un promotor subgenómico, se exprese a niveles altos. Esto está asociado con una ventaja de costo en comparación con otros sistemas de expresión transgénica. Por ejemplo, en el caso de la vacunación animal, el costo de una vacuna es clave para su éxito en la comunidad veterinaria y agrícola. Dado que el replicón de la presente enseñanza puede replicarse en presencia de una proteína no estructural de alfavirus funcional, por ejemplo, en una célula de un animal vacunado, pueden lograrse altos niveles de expresión de un gen de interés incluso si se administran cantidades relativamente bajas de ARN replicón. Las bajas cantidades de ARN replicón influyen positivamente en los costos de la vacuna por sujeto.

Posición del al menos un marco de lectura abierto en el replicón de ARN

El replicón de ARN es adecuado para la expresión de uno o más genes que codifican un péptido de interés o una proteína de interés, opcionalmente bajo el control de un promotor subgenómico. Son posibles diversas realizaciones. Uno o más marcos de lectura abiertos, cada uno de los cuales codifica un péptido de interés o una proteína de interés, pueden estar presentes en el replicón de ARN. El marco de lectura abierto más corriente arriba del replicón de ARN se denomina "primer marco de lectura abierto". En algunas realizaciones, el "primer marco de lectura abierto" es el único marco de lectura abierto del replicón de ARN. Opcionalmente, uno o más marcos de lectura abiertos adicionales pueden estar presentes corriente abajo del primer marco de lectura abierto. Uno o más marcos de lectura abiertos adicionales corriente abajo del primer marco de lectura abierto pueden denominarse "segundo marco de lectura abierto", "tercer marco de lectura abierto" y así sucesivamente, en el orden (5' a 3') en el que están presente corriente abajo del primer marco de lectura abierto. Preferentemente, cada marco de lectura abierto comprende un codón de inicio (triplete de bases), típicamente AUG (en la molécula de ARN), correspondiente a ATG (en una molécula de ADN respectiva).

Si el replicón comprende una secuencia de reconocimiento de replicación 3', se prefiere que todos los marcos de lectura abiertos estén localizados corriente arriba de la secuencia de reconocimiento de replicación 3'.

Cuando el replicón de ARN que comprende uno o más marcos de lectura abiertos se introduce en una célula huésped, la traducción preferentemente no se inicia en ninguna posición corriente arriba del primer marco de lectura abierto, debido a la eliminación de al menos un codón de iniciación de la secuencia de reconocimiento de replicación 5'. Por lo tanto, el replicón puede servir directamente como plantilla para la traducción del primer marco de lectura abierto. Preferentemente, el replicón comprende una caperuza 5'. Esto es útil para la expresión del gen codificado por el primer marco de lectura abierto directamente desde el replicón.

En algunas realizaciones, al menos un marco de lectura abierto del replicón está bajo el control de un promotor subgenómico, preferentemente un promotor subgenómico de alfavirus. El promotor subgenómico de alfavirus es muy eficiente y, por lo tanto, es adecuado para la expresión de genes heterólogos a altos niveles. Preferentemente, el promotor subgenómico es un promotor para un transcrito subgenómico en un alfavirus. Esto significa que el promotor subgenómico es uno que es nativo con respecto a un alfavirus y que preferentemente controla la transcripción del marco de lectura abierto que codifica una o más proteínas estructurales en dicho alfavirus. Alternativamente, el promotor subgenómico es una variante de un promotor subgenómico de un alfavirus; cualquier variante que funcione como promotor de la transcripción de ARN subgenómico en una célula huésped es adecuada. Si el replicón comprende un promotor subgenómico, se prefiere que el replicón comprenda un elemento de secuencia conservada 3 (c Se 3) o una variante de este.

Preferentemente, el al menos un marco de lectura abierto bajo control de un promotor subgenómico se localiza corriente abajo del promotor subgenómico. Preferentemente, el promotor subgenómico controla la producción de ARN subgenómico que comprende un transcrito del marco de lectura abierto

En algunas realizaciones, el primer marco de lectura abierto está bajo el control de un promotor subgenómico. Cuando el primer marco de lectura abierto está bajo el control de un promotor subgenómico, su localización se asemeja a la localización del marco de lectura abierto que codifica las proteínas estructurales en el genoma de un alfavirus. Cuando el primer marco de lectura abierto está bajo el control del promotor subgenómico, el gen codificado por el primer marco de lectura abierto puede expresarse tanto desde el replicón como desde un transcrito subgenómico de este (este último en presencia de la proteína no estructural de alfavirus). Una realización respectiva se ejemplifica con el replicón "A5ATG-RRS" en la Figura 1. Preferentemente "A5ATG-RRS" no comprende ningún codón de iniciación en la secuencia de ácidos nucleicos que codifica el fragmento C-terminal de nsP4 (*nsP4). Pueden estar presentes uno o más marcos de lectura abiertos adicionales, cada uno bajo el control de un promotor subgenómico, corriente abajo del primer marco de lectura abierto que está bajo el control de un promotor subgenómico (no ilustrado en la Figura i). Los genes codificados por uno o más marcos de lectura abiertos adicionales, por ejemplo, por el segundo marco de lectura abierto, pueden traducirse de uno o más transcritos subgenómicos, cada uno bajo el control de un promotor subgenómico. Por ejemplo, el replicón de ARN puede comprender un promotor subgenómico que controla la producción de un transcrito que codifica una segunda proteína de interés.

En otras realizaciones el primer marco de lectura abierto no está bajo el control de un promotor subgenómico. Cuando el primer marco de lectura abierto no está bajo el control de un promotor subgenómico, el gen codificado por el primer marco de lectura abierto puede expresarse desde el replicón. Una realización respectiva se ejemplifica con el replicón "A5ATG-RRSASGP" en la Figura 1. Pueden estar presentes uno o más marcos de lectura abiertos adicionales, cada uno bajo el control de un promotor subgenómico, corriente abajo del primer marco de lectura abierto (para ilustración de dos realizaciones ilustrativas, ver "A5ATG-RRS - bicistrónico" y "cisReplicón A5ATG-RRS" en la Figura 1). Los genes codificados por uno o más marcos de lectura abiertos adicionales pueden expresarse a partir de transcritos subgenómicos.

En una célula que comprende el replicón de acuerdo con la presente enseñanza, el replicón puede ser amplificado por una proteína no estructural de alfavirus funcional. Además, si el replicón comprende uno o más marcos de lectura abiertos bajo el control de un promotor subgenómico, se espera que uno o más transcritos subgenómicos se preparen mediante la proteína no estructural de alfavirus funcional. Puede proporcionarse la proteína no estructural de alfavirus funcional en trans, o puede ser codificado por un marco de lectura abierto del replicón.

Si un replicón comprende más de un marco de lectura abierto que codifica una proteína de interés, es preferible que cada marco de lectura abierto codifique una proteína diferente. Por ejemplo, la proteína codificada por el segundo marco de lectura abierto es diferente de la proteína codificada por el primer marco de lectura abierto.

En algunas realizaciones, la proteína de interés codificada por el primer marco de lectura abierto y/o adicional, preferentemente por el primer marco de lectura abierto, es una proteína no estructural de alfavirus funcional o un inhibidor de la señalización de IFN, por ejemplo, E3. En algunas realizaciones, la proteína de interés codificada por el primer y/u otro marco de lectura abierto, por ejemplo, por el segundo marco de lectura abierto, es un péptido o proteína farmacéuticamente activa, o una proteína reportera.

En una realización, la proteína de interés codificada por el primer marco de lectura abierto es una proteína no estructural de alfavirus funcional. En esa realización, el replicón comprende preferentemente una caperuza 5'. Particularmente cuando la proteína de interés codificada por el primer marco de lectura abierto es una proteína no estructural de alfavirus funcional, y preferentemente cuando el replicón comprende una caperuza 5', la secuencia de ácidos nucleicos que codifica la proteína no estructural de alfavirus funcional puede traducirse eficientemente a partir del replicón, y la proteína resultante puede conducir posteriormente a la replicación del replicón e conducir la síntesis de transcrito(s) subgenómico(s). Esta realización puede preferirse cuando no se usa una molécula de ácido nucleico adicional que codifica la proteína no estructural de alfavirus funcional o presente junto con el replicón. En esta realización, se apunta a la replicación cis del replicón.

Una realización en donde el primer marco de lectura abierto codifica la proteína no estructural de alfavirus funcional se ilustra con "cisReplicón A5ATG-RRS" en la Figura 1. Después de la traducción de la secuencia de ácidos nucleicos que codifica nsP1234, el producto de traducción (nsP1234 o fragmento(s) de este) puede actuar como replicasa y conducir la síntesis de ARN, es decir, la replicación del replicón y la síntesis de un transcrito subgenómico que comprende el segundo marco de lectura abierto ("Transgén" en la Figura 1).

Sistema de trans-replicación

el replicón de ARN de acuerdo con el primer aspecto de la enseñanza, que puede ser replicado por la proteína no estructural funcional de alfavirus en trans.

En el segundo aspecto se prefiere que el replicón de ARN no comprenda un marco de lectura abierto que codifique la proteína no estructural de alfavirus funcional.

Por lo tanto, la presente enseñanza proporciona un sistema que comprende dos moléculas de ácido nucleico: un primer constructo de ARN para expresar la proteína no estructural de alfavirus funcional (es decir, que codifica la proteína no estructural de alfavirus funcional); y una segunda molécula de ARN, el replicón de ARN. El constructo de ARN para expresar la proteína no estructural de alfavirus funcional se denomina en la presente descripción de igual manera de "constructo de ARN para expresar la proteína no estructural de alfavirus funcional" o como "constructo de replicasa".

La proteína no estructural de alfavirus funcional es como se definió anteriormente y está típicamente codificada por un marco de lectura abierto comprendido por el constructo de replicasa. La proteína no estructural de alfavirus funcional codificada por el constructo de replicasa puede ser cualquier proteína no estructural de alfavirus funcional que sea capaz de replicar el replicón.

Cuando el sistema de la presente enseñanza se introduce en una célula, preferentemente una célula eucariota, puede traducirse el marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional. Después de la traducción, la proteína no estructural de alfavirus funcional es capaz de replicar una molécula de ARN separada (replicón de a Rn ) en trans. Por lo tanto, la presente enseñanza proporciona un sistema para replicar ARN en trans. En consecuencia, el sistema de la presente enseñanza es un sistema de replicación trans. De acuerdo con el segundo aspecto, el replicón es un trans-replicón.

En la presente descripción, trans (por ejemplo, en el contexto de acción trans, trans-regulatorio), en general, significa "actuar desde una molécula diferente" (es decir, intermolecular). Es lo contrario de cis (por ejemplo, en el contexto de acción cis, cis-regulatorio), que, en general, significa "actuar desde la misma molécula" (es decir, intramolecular). En el contexto de la síntesis de ARN (incluida la transcripción y la replicación del ARN), un elemento de acción trans incluye una secuencia de ácidos nucleicos que contiene un gen que codifica una enzima capaz de síntesis de ARN (ARN polimerasa). La ARN polimerasa usa una segunda molécula de ácido nucleico, es decir, una molécula de ácido nucleico distinta de la que está codificada, como plantilla para la síntesis de ARN. Se dice que tanto la ARN polimerasa como la secuencia de ácidos nucleicos que contiene un gen que codifica la ARN polimerasa "actúan en trans" en la segunda molécula de ácido nucleico. En el contexto de la presente enseñanza, la ARN polimerasa codificada por el ARN de acción trans es una proteína no estructural de alfavirus funcional. La proteína no estructural de alfavirus funcional es capaz de usar una segunda molécula de ácido nucleico, que es un replicón de ARN, como plantilla para la síntesis de ARN, incluida la replicación del replicón de ARN. El replicón de a Rn que puede ser replicado por la replicasa en trans de acuerdo con la presente enseñanza también se denomina en la presente descripción "trans replicón".

En el sistema de la presente enseñanza, el papel de la proteína no estructural de alfavirus funcional es amplificar el replicón y preparar una transcrito subgenómico, si está presente un promotor subgenómico en el replicón. Si el replicón codifica un gen de interés para la expresión, los niveles de expresión del gen de interés y/o la duración de la expresión pueden regularse en trans modificando los niveles de la proteína no estructural de alfavirus funcional.

El hecho de que la replicasa alfaviral es generalmente capaz de reconocer y replicar un ARN plantilla en trans fue descubierto inicialmente en la década de 1980, pero el potencial de la replicación trans para aplicaciones biomédicas no fue reconocida, entre otros porque se consideró que el ARN replicado en trans inhibía la replicación eficiente: se descubrió en el caso del ARN de interferencia (DI) defectuoso que correplica con genomas alfavirales en células infectadas (Barrett et al., 1984, J. Gen. Virol., vol. 65 (Pt 8), páginas 1273-1283; Lehtovaara et al., 1981, Proc. Natl. Acad. Sci. U. S. A., vol. 78, páginas 5353-5357; Pettersson, 1981, Proc. Natl. Acad. Sci. U. S. A., vol. 78, páginas 115 119). Los ARN DI son trans-replicones que pueden producirse casi naturalmente durante las infecciones de líneas celulares con alta carga de virus. Los elementos DI correplican de manera tan eficiente que reducen la virulencia del virus parental y, por lo tanto, actúan como ARN parásito inhibidor (Barrett et al., 1984, J. Gen. Virol., vol. 65 (Pt 11), páginas 1909-1920). Aunque no se reconoció el potencial para aplicaciones biomédicas, el fenómeno de replicación en trans se usó en varios estudios básicos con el objetivo de dilucidar los mecanismos de replicación, sin necesidad de expresar la replicasa de la misma molécula en cis; además, la separación de replicasa y replicón también permite estudios funcionales que implican mutantes de proteínas virales, incluso si los mutantes respectivos eran mutantes con pérdida de función (Lemm et al., 1994, EMBO J., vol. 13, páginas 2925-2934). Estos estudios de pérdida de función y ARN DI no sugirieron que los sistemas de activación en trans basados en elementos alfavirales puedan eventualmente estar disponibles para adaptarse a fines terapéuticos.

El sistema de la presente enseñanza comprende al menos dos moléculas de ácido nucleico. Por lo tanto, puede comprender dos o más, tres o más, cuatro o más, cinco o más, seis o más, siete o más, ocho o más, nueve o más, o diez o más moléculas de ácido nucleico, que son preferentemente moléculas de ARN. En una realización preferida, el sistema consta de exactamente dos moléculas de ARN, el replicón y el constructo de replicasa. En realizaciones preferidas alternativas, el sistema comprende más de un replicón, donde cada uno codifica preferentemente al menos una proteína de interés, y también comprende el constructo de replicasa. En estas realizaciones, la proteína no estructural de alfavirus funcional codificada por el constructo de replicasa puede actuar en cada replicón para conducir la replicación y la producción de transcritos subgenómicos, respectivamente. Por ejemplo, cada replicón puede codificar un péptido o proteína farmacéuticamente activa. Esto es ventajoso, por ejemplo, si se desea la vacunación de un sujeto contra varios antígenos diferentes.

Preferentemente, el constructo de replicasa carece de al menos un elemento de secuencia conservada (CSE) que se requiere para la síntesis de cadena (-) basada en una plantilla de cadena (+), y/o para síntesis de cadena (+) basada en una plantilla de cadena (-). Con mayor preferencia, el constructo de replicasa no comprende ninguno de los elementos de secuencia conservada alfaviral (CSE). En particular, entre las cuatro CSE de alfavirus (Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562; José et al., Future Microbiol., 2009, vol. 4, páginas 837-856), uno cualquiera o más de los siguientes CSE preferentemente no están presentes en el constructo de replicasa: CSE 1; CSE 2; CSE 3; CSE 4. Particularmente en ausencia de uno o más c Se alfavirales, el constructo de replicasa de la presente enseñanza se parece mucho más al ARNm eucariota típico que al ARN genómico alfaviral.

El constructo de replicasa de la presente enseñanza se distingue preferentemente del ARN genómico alfaviral al menos en que no es capaz de autorreplicarse y/o que no comprende un marco de lectura abierto bajo el control de un promotor subgenómico. Cuando no puede autorreplicarse, el constructo de replicasa también puede denominarse "constructo suicida".

El sistema de replicación trans está asociado con las siguientes ventajas:

En primer lugar, la versatilidad del sistema de replicación en trans permite que el constructo de replicón y replicasa pueda diseñarse y/o prepararse en diferentes momentos y/o en diferentes sitios. En una realización, el constructo de replicasa se prepara en un primer punto en el tiempo, y el replicón se prepara en un punto posterior en el tiempo. Por ejemplo, después de su preparación, el constructo de replicasa puede almacenarse para su uso en un punto posterior en el tiempo. La presente enseñanza proporciona una mayor flexibilidad en comparación con los cis-replicones: cuando surge un nuevo patógeno, el sistema de la presente enseñanza puede diseñarse para la vacunación, al clonar en el replicón un ácido nucleico que codifica un polipéptido que provoca una respuesta inmunitaria contra el nuevo patógeno. Un constructo de replicasa preparado previamente puede recuperarse del almacenamiento. Por lo tanto, no se requiere que, en el momento en que se diseña y prepara el constructo de replicasa, se conozca la naturaleza de un patógeno particular, o del (de los) antígeno(s) de un patógeno particular. En consecuencia, no se requiere que, en el momento en que se diseña y prepara el constructo de replicasa, esté disponible un replicón que codifique un polipéptido que provoque una respuesta inmunitaria contra un nuevo patógeno particular. En otras palabras, el constructo de replicasa puede diseñarse y prepararse independientemente de cualquier replicón particular. Esto permite reaccionar rápidamente a la aparición de nuevos patógenos, o a los patógenos caracterizados por la expresión de al menos un nuevo antígeno, porque la preparación del replicón desprovisto de replicasa requiere menos esfuerzo y recursos que la preparación de cis-replicones. La historia dice que se necesita un sistema que permita una reacción rápida a los patógenos: esto se ilustra, por ejemplo, por la aparición de patógenos que causan el síndrome respiratorio agudo severo (SARS), el ébola y varios subtipos de virus de la influenza en los últimos años.

En segundo lugar, el trans-replicón de acuerdo con la presente enseñanza es típicamente una molécula de ácido nucleico más corta que un c/s-replicón típico. Esto permite una clonación más rápida de un replicón que codifica una proteína de interés, por ejemplo, un polipéptido inmunogénico, y proporciona altos rendimientos de la proteína de interés.

Otras ventajas del sistema de la presente enseñanza incluyen la independencia de la transcripción nuclear y la presencia de información genética clave en dos moléculas de ARN separadas, lo que proporciona una libertad de diseños sin precedentes. En vista de sus elementos versátiles, que son combinables entre sí, la presente enseñanza permite optimizar la expresión de replicasa para un nivel deseado de amplificación de ARN, para un organismo objetivo deseado, para un nivel deseado de producción de una proteína de interés, etc. El sistema de acuerdo con la enseñanza permite cotransfectar cantidades o proporciones variables de replicón y constructo de replicasa para cualquier tipo de célula dado - reposo o en ciclos, /n v/tro o /n v/vo. El sistema de replicación en trans de la presente enseñanza es adecuado para la inoculación de una célula huésped y para la expresión de un gen de interés en una célula huésped (ver, por ejemplo, los Ejemplos 2, 3 y 5).

El constructo de replicasa de acuerdo con la presente enseñanza es preferentemente una molécula de ARN monocatenario. El constructo de replicasa de acuerdo con la presente enseñanza es típicamente una molécula de ARN de cadena (+). En una realización, el constructo de replicasa de la presente enseñanza es una molécula de ácido nucleico aislada.

Características preferidas de las moléculas de ARN descritas

Las moléculas de ARN de acuerdo con la enseñanza pueden caracterizarse opcionalmente por características adicionales, por ejemplo, por una caperuza 5', una 5'-UTR, una 3'-UTR, una secuencia de poli(A), y/o la adaptación del uso de codones. Los detalles se describen a continuación.

Caperuza

En algunas realizaciones, el replicón de acuerdo con la presente enseñanza comprende una caperuza 5'.

En algunas realizaciones, el constructo de replicasa de acuerdo con la presente enseñanza comprende una caperuza 5'.

Los términos "caperuza 5'", "caperuza", "estructura caperuza 5'", "estructura caperuza" se usan de igual manera para referirse a un dinucleótido que se encuentra en el extremo 5' de algunos transcritos primarios eucariotas tal como el ARN mensajero precursor. Una caperuza 5' es una estructura en donde una guanosina (opcionalmente modificada) está unida al primer nucleótido de una molécula de ARNm a través de un enlace trifosfato de 5' a 5' (o enlace trifosfato modificado en el caso de ciertos análogos de caperuza). Los términos pueden referirse a una caperuza convencional o a una caperuza análoga. Para ilustración, se muestran algunos dinucleótidos caperuza particulares (incluidos dinucleótidos análogos caperuza) en la Figura 6.

"ARN que comprende una caperuza 5'" o "ARN que se proporciona con una caperuza 5'" o "ARN que se modifica con una caperuza 5'" o "ARN con caperuza" se refiere al ARN que comprende una caperuza 5'. Por ejemplo, proporcionar un ARN con una caperuza 5' puede lograrse mediante transcripción in vitro de una plantilla de ADN en presencia de dicha caperuza 5', en donde dicha caperuza 5' se incorpora cotranscripcionalmente en la cadena de ARN generada, o el ARN puede generarse, por ejemplo, mediante transcripción /n v/tro, y la caperuza 5' puede unirse al ARN de manera postranscripcional mediante el uso de enzimas formadoras de caperuza, por ejemplo, las enzimas formadoras de caperuza del virus vaccinia. En el ARN con caperuza, la posición 3' de la primera base de una molécula de ARN (con caperuza) está unida a la posición 5' de la base posterior de la molécula de ARN ("segunda base") a través de un enlace fosfodiéster.

La presencia de una caperuza en una molécula de ARN es fuertemente preferida si se desea la traducción de una secuencia de ácidos nucleicos que codifica una proteína en las primeras etapas después de la introducción del ARN respectivo en las células huésped o en un organismo huésped. Por ejemplo, como se muestra en el Ejemplo 4, la presencia de una caperuza permite que un gen de interés codificado por el replicón de ARN se traduzca eficientemente en las primeras etapas después de la introducción del ARN respectivo en las células huésped. "Etapas tempranas" típicamente significa dentro de la primera 1 hora, o dentro de las primeras dos horas, o dentro de las primeras tres horas después de la introducción del ARN.

También se prefiere la presencia de una caperuza en una molécula de ARN si se desea que la traducción se produzca en ausencia de replicasa funcional, o cuando solo están presentes niveles menores de replicasa en una célula huésped. Por ejemplo, incluso si una molécula de ácido nucleico que codifica la replicasa se introduce en una célula huésped, en las etapas tempranas después de la introducción los niveles de replicasa serán típicamente menores.

En el sistema de acuerdo con la enseñanza, se prefiere que el constructo de ARN para expresar la proteína no estructural de alfavirus funcional comprenda una caperuza 5'.

En particular, cuando el replicón de ARN de acuerdo con la presente enseñanza no se usa o se proporciona junto con una segunda molécula de ácido nucleico (por ejemplo, ARNm) que codifica una proteína no estructural de alfavirus funcional, se prefiere que el replicón de a Rn comprenda una caperuza 5'. Independientemente, el replicón de ARN también puede comprender una caperuza 5' incluso cuando se usa o se proporciona junto con una segunda molécula de ácido nucleico que codifica la proteína no estructural de alfavirus funcional.

La expresión "caperuza 5' convencional" se refiere a una caperuza 5' de origen natural, preferentemente, a la caperuza 7-metilguanosina. En la caperuza 7-metilguanosina, la guanosina de la caperuza es una guanosina modificada en donde la modificación consiste en una metilación en la posición 7 (parte superior de la Figura 6).

En el contexto de la presente enseñanza, el término "análogo de caperuza 5'" se refiere a una estructura que se asemeja a la caperuza 5' convencional, pero se modifica para que posea la capacidad de estabilizar el ARN si se une a este, preferentemente, in vivo y/o en una célula. Un análogo de caperuza no es una caperuza 5' convencional.

Para el caso de ARNm eucariota, se ha descrito generalmente que la caperuza 5' está implicada en la traducción eficiente de ARNm: en general, en eucariotas, la traducción se inicia solo en el extremo 5' de una molécula de ARN mensajero (ARNm), a menos que esté presente un sitio de entrada ribosomal interno (IRES). Las células eucariotas son capaces de proporcionar un ARN con una caperuza 5' durante la transcripción en el núcleo: los ARNm recién sintetizados generalmente se modifican con una estructura de caperuza 5', por ejemplo, cuando el transcrito alcanza una longitud de 20 a 30 nucleótidos. Primero, el nucleótido terminal 5' pppN (ppp que representa trifosfato; N que representa cualquier nucleósido) se convierte en la célula a GpppN 5' mediante una enzima formadora de caperuza que tiene actividades de ARN 5'-trifosfatasa y guanililtransferasa. El GpppN puede ser metilado posteriormente en la célula por una segunda enzima con actividad (guanina-7)-metiltransferasa para formar una caperuza m7GpppN monometilada. En una realización, la caperuza 5' usada en la presente enseñanza es una caperuza 5' natural.

En la presente enseñanza, un dinucleótido caperuza 5' natural se selecciona típicamente del grupo que consiste en un dinucleótido caperuza no metilado (G(5')ppp(5')N; también denominado GpppN) y un dinucleótido caperuza metilado ((m7G(5')ppp(5')N; también denominado m7GpppN). m7GpppN (en donde N es G) se representa mediante la siguiente fórmula:

El ARN con caperuza de la presente enseñanza puede prepararse in vitro y por lo tanto, no depende de una maquinaria de formación de caperuza en una célula huésped. El método usado con más frecuencia para preparar los ARN con caperuza in vitro es transcribir una plantilla de ADN ya sea con una ARN polimerasa bacteriana o de bacteriófagos en presencia de los cuatro ribonucleósidos trifosfatos y un dinucleótido caperuza como m7G(5')ppp(5')G (también llamado m7GpppG). La ARN polimerasa inicia la transcripción con un ataque nucleofílico por el 3'-OH del resto de guanosina de m7GpppG en el a-fosfato del siguiente nucleósido trifosfato de la plantilla (pppN), lo que da como resultado el producto intermediario m7GpppGpN (en donde N es la segunda base de la molécula de ARN). La formación del producto pppGpN iniciado por g Tp de competencia se suprime al establecer la relación molar de la caperuza con respecto a Gt P entre 5 y l0 durante la transcripción in vitro.

En realizaciones preferidas de la presente enseñanza, la caperuza 5' (si está presente) es un análogo de caperuza 5'. Estas realizaciones son particularmente adecuadas si el ARN se obtiene mediante transcripción in vitro, por ejemplo, es un ARN transcrito in vitro (ARN-IVT). Los análogos de caperuza se han descrito inicialmente para facilitar la síntesis a gran escala de transcritos de ARN por medio de la transcripción in vitro.

Para el ARN mensajero, algunos análogos de caperuza (caperuzas sintéticas) se han descrito generalmente hasta la fecha, y todos pueden usarse en el contexto de la presente enseñanza. Idealmente, se selecciona un análogo de caperuza asociado con una mayor eficiencia de traducción y/o un aumento de la resistencia a la degradación in vivo y/o un aumento de la resistencia a la degradación in vitro.

Preferentemente, se usa un análogo de caperuza que solo puede incorporarse en una cadena de ARN en una orientación. Pasquinelli et al., (1995, RNA J., vol., 1, páginas 957-967) demostraron que durante la transcripción in vitro, las ARN polimerasas de bacteriófagos usan la unidad de 7-metilguanosina para el inicio de la transcripción, por lo que alrededor del 40-50 % de los transcritos con caperuza poseen el dinucleótido caperuza en una orientación inversa (es decir, el producto de reacción inicial es Gpppm7GpN). En comparación con los ARN con una caperuza correcta, los ARN con una caperuza inversa no son funcionales con respecto a la traducción de una secuencia de ácidos nucleicos en proteína. Por lo tanto, es deseable incorporar la caperuza en la orientación correcta, es decir, dando como resultado un ARN con una estructura esencialmente correspondiente a m7GpppGpN etc. Se ha demostrado que la integración inversa del dinucleótido caperuza se inhibe por la sustitución ya sea del grupo 2' o 3' OH de la unidad de guanosina metilada (Stepinski et al., 2001; RNA J., vol. 7, páginas 1486-1495; Peng et al., 2002; Org. Lett., vol. 24, páginas 161-164). Los ARN que se sintetizan en presencia de tales "análogos caperuza anti inversos" se traducen de manera más eficiente que los ARN que se transcriben in vitro en presencia de la caperuza 5' convencional m7GpppG. Con ese fin, un análogo de caperuza en el que el grupo 3' OH de la unidad de guanosina metilada se reemplaza por OCH3 se describe, por ejemplo, por Holtkamp et al., 2006, Blood, vol. 108, páginas 4009 4017 (7-metil(3'-O-metil)GpppG; análogo de caperuza anti-inversos (ARCA)). ARCA es un dinucleótido caperuza adecuado de acuerdo con la presente enseñanza.

En una realización preferida de la presente enseñanza, el ARN de la presente enseñanza no es esencialmente susceptible a la eliminación de la caperuza. Esto es importante porque, en general, la cantidad de proteína producida a partir de los ARNm sintéticos introducidos en células de mamífero cultivadas está limitada por la degradación natural del ARNm. Una ruta in vivo para la degradación del ARNm comienza con la eliminación de la caperuza del ARNm. Esta eliminación es catalizada por una pirofosfatasa heterodimérica, que contiene una subunidad reguladora (Dcp1) y una subunidad catalítica (Dcp2). La subunidad catalítica se escinde entre los grupos fosfato a y p del puente trifosfato. En la presente enseñanza, puede seleccionarse o presentarse un análogo de caperuza que no sea susceptible, o menos susceptible, a ese tipo de escisión. Un análogo de caperuza adecuado para este propósito puede seleccionarse de un dinucleótido caperuza de acuerdo con la fórmula (I):

en donde R1 se selecciona del grupo que consiste en alquilo opcionalmente sustituido, alquenilo opcionalmente sustituido, alquinilo opcionalmente sustituido, cicloalquilo opcionalmente sustituido, heterociclilo opcionalmente sustituido, arilo opcionalmente sustituido, y heteroarilo opcionalmente sustituido,

R2 y R3 se seleccionan independientemente del grupo que consiste en H, halo, OH y alcoxi opcionalmente sustituido, o R 2 y R3 juntos forman O-X-O, en donde X se selecciona del grupo que consiste en CH2 opcionalmente sustituido, CH2CH2, CH2CH2CH2, CH2CH (CH3) y

C(CH3)2, o R2 se combina con el átomo de hidrógeno en la posición 4' del anillo al que R2 se une para formar -O-CH2-o -CH2-O-,

R5 se selecciona del grupo que consiste en S, Se, y BH3,

R4 y R6 se seleccionan independientemente del grupo que consiste en O, S, Se, y BH3. n es 1, 2, o 3.

Las realizaciones preferidas para R1, R2, R3, R4, R5, R6 se describen en el documento WO 2011/015347 A1 y puede seleccionarse en consecuencia en la presente enseñanza.

Por ejemplo, en una realización preferida de la presente enseñanza, el ARN de la presente enseñanza comprende un análogo de caperuza fosforotioato. Los análogos de caperuza fosforotioato son análogos de caperuza específicos en los que uno de los tres átomos de O no puenteados en la cadena trifosfato se reemplaza con un átomo de S, es decir, uno de R4, R5 o R6 en la Fórmula (I) es S. Los análogos de caperuza fosforotioato se han descrito por J. Kowalska et al., 2008, ARN, vol. 14, páginas 1119-1131, como una solución al proceso de eliminación de caperuza no deseado y, por lo tanto, para aumentar la estabilidad del ARN in vivo. En particular, la sustitución de un átomo de oxígeno por un átomo de azufre en el grupo beta-fosfato de la caperuza 5' da como resultado la estabilización contra Dcp2. En esa realización, que se prefiere en la presente enseñanza, R5 en la Fórmula (I) es S; y R4 y R6 son O.

En una realización preferida adicional de la presente enseñanza, el ARN de la presente enseñanza comprende un análogo de caperuza fosforotioato en donde la modificación de fosforotioato de la caperuza 5' de ARN se combina con una modificación de "análogo de caperuza anti inverso" (ARCA). Los respectivos análogos de caperuza fosforotioato de ARCA se describen en el documento WO 2008/157688 A2, y todos pueden usarse en el ARN de la presente enseñanza. En esa realización, al menos uno de R2 o R3 en la Fórmula (I) no es OH, preferentemente uno entre R2 y R3 es metoxi (OCH3), y el otro entre R2 y R3 es preferentemente OH.

En una realización preferida, un átomo de oxígeno se sustituye por un átomo de azufre en el grupo beta-fosfato (de manera que R5 en la fórmula (I) es S; y R4 y R6 son O). Se considera que la modificación con fosforotioato del ARCA asegura que los grupos de fosforotioato a, p y y se coloquen con precisión dentro de los sitios activos de las proteínas de unión a caperuza tanto en la maquinaria de traslación como de eliminación de caperuza. Al menos algunos de estos análogos son esencialmente resistentes a la pirofosfatasa Dcp1/Dcp2. Se describió que los ARCA modificados con fosforotioato tienen una afinidad mucho mayor por elF4E que los ARCA correspondientes que carecen de un grupo fosforotioato.

Un análogo de caperuza respectivo que es particularmente preferido en la presente enseñanza, es decir, m2'72' oGppspG, se denomina beta-S-ARCA (WO 2008/157688 A2; Kuhn et al., Gene Ther., 2010, vol. 17, páginas 961-971). Por lo tanto, en una realización de la presente enseñanza, el ARN de la presente enseñanza se modifica con beta-S-ARCA. beta-S-ARCA está representado por la siguiente estructura:

En general, el reemplazo de un átomo de oxígeno por un átomo de azufre en un fosfato puente da como resultado diastereómeros de fosforotioato que se designan D1 y D2, en función de su patrón de elución en HPLC. Brevemente, el diastereómero D1 de beta-S-ARCA o "beta-S-ARCA(D1) "es el diastereómero de beta-S-ARCA que se eluye primero en una columna de HPLC en comparación con el diastereómero D2 de beta-S-ARCA (beta-S-ARCA(D2)) y por lo tanto exhibe un tiempo de retención más corto. La determinación de la configuración estereoquímica por HPLC se describe en el documento WO 2011/015347 A1.

En una primera realización particularmente preferida de la presente enseñanza, el ARN de la presente enseñanza se modifica con el diastereómero beta-S-ARCA(D2). Los dos diastereómeros de beta-S-ARCA difieren en sensibilidad contra las nucleasas. Se ha demostrado que el ARN que porta el diastereómero D2 de beta-S-ARCA es casi completamente resistente contra la escisión de Dcp2 (solo un 6 % de escisión en comparación con el ARN que se ha sintetizado en presencia de la caperuza 5' ARCA no modificada), mientras que el ARN con la caperuza 5' beta-S-ARCA(DI) exhibe una sensibilidad intermedia a la escisión de Dcp2 (escisión del 71 %). Además, se ha demostrado que la mayor estabilidad contra la escisión de Dcp2 se correlaciona con un aumento de la expresión de proteínas en células de mamífero. En particular, se ha demostrado que los ARN que portan la caperuza beta-S-ARCA(D2) se traducen de manera más eficiente en células de mamíferos que los ARN que llevan la caperuza beta-S-ARCA(DI). Por lo tanto, en una realización de la presente enseñanza, el ARN de la presente enseñanza se modifica con un análogo de caperuza de acuerdo con la Fórmula (I), caracterizado por una configuración estereoquímica en el átomo P que comprende el sustituyente R5 en la Fórmula (I) que corresponde a la del átomo Pp del diastereómero D2 de beta-S-ARCA. En esa realización, R5 en la Fórmula (I) es S; y R4 y R6 son O. Además, al menos uno de R2 o R3 en la Fórmula (I) preferentemente no es OH, preferentemente uno entre R2 y R3 es metoxi (OCH3), y el otro entre R2 y R3 es preferentemente OH.

En una segunda realización particularmente preferida, el ARN de la presente enseñanza se modifica con el diastereómero beta-S-ARCA(DI). Esta realización es particularmente adecuada para la transferencia de ARN con caperuza a las células presentadoras de antígeno inmaduras, tal como para fines de vacunación. Se ha demostrado que el diastereómero beta-S-ARCA(DI), tras la transferencia del ARN con caperuza respectivamente a las células presentadoras de antígeno inmaduras, es particularmente adecuado para aumentar la estabilidad del ARN, aumentar la eficiencia de traducción del ARN, prolongar la traducción del ARN, aumentar la expresión de proteínas totales del ARN, y/o aumentar la respuesta inmunitaria contra un antígeno o péptido antigénico codificado por dicho ARN (Kuhn et al., 2010, Gene Ther., Vol. 17, páginas 961-971). Por lo tanto, en una realización alternativa de la presente enseñanza, el ARN de la presente enseñanza se modifica con un análogo de caperuza de acuerdo con la Fórmula (I), caracterizado por una configuración estereoquímica en el átomo P que comprende el sustituyente R5 en la fórmula (I) que corresponde a la del átomo Pp del diastereómero D1 de beta-S-ARCA. Los análogos de caperuza respectivos y sus realizaciones se describen en los documentos WO 2011/015347 A1 y Kuhn et al., 2010, Gene Ther., Vol. 17, páginas 961-971. Cualquier análogo de caperuza descrito en el documento WO 2011/015347 A1, en donde la configuración estereoquímica en el átomo P que comprende el sustituyente R5 corresponde a la del átomo Pp del diastereómero D1 de beta-S-ARCA, puede usarse en la presente enseñanza. Preferentemente, R5 en la Fórmula (I) es S; y R4 y R6 son O. Además, al menos uno de R2 o R3 en la Fórmula (I) preferentemente no es OH, preferentemente uno entre R2 y R3 es metoxi (OCH3), y el otro entre R2 y R3 es preferentemente OH.

En una realización, el ARN de la presente enseñanza se modifica con una estructura de caperuza 5' de acuerdo con la Fórmula (I) en donde cualquier grupo fosfato se reemplaza por un grupo boranofosfato o un grupo fosforoselenoato. Tales caperuzas tienen mayor estabilidad tanto in vitro como in vivo. Opcionalmente, el compuesto respectivo tiene un grupo 2'-O- o 3'-O-alquilo (en donde el alquilo es preferentemente metilo); los respectivos análogos de caperuza se denominan BH3-ARCA o Se-ARCA. Los compuestos que son particularmente adecuados para la formación de caperuzas de ARNm incluyen los P-BH3-ARCA y p-Se-ARCA, como se describe en el documento WO 2009/149253 A2. Para estos compuestos, se prefiere una configuración estereoquímica en el átomo P que comprende el sustituyente R5 en la fórmula (I) que corresponde a la del átomo Pp del diastereómero D1 de beta-S-ARCA.

UTR

La expresión "región no traducida" o "UTR" se refiere a una región en una molécula de ADN que se transcribe, pero no se traduce en una secuencia de aminoácidos, o a la región correspondiente en una molécula de ARN, tal como una molécula de ARNm. Una región no traducida (UTR) puede estar presente 5' (corriente arriba) de un marco de lectura abierto (5'-UTR) y/o 3' (corriente abajo) de un marco de lectura abierto (3'-UTR).

Un 3'-UTR, si está presente, está ubicado en el extremo 3' de un gen, corriente abajo del codón de terminación de una región codificante de proteína, pero el término "3'-UTR" preferentemente no incluye la cola de poli(A). Por lo tanto, el 3'-UTR está corriente arriba de la cola de poli(A) (si está presente), por ejemplo, directamente adyacente a la cola de poli(A).

Un 5'-UTR, si está presente, está ubicado en el extremo 5' de un gen, corriente arriba del codón de inicio de una región codificante de proteína. Un 5'-UTR está corriente abajo de la caperuza 5' (si está presente), por ejemplo, directamente adyacente a la caperuza 5'.

Las regiones 5' y/o 3' no traducidas pueden, de acuerdo con la enseñanza, estar funcionalmente vinculadas a un marco de lectura abierto, de manera que estas regiones se asocien con el marco de lectura abierto de tal manera que se aumenten la estabilidad y/o la eficiencia de traducción del ARN que comprende dicho marco de lectura abierto.

En algunas realizaciones, el constructo de replicasa de acuerdo con la presente enseñanza comprende una 5'-UTR y/o una 3'-UTR.

En una realización preferida, el constructo de replicasa de acuerdo con la presente enseñanza comprende

(1) una 5'-UTR,

(2) un marco de lectura abierto, y

(3) una 3'-UTR.

Los UTR están implicados en la estabilidad y la eficiencia de traducción del ARN. Ambos pueden mejorarse, además de las modificaciones estructurales relacionadas con la caperuza 5' y/o la cola de poli(A) 3' como se describe en la presente descripción, al seleccionar regiones no traducidas 5' y/o 3' específicas (UTR). Generalmente se entiende que los elementos de secuencia dentro de las UTR influyen en la eficiencia de traducción (principalmente 5'-UTR) y la estabilidad del ARN (principalmente 3'-UTR). Es preferible que esté presente una 5'-UTR que esté activo para aumentar la eficiencia de traducción y/o la estabilidad del constructo de replicasa. Independiente o adicionalmente, es preferible que esté presente una 3'-UTR que esté activo para aumentar la eficiencia de traducción y/o la estabilidad del constructo de replicasa.

Los términos "activo para aumentar la eficiencia de la traducción" y/o "activo para aumentar la estabilidad", con referencia a una primera secuencia de ácidos nucleicos (por ejemplo, una UTR), significa que la primera secuencia de ácidos nucleicos es capaz de modificar, en un transcrito común con una segunda secuencia de ácidos nucleicos, la eficiencia de traducción y/o estabilidad de dicha segunda secuencia de ácidos nucleicos de tal manera que dicha eficiencia de traducción y/o estabilidad aumenta en comparación con la eficiencia de traducción y/o estabilidad de dicha segunda secuencia de ácidos nucleicos en ausencia de dicha primera secuencia de ácidos nucleicos.

En una realización, el constructo de replicasa de acuerdo con la presente enseñanza comprende una 5'-UTR y/o una 3'-UTR que es heteróloga o no nativa con respecto al alfavirus del que se deriva la proteína no estructural de alfavirus funcional. Esto permite que las regiones no traducidas se diseñen de acuerdo con la eficiencia de traducción deseada y la estabilidad del ARN. Por lo tanto, las UTR heterólogas o no nativas permiten un alto grado de flexibilidad, y esta flexibilidad es ventajosa en comparación con las UTR alfavirales nativas. En particular, aunque se sabe que el ARN alfaviral (nativo) también comprende una 5'-UTR y/o una 3'-UTR, las UTR alfavirales cumplen una doble función, es decir (i) impulsar la replicación del ARN así como (ii) conducir la traducción. Si bien se informó que los UTR alfavirales eran ineficientes para la traducción (Berben-Bloemheuvel et al., 1992, Eur. J. Biochem., vol. 208, páginas 581-587), normalmente no pueden ser reemplazadas fácilmente por las UTR más eficientes debido a su doble función. En la presente enseñanza, sin embargo, una 5'-UTR y/o una 3'-UTR comprendidas en un constructo de replicasa para replicación en trans pueden seleccionarse independientemente de su influencia potencial en la replicación del a Rn .

Preferentemente, el constructo de replicasa de acuerdo con la presente enseñanza comprende una 5'-UTR y/o una 3'-UTR que no es de origen viral; particularmente no de origen alfavirus. En una realización, el constructo de replicasa comprende una 5'-UTR derivada de una 5'-UTR eucariota y/o una 3'-UTR derivada de una 3'-UTR eucariota.

Una 5'-UTR de acuerdo con la presente enseñanza puede comprender cualquier combinación de más de una secuencia de ácidos nucleicos, opcionalmente separada por un enlazador. Una 3'-UTR de acuerdo con la presente enseñanza puede comprender cualquier combinación de más de una secuencia de ácidos nucleicos, opcionalmente separada por un enlazador.

El término "enlazador" de acuerdo con la enseñanza se refiere a una secuencia de ácidos nucleicos añadida entre dos secuencias de ácidos nucleicos para conectar dichas dos secuencias de ácidos nucleicos. No existe ninguna limitación particular con respecto a la secuencia del enlazador.

Una 3'-UTR tiene típicamente una longitud de 200 a 2000 nucleótidos, por ejemplo, 500 a 1500 nucleótidos. Las regiones no traducidas 3' de los ARNm de inmunoglobulina son relativamente cortas (menos de alrededor de 300 nucleótidos), mientras que las regiones no traducidas 3' de otros genes son relativamente largas. Por ejemplo, la región 3' no traducida de tPA tiene alrededor de 800 nucleótidos de longitud, la del factor VIII tiene alrededor de 1800 nucleótidos de longitud y la de la eritropoyetina tiene alrededor de 560 nucleótidos de longitud. Las regiones no traducidas 3' del ARNm de mamífero típicamente tienen una región de homología conocida como la secuencia de hexanucleótidos AAUAAA. Presumiblemente, esta secuencia es la señal de unión de poli(A) y con frecuencia se encuentra entre 10 y 30 bases corriente arriba del sitio de unión de poli(A). Las regiones no traducidas 3' pueden contener una o más repeticiones invertidas que pueden plegarse para dar estructuras de horquilla que actúan como barreras para las exorribonucleasas o interactúan con proteínas que se conoce que aumentan la estabilidad del ARN (por ejemplo, proteínas de unión al ARN).

La 3'-UTR de beta-globina humana, particularmente dos copias idénticas consecutivas de la 3'-UTR beta-globina humana, contribuye a la alta estabilidad del transcrito y la eficiencia de la traducción (Holtkamp et al., 2006, Blood, vol.

108, páginas 4009-4017). Por lo tanto, en una realización, el constructo de replicasa de acuerdo con la presente enseñanza comprende dos copias idénticas consecutivas de la 3'-UTR de beta-globina humana. Por lo tanto, este comprende en la dirección 5' ^ 3': (a) opcionalmente una 5'-UTR; (b) un marco de lectura abierto; (c) una 3'-UTR; dicha 3'-UTR comprende dos copias idénticas consecutivas de la 3'-UTR de beta-globina humana, un fragmento de esta, o una variante de la 3'-UTR de beta-globina humana o fragmento de esta.

En una realización, el constructo de replicasa de acuerdo con la presente enseñanza comprende una 3'-UTR que es activa para aumentar la eficiencia de traducción y/o estabilidad, pero que no es la 3'-UTR de beta-globina humana, un fragmento de esta, o una variante de la 3'-UTR de beta-globina humana o fragmento de esta.

En una realización, el constructo de replicasa de acuerdo con la presente enseñanza comprende una 5'-UTR que es activo para aumentar la eficiencia de traducción y/o estabilidad.

Puede prepararse un constructo de replicasa que contiene UTR de acuerdo con la enseñanza, por ejemplo, mediante la transcripción in vitro. Esto puede lograrse modificando genéticamente una molécula de ácido nucleico plantilla (por ejemplo, ADN) de tal manera que permita la transcripción de ARN con las 5'-UTR y/o las 3'-UTR.

Como se ilustra en la Figura 1, también el replicón puede caracterizarse por una 5'-UTR y/o una 3'-UTR. Las UTR del replicón son típicamente UTR alfavirales o variantes de estas.

Secuencia poli(A)

En algunas realizaciones, el replicón de acuerdo con la presente enseñanza comprende una secuencia poli(A) 3'. Si el replicón comprende el elemento de secuencia conservada 4 (CSE 4), la secuencia poli(A) 3' del replicón está presente preferentemente corriente abajo de CSE 4, con la máxima preferencia directamente adyacente a CSE 4.

En algunas realizaciones, el constructo de replicasa de acuerdo con la presente enseñanza comprende una secuencia poli(A) 3'.

De acuerdo con la enseñanza, en una realización, una secuencia de poli(A) comprende o consiste esencialmente en o consiste en al menos 20, preferentemente al menos 26, preferentemente al menos 40, preferentemente al menos 80, preferentemente al menos 100 y preferentemente hasta 500, preferentemente hasta 400, preferentemente hasta 300, preferentemente hasta 200, y en particular hasta 150 nucleótidos A, y en particular alrededor de 120 nucleótidos A. En este contexto, "esencialmente consiste en" significa que la mayoría de los nucleótidos en la secuencia de poli(A), típicamente al menos 50 %, y preferentemente al menos 75 % en número de nucleótidos en la "secuencia de poli(A)", son nucleótidos A (adenilato), pero permite que los nucleótidos restantes sean nucleótidos distintos de los nucleótidos A, tales como los nucleótidos U (uridilato), los nucleótidos G (guanilato), los nucleótidos C (citidilato). En este contexto "consiste en" significa que todos los nucleótidos en la secuencia de poli(A), es decir, 100 % en número de nucleótidos en la secuencia de poli(A), son nucleótidos A. La expresión "nucleótido A" o "A" se refiere a adenilato.

De hecho, se ha demostrado que una secuencia poli(A) 3' de alrededor de 120 nucleótidos Atiene una influencia beneficiosa en los niveles de a Rn en las células eucariotas transfectadas, así como en los niveles de proteína que se traducen de un marco de lectura abierto que está presente corriente arriba (5') de la secuencia de poli(A) 3' (Holtkamp et al., 2006, Blood, vol. 108, páginas 4009-4017).

En los alfavirus, se considera que una secuencia de poli(A) 3' de al menos 11 residuos de adenilato consecutivos, o al menos 25 residuos de adenilato consecutivos, es importante para una síntesis eficiente de la cadena negativa. En particular, en alfavirus, se entiende que una secuencia de poli(A) 3' de al menos 25 residuos de adenilato consecutivos funciona junto con el elemento de secuencia conservada 4 (CSE 4) para promover la síntesis de la cadena (-) (Hardy & Rice, J. Virol., 2005, vol. 79, páginas 4630-4639).

La presente enseñanza proporciona una secuencia de poli(A) 3' para unirse durante la transcripción de ARN, es decir, durante la preparación de transcrito de ARN in vitro, basado en una plantilla de ADN que comprende nucleótidos dT repetidos (desoxitimidilato) en la cadena complementaria a la cadena codificante. La secuencia de ADN que codifica una secuencia de poli(A) (cadena codificante) se denomina casete de poli(A).

En una realización preferida de la presente enseñanza, el casete de poli(A) 3' presente en la cadena codificante de ADN consiste esencialmente en nucleótidos dA, pero está interrumpido por una secuencia aleatoria que tiene una distribución igual de los cuatro nucleótidos (dA, dC, dG, dT). Tal secuencia aleatoria puede tener de 5 a 50, preferentemente de 10 a 30, con mayor preferencia de 10 a 20 nucleótidos de longitud. Tal casete se describe en el documento WO 2016/005004 A1. Cualquier casete de poli(A) descrito en el documento WO 2016/005004 A1 puede usarse en la presente enseñanza. Un casete de poli(A) que consiste esencialmente en nucleótidos dA, pero está interrumpido por una secuencia aleatoria que tiene una distribución igual de los cuatro nucleótidos (dA, dC, dG, dT) y que tiene una longitud de, por ejemplo, 5 a 50 nucleótidos muestra, a nivel de ADN, la propagación constante de ADN plasmídico en E. coli y todavía está asociado, a nivel de ARN, con las propiedades beneficiosas con respecto al soporte de la estabilidad del ARN y la eficiencia de traducción.

En consecuencia, en una realización preferida de la presente enseñanza, la secuencia poli(A) 3' contenida en una molécula de ARN descrita en la presente descripción consiste esencialmente en nucleótidos A, pero está interrumpida por una secuencia aleatoria que tiene una distribución igual de los cuatro nucleótidos (A, C, G, U). Tal secuencia aleatoria puede tener de 5 a 50, preferentemente de 10 a 30, con mayor preferencia de 10 a 20 nucleótidos de longitud.

Uso de codones

En general, la degeneración del código genético permitirá la sustitución de ciertos codones (tripletes de bases que codifican un aminoácido) que están presentes en una secuencia de ARN por otros codones (tripletes de bases), mientras se mantiene la misma capacidad de codificación (de manera que el codón de reemplazo codifica el mismo aminoácido que el codón reemplazado). En algunas realizaciones de la presente enseñanza, al menos un codón de un marco de lectura abierto compuesto por una molécula de ARN difiere del codón respectivo en el marco de lectura abierto respectivo en la especie a partir de la cual se origina el marco de lectura abierto. En esa realización, se dice que la secuencia codificante del marco de lectura abierto está "adaptada" o "modificada". Puede adaptarse la secuencia codificante de un marco de lectura abierto contenida en el replicón. Puede adaptarse, alternativamente o adicionalmente, la secuencia codificante para la proteína no estructural de alfavirus funcional contenida en el constructo de replicasa.

Por ejemplo, cuando se adapta la secuencia codificante de un marco de lectura abierto, pueden seleccionarse codones de uso frecuente: El documento WO 2009/024567 A1 describe la adaptación de una secuencia codificante de una molécula de ácido nucleico, que implica la sustitución de codones raros por codones usados con más frecuencia. Dado que la frecuencia del uso de codones depende de la célula huésped u organismo huésped, ese tipo de adaptación es adecuada para ajustar una secuencia de ácidos nucleicos a la expresión en una célula huésped u organismo huésped particular. Generalmente hablando, los codones usados con mayor frecuencia se traducen de manera más eficiente en una célula huésped u organismo huésped, aunque no siempre se requiere la adaptación de todos los codones de un marco de lectura abierto.

Por ejemplo, cuando se adapta la secuencia codificante de un marco de lectura abierto, el contenido de residuos G (guanilato) y residuos C (citidilato) puede alterarse seleccionando codones con el contenido rico en GC más alto para cada aminoácido. Se informó que las moléculas de ARN con marcos de lectura abiertos ricos en GC tienen el potencial de reducir la activación inmunitaria y mejorar la traducción y la vida media del ARN (Thess et al., 2015, Mol. Ther. 23, 1457-1465).

Cuando el replicón de acuerdo con la presente enseñanza codifica la proteína no estructural de alfavirus, la secuencia codificante para la proteína no estructural de alfavirus puede adaptarse según sea conveniente. Esta libertad es posible porque el marco de lectura abierto que codifica la proteína no estructural de alfavirus no se superpone con la secuencia de reconocimiento de replicación 5' del replicón.

Características de seguridad de las realizaciones de la presente enseñanza

Las siguientes características son preferidas en la presente enseñanza, solas o en cualquier combinación adecuada: Preferentemente, el replicón o el sistema de la presente enseñanza no es formador de partículas. Esto significa que, después de la inoculación de una célula huésped por el replicón o el sistema de la presente enseñanza, la célula huésped no produce partículas de virus, tales como partículas de virus de nueva generación. En una realización, todas las moléculas de ARN de acuerdo con la enseñanza están completamente libres de información genética que codifique cualquier proteína estructural de alfavirus, tal como la proteína de nucleocápside central C, la proteína de envoltura P62 y/o la proteína de envoltura E1. Este aspecto de la presente enseñanza proporciona un valor añadido en términos de seguridad sobre los sistemas de la técnica anterior en donde las proteínas estructurales están codificadas en ARN auxiliar de replicación trans (por ejemplo Bredenbeek et al., J. Virol, 1993, vol. 67, páginas 6439-6446).

Preferentemente, el sistema de la presente enseñanza no comprende ninguna proteína estructural de alfavirus, tal como la proteína central de nucleocápside C, la proteína de envoltura P62 y/o la proteína de envoltura E1.

Preferentemente, el replicón y el constructo de replicasa del sistema de la presente enseñanza no son idénticos entre sí. En una realización, el replicón no codifica la proteína no estructural de alfavirus funcional. En una realización, el constructo de replicasa carece de al menos un elemento de secuencia (preferentemente al menos un CSE) que se requiere para la síntesis de cadena (-) basada en una plantilla de cadena (+), y/o para la síntesis de cadena (+) basada en una plantilla de cadena (-). En una realización, el constructo de replicasa no comprende CSE 1 y/o CSE 4.

Preferentemente, ni el replicón de acuerdo con la presente enseñanza ni el constructo de replicasa de acuerdo con la presente enseñanza comprenden una señal de empaquetamiento de alfavirus. Por ejemplo, la señal de empaquetamiento de alfavirus comprendida en la región codificante de nsP2 de SFV (White et al., 1998, J. Virol., vol.

72, páginas 4320-4326) puede eliminarse, por ejemplo, mediante eliminación o mutación. Una forma adecuada de eliminar la señal de empaquetamiento de alfavirus incluye la adaptación del uso de codones de la región codificante de nsP2. La degeneración del código genético puede permitir delecionar la función de la señal de empaquetamiento sin afectar la secuencia de aminoácidos de la nsP2 codificada.

En una realización, el sistema de la presente enseñanza es un sistema aislado. En esa realización, el sistema no está presente dentro de una célula, como dentro de una célula de mamífero, o no está presente dentro de una cápside de virus, tal como dentro de una capa que comprende las proteínas estructurales de alfavirus. En una realización, el sistema de la presente enseñanza está presente in vitro.

ADN

Preferentemente, el ADN es bicatenario.

En una realización preferida, el ADN de acuerdo con el tercer aspecto de la enseñanza es un plásmido. El término "plásmido", como se usa en la presente descripción, se refiere en general a un constructo de material genético extracromosómico, generalmente, un ADN dúplex circular, que puede replicarse independientemente del ADN cromosómico.

El ADN de la presente enseñanza puede comprender un promotor que puede ser reconocido por una ARN-polimerasa dependiente de ADN. Esto permite la transcripción del ARN codificado in vivo o in vitro por ejemplo, del ARN de la presente enseñanza. Los vectores IVT pueden usarse de manera estandarizada como plantilla para la transcripción in vitro. Los ejemplos de promotores preferidos de acuerdo con la enseñanza son los promotores para polimerasa SP6, T3 o T7.

En una realización, el ADN de la presente enseñanza es una molécula de ácido nucleico aislada.

Métodos de preparación de ARN

Cualquier molécula de ARN de acuerdo con la presente enseñanza, ya sea parte del sistema de la presente enseñanza o no, puede obtenerse mediante transcripción in vitro. El ARN transcrito in vitro (IVT-ARN) es de particular interés en la presente enseñanza. IVT-ARN puede obtenerse mediante la transcripción de una molécula de ácido nucleico (particularmente una molécula de ADN). La(s) molécula(s) de ADN del tercer aspecto de la presente enseñanza son adecuadas para tales fines, particularmente si comprenden un promotor que puede ser reconocido por una ARN-polimerasa dependiente de ADN.

El ARN de acuerdo con la presente enseñanza puede sintetizarse in vitro. Esto permite añadir análogos de caperuza a la reacción de transcripción in vitro. Típicamente, la cola de poli(A) está codificada por una secuencia poli-(dT) en la plantilla de ADN. Alternativamente, la formación de caperuza y la adición de la cola de poli(A) pueden lograrse enzimáticamente después de la transcripción.

La metodología de la transcripción in vitro es conocida por el experto. Por ejemplo, como se menciona en el documento WO 2011/015347 A1, una variedad de kits de transcripción in vitro están comercialmente disponibles.

Kit

La presente enseñanza también proporciona un kit que comprende un replicón de ARN de acuerdo con el primer aspecto de la enseñanza o un sistema de acuerdo con el segundo aspecto de la enseñanza.

En una realización, los constituyentes del kit están presentes como entidades separadas. Por ejemplo, una molécula de ácido nucleico del kit puede estar presente en una entidad, y el otro ácido nucleico del kit puede estar presente en una entidad separada. Por ejemplo, un contenedor abierto o cerrado es una entidad adecuada. Se prefiere un recipiente cerrado. El recipiente usado debería estar preferentemente libre de ARNasa o esencialmente libre de ARNasa.

En una realización, el kit de la presente enseñanza comprende ARN para la inoculación con una célula y/o para la administración a un sujeto humano o animal.

El kit de acuerdo con la presente enseñanza comprende opcionalmente una etiqueta u otra forma de elemento de información, por ejemplo, un soporte de datos electrónico. La etiqueta o elemento de información comprende preferentemente instrucciones, por ejemplo, instrucciones escritas impresas o instrucciones en forma electrónica que pueden imprimirse opcionalmente. Las instrucciones pueden referirse al menos a un posible uso adecuado del kit.

Composición farmacéutica

El constructo de replicasa y/o el replicón descrito en la presente descripción pueden estar presentes en forma de una composición farmacéutica. Una composición farmacéutica de acuerdo con la enseñanza puede comprender al menos una molécula de ácido nucleico de acuerdo con la presente enseñanza. Una composición farmacéutica de acuerdo con la enseñanza comprende un diluyente farmacéuticamente aceptable y/o un excipiente farmacéuticamente aceptable y/o un portador farmacéuticamente aceptable y/o un vehículo farmacéuticamente aceptable. La elección del portador, vehículo, excipiente o diluyente farmacéuticamente aceptable no está particularmente limitada. Se puede usar cualquier portador, vehículo, excipiente o diluyente farmacéuticamente aceptable adecuado conocido en la técnica.

En una realización de la presente enseñanza, una composición farmacéutica puede comprender además un disolvente tal como un disolvente acuoso o cualquier disolvente que permita conservar la integridad del ARN. En una realización preferida, la composición farmacéutica es una solución acuosa que comprende ARN. La solución acuosa puede comprender opcionalmente solutos, por ejemplo, sales.

En una realización de la presente enseñanza, la composición farmacéutica está en forma de una composición liofilizada. Una composición liofilizada puede obtenerse liofilizando una composición acuosa respectiva.

En una realización, la composición farmacéutica comprende al menos una entidad catiónica. En general, los lípidos catiónicos, los polímeros catiónicos y otras sustancias con cargas positivas pueden formar complejos con ácidos nucleicos cargados negativamente. Es posible estabilizar el ARN de acuerdo con las enseñanzas mediante formación de complejos con compuestos catiónicos, preferentemente compuestos policatiónicos tales como, por ejemplo, un péptido o proteína catiónico o policatiónico. En una realización, la composición farmacéutica de acuerdo con la presente enseñanza comprende al menos una molécula catiónica seleccionada del grupo que consiste en protamina, polietilenimina, una poli-L-lisina, una poli-L-arginina, una histona o un lípido catiónico.

De acuerdo con la presente enseñanza, un lípido catiónico es una molécula anfifílica catiónica, por ejemplo, una molécula que comprende al menos un resto hidrófilo y lipófilo. El lípido catiónico puede ser monocatiónico o policatiónico. Los lípidos catiónicos típicamente tienen un resto lipofílico, tal como un esterol, una cadena acilo o diacilo, y tienen una carga positiva neta general. El grupo principal del lípido típicamente porta la carga positiva. El lípido catiónico preferentemente tiene una carga positiva de 1 a 10 valencias, con mayor preferencia una carga positiva de 1 a 3 valencias, y con mayor preferencia una carga positiva de 1 valencia. Los ejemplos de lípidos catiónicos incluyen, pero no se limitan a 1,2-di-O-octadecenil-3-trimetilamonio propano (DOTMA); dimetildioctadecilamonio (DDAB); 1,2-dioleoil-3-trimetilamonio-propano (DOTAP); 1,2-dioleoil-3-dimetilamonio-propano (DODAP); 1,2-diaciloxi-3-dimetilamonio propanos; 1,2-dialquiloxi-3-dimetilamonio propanos; cloruro de dioctadecildimetilamonio (DODAC), 1,2-dimiristoiloxipropil-1,3-dimetilhidroxietil amonio (DMRIE) y trifluoroacetato de 2,3-dioleoiloxi-N-[2(espermina carboxamida)etil]-N,N-dimetil-1-propanamio (DOSPA). Los lípidos catiónicos también incluyen lípidos con un grupo de amina terciaria, que incluye 1,2-dilinoleiloxi-N,N-dimetil-3-aminopropano (DLinDMA). Los lípidos catiónicos son adecuados para formular ARN en formulaciones lipídicas como se describe en la presente descripción, tales como liposomas, emulsiones y lipoplejos. Típicamente las cargas positivas son aportadas por al menos un lípido catiónico y las cargas negativas son aportadas por el ARN. En una realización, la composición farmacéutica comprende al menos un lípido auxiliar, además de un lípido catiónico. El lípido auxiliar puede ser un lípido neutro o aniónico. El lípido auxiliar puede ser un lípido natural, tal como un fosfolípido, o un análogo de un lípido natural, o un lípido totalmente sintético, o una molécula similar a lípido, sin similitudes con los lípidos naturales. En el caso en que una composición farmacéutica incluye tanto un lípido catiónico como un lípido auxiliar, la relación molar del lípido catiónico con respecto al lípido neutro puede determinarse apropiadamente en vista de la estabilidad de la formulación y similares.

En una realización, la composición farmacéutica de acuerdo con la presente enseñanza comprende protamina. De acuerdo con la enseñanza, la protamina es útil como agente portador catiónico. El término "protamina" se refiere a cualquiera de varias proteínas fuertemente básicas de peso molecular relativamente bajo que son ricas en arginina y se encuentran asociadas especialmente con el ADN en lugar de histonas somáticas en las células de esperma de animales tales como los peces. En particular, el término "protamina" se refiere a proteínas encontradas en los espermatozoides de los peces que son fuertemente básicas, solubles en agua, no están coaguladas por el calor y comprenden múltiples monómeros de arginina. De acuerdo con la enseñanza, el término "protamina", como se usa en la presente descripción, pretende comprender cualquier secuencia de aminoácidos de protamina obtenida o derivada de fuentes nativas o biológicas que incluyen fragmentos de esta y formas multiméricas de dicha secuencia de aminoácidos o fragmento de esta. Además, el término abarca polipéptidos (sintetizados) que son artificiales y se diseñan específicamente para fines específicos y no pueden aislarse de fuentes nativas o biológicas.

En algunas realizaciones, las composiciones de la enseñanza pueden comprender uno o más adyuvantes. Pueden añadirse adyuvantes a las vacunas para estimular la respuesta del sistema inmunitario; los adyuvantes típicamente no proporcionan inmunidad por sí mismos. Los adyuvantes ilustrativos incluyen sin limitación los siguientes: Los compuestos inorgánicos (por ejemplo, alumbre, hidróxido de aluminio, fosfato de aluminio, hidróxido de fosfato de calcio); aceite mineral (por ejemplo, aceite de parafina), citocinas (por ejemplo, IL-1, IL-2, IL-12); polinucleótido inmunoestimulador (tal como ARN o ADN; por ejemplo, oligonucleótidos que contienen CpG); saponinas (por ejemplo, saponinas vegetales de Quillaja, Soja, Polygala senega); emulsiones de aceite o liposomas; formulaciones de éter de polioxietileno y éster de polioxietileno; polifosfenceno (PCPP); péptidos de muramilo; compuestos de imidazoquinolona; compuestos de tiosemicarbazona; el ligando Flt3 (WO 2010/066418 A1); o cualquier otro adyuvante que sea conocido por un experto en la técnica. Un adyuvante preferido para la administración de ARN de acuerdo con la presente enseñanza es el ligando Flt3 (WO 2010/066418 A1). Cuando el ligando Flt3 se administra junto con ARN que codifica un antígeno, puede observarse un fuerte aumento de células T CD8+ específicas de antígeno.

La composición farmacéutica de acuerdo con la enseñanza puede tamponarse (por ejemplo, con un tampón de acetato, un tampón de citrato, un tampón de succinato, un tampón de Tris, un tampón de fosfato).

Partículas que contienen ARN

En algunas realizaciones, debido a la inestabilidad del ARN no protegido, es ventajoso proporcionar las moléculas de ARN de la presente enseñanza en forma compleja o encapsulada. Se proporcionan composiciones farmacéuticas respectivas en la presente enseñanza. En particular, en algunas realizaciones, la composición farmacéutica de la presente enseñanza comprende partículas que contienen ácido nucleico, preferentemente partículas que contienen ARN. Las composiciones farmacéuticas respectivas se denominan formulaciones particuladas. En formulaciones particuladas de acuerdo con la presente enseñanza, una partícula comprende ácido nucleico de acuerdo con la enseñanza y un portador farmacéuticamente aceptable o un vehículo farmacéuticamente aceptable que es adecuado para el suministro del ácido nucleico. Las partículas que contienen ácido nucleico pueden estar, por ejemplo, en forma de partículas proteicas o en forma de partículas que contienen lípidos. Las proteínas o lípidos adecuados se denominan agentes formadores de partículas. Las partículas proteicas y las partículas que contienen lípidos se han descrito previamente como adecuadas para el suministro de a Rn alfaviral en forma de partículas (por ejemplo Strauss & Strauss, Microbiol. Rev., 1994, vol. 58, páginas 491-562). En particular, las proteínas estructurales de alfavirus (proporcionadas, por ejemplo, por un virus auxiliar) son un portador adecuado para el suministro de ARN en la forma de partículas proteicas.

Cuando el sistema de acuerdo con la presente enseñanza se formula como una formulación particulada, es posible que cada especie de ARN (por ejemplo, replicón, constructo de replicasa y especies de ARN adicionales opcionales tal como un ARN que codifica una proteína adecuada para inhibir IFN) se formule por separado como una formulación particulada individual. En ese caso, cada formulación particulada individual comprenderá una especie de ARN. Las formulaciones particuladas individuales pueden estar presentes como entidades separadas, por ejemplo, en recipientes separados. Tales formulaciones pueden obtenerse al proporcionar cada especie de a Rn por separado (típicamente cada una en la forma de una solución que contiene a Rn ) junto con un agente formador de partículas, lo que permite la formación de partículas. Las partículas respectivas contendrán exclusivamente las especies de ARN específicas que se proporcionan cuando se forman las partículas (formulaciones particuladas individuales).

En una realización, una composición farmacéutica de acuerdo con la enseñanza comprende más de una formulación de partículas individuales. Las composiciones farmacéuticas respectivas se denominan formulaciones particuladas mixtas. Las formulaciones particuladas mixtas de acuerdo con la enseñanza pueden obtenerse formando, por separado, formulaciones particuladas individuales, como se describió anteriormente, seguido de una etapa de mezclado de las formulaciones particuladas individuales. En la etapa de mezclado, puede obtenerse una formulación que comprende una población mixta de partículas que contienen ARN (para ilustración: por ejemplo, una primera población de partículas puede contener replicón de acuerdo con la enseñanza, y una segunda formulación de partículas puede contener un constructo de replicasa de acuerdo con la enseñanza). Las poblaciones particuladas individuales pueden estar juntas en un recipiente, que comprende una población mixta de formulaciones particuladas individuales.

Alternativamente, es posible que todas las especies de ARN de la composición farmacéutica (por ejemplo, replicón, constructo de replicasa y especies adicionales opcionales tales como ARN que codifica una proteína adecuada para inhibir IFN) se formulen juntas como una formulación particulada combinada. Tales formulaciones pueden obtenerse al proporcionar una formulación combinada (típicamente solución combinada) de todas las especies de ARN junto con un agente formador de partículas, permitiendo así la formación de partículas. A diferencia de una formulación particulada mixta, una formulación de partículas combinadas comprenderá típicamente partículas que comprenden más de una especie de ARN. En una composición particulada combinada, diferentes especies de ARN están típicamente presentes juntas en una sola partícula.

En una realización, la formulación particulada de la presente enseñanza es una formulación nanoparticulada. En esa realización, la composición de acuerdo con la presente enseñanza comprende ácido nucleico de acuerdo con la enseñanza en forma de nanopartículas. Las formulaciones nanoparticuladas pueden obtenerse mediante diversos protocolos y con diversos compuestos formadores de complejos. Los lípidos, polímeros, oligómeros o anfífilos son componentes típicos de las formulaciones de nanopartículas.

Como se usa en la presente descripción, el término "nanopartícula" se refiere a cualquier partícula que tiene un diámetro que hace que la partícula sea adecuada para la administración sistémica, en particular parenteral, de, en particular, ácidos nucleicos, típicamente un diámetro de 1000 nanómetros (nm) o menos. En una realización, las nanopartículas tienen un diámetro promedio en el intervalo de alrededor de 50 nm a alrededor de 1000 nm, preferentemente de alrededor de 50 nm a alrededor de 400 nm, preferentemente de alrededor de 100 nm a alrededor de 300 nm tal como alrededor de 150 nm a alrededor de 200 nm. En una realización, las nanopartículas tienen un diámetro en el intervalo de alrededor de 200 a alrededor de 700 nm, alrededor de 200 a alrededor de 600 nm, preferentemente de alrededor de 250 a alrededor de 550 nm, en particular de alrededor de 300 a alrededor de 500 nm o de alrededor de 200 a alrededor de 400 nm.

En una realización, el índice de polidispersidad (PI) de las nanopartículas descritas en la presente descripción, medido por dispersión de luz dinámica, es 0,5 o menos, preferentemente 0,4 o menos o incluso con mayor preferencia 0,3 o menos. El "índice de polidispersidad" (PI) es una medida de la distribución de tamaño homogénea o heterogénea de las partículas individuales (tales como liposomas) en una mezcla de partículas e indica la amplitud de la distribución de partículas en una mezcla. El IP puede determinarse, por ejemplo, como se describe en el documento WO 2013/143555 A1.

Como se usa en la presente descripción, el término "formulación nanoparticulada" o términos similares se refieren a cualquier formulación particulada que contenga al menos una nanopartícula. En algunas realizaciones, una composición nanoparticulada es una colección uniforme de nanopartículas. En algunas realizaciones, una composición nanoparticulada es una formulación farmacéutica que contiene lípidos, tal como una formulación de liposomas o una emulsión.

Composiciones farmacéuticas que contienen lípidos

En una realización, la composición farmacéutica de la presente enseñanza comprende al menos un lípido. Preferentemente, al menos un lípido es un lípido catiónico. Dicha composición farmacéutica que contiene lípidos comprende ácido nucleico de acuerdo con la presente enseñanza. En una realización, la composición farmacéutica de acuerdo con la enseñanza comprende ARN encapsulado en una vesícula, por ejemplo, en un liposoma. En una realización, la composición farmacéutica de acuerdo con la enseñanza comprende ARN en forma de una emulsión. En una realización, la composición farmacéutica de acuerdo con la enseñanza comprende ARN en un complejo con un compuesto catiónico, formando así, por ejemplo, los denominados lipoplejos o poliplejos. La encapsulación de ARN dentro de vesículas tales como liposomas es distinta de, por ejemplo, complejos de lípidos/ARN. Pueden obtenerse complejos de lípidos/ARN, por ejemplo, cuando el ARN se mezcla, por ejemplo, con liposomas preformados.

En una realización, la composición farmacéutica de acuerdo con la enseñanza comprende ARN encapsulado en una vesícula. Tal formulación es una formulación particulada particular de acuerdo con la enseñanza. Una vesícula es una bicapa lipídica enrollada en una concha esférica, que encierra un espacio pequeño y separa ese espacio del espacio fuera de la vesícula. Típicamente, el espacio dentro de la vesícula es un espacio acuoso, es decir, comprende agua. Típicamente, el espacio fuera de la vesícula es un espacio acuoso, es decir, comprende agua. La bicapa lipídica está formada por uno o más lípidos (lípidos formadores de vesículas). La membrana que encierra la vesícula es una fase lamelar, similar a la de la membrana plasmática. La vesícula de acuerdo con la presente enseñanza puede ser una vesícula multilamelar, una vesícula unilamelar o una mezcla de estas. Cuando se encapsula en una vesícula, el ARN típicamente se separa de cualquier medio externo. Por lo tanto, está presente en forma protegida, funcionalmente equivalente a la forma protegida en un alfavirus natural. Las vesículas adecuadas son partículas, particularmente nanopartículas, como se describe en la presente descripción.

Por ejemplo, el ARN puede encapsularse en un liposoma. En esa realización, la composición farmacéutica es o comprende una formulación de liposomas. La encapsulación dentro de un liposoma típicamente protegerá el ARN de la digestión con RNasa. Es posible que los liposomas incluyan algún ARN externo (por ejemplo, en su superficie), pero al menos la mitad del ARN (e idealmente todo) está encapsulado dentro del núcleo del liposoma.

Los liposomas son vesículas lipídicas microscópicas que frecuentemente tienen una o más bicapas de un lípido formador de vesículas, tal como un fosfolípido, y son capaces de encapsular un fármaco, por ejemplo, ARN. Pueden emplearse diferentes tipos de liposomas en el contexto de la presente enseñanza, que incluyen, sin limitación, vesículas multilamelares (MLV), vesículas unilamelares pequeñas (SUV), vesículas unilamelares grandes (LUV), liposomas estabilizados estéricamente (SSL), vesículas multivesiculares (MV), y grandes vesículas multivesiculares (LMV), así como otras formas en bicapa conocidas en la técnica. El tamaño y la lamelaridad del liposoma dependerán de la forma de preparación. Existen varias otras formas de organización supramolecular en las que los lípidos pueden estar presentes en un medio acuoso, que comprende fases lamelares, fases hexagonales y hexagonales inversas, fases cúbicas, micelas, micelas inversas compuestas de monocapas. Estas fases también pueden obtenerse en combinación con ADN o ARN, y la interacción con ARN y ADN puede afectar sustancialmente el estado de la fase. Tales fases pueden estar presentes en formulaciones de ARN nanoparticuladas de la presente enseñanza.

Los liposomas pueden formarse mediante el uso de métodos estándar conocidos por el experto. Los métodos respectivos incluyen el método de evaporación inversa, el método de inyección de etanol, el método de deshidrataciónrehidratación, sonicación u otros métodos adecuados. Después de la formación de liposomas, los liposomas pueden dimensionarse para obtener una población de liposomas que tienen un intervalo de tamaños sustancialmente homogéneo.

En una realización preferida de la presente enseñanza, el ARN está presente en un liposoma que incluye al menos un lípido catiónico. Los liposomas respectivos pueden formarse a partir de un solo lípido o de una mezcla de lípidos, siempre que se use al menos un lípido catiónico. Los lípidos catiónicos preferidos tienen un átomo de nitrógeno que puede ser protonado; preferentemente, tales lípidos catiónicos son lípidos con un grupo amino terciario. Un lípido particularmente adecuado con un grupo amino terciario es 1,2-dilinoleiloxi-N,N-dimetil-3-aminopropano (DLinDMA). En una realización, el ARN de acuerdo con la presente enseñanza está presente en una formulación de liposoma como se describe en el documento WO 2012/006378 A1: un liposoma que tiene una bicapa lipídica que encapsula un núcleo acuoso que incluye ARN, en donde la bicapa lipídica comprende un lípido con un pKa en el intervalo de 5,0 a 7,6, que preferentemente tiene un grupo de amina terciaria. Los lípidos catiónicos preferidos con un grupo de amina terciaria incluyen DLinDMA (pKa 5,8) y se describen generalmente en el documento WO 2012/031046 A2. De acuerdo con el documento WO 2012/031046 A2, los liposomas que comprenden un compuesto respectivo son particularmente adecuados para la encapsulación de ARN y, por lo tanto, el suministro liposómico de ARN. En una realización, el ARN de acuerdo con la presente enseñanza está presente en una formulación de liposomas, en donde el liposoma incluye al menos un lípido catiónico cuyo grupo principal incluye al menos un átomo de nitrógeno (N) que puede ser protonado, en donde el liposoma y el ARN tiene una relación de N:P de entre 1:1 y 20:1. De acuerdo con la presente enseñanza, "relación N:P" se refiere a la relación molar de átomos de nitrógeno (N) en los lípidos catiónicos con respecto a los átomos de fosfato (P) en el ARN comprendido en una partícula que contiene lípidos (por ejemplo, liposoma), como se describe en el documento WO 2013/006825 A1. La relación de N:P de entre 1:1 y 20:1 está implicada en la carga neta del liposoma y en la eficiencia del suministro de ARN a una célula de vertebrado.

En una realización, el ARN de acuerdo con la presente enseñanza está presente en una formulación de liposomas que comprende al menos un lípido que incluye una porción de polietilenglicol (PEG), en donde el ARN está encapsulado dentro de un liposoma PEGilado de manera que la porción de PEG está presente en el exterior del liposoma, como se describe en los documentos WO 2012/031043 A1 y WO 2013/033563 A1.

En una realización, el ARN de acuerdo con la presente enseñanza está presente en una formulación de liposomas, en donde el liposoma tiene un diámetro en el intervalo de 60-180 nm, como se describe en el documento WO 2012/030901 A1.

En una realización, el ARN de acuerdo con la presente enseñanza está presente en una formulación de liposomas, en donde los liposomas que contienen ARN tienen una carga neta cercana a cero o negativa, como se describe en el documento WO 2013/143555 A1.

En otras realizaciones, el ARN de acuerdo con la presente enseñanza está presente en forma de una emulsión. Se ha descrito previamente que las emulsiones se usan para el suministro de moléculas de ácido nucleico, tales como las moléculas de ARN, a las células. Se prefieren en la presente descripción emulsiones de aceite en agua. Las partículas de emulsión respectivas comprenden un núcleo de aceite y un lípido catiónico. Más preferidas son las emulsiones catiónicas de aceite en agua en las que el ARN de acuerdo con la presente enseñanza está acomplejado con las partículas de la emulsión. Las partículas de la emulsión comprenden un núcleo de aceite y un lípido catiónico. El lípido catiónico puede interactuar con el ARN cargado negativamente, anclando así el ARN a las partículas de la emulsión. En una emulsión de aceite en agua, las partículas de emulsión se dispersan en una fase acuosa continua. Por ejemplo, el diámetro promedio de las partículas de emulsión puede ser típicamente de alrededor de 80 nm a 180 nm. En una realización, la composición farmacéutica de la presente enseñanza es una emulsión catiónica de aceite en agua, en donde las partículas de la emulsión comprenden un núcleo de aceite y un lípido catiónico, como se describe en el documento WO 2012/006380 A2. El ARN de acuerdo con la presente enseñanza puede estar presente en forma de una emulsión que comprende un lípido catiónico en donde la relación de N:P de la emulsión es al menos 4:1, como se describe en el documento WO 2013/006834 A1. El ARN de acuerdo con la presente enseñanza puede estar presente en forma de una emulsión lipídica catiónica, como se describe en el documento WO 2013/006837 A1. En particular, la composición puede comprender ARN acomplejado con una partícula de una emulsión catiónica de aceite en agua, en donde la relación de aceite/lípido es al menos alrededor de 8:1 (mol:mol).

En otras realizaciones, la composición farmacéutica de acuerdo con la enseñanza comprende ARN en el formato de un lipoplejo. El término "lipoplejo" o "lipoplejo de ARN" se refiere a un complejo de lípidos y ácidos nucleicos tal como el ARN. Los lipoplejos pueden estar formados por liposomas catiónicos (cargados positivamente) y el ácido nucleico aniónico (cargado negativamente). Los liposomas catiónicos también pueden incluir un lípido "auxiliar" neutro. En el caso más simple, los lipoplejos se forman espontáneamente mezclando el ácido nucleico con los liposomas con un cierto protocolo de mezcla, sin embargo, pueden aplicarse varios otros protocolos. Se entiende que las interacciones electrostáticas entre liposomas cargados positivamente y ácido nucleico cargado negativamente son la fuerza impulsora para la formación de lipoplejo (WO 2013/143555 A1). En una realización de la presente enseñanza, la carga neta de las partículas de lipoplejo de ARN es cercana a cero o negativa. Se sabe que los lipoplejos de ARN y liposomas electro neutros o cargados negativamente conducen a una expresión sustancial de ARN en las células dendríticas (DC) del bazo después de la administración sistémica y no están asociados con la toxicidad elevada que se ha informado para los liposomas y lipoplejos cargados positivamente (cf. WO 2013/143555 A1). Por lo tanto, en una realización de la presente enseñanza, la composición farmacéutica de acuerdo con la enseñanza comprende ARN en el formato de nanopartículas, preferentemente nanopartículas de lipoplejos, en las que (i) el número de cargas positivas en las nanopartículas no excede el número de cargas negativas en las nanopartículas y/o (ii) las nanopartículas tienen una carga neutra o negativa neta y/o (iii) la relación de carga de cargas positivas con respecto a cargas negativas en las nanopartículas es 1.4:1 o menos y/o (iv) el potencial zeta de las nanopartículas es 0 o menos. Como se describe en el documento WO 2013/143555 A1, potencial zeta es un término científico para el potencial electrocinético en sistemas coloidales. En la presente enseñanza, (a) el potencial zeta y (b) la relación de carga del lípido catiónico con respecto al ARN en las nanopartículas pueden calcularse como se describe en el documento WO 2013/143555 A1. En resumen, las composiciones farmacéuticas que son formulaciones de lipoplejos nanoparticuladas con un tamaño de partícula definido, en donde la carga neta de las partículas es cercana a cero o negativa, como se describe en el documento WO 2013/143555 A1, son composiciones farmacéuticas preferidas en el contexto de la presente enseñanza.

Métodos para producir una proteína

(b) inocular el replicón de ARN en la célula.

En diversas realizaciones del método, el replicón de ARN es como se definió anteriormente para el replicón de ARN de la enseñanza, siempre que el replicón de ARN comprenda un marco de lectura abierto que codifique la proteína no estructural de alfavirus funcional y un marco de lectura abierto que codifique la proteína de interés, y puede ser replicado por la proteína no estructural de alfavirus funcional.

En diversas realizaciones del método, el constructo de ARN para expresar la proteína no estructural de alfavirus funcional y/o el replicón de ARN son como se definieron anteriormente para el sistema de la enseñanza, siempre que el replicón de ARN pueda ser replicado por la proteína no estructural de alfavirus funcional en trans y comprende un marco de lectura abierto que codifica la proteína de interés. El constructo de ARN para expresar la proteína no estructural de alfavirus funcional y el replicón de ARN pueden inocularse en el mismo punto en el tiempo, o pueden inocularse alternativamente en diferentes puntos en el tiempo. En el segundo caso, el constructo de ARN para expresar la proteína no estructural de alfavirus funcional se inocula típicamente en un primer punto en el tiempo, y el replicón se inocula típicamente en un segundo punto, más tarde. En ese caso, se prevé que el replicón se replicará inmediatamente ya que la replicasa ya se habrá sintetizado en la célula. El segundo punto en el tiempo es típicamente poco después del primer punto en el tiempo, por ejemplo, 1 minuto a 24 horas después del primer punto en el tiempo.

La célula en la que pueden inocularse una o más moléculas nucleicas puede denominarse "célula huésped". De acuerdo con la enseñanza, la expresión "célula huésped" se refiere a cualquier célula que puede transformarse o transfectarse con una molécula de ácido nucleico exógena. El término "célula" preferentemente es una célula intacta, es decir, una célula con una membrana intacta que no libera sus componentes intracelulares normales tales como enzimas, organelos, o material genético. Una célula intacta, preferentemente, es una célula viable, es decir, una célula viva capaz de llevar a cabo sus funciones metabólicas normales. La expresión "célula huésped" comprende, de acuerdo con la enseñanza, células procariotas (por ejemplo, Ecoli) o eucariotas (por ejemplo, células humanas y animales, células vegetales, células de levadura y células de insectos). Se da preferencia particular a células de mamífero tales como células de seres humanos, ratones, hámsteres, cerdos, animales domésticos que incluyen caballos, vacas, cabras y carneros, así como primates. Las células pueden derivarse de una multiplicidad de tipos de tejidos y comprenden células primarias y líneas celulares. Los ejemplos específicos incluyen queratinocitos, leucocitos de sangre periférica, células madre de médula ósea y células madre embrionarias. En otras realizaciones, la célula huésped es una célula presentadora de antígeno, en particular una célula dendrítica, un monocito o un macrófago. Un ácido nucleico puede estar presente en la célula huésped en una sola copia o en varias copias y, en una realización se expresa en la célula huésped.

La célula puede ser una célula procariota o una célula eucariota. Las células procariotas son adecuadas en la presente descripción, por ejemplo, para la propagación de ADN de acuerdo con la enseñanza, y las células eucariotas son adecuadas en la presente descripción, por ejemplo, para la expresión del marco de lectura abierto del replicón.

En el método de la presente enseñanza, puede usarse cualquiera de los sistemas de acuerdo con la enseñanza, o el kit de acuerdo con la enseñanza, o la composición farmacéutica de acuerdo con la enseñanza. El ARN puede usarse en la forma de una composición farmacéutica, o como ARN desnudo, por ejemplo, para electroporación.

De acuerdo con el método de la presente enseñanza, puede lograrse la expresión eficiente de un gen de interés en una célula huésped (ver, por ejemplo, los Ejemplos 2 a 5).

En una realización, puede inocularse una molécula de ARN adicional, preferentemente una molécula de ARNm, con la célula. Opcionalmente, la molécula de ARN adicional codifica una proteína adecuada para inhibir IFN, tal como E3, como se describe en la presente descripción. Opcionalmente, la molécula de ARN adicional puede inocularse antes de la inoculación del replicón o del constructo de replicasa o del sistema de acuerdo con la enseñanza.

En el método para producir una proteína en una célula de acuerdo con la presente enseñanza, la célula puede ser una célula presentadora de antígeno, y el método puede usarse para expresar el ARN que codifica el antígeno. Con este fin, la enseñanza puede implicar la introducción del ARN que codifica el antígeno en las células presentadoras de antígeno tales como las células dendríticas. Para la transfección de células presentadoras de antígeno tales como células dendríticas puede usarse una composición farmacéutica que comprende ARN que codifica el antígeno.

En una realización, un método para producir una proteína en una célula es un método in vitro. En una realización, un método para la producción de una proteína en una célula no comprende la eliminación de una célula de un sujeto humano o animal mediante cirugía o terapia.

En esta realización, la célula inoculada de acuerdo con el cuarto aspecto de la enseñanza puede administrarse a un sujeto para producir la proteína en el sujeto y proporcionar al sujeto la proteína. La célula puede ser autóloga, sinogénica, alogénica o heteróloga con respecto al sujeto.

En otras realizaciones, la célula en un método para producir una proteína en una célula puede estar presente en un sujeto, tal como un paciente. En estas realizaciones, el método para producir una proteína en una célula es un método in vivo que comprende la administración de moléculas de ARN al sujeto.

A este respecto, la enseñanza también proporciona un método para producir una proteína de interés en un tema que comprende las etapas de:

(b) administrar el replicón de ARN al sujeto.

La enseñanza proporciona, además, un método para producir una proteína de interés en un sujeto que comprende las etapas de:

(b) obtener el replicón de ARN de acuerdo con el primer aspecto de la enseñanza, que puede ser replicado por la proteína no estructural de alfavirus funcional de acuerdo con (a) en trans y que comprende un marco de lectura abierto que codifica la proteína de interés, y

En diversas realizaciones del método, el constructo de ARN para expresar la proteína no estructural de alfavirus funcional y/o el replicón de ARN son como se definieron anteriormente para el sistema de la enseñanza, siempre que el replicón de ARN pueda ser replicado por la proteína no estructural de alfavirus funcional en trans y comprende un marco de lectura abierto que codifica la proteína de interés. El constructo de ARN para expresar la proteína no estructural de alfavirus funcional y el replicón de ARN pueden administrarse en el mismo punto en el tiempo, o pueden administrarse alternativamente en diferentes puntos en el tiempo. En el segundo caso, el constructo de ARN para expresar la proteína no estructural de alfavirus funcional se administra típicamente en un primer punto en el tiempo, y el replicón de ARN se administra típicamente en un segundo punto en el tiempo, más tarde. En ese caso, se prevé que el replicón se replicará inmediatamente ya que la replicasa ya se habrá sintetizado en la célula. El segundo punto en el tiempo es típicamente poco después del primer punto en el tiempo, por ejemplo, 1 minuto a 24 horas después del primer punto en el tiempo. Preferentemente, la administración del replicón de a Rn se realiza en el mismo sitio y a través de la misma ruta de administración que la administración del constructo de ARN para expresar la proteína no estructural de alfavirus funcional, para aumentar las posibilidades de que el replicón de ARN y el constructo de ARN para la expresión de la proteína no estructural de alfavirus funcional alcancen el mismo tejido o célula diana. "Sitio" se refiere a la posición del cuerpo de un sujeto. Los sitios adecuados son, por ejemplo, el brazo izquierdo, el brazo derecho, etc.

En una realización, puede administrarse una molécula de ARN adicional, preferentemente una molécula de ARNm, al sujeto. Opcionalmente, la molécula de ARN adicional codifica una proteína adecuada para inhibir IFN, tal como E3, como se describe en la presente descripción. Opcionalmente, la molécula de ARN adicional puede administrarse antes de la administración del replicón o del constructo de replicasa o del sistema de acuerdo con la enseñanza.

Cualquiera de los replicones de ARN de acuerdo con la enseñanza, el sistema de acuerdo con la enseñanza, o el kit de acuerdo con la enseñanza, o la composición farmacéutica de acuerdo con la enseñanza puede usarse en el método para producir una proteína en un sujeto de acuerdo con la enseñanza. Por ejemplo, en el método de la enseñanza, el ARN puede usarse en el formato de una composición farmacéutica, por ejemplo, como se describe en la presente descripción, o como ARN desnudo.

En vista de la capacidad para administrarse a un sujeto, cada uno de los replicones de ARN de acuerdo con la enseñanza, el sistema de acuerdo con la enseñanza, o el kit de acuerdo con la enseñanza, o la composición farmacéutica de acuerdo con la enseñanza, puede denominarse "medicamento" o similar. La presente enseñanza prevé que el replicón de ARN, el sistema, el kit, la composición farmacéutica de la presente enseñanza se proporcionan para su uso como un medicamento. El medicamento puede usarse para tratar un sujeto. Por "tratar" se entiende administrar un compuesto o composición u otra entidad como se describe en la presente descripción a un sujeto. El término incluye los métodos para el tratamiento del cuerpo humano o animal mediante terapia.

El medicamento descrito anteriormente típicamente no comprende un ADN, y por lo tanto está asociado con características de seguridad adicionales en comparación con las vacunas de ADN descritas en la técnica anterior (por ejemplo, WO 2008/119827 A1).

Un uso médico alternativo de acuerdo con la presente enseñanza comprende un método para producir una proteína en una célula de acuerdo con el cuarto aspecto de la presente enseñanza, en donde la célula puede ser una célula presentadora de antígeno tal como una célula dendrítica, seguido de la introducción de dicha célula a un sujeto. Por ejemplo, el ARN que codifica una proteína farmacéuticamente activa, tal como un antígeno, puede introducirse (transfectarse) en células presentadoras de antígeno ex vivo por ejemplo, células presentadoras de antígeno tomadas de un sujeto, y las células presentadoras de antígeno, opcionalmente propagadas clonalmente ex vivo puede reintroducirse en el mismo sujeto o en otro diferente. Las células transfectadas pueden reintroducirse en el sujeto mediante el uso de cualquier medio conocido en la técnica.

El medicamento de acuerdo con la presente enseñanza puede administrarse a un sujeto que lo necesite. El medicamento de la presente enseñanza puede usarse en métodos de tratamiento profilácticos así como terapéuticos de un sujeto.

El medicamento de acuerdo con la enseñanza se administra en una cantidad eficaz. Una "cantidad eficaz" se refiere a una cantidad que es suficiente, sola o junto con otras dosis, para provocar una reacción o un efecto deseado. En el caso del tratamiento de una cierta enfermedad o una cierta afección en un sujeto, el efecto deseado es la inhibición de la progresión de la enfermedad. Esto incluye la desaceleración de la progresión de la enfermedad, en particular la interrupción de la progresión de la enfermedad. El efecto deseado en el tratamiento de una enfermedad o afección también puede ser un retardo del brote de la enfermedad o la inhibición del brote de la enfermedad.

Una cantidad eficaz dependerá de la afección a tratar, la gravedad de la enfermedad, los parámetros individuales del paciente, incluida la edad, la condición fisiológica, el tamaño y el peso, la duración del tratamiento, el tipo de la terapia de acompañamiento (si está presente), el modo específico de administración y otros factores.

Vacunación

El término "inmunización" o "vacunación" generalmente se refiere aun proceso de tratamiento de un sujeto por razones terapéuticas o profilácticas. Un tratamiento, particularmente un tratamiento profiláctico, es o comprende preferentemente un tratamiento destinado a inducir o potenciar una respuesta inmunitaria de un sujeto, por ejemplo, contra uno o más antígenos. Si, de acuerdo con la presente enseñanza, se desea inducir o mejorar una respuesta inmunitaria mediante el uso de ARN como se describe en la presente descripción, la respuesta inmunitaria puede ser activada o potenciada por el ARN. En una realización, la enseñanza proporciona un tratamiento profiláctico que es o comprende preferentemente la vacunación de un sujeto. Una realización de la presente enseñanza en donde el replicón codifica, como una proteína de interés, un péptido o proteína farmacéuticamente activa que es un compuesto inmunológicamente activo o un antígeno es particularmente útil para la vacunación.

El ARN se ha descrito previamente para la vacunación contra agentes extraños incluidos los patógenos o el cáncer (revisado recientemente por Ulmer et al., 2012, Vaccine, vol. 30, páginas 4414-4418). En contraste con los enfoques comunes en la técnica anterior, el replicón de acuerdo con la presente enseñanza es un elemento particularmente adecuado para la vacunación eficiente debido a la capacidad de ser replicado por la proteína no estructural de alfavirus funcional como se describe en la presente descripción. La vacunación de acuerdo con la presente enseñanza puede usarse, por ejemplo, para la inducción de una respuesta inmunitaria a proteínas débilmente inmunogénicas. En el caso de las vacunas de ARN de acuerdo con las enseñanzas, el antígeno proteico nunca se expone a los anticuerpos séricos, sino que es producido por las propias células transfectadas después de la traducción del ARN. Por lo tanto, la anafilaxia no debería ser un problema. Por lo tanto, la enseñanza permite la inmunización repetida de un paciente sin riesgo de reacciones alérgicas.

En los métodos que implican la vacunación de acuerdo con la presente enseñanza, el medicamento de la presente enseñanza se administra a un sujeto, en particular si se desea tratar a un sujeto que tiene una enfermedad que implica el antígeno o que está en riesgo de enfermarse con la enfermedad que implica el antígeno.

En los métodos que implican la vacunación de acuerdo con la presente enseñanza, la proteína de interés codificada por el replicón de acuerdo con la presente enseñanza codifica, por ejemplo, un antígeno bacteriano, contra el cual se debe dirigir una respuesta inmunitaria, o para un antígeno viral, contra el cual debe dirigirse una respuesta inmunitaria, o un antígeno de cáncer, contra el cual debe dirigirse una respuesta inmunitaria, o un antígeno de un organismo unicelular, contra el cual debe dirigirse una respuesta inmunitaria. La eficacia de la vacunación puede evaluarse mediante métodos estándar conocidos tal como la medición de anticuerpos IgG específicos de antígeno del organismo. En los métodos que implican inmunoterapia específica para alérgenos de acuerdo con la presente enseñanza, la proteína de interés codificada por el replicón de acuerdo con la presente enseñanza codifica un antígeno relevante para una alergia. La inmunoterapia específica para alérgenos (también conocida como hiposensibilización) se define como la administración, preferentemente, de dosis cada vez mayores de una vacuna alergénica a un organismo con una o más alergias, con el fin de lograr un estado en el que se alivien los síntomas asociados con una posterior exposición al alérgeno causante. La eficacia de una inmunoterapia específica para alérgenos puede evaluarse mediante métodos estándar conocidos tales como la medición de anticuerpos IgG e IgE específicos para alérgenos del organismo.

El medicamento de la presente enseñanza puede administrarse a un sujeto, por ejemplo, para el tratamiento del sujeto, incluida la vacunación del sujeto.

El término "sujeto" se refiere a vertebrados, particularmente mamíferos. Por ejemplo, los mamíferos en el contexto de la presente enseñanza son seres humanos, primates no humanos, mamíferos domésticos tales como perros, gatos, ovejas, vacuno, cabras, cerdos, caballos, etc., animales de laboratorio tales como ratones, ratas, conejos, conejillos de indias, etc., así como animales en cautiverio tales como los animales de zoológicos. El término "sujeto" también se refiere a vertebrados no mamíferos tales como aves (particularmente aves domesticadas tales como pollo, patos, gansos, pavos) y peces (particularmente peces de cultivo, por ejemplo, salmones o siluros). El término "animal" como se usa en la presente descripción incluye, además, a los seres humanos.

La administración a animales domesticados tales como perros, gatos, conejos, conejillos de india, hámsteres, ovejas, vacas, cabras, cerdos, caballos, pollos, patos, gansos, pavos o animales silvestres, por ejemplo, zorros, se prefiere en algunas realizaciones. Por ejemplo, una vacuna profiláctica de acuerdo con la presente enseñanza puede ser adecuada para vacunar a una población animal, por ejemplo, en la industria agrícola, o una población de animales silvestres. Pueden vacunarse otras poblaciones de animales en cautiverio, tales como mascotas o animales de zoológicos.

Cuando se administra a un sujeto, el replicón y/o el constructo de replicasa usados como un medicamento preferentemente no comprenden secuencias de un tipo de alfavirus que es infeccioso para la especie o género al que pertenece el sujeto tratado. Preferentemente, en ese caso, el replicón y/o el constructo de replicasa no comprenden ninguna secuencia de nucleótidos de un alfavirus que pueda infectar la especie o género respectivo. Esta realización tiene la ventaja de que no es posible la recombinación con alfavirus infeccioso (por ejemplo, completamente funcional o de tipo silvestre), incluso si el sujeto al que se administra el ARN se ve afectado (por ejemplo, accidentalmente) por alfavirus infeccioso. Como un ejemplo ilustrativo, para el tratamiento de cerdos, el replicón y/o constructo de replicasa usados no comprende ninguna secuencia de nucleótidos de un alfavirus que pueda infectar a cerdos.

Modo de administración

El medicamento de acuerdo con la presente enseñanza puede aplicarse a un sujeto en cualquier ruta adecuada. Por ejemplo, el medicamento puede administrarse por vía sistémica, por ejemplo por vía intravenosa (i.v.), subcutánea (s.c.), intradérmica (i.d.) o por inhalación.

En una realización, el medicamento de acuerdo con la presente enseñanza se administra a tejido muscular, tal como músculo esquelético o piel, por ejemplo, por vía subcutánea. En general, se entiende que la transferencia de ARN a la piel o los músculos conduce a una expresión local alta y sostenida, paralela a una fuerte inducción de respuestas inmunitarias humorales y celulares (Johansson et al., 2012, PLoS. One., 7, e29732; Geall et al., 2012, Proc. Natl. Acad. Sci. U. S. A., vol. 109, páginas 14604-14609).

Las alternativas a la administración para tejido muscular o piel incluyen, pero no se limitan a: administración intradérmica, intranasal, intraocular, intraperitoneal, intravenosa, intersticial, bucal, transdérmica o sublingual. La administración intradérmica e intramuscular son dos rutas preferidas.

La administración puede lograrse de varias maneras. En una realización, el medicamento de acuerdo con la presente enseñanza se administra por inyección. En una realización preferida, la inyección es a través de una aguja. La inyección sin aguja puede usarse como una alternativa.

La presente enseñanza se describe en detalle y se ilustra mediante las figuras y los ejemplos más abajo, que se usan solamente para propósitos ilustrativos y no pretenden ser limitantes. Debido a la descripción y los ejemplos, las realizaciones adicionales que se incluyen del mismo modo en la invención son asequibles para el trabajador experto.

Ejemplos

Materiales y métodos:

Se usaron los siguientes materiales y métodos en los ejemplos que se describen a continuación.

Clonación de plásmidos, transcripción, purificación de ARN in vitro:

Los plásmidos se clonaron mediante el uso de la tecnología estándar. Los detalles sobre la clonación de plásmidos individuales usados en los ejemplos de esta enseñanza se describen en el Ejemplo 1. La transcripción in vitro, mediante el uso de los plásmidos descritos en el Ejemplo 1 y la ARN-polimerasa T7, y la purificación de ARN se realizaron como se describió previamente (Holtkamp et al., 2006, Blood, vol. 108, páginas 4009-4017; Kuhn et al., 2010, Gene Ther., vol. 17, páginas 961-971).

La calidad del ARN purificado se evaluó mediante espectrofotometría y análisis en el 2100 BioAnalyzer (Agilent, Santa Clara, Estados Unidos). Todo el ARN transfectado en células en los ejemplos fue ARN transcrito in vitro (ARN-IVT).

Transfección de ARN:

Para la electroporación, el ARN se sometió a electroporación en células de mamífero a temperatura ambiente mediante el uso de un dispositivo de electroporación de onda cuadrada (BTX ECM 830, Harvard Apparatus, Holliston, MA, Estados Unidos) mediante el uso de los siguientes ajustes: para células BHK21: 750 V/cm, 1 pulso de 16 ms; para fibroblastos de prepucio humano: 500 V/cm, 1 pulso de 24 ms. Se prepararon mezclas de diferentes especies de ARN en tubos libres de ARNasa y se mantuvieron en hielo hasta la transfección. Para la electroporación, las mezclas de ARN o ARN se resuspendieron en un volumen final de 62,5 pl/mm de tamaño de espacio de cubeta.

Para la lipofección, las células se sembraron en placas a aproximadamente 20000 células/cm2 de área de crecimiento, y se transfectaron con una cantidad total de 260 ng/cm2 de ARN y 1 pl/cm2 de reactivo MessengerMax siguiendo las instrucciones del fabricante (Life Technologies, Darmstadt, Alemania).

Cultivo de células:

Life Technologies/Gibco suministró todos los medios de crecimiento, suero de ternera fetal (FCS), antibióticos y otros suplementos, excepto cuando se indique lo contrario. Los fibroblastos de prepucio humano obtenidos de System Bioscience (HFF, neonatal) o ATCC (cCD-1079Sk) se cultivaron en medios esenciales mínimos (MEM) que contenían FCS al 15 %, 1 % de aminoácidos no esenciales, piruvato de sodio 1 mM a 37 °C. Las células se cultivaron a 37 °C en atmósfera humidificada equilibrada a 5 % de CO2. Las células BHK21 de la línea celular "BHK21 [C13] (ATCC® CCL10™)", disponible de la Colección Americana de Cultivos Tipo, Manassas, Virginia, Estados Unidos, se cultivaron en medio Eagle's Minimum Essential suplementado con FCS al 10 %.

Citometría de flujo:

La expresión de ARN que codifica GFP se midió mediante citometría de flujo mediante el uso de un citómetro de flujo FACS Canto II (BD Bioscience, Heidelberg, Alemania), y los datos adquiridos se analizaron mediante el software Diva correspondiente o el software FlowJo (Tree Star Inc., Ashland, OR, Estados Unidos).

Ensayos de luciferasa:

Para evaluar la expresión de luciferasa de luciérnaga, las células transfectadas se sembraron en microplacas negras de 96 pocillos, y los sobrenadantes de las células transfectadas con Nanoluc se transfirieron a microplacas negras de 96 pocillos (Nunc, Langenselbold, Alemania). La expresión de luciferasa de luciérnaga se midió mediante el uso del sistema de ensayo de luciferasa Bright-Glo, la expresión de Nanoluc se midió mediante el uso del sistema de ensayo de luciferasa Nano-Glo (ambos Promega, Madison, WI, Estados Unidos) de acuerdo con las instrucciones del fabricante. La bioluminiscencia se midió mediante el uso de un lector de microplacas de luminiscencia Infinite M200 (Tecan Group, Mannedorf, Suiza). Los datos se representan en unidades de luz relativas [RLU], se usaron células negativas a la luciferasa para restar la señal de fondo.

Ejemplo 1: Clonación de plásmidos

A. Los plásmidos que codifican el replicón basado en el virus del bosque Semliki (SFV) se obtuvieron mediante el uso de técnicas de clonación sin interrupciones basadas en PCR. La clonación sin interrupciones significa técnicas de clonación basadas en la recombinación de fragmentos generados por PCR en vectores linealizados mediante el uso de tramos de secuencia homólogos. De este modo, una secuencia de ADN que codifica un replicón que corresponde al genoma de SFV, excepto por la ausencia de un marco de lectura abierto que codifica genes estructurales virales, se transfirió de pSFV-gen-GFP (Ehrengruber & Lundstrom, 1999, Proc. Natl. Acad. Sci. U. S. A., vol. 96, páginas 7041 7046; Lundstrom, 2001, Histochem. Cell Biol., vol. 115, páginas 83-91) en la cadena principal del plásmido pST1 (Holtkamp et al., 2006, Blood, vol. 108, páginas 4009-4017) inmediatamente corriente abajo de un promotor de ARN-polimerasa de fago T7. Un casete de poli(A) codificado por plásmido de 120 residuos adenilato (Holtkamp et al., más arriba) - o un casete de poli(A) modificado que consistía en 30 y 70 residuos adenilato, separados por una secuencia aleatoria de 10 nucleótidos (WO 2016/005004 A1), se añadió inmediatamente corriente abajo del último nucleótido de la 3'-UTR de SFV. Se colocó un sitio de restricción de SapI inmediatamente corriente abajo del casete de poli(A) o del casete de poli(A) modificado. Además, se insertó una secuencia codificante que codifica la etiqueta myc en el sitio de Xhol que se encuentra en la región codificante para la región variable de nsP3 de SFV. Las inserciones en la región variable de nsP3 no afectan la actividad de la poliproteína replicasa (Spuul et al., 2010, J. Virol, vol. 85, páginas 7543 7557). El plásmido resultante comprende una secuencia de ADN que codifica la secuencia de reconocimiento de replicación 5' de SFV bajo el control de un promotor para la polimerasa T7. La secuencia de ADN que codifica la secuencia de reconocimiento de replicación 5' de SFV está representada por la SEQ ID NO: 4:

ATGGCGGATGTGTGACATACACGACGCCAAAAGATTTTGTTCCAGCTCCTGCCACCTCCG

CTACGCGAGAGATTAACCACCCACGATGGCCGCCAAAGTGCATGTTGATATTGAGGCTGA

CAGCCCATTCATCAAGTCTTTGCAGAAGGCATTTCCGTCGTTCGAGGTGGAGTCATTGCA

GGTCACACCAAATGACCATGCAAATGCCAGAGCATTTTCGCACCTGGCTACCAAATTGA

(SEQ ID NO: 4)

En la representación anterior de la SEQ ID NO: 4, el primer ATG subrayado sirve como codón de iniciación para la síntesis del fragmento N-terminal de nsP1; Las bases traducidas en la proteína se representan en negrita. Otros ATG dentro de la región codificante de nsP1 también están subrayados. Durante la transcripción in vitro del plásmido que comprende la secuencia de reconocimiento de replicación 5' de SFV (representada por la SEQ ID NO: 4) por la polimerasa T7, se obtiene un transcrito que comprende una secuencia de ARN correspondiente a la SEQ ID NO: 3: la G terminal 5' corresponde al primer nucleótido que se transcribe por la polimerasa T7. Esta G precede a la secuencia alfaviral y es necesaria para la transcripción eficiente por la polimerasa T7.

GATGGCGGATGTGTGACATACACGACGCCAAAAGATTTTGTTCCAGCTCCTGCCACCTCCGC

TACGCGAGAGATTAACCACCCACGATGGCCGCCAAAGTGCATGTTGATATTGAGGCTGACAG

CCCATTCATCAAGTCTTTGCAGAAGGCATTTCCGTCGTTCGAGGTGGAGTCATTGCAGGTCA

CACCAAATGACCATGCAAATGCCAGAGCATTTTCGCACCTGGCTACCAAATTGATCGAGCAG

GAGACTGACAAAGACACACTCATCTTGGATATC (SEQ ID NO:3)

En la representación anterior de la SEQ ID NO: 3, cinco tripletes de bases ATG específicos están subrayados. Un único sitio de restricción de EcoRV en la región codificante para la replicasa de SFV (GATATC) se resalta en negrita.

Como resultado, se obtuvo el plásmido A. El plásmido A comprende un marco de lectura abierto para la proteína no estructural de alfavirus funcional.

B. Un plásmido que codifica un trans-replicón con secuencia de reconocimiento de replicación 5' no modificada se obtuvo eliminando la secuencia codificante de proteínas no estructurales de EcoRV a Sall en el plásmido A (ver más arriba). De este modo, se eliminó la mayor parte del marco de lectura abierto que codifica nsP1234, es decir, la secuencia que se extiende desde el único sitio de restricción de EcoRV al único sitio de restricción Sall. Para ilustración: GATATC (la mayoría de los seis nucleótidos 3' de la SEQ ID NO: 3, en negrita en la representación anterior) corresponde al único sitio de restricción de EcoRV de la secuencia codificante de la replicasa de SFV. Después de la eliminación de la mayor parte del marco de lectura abierto que codifica nsP1234, la secuencia de reconocimiento de replicación 5' y el promotor subgenómico todavía estaban presentes. Debido a la eliminación de la mayor parte del marco de lectura abierto que codifica nsP1234, el ARN codificado por el plásmido respectivo, cuando está presente en una célula huésped, no es capaz de conducir la replicación en cis, pero requiere para la replicación la presencia de la proteína no estructural de alfavirus funcional.

Se insertó un marco de lectura abierto que codifica luciferasa de luciérnaga (transgén) corriente abajo del promotor subgenómico (SGP). De este modo, se obtuvo el plásmido B. Un replicón de ARN codificado por un plásmido respectivo se ilustra como "ARN plantilla WT-RRS" en la Figura 1.

Este se confirmó mediante el uso de un servidor web para la predicción de la estructura secundaria de ARN (http://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html) que predice la secuencia de reconocimiento de replicación 5' no modificada (ARN) que se pliega en cuatro horquillas, indistinguibles del ARN parental y de acuerdo con la bibliografía (Frolov, 2001, a Rn , vol. 7, páginas 1638-1651).

C-1. A partir de plásmido B, se generó un plásmido que codifica un frans-replicón con una modificación de la secuencia de reconocimiento de replicación 5' (que comprende la eliminación del triplete de bases ATG que codifica el primer residuo de aminoácido de nsP1, así como la eliminación de cuatro tripletes de bases ATG adicionales dentro de la secuencia de reconocimiento de replicación 5') mediante cambios de un solo nucleótido, es decir, la sustitución de una base del triplete de bases ATG respectivo (es decir, la sustitución de A o T o G) por una base diferente. En otras palabras, esos tripletes de bases ATG de la SEQ ID NO: 3 que se subrayaron anteriormente se eliminaron, cada uno por cambio de un solo nucleótido (sustitución), respectivamente.

El plegamiento del ARN del frans-replicón codificado por el plásmido se predijo mediante el uso del servidor web para la predicción de la estructura secundaria de ARN (http://rna.urmc.rochester.edu/rnastructureweb/Servers/Predict1/Predict1.html) y Mfold(http://unafold.rna.albany.edu/?q=mfold).

El plegamiento predicho de la secuencia de reconocimiento de replicación 5' modificada caracterizada por la eliminación de ATG se comparó con el plegamiento predicho de la secuencia de reconocimiento de replicación 5' no modificada respectiva. En caso de que la predicción revelara que la estructura secundaria de la secuencia de reconocimiento de replicación 5' modificada difería de la estructura secundaria de la secuencia de reconocimiento de replicación 5' no modificada, se llevaron a cabo uno o más cambios (sustituciones) de nucleótidos adicionales en un enfoque de ensayo y error hasta que se predijera que el plegamiento del ARN de la secuencia de reconocimiento de replicación 5' libre de ATG (A5ATG-RRS) es idéntico al plegamiento del ARN de la secuencia de reconocimiento de replicación 5' no modificada codificada por el plásmido B. Como un resultado, se obtuvo la secuencia de ADN de acuerdo con la SEQ ID NO: 5:

GATGGCGGATGTGTGACATACACGACGCCAAAAGATTTTGTTCCAGCTCCTGCCACCTCCGC

TACGCGAGAGATTAACCACCCACGACGGCCGCCAAAGTGCTTGTTGATATTGAGGCTGACAG

CCCATTCATCAAGTCTTAGCAGAAGGCATTTCCGTCGTTCGAGGTGGAGTCATTGGAGGTGA

CACCAAATCACCATCCAAATCCCAGAGCATTTTCGCACCTGGGTACCAAATTGATCGAGCAG

GAGACTGACAAAGACACACTCATCTTGGATATC (SEQ ID NO: 5)

El plásmido que codifica la secuencia de reconocimiento de replicación 5' modificada caracterizada por plegamiento idéntico predicho, es decir, el plásmido que comprende la SEQ ID NO: 5, se denomina en la presente descripción C-1.

Un replicón de ARN codificado por un plásmido respectivo se ilustra en la Figura 1, designado "A5ATG-RRS".

Se entiende que la eliminación de cinco ATG específicos, como se ejemplifica en la SEQ ID NO: 5, evitará la síntesis de nsP1 o un fragmento de esta. Debido a la eliminación del codón de iniciación nativo para nsP1, se entiende que la síntesis de proteínas se inicia en el primer codón de iniciación corriente abajo del promotor subgenómico (SGP), dando como resultado la transcripción del marco de lectura abierto que codifica luciferasa de luciérnaga (transgén).

C-2. A partir de C-1, el SGP se eliminó mediante digestión con EcoRV y Smal y re-ligadura. Un replicón de ARN respectivo se representa esquemáticamente en la Figura 1, designado "A5ATG-RRSASGP". Si un replicón de ARN respectivo comprende una caperuza 5', el transgén que codifica la luciferasa puede colocarse bajo el control traduccional directo de la caperuza 5'.

C-3. A partir de C-1, se insertó un marco de lectura abierto que codifica la replicasa de SFV mediante el uso de los sitios de restricción para EcoRV y Sall. De ese modo, se obtuvo un plásmido que codifica ARN capaz de autorreplicación, en donde el ORF de replicasa no se solapa con la secuencia de reconocimiento de replicación 5' ni con el promotor subgenómico. Un replicón de ARN respectivo se representa esquemáticamente en la Figura 1, designado "c/sReplicón A5ATG-RRS".

D. Para permitir la traducción de una secuencia de ácidos nucleicos que codifica la replicasa de un ARNm no replicante, se clonó un marco de lectura abierto que codifica la replicasa de SFV en un plásmido que contiene una 5'-u Tr de alfa-globina humana, una 3'-UTR sintética y una cola de poli(A) codificada por plásmido de 30 más 70 residuos adenilato, separados por un enlazador estabilizador de 10 nucleótidos (10 nt) (WO 2016/005324 A1). El marco de lectura abierto que codifica la replicasa de SFV se clonó corriente abajo de la 5'-UTR de alfa-globina humana. El plásmido contenía un promotor t 7 para la transcripción del marco de lectura abierto que codifica la replicasa de SFV.

E. Para permitir la traducción de una secuencia de ácidos nucleicos que codifica el inhibidor E3 de la proteína quinasa R del virus Vaccinia de un ARNm no replicante, se clonó un marco de lectura abierto que codifica el inhibidor e 3 ("E3") de la proteína quinasa R del virus Vaccinia en un plásmido que contenía una 5'-UTR de alfa-globina humana, una 3'-UTR sintética y una cola de poli(A) codificada por un plásmido de 30 más 70 residuos adenilato, separados por un enlazador estabilizador de 10 nucleótidos (10 nt) (WO 2016/005324 A1). El marco de lectura abierto que codifica E3 se clonó corriente abajo de la 5'-UTR de alfa-globina humana. El plásmido contenía un promotor T7 para la transcripción del marco de lectura abierto que codifica E3.

Ejemplo 2: La eliminación de codones de inicio dentro de la secuencia de reconocimiento de replicación 5' no afecta la replicación de los ARN de frans-replicón.

Las células BHK21 se coelectroporaron con (i) 5 |jg de ARNm que codifica la replicasa de SFV (codificada por el plásmido D del Ejemplo 1) y (ii) cantidades variables de ARN de frans-replicón (codificado por los plásmidos B o C-1 del Ejemplo 1; en la Figura 2: "plantilla"). frans-replicón codifica luciferasa de luciérnaga; frans-replicón contiene una secuencia de reconocimiento de replicación 5' de tipo silvestre (Figura 2: "WT-RRS"; codificada por el plásmido B); o una secuencia de reconocimiento de replicación 5' caracterizada por la eliminación de todos los codones de iniciación (Figura 2: "A5ATG-RRS"; codificada por el plásmido C-1). Al a Rn de frans-replicón no se le generó caperuza (sin caperuza). Se colocaron en placas 5000 células BHK21 electroporadas en cada pocillo de placas de 96 pocillos para medir la expresión de luciferasa 24 h después de la electroporación. Los resultados se muestran en la Figura 2B.

Ejemplo 3: La eliminación de los codones de inicio dentro de la secuencia de reconocimiento de replicación 5' permite la traducción de un transgén bajo control de la caperuza

Se usaron el frans-replicón caracterizado por la eliminación de todos los codones de iniciación, y que comprende un promotor subgenómico (Figura 3: "A5ATG-RRS"; codificado por el plásmido C-1 del Ejemplo 1), el frans-replicón caracterizado por la eliminación de todos los codones de iniciación, pero que no comprende un promotor subgenómico (Figura 3: "A5ATG-RRSASGP"; codificado por el plásmido C-2 del Ejemplo 1), y el frans-replicón que tiene todos los codones de iniciación y que comprende un promotor subgenómico (Figura 3 "ARN plantilla WT-RRS"). Los fibroblastos del prepucio humano se coelectroporaron con (i) 0,45 jg de los respectivos ARN de frans-replicón, como se indica en la Figura 3, y ya sea (ii-a) 2,5 jg de ARNm que codifica la proteína E3 del virus Vaccinia (codificada por el plásmido E del Ejemplo 1, en la Figura 3: "E3"), o (ii-b) 2,5 jg de ARNm que codifica replicasa (codificada por el plásmido D del Ejemplo 1, en la Figura 3: "replicasa") más 2,5 jg de ARNm que codifica la proteína E3 del virus Vaccinia (codificada por el plásmido E del Ejemplo 1). El ARNm que codifica la proteína E3 del virus Vaccinia se añadió para inhibir la activación de la proteína quinasa R y para promover así la expresión de luciferasa y replicasa. Al ARN de frans-replicón no se le generó caperuza (Figura 3: "sin caperuza") o se le generó caperuza cotranscripcionalmente con un análogo de caperuza betaS-ARCA (D2) (Figura 3: "D2-cap"). La expresión de luciferasa se evaluó después de 24 h. Los resultados se muestran en la Figura 3 (panel derecho).

Este ejemplo demuestra que la eliminación de los codones de iniciación de la secuencia de reconocimiento de replicación 5' permite que un transgén se traduzca de manera eficiente directamente a partir del ARN de frans-replicón con caperuza.

Ejemplo 4: En las primeras etapas después de la transfección, la traducción dependiente de caperuza del fransreplicón caracterizado por la eliminación de codones de inicio dentro de la secuencia de reconocimiento de replicación 5' es más fuerte que el ARN subgenómico.

Se usaron el frans-replicón caracterizado por la eliminación de todos los codones de iniciación, y que comprende un promotor subgenómico (Figura 4: "A5ATG-RRS"; codificado por el plásmido C-1 del Ejemplo 1), y el frans-replicón caracterizado por la eliminación de todos los codones de iniciación, pero que no comprende un promotor subgenómico (en la Figura 4: "A5ATG-RRSASGP"; codificado por el plásmido C-2 del Ejemplo 1). Las células BHK21 se coelectroporaron con (i) 0,45 jg de los respectivos ARN de frans-replicón y con (ii) 2,5 jg de ARNm que codifica replicasa (codificada por el plásmido D del Ejemplo 1). Al ARN de trans-replicón no se le generó caperuza (Figura 4: "sin Caperuza") o se le generó caperuza cotranscripcionalmente con un análogo de caperuza beta-S-ARCA(D2) (Figura 4: "D2-cap"). La expresión de luciferasa se evaluó en el tiempo. Los resultados se muestran en la Figura 4 (panel derecho).

Ejemplo 5: La traducción dependiente de caperuza del frans-replicón caracterizado por la eliminación de codones de inicio dentro de la secuencia de reconocimiento de replicación 5' permite la expresión transgénica en etapas tempranas, sin ser dependiente de la expresión previa de replicasa.

Se usó el frans-replicón caracterizado por la eliminación de todos los codones de iniciación, pero que no comprende un promotor subgenómico (Figura 5: "A5ATG-RRSASGP"; codificado por el plásmido C-2 del Ejemplo 1). Al ARN de trans-replicón no se le generó caperuza (Figura 5: "sin caperuza") o se le generó caperuza cotranscripcionalmente con un análogo de caperuza beta-S-ARCA(D2) (Figura 5: "D2-cap"). Las células BHK21 se electroporaron con (i) 0,45 jg de los respectivos ARN de frans-replicón y, donde se indica ("replicasa" en la Figura 5), adicionalmente con (ii) 2,5 jg de ARNm codificante de replicasa (codificada por el plásmido D del Ejemplo 1). La expresión de luciferasa se evaluó en el tiempo. Los resultados se muestran en la Figura 5 (panel derecho).

Claims

REIVINDICACIONES

1. Una composición farmacéutica que comprende un replicón de ARN y, opcionalmente, un diluyente farmacéuticamente aceptable y/o un excipiente farmacéuticamente aceptable y/o un portador farmacéuticamente aceptable y/o un vehículo farmacéuticamente aceptable, comprendiendo dicho replicón una secuencia de reconocimiento de replicación 5' modificada de alfavirus, en donde la secuencia de reconocimiento de replicación 5' modificada se caracteriza porque todos los codones de iniciación se han eliminado del elemento de secuencia conservada 2 (CSE 2) de la secuencia de reconocimiento de replicación 5' de alfavirus nativo y en donde la secuencia de reconocimiento de replicación 5' modificada comprende uno o más cambios de nucleótidos adicionales que compensan las alteraciones del emparejamiento de nucleótidos dentro de uno o más bucles de tallo (SL) introducidas por la eliminación de los codones de iniciación,

en donde dicho CSE 2 abarca desde SL2 a SL4 y comprende el codón de iniciación nativo que codifica los primeros residuos de aminoácidos de la proteína no estructural de alfavirus nsP1, y

en donde la secuencia de reconocimiento de replicación 5' modificada se caracteriza por una estructura secundaria predicha que es equivalente a la estructura secundaria predicha de la secuencia de reconocimiento de replicación 5' del ARN genómico alfaviral.

2. La composición farmacéutica de acuerdo con la reivindicación 1, en la que el replicón de ARN comprende una secuencia de reconocimiento de replicación 3'.

3. La composición farmacéutica de acuerdo con la reivindicación 1 o 2, en la que el replicón de ARN comprende un primer marco de lectura abierto que codifica una proteína de interés, en donde preferentemente la proteína de interés puede expresarse a partir del replicón de ARN como una plantilla.

4. La composición farmacéutica de acuerdo con la reivindicación 3, en la que el replicón de ARN comprende un promotor subgenómico que controla la producción de ARN subgenómico que comprende el primer marco de lectura abierto que codifica una proteína de interés, en donde preferentemente la proteína de interés codificada por el primer marco de lectura abierto puede expresarse a partir del replicón de ARN y el ARN subgenómico.

5. La composición farmacéutica de acuerdo con la reivindicación 3, en la que el replicón de ARN comprende un promotor subgenómico que controla la producción de ARN subgenómico que comprende un segundo marco de lectura abierto que codifica una proteína de interés, que se localiza preferentemente corriente abajo del primer marco de lectura abierto que codifica una proteína de interés.

6. La composición farmacéutica de acuerdo con una cualquiera de las reivindicaciones 3 a 5, en la que la proteína de interés codificada por el primer y/o segundo marco de lectura abierto es una proteína no estructural de alfavirus funcional.

7. La composición farmacéutica de acuerdo con la reivindicación 6, en la que el replicón puede ser replicado por la proteína no estructural de alfavirus funcional.

8. La composición farmacéutica de acuerdo con una cualquiera de las reivindicaciones 1 a 5, en la que el replicón no comprende un marco de lectura abierto que codifica la proteína no estructural de alfavirus funcional.

9. La composición farmacéutica de acuerdo con una cualquiera de las reivindicaciones 1 a 5 y 8, que comprende además un constructo de ARN para expresar proteína no estructural de alfavirus funcional,

en la que el replicón de ARN puede ser replicado por la proteína no estructural de alfavirus funcional en trans.

10. La composición farmacéutica de acuerdo con una cualquiera de las reivindicaciones 1 a 9, en la que el alfavirus es el virus del bosque Semliki.

11. La composición farmacéutica de acuerdo con una cualquiera de las reivindicaciones 1 a 10, que comprende una formulación en partículas del replicón de ARN, en la que la partícula es bien sea una partícula proteica o una partícula que contiene lípidos.

12. La composición farmacéutica de la reivindicación 11, en la que la partícula que contiene lípidos comprende al menos un lípido catiónico y en la que dicho lípido catiónico es preferentmente 1,2-di-O-octadecenil-3-trimetilamonio propano (DOTMA); dimetildioctadecilamonio (DDAB); 1,2-dioleoil-3-trimetilamonio-propano (DOTAP); 1,2-dioleoil-3-dimetilamonio-propano (DODAP); propanos de 1,2-diaciloxi-3-dimetilamonio; propanos de 1,2-dialquiloxi-3-dimetilamonio; cloruro de dioctadecildimetilamonio (DODAC), 1,2-dimiristoiloxipropil-1,3-dimetilhidroxietilamonio (DMRIE) y 2,3-dioleoiloxi-N-[2(espermina carboxamida)etil]-N,N-dimetil-1-propanamio trifluoroacetato (DOSPA), en la que los lípidos catiónicos preferentmente también incluyen lípidos con un grupo amino terciario, incluyendo 1,2-dilinoleiloxi-N,N-dimetil-3-aminopropano (DLinDMA).

13. La composición farmacéutica de la reivindicación 11, en la que la partícula que contiene lípidos es un complejo lípido/ARN, un liposoma, un lipoplejo o un poliplejo y en la que el lipoplejo está formado preferentemente por liposomas catiónicos y, opcionalmente, comprende un lípido auxiliar neutro.

14. Una composición farmacéutica de acuerdo con una cualquiera de las reivindicaciones 1 a 13 para uso en terapia, en la que la terapia comprende administrar la composición farmacéutica a un sujeto.

15. La composición farmacéutica para el uso de acuerdo con la reivindicación 14, en la que la administración es intravenosa (i.v.), subcutánea (s.c.), intradérmica (i.d.), por inhalación, intranasal, intraocular, intraperitoneal, intersticial, bucal, transdérmica o administración sublingual.