ES2924739T3 - Moléculas de ácido nucleico artificiales - Google Patents

Moléculas de ácido nucleico artificiales Download PDF

Info

Publication number
ES2924739T3
ES2924739T3 ES16759979T ES16759979T ES2924739T3 ES 2924739 T3 ES2924739 T3 ES 2924739T3 ES 16759979 T ES16759979 T ES 16759979T ES 16759979 T ES16759979 T ES 16759979T ES 2924739 T3 ES2924739 T3 ES 2924739T3
Authority
ES
Spain
Prior art keywords
utr
nucleic acid
seq
acid molecule
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16759979T
Other languages
English (en)
Inventor
Thomas Schlake
Stefanie Grund
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Curevac SE
Original Assignee
Curevac AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Curevac AG filed Critical Curevac AG
Application granted granted Critical
Publication of ES2924739T3 publication Critical patent/ES2924739T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Pain & Pain Management (AREA)
  • Rheumatology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

La invención se refiere a una molécula de ácido nucleico artificial que comprende al menos un marco de lectura abierto y al menos un elemento de la región no traducida en 3' (elemento 3'-UTR) y/o al menos un elemento de la región no traducida en 5' (elemento 5'-UTR elemento), en el que dicha molécula de ácido nucleico artificial se caracteriza por una alta eficiencia de traducción. La eficacia de la traducción la contribuye, al menos en parte, el elemento 5'-UTR o el elemento 3'-UTR, o ambos, el elemento 5'-UTR y el elemento 3'-UTR. La invención se refiere además al uso de dicha molécula de ácido nucleico artificial en terapia génica y/o vacunación genética. Además, se proporcionan nuevos elementos 3'-UTR y 5'-UTR. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Moléculas de ácido nucleico artificiales
La invención se refiere a moléculas de ácido nucleico artificiales que comprenden un marco de lectura abierto, un elemento de región 3' no traducida (elemento 3'-UTR) y, opcionalmente, un elemento de región 5' no traducida (elemento 5'-UTR) y, opcionalmente, una secuencia poli(A) y, opcionalmente, una señal de poliadenilación. La invención también se refiere a un vector que comprende un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR, a una célula que comprende la molécula de ácido nucleico artificial o el vector, a una composición farmacéutica que comprende la molécula de ácido nucleico artificial o el vector y a un kit que comprende la molécula de ácido nucleico artificial, el vector y/o la composición farmacéutica, preferentemente para el uso en el campo de la terapia génica y/o la vacunación genética. Cualquier referencia a métodos de tratamiento del cuerpo humano o animal mediante cirugía o terapia deben interpretarse como referentes a los compuestos, composiciones farmacéuticas y medicamento de la presente invención para el uso en un método de tratamiento.
La terapia génica y la vacunación genética forman parte de los métodos más prometedores y de rápido desarrollo de la medicina moderna. Pueden proporcionar opciones sumamente específicas e individuales para la terapia de una gran variedad de enfermedades. En particular, las enfermedades genéticas heredadas pero también las enfermedades autoinmunes, cancerosas o relacionadas con tumores, así como las enfermedades inflamatorias pueden ser objeto de estos enfoques de tratamiento. También, se contempla prevenir el inicio temprano de estas enfermedades mediante estos enfoques.
La razón conceptual principal detrás de la terapia génica es la modulación apropiada de la expresión génica deteriorada asociada con afecciones patológicas de enfermedades específicas. La expresión génica patológicamente alterada puede resultar en una falta o sobreproducción de productos génicos esenciales, por ejemplo factores de señalización tales como hormonas, factores de mantenimiento, enzimas metabólicas, proteínas estructurales o similares. La expresión génica alterada no solo puede deberse a una regulación errónea de la transcripción y/o traducción, sino también a mutaciones dentro del ORF que codifica para una proteína particular. Las mutaciones patológicas pueden ser provocadas, por ejemplo, por una aberración cromosómica o por mutaciones más específicas, tal como mutaciones puntuales o de desplazamiento del marco, todas de ellas resultando en una funcionalidad limitada y, potencialmente, pérdida total de función del producto génico.
Sin embargo, la regulación errónea de la transcripción o traducción también puede producirse cuando las mutaciones afectan a genes que codifican proteínas implicadas en la maquinaria de transcripción o traducción de la célula. Tales mutaciones pueden conducir a una sobre- o sub-regulación patológica de genes que son - como tal - funcionales. Genes que codifican productos génicos que ejercen estas funciones reguladoras, pueden ser, por ejemplo, factores de transcripción, receptores de señal, proteínas mensajeras o similares. Sin embargo, la pérdida de función de estos genes que codifican proteínas reguladoras puede ser revertida, bajo ciertas circunstancias, mediante la introducción artificial de otros factores que actúan además aguas abajo del producto génico dañado. Estos defectos génicos también pueden ser compensados mediante terapia génica vía la sustitución del propio gen afectado.
La vacunación genética permite provocar una respuesta inmunitaria deseada a antígenos seleccionados, tales como componentes característicos de las superficies bacterianas, partículas virales, antígenos tumorales o similares. En general, la vacunación es uno de los logros principales de la medicina moderna. Sin embargo, sólo se dispone actualmente de vacunas efectivas para un número limitado de enfermedades. Por consiguiente, las infecciones que no se pueden prevenir mediante vacunación aun afectan a millones de personas cada año.
Habitualmente, las vacunas se pueden subdividir en vacunas de “primera”, “segunda” y “tercera” generación. Las vacunas de “primera generación” son típicamente vacunas de organismos completos. Éstas se basan en patógenos ya sea vivos o atenuados o muertos, por ejemplo virus, bacterias o similares. La principal desventaja de las vacunas vivas o atenuadas es el riesgo de una reversión a variantes que ponen en peligro la vida. Así, aunque atenuados, estos patógenos aún pueden conllevar riesgos intrínsecos no predecibles. Los patógenos muertos no pueden ser lo eficaces que se desea para generar una respuesta inmunitaria específica. Con el fin de minimizar estos riesgos, se han desarrollado vacunas de “segunda generación”. Éstas son típicamente vacunas de subunidad que consisten en antígenos definidos o componentes proteicos recombinantes derivados de patógenos.
Las vacunas genéticas, es decir vacunas para la vacunación genética, normalmente se consideran como vacunas “de tercera generación”. Están compuestas típicamente de moléculas de ácido nucleico modificadas genéticamente que permiten la expresión de fragmentos de péptidos o proteínas (antígenos) característicos de un patógeno o de un antígeno tumoral in vivo. Las vacunas genéticas se expresan con la administración a un paciente después del suministro por las células diana. La expresión de los ácidos nucleicos administrados resulta en la producción de las proteínas codificadas. En caso de que estas proteínas sean reconocidas como extrañas por el sistema inmune del paciente, se activa una respuesta inmunitaria.
Como se puede advertir a partir de lo anterior, ambos métodos, la terapia génica y la vacunación genética, esencialmente están basados en la administración de moléculas de ácido nucleico a un paciente y la transcripción y/o traducción subsecuente de la información genética codificada. Alternativamente, la vacunación genética o la terapia genética también puede comprender métodos que incluyen el aislamiento de células corporales específicas de un paciente a tratar, la transfección in - ex vivo subsecuente de estas células y la re-administración de las células tratadas al paciente.
El ADN y el ARN se pueden utilizar como moléculas de ácido nucleico para la administración en el contexto de la terapia génica o la vacunación genética. Es sabido que el ADN es relativamente estable y fácil de manejar. Sin embargo, el uso de ADN conlleva el riesgo de una inserción indeseada de los fragmentos de ADN administrados en el genoma del paciente, lo que potencialmente resulta en eventos mutagénicos, como pérdida de la función de los genes deteriorados. Otro riesgo es la generación no deseada de anticuerpos anti-ADN. Otra desventaja es el limitado nivel de expresión del péptido o proteína codificados que se consigue con la administración de ADN, dado que el ADN debe entrar en el núcleo para ser transcripto antes de que el ARNm resultante se pueda traducir. Entre otras razones, el nivel de expresión del ADN administrado será dependiente de la presencia de factores de transcripción específicos que regulan la transcripción del ADN. En ausencia de estos factores, la transcripción del ADN no producirá cantidades satisfactorias de ARN. Como resultado, el nivel del péptido o de la proteína traducidos obtenido es limitado.
Empleando ARN en lugar de ADN para la terapia génica o la vacunación genética, el riesgo de integración y generación genómica no deseada de los anticuerpos anti-ADN se minimiza o evita. Sin embargo el ARN es considerado como una especie molecular más bien inestable que puede ser degradado fácilmente por ARNasas ubicuas.
Típicamente, la degradación del ARN contribuye a la regulación del tiempo de vida medio del ARN. Ese efecto se consideró y comprobó para refinar la regulación de la expresión génica eucariota (Friedel y col., 2009. Conserved principles of mammalian transcriptional regulation revealed by ARN half-life, Nucleic Acid Research 37(17): 1-12). Así, cada ARNm de origen natural tiene su vida media individual dependiendo del genoma del cual se deriva el ARNm y en qué tipo de células se expresa. Contribuye a la regulación del nivel de expresión de este gen. Los ARN inestables son importantes para llevar a cabo la expresión génica transitoria en distintos puntos del tiempo. Sin embargo, los ARN de vida larga se pueden asociar con la acumulación de distintas proteínas o con la expresión continua de genes. In vivo, la vida media de los ARNm también puede depender de factores ambientales, tales como un tratamiento hormonal, como se ha mostrado, por ejemplo, para los ARNm del factor de crecimiento tipo insulina I, actina y de albúmina (Johnson y col., Newly synthesized ARN: Simultaneous measurement in intact cells of transcription rates and ARN stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. 20 Sci., Vol. 88, pp. 5287-5291, 1991).
Para la terapia génica y la vacunación genética, normalmente es deseable un ARN estable. Por una parte, esto se debe al hecho de que habitualmente se desea que el producto codificado por la secuencia de ARN se acumule in vivo. Por otra parte, el ARN tiene que mantener su integridad estructural y funcional cuando se prepara en una forma de dosificación adecuada, durante su almacenamiento y cuando se administra. Por ello, se han hecho esfuerzos con el fin de proporcionar moléculas de ARN estables para terapia génica o la vacunación genética con el objetivo de impedir su degradación o descomposición temprana.
Se ha reportado que el contenido G/C de las moléculas de ácido nucleico puede influir en su estabilidad. Así, los ácidos nucleicos que comprenden una cantidad incrementada de residuos guanina (G) y/o citosina (C) pueden ser funcionalmente más estables que los ácidos nucleicos que contienen una gran cantidad de nucleótidos adenina (A) y timina (T) o uracilo (U). En este contexto, la WO02/098443 proporciona una composición farmacéutica que contiene un ARNm estabilizado por modificaciones de secuencia en la región codificadora. Esta modificación de secuencia tiene la ventaja de la degeneración del código genético. Por consiguiente, los codones que contienen una combinación menos favorable de nucleótidos (menos favorable en términos de estabilidad del ARN) se pueden sustituir por codones alternativos sin alterar la secuencia de aminoácidos codificada. Este método de estabilización de ARN está limitado por las condiciones de las secuencias de nucleótidos específicas de cada molécula ARN individual, no estando permitido dejar el espacio de la secuencia de aminoácidos deseada. Igualmente, este procedimiento está restringido a regiones de codificación del ARN.
Como opción alternativa para la estabilización del ARNm, se ha encontrado que las moléculas de ARNm eucariotas de origen natural contienen elementos estabilizantes característicos. Por ejemplo, pueden comprender las llamadas regiones no traducidas (UTR) en su extremo 5' (5'-UTR) y/o en su extremo 3' (3'-UTR), así como otras características estructurales, tal como una estructura cap 5' o una cola 3'-poli(A). Tanto 5'-UTR como 3'-UTR son transcriptas típicamente a partir del ADN genómico y, así, son un elemento del ARNm prematuro. Los aspectos estructurales característicos del ARNm maduro, tal como la cap 5' y la cola 3'-poli(A) (también llamada cola poli(A) o secuencia poli(A)) habitualmente se añaden al ARNm transcripto (prematuro) durante el procesamiento del ARNm.
Una cola 3'-poli(A) es típicamente un tramo de secuencia monótono de nucleótidos adenosina añadido al extremo 3' del ARNm transcripto. Puede comprender hasta aproximadamente 400 nucleótidos adenosina. Se ha encontrado que la longitud de esta cola 3'-poli(A) es un elemento potencialmente crítico para la estabilidad del ARNm individual.
La WO 2012/019630 A1 describe una ARNm estabilizado mediante la construcción de un ARNm con secuencias estabilizadoras 5'- y/o 3'-UTR, por ejemplo el 3'-UTR de alfa-globina.
También se ha demostrado que la 3'-UTR de un ARNm de a-globina puede ser un factor importante para la estabilidad bien conocida del ARNm de a-globina (Rodgers y col., Regulated del ARNm a-globina decay is a cytoplasmic event proceeding through 3'-to-5' exosome-dependent decapping, ARN, 8, pp. 1526-1537, 2002). La 3'-UTR de un ARNm de aglobina aparentemente está implicado en la formación de un complejo de ribonucleoproteína específico, el complejo a, cuya presencia se correlaciona con la estabilidad del ARNm in vitro (Wang y col., An ARNm stability complex functions with poli(A)-binding protein to stabilize ARNm in vitro, Molecular and Cellular biology, Vol 19, No. 7, Julio de 1999, p. 4552­ 4560).
También se ha demostrado una función reguladora interesante para las UTR de ARNm de proteínas ribosómicas: mientras que la 5'-UTR de los ARNm de proteínas ribosómicas controlan la traducción del ARNm asociada al crecimiento, la rigurosidad de esa regulación la confiere la 3'-UTR respectiva de los ARNm de proteínas ribosómicas (Ledda y col., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine ARNms, Gene, Vol. 344, 2005, p. 213­ 220). Este mecanismo contribuye al patrón de expresión específico de las proteínas ribosómicas, que se transcriben típicamente de manera constante de forma que algunos ARNm de proteínas ribosómicas, tal como la proteína ribosómica S9 o la proteína ribosómica L32, son referidos como genes de mantenimiento (Janovick-Guretzky y col., Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., Vol.
90, 2007, p. 2246-2252). Así, el patrón de expresión asociado al crecimiento de las proteínas ribosómicas se debe principalmente a la regulación del nivel de traducción.
La WO 2014/164253 A1 describe algunas moléculas de ácido nucleico específicas con 5'-UTR y/o 3'-UTR, sin detallar la eficiencia de traducción de estas moléculas.
Independientemente de los factores que influyen en la estabilidad del ARNm, la traducción efectiva de las moléculas de ácido nucleico administradas mediante células o tejidos diana es crucial para cualquier enfoque que utilice moléculas de ácido nucleico para la terapia génica o la vacunación genética. Como se puede observar de los ejemplos citados anteriormente, junto con la regulación de la estabilidad, también la traducción de la mayoría de los ARNm es regulada mediante características estructurales tipo UTR, cap 5' y cola 3'-poli(A). En este contexto, se ha reportado que la longitud de la cola poli(A) también puede desempeñar un papel importante en la eficiencia de traducción. Sin embargo, los elementos estabilizadores 3' también pueden tener un efecto atenuante de la traducción.
El objeto de la invención es proporcionar moléculas de ácido nucleico que puedan ser adecuadas para la aplicación en la terapia génica y/o la vacunación genética. En particular, es el objeto de la invención proporcionar una especie de ARNm que está estabilizado frente a la degradación prematura o la descomposición sin mostrar una pérdida funcional significativa de la eficiencia de traducción. También es objeto de la invención proporcionar una molécula de ácido nucleico artificial, preferentemente un ARNm, que se caracterice por una elevada eficiencia de traducción. Un objeto particular de la invención es proporcionar un ARNm con el que mejore la eficiencia de la traducción (producción ribosómica de la proteína codificada respectiva), por ejemplo en comparación con una molécula de ácido nucleico de referencia (ARNm de referencia). Otro objeto de la presente invención es proporcionar moléculas de ácido nucleico que codifican para una especie de ARNm superior que pueda ser susceptible de uso en la terapia génica y/o la vacunación genética. Es otro objeto de la presente invención proporcionar una composición farmacéutica para su uso en la terapia génica y/o la vacunación genética. En resumen, el objeto de la presente invención es proporcionar especies de ácido nucleico mejoradas que superen las desventajas planteadas anteriormente de la técnica anterior mediante un enfoque económico y directo.
El objetivo subyacente de la presente invención se resuelve mediante el objeto reivindicado. Los presentes inventores identificaron elementos 3'-UTR y, opcionalmente, elementos 5'-UTR que proporcionar una alta eficiencia de traducción. Es un aspecto común de las moléculas de ácido nucleico preferentes de esta invención que todas ellas se caractericen por una eficiencia de traducción que es más alta que la eficiencia de traducción de las moléculas de ácido nucleico previamente conocidas. También se proporciona un ensayo para determinar la alta eficiencia de traducción alta en comparación con una molécula de ácido nucleico de referencia.
La presente invención se hizo con apoyo del Gobierno de EE. UU. bajo el Número de Acuerdo HR0011-11-3-0001 otorgado por DARPA. El Gobierno de EE. UU. tiene ciertos derechos en la invención.
Por razones de claridad y legibilidad se proporcionan las siguientes definiciones. Cualquier característica técnica mencionada para estas definiciones se puede leer en toda y cada una de las realizaciones de la invención. Se pueden proporcionar específicamente definiciones y explicaciones adicionales en el contexto de estas realizaciones.
Respuesta inmunitaria adaptiva: La respuesta inmunitaria adaptiva se entiende típicamente como una respuesta específica de antígeno del sistema inmunitario. La especificidad de antígeno permite generar respuestas que se adaptan a patógenos o células infectadas con patógenos específicos. Normalmente, la capacidad para generar estas respuestas adaptadas es mantenida en el cuerpo gracias a las “células de memoria”. Si un patógeno infecta el cuerpo más de una vez, utiliza estas células de memoria específicas para eliminarlo rápidamente. En este contexto, el primer paso de una respuesta inmunitaria adaptiva es la activación de las células T específicas de antígeno naive o de diferentes células inmunes capaces de inducir una respuesta inmunitaria específica de antígeno mediante las células presentadoras de antígeno. Esto ocurre en los tejidos y órganos linfáticos a través de los cuales pasan las células T naive constantemente. Los tres tipos de células que pueden servir como células presentadoras de antígeno son células dendríticas, macrófagos y células B. Cada una de estas células tiene una función distinta en inducir respuestas inmunitarias. Las células dendríticas pueden captar antígenos por fagocitosis y macropinocitosis y se pueden estimular por contacto con, por ejemplo, un antígeno extraño o migrar al tejido linfático local, donde se diferencian en células dendríticas maduras. Los macrófagos ingieren antígenos particulados, tales como bacterias, y son inducidos por agentes infecciosos u otros estímulos apropiados para expresar moléculas MHC. La capacidad única de las células B de enlazar e internalizar antígenos de proteínas solubles vía sus receptores también puede ser importante para inducir células T. Típicamente, las moléculas MHC son responsables de la presentación de un antígeno a las células T. Así, la presentación del antígeno en las moléculas MHC conduce la activación de las células T, lo cual induce su proliferación y diferenciación en células T efectoras armadas. La función más importante de las células T efectoras es el exterminio de células infectadas mediante las células T citotóxicas CD8+ y la activación de macrófagos por las células Th1, que juntas constituyen la inmunidad mediada por células, y la activación de células B tanto por las células Th2 como Th1 para producir diferentes clases de anticuerpos, conduciendo así a la respuesta inmunitaria humoral. Las células T reconocen un antígeno mediante sus receptores de células T, que no reconocen y enlazan el antígeno directamente, sino que, en cambio, reconocen fragmentos peptídicos cortos, por ejemplo de antígenos de proteínas derivadas de patógenos, por ejemplo los llamados epítopos, que se unen a las moléculas MHC sobre la superficie de otras células.
Sistema inmunitario adaptivo: El sistema inmunitario adaptivo se dedica esencialmente a eliminar o prevenir el crecimiento de patógenos. Típicamente regula la respuesta inmunitaria adaptiva proporcionando al sistema inmunitario vertebrado la capacidad de reconocer y recordar patógenos específicos (para generar inmunidad) y a generar ataques más potentes cada vez que se encuentra el patógeno. El sistema es sumamente adaptable debido a la hipermutación somática (un proceso de mutaciones somáticas aceleradas) y la recombinación V(D)J (una recombinación genética irreversible de segmentos génicos del receptor de antígeno). Este mecanismo permite que un pequeño número de genes genere un amplio número de diferentes receptores de antígeno, que después se expresan individualmente en cada linfocito individual. Debido a que el re-arreglo genético conduce a un cambio irreversible en el ADN de cada célula, toda la progenie (descendencia) de esta célula heredará entonces los genes que codifican la misma especificidad del receptor, incluyendo las células B de memoria y las células T de memoria, que son las claves para la inmunidad específica a largo plazo.
Adyuvante/componte adyuvante: En el sentido más amplio, un adyuvante o un componente adyuvante es típicamente un agente farmacológico y/o inmunológico que puede modificar, por ejemplo mejorar, el efecto de otros agentes, tal como un fármaco o una vacuna. Se interpreta en un sentido amplio y se refiere a un amplio espectro de sustancias. Típicamente, estas sustancias son capaces de incrementar la inmunogenicidad de los antígenos. Por ejemplo, los adyuvantes pueden ser reconocidos por los sistemas inmunitarios innatos y, por ejemplo, pueden inducir una respuesta inmunitaria innata. Los “adyuvantes” típicamente no inducen una respuesta inmunitaria adaptiva. Así, los “adyuvantes” no se califican como antígenos. Su modo de acción es distinto de los efectos desencadenados por los antígenos que dan como resultado una respuesta inmunitaria adaptiva.
Antígeno: En el contexto de la presente invención “antígeno” se refiere típicamente a una sustancia que puede ser reconocida por el sistema inmunitario, de manera preferente por el sistema inmunitario adaptivo, y es capaz de desencadenar una respuesta inmunitaria específica de antígeno, por ejemplo por la formación de anticuerpos y/o células T específicas de antígeno como parte de una respuesta inmunitaria adaptiva. Típicamente, un antígeno puede ser o puede comprender una proteína o péptido que puede ser presentado por las MHC a las células T. En el sentido de la presente invención, un antígeno puede ser el producto de traducción de una molécula de ácido nucleico proporcionada, preferentemente un ARNm como se define aquí. En este contexto, también los fragmentos, variantes y derivados de péptidos y proteínas que comprenden al menos un epítopo se entienden como antígenos. En el contexto de la presente invención, los antígenos tumorales y antígenos patogénicos como se definen aquí son particularmente preferentes.
En otras palabras, una molécula de ácido nucleico artificial se puede entender como una molécula de ácido nucleico no natural. Esta molécula de ácido nucleico puede ser no-natural debido a su secuencia individual (que no es de origen natural) y/o debido a otras modificaciones, por ejemplo modificaciones estructurales de nucleótidos que no se producen naturalmente. Una molécula de ácido nucleico artificial puede ser una molécula de ADN, una molécula de ARN o una molécula hibrida que comprende porciones de ADN y ARN. Típicamente, las moléculas de ácido nucleico artificiales se pueden diseñar y/o generar mediante métodos de modificación genética para corresponderse con una secuencia de nucleótidos artificial deseada (secuencia heteróloga). En este contexto, una secuencia artificial normalmente es una secuencia que no puede producirse de forma natural, es decir difiere de la secuencia de tipo natural en al menos un nucleótido. El término “tipo natural” se puede entender como una secuencia que está presente en la naturaleza. Cuando cualquier “molécula de ácido nucleico artificial” concreta se describe aquí como “basada en” cualquier molécula de ácido nucleico de tipo natural particular, entonces la molécula de ácido nucleico artificial difiere de la molécula de ácido nucleico de tipo natural en al menos un nucleótido. Además, el término “molécula de ácido nucleico artificial” no está limitado a significar “una molécula individual” sino que se entiende típicamente como que comprende un conjunto de moléculas idénticas. Por consiguiente, puede referirse a múltiples moléculas idénticas contenidas en una alícuota.
ARN bicistrónico, ARN multicistrónico: Un ARN bicistrónico o multicistrónico es típicamente un ARN, preferentemente un ARNm, que típicamente puede tener dos marcos de lectura abiertos (ORF) (bicistrónico) o más (multicistrónico). Un marco de lectura abierto en este contexto es una secuencia de codones que es traducible en un péptido o proteína.
Vehículo/vehículo polimérico: Un vehículo en el contexto de la invención puede ser típicamente un compuesto que facilita el transporte y/o la complejación de otro compuesto (carga). Un vehículo polimérico es típicamente un portador conformado por un polímero. Un vehículo puede asociarse a su carga por interacción covalente o no covalente. Un vehículo puede transportar ácidos nucleicos, por ejemplo ARN o ADN, a las células diana. En algunas realizaciones, el vehículo puede ser un componente catiónico.
Componente catiónico: El término “componente catiónico” se refiere típicamente a una molécula cargada positivamente (catión) a un valor pH típicamente de 1 a 9, preferentemente a un valor pH de o inferior a 9 (por ejemplo de 5 a 9), de o inferior a 8 (por ejemplo de 5 a 8), de o inferior a 7 (por ejemplo de 5 a 7), de manera especialmente preferente a pH fisiológico, por ejemplo de 7,3 a 7,4. Por consiguiente, un componente catiónico puede ser cualquier compuesto o polímero cargado positivamente, preferentemente un péptido o proteína catiónica que se carga positivamente bajo condiciones fisiológicas, en particular bajo condiciones fisiológicas in vivo. Un “péptido o proteína catiónica” puede contener al menos un aminoácido cargado positivamente o más de un aminoácido cargado positivamente, por ejemplo seleccionado de Arg, His, Lys u Orn. Por consiguiente, los componentes “policatiónicos” también están dentro del alcance presentando más de una carga positiva bajo las condiciones dadas.
Cap-5': Cap-5' es una entidad, típicamente una entidad de nucleótido modificada, que en general “tapa” el extremo 5' de un ARNm maduro. Típicamente la cap 5' puede estar formada por un nucleótido modificado, en particular por un derivado de un nucleótido de guanina. Preferentemente, la cap-5' se una al terminal 5' mediante un enlace de 5'-5'-trifosfato. Cap-5' puede estar metilada, por ejemplo m7GpppN, siendo N el nucleótido 5' del ácido nucleico que lleva la cap-5', típicamente, el extremo 5' de un ARN. Otros ejemplos de estructuras cap-5' incluyen glicerilo, residuo abásico desoxi invertido (parte), nucleótido 4',5'-metileno, nucleótido 1-(beta-D-eritrofuranosilo), nucleótido 4'-tio, nucleótido carbocíclico, nucleótido 1,5-anhidrohexitol, L-nucleótidos, alfa-nucleótidos, nucleótidos base modificados, nucleótido treo-pentofuranosilo, nucleótido 3',4'-seco acíclico, nucleótido 3,4-dihidroxibutilo acíclico, nucleótido 3,5-dihidroxipentilo acíclico, parte de nucleótido 3'-3'-invertida, parte abásica 3'-3'-invertida, parte de nucleótido 3'-2'-invertida, parte abásica 3'-2'-invertida, fosfato de 1,4-butanodiol, 3'-fosforamidato, hexilfosfato, fosfato de aminohexilo, 3'-fosfato, 3'-fosforotioato, fosforoditioato o parte de metilfosfonato puente o no puente.
Inmunidad celular/respuesta inmune celular: La inmunidad celular se refiere típicamente a la activación de macrófagos, células exterminadoras naturales (NK), linfocitos T citotóxicos específicos de antígeno y la liberación de varias citoquinas en respuesta a un antígeno. En términos más generales, la inmunidad celular no está basada en anticuerpos, sino en la activación de células del sistema inmunitario. Típicamente, una respuesta inmune celular puede estar caracterizada, por ejemplo, por la activación de linfocitos T citotóxicos específicos de antígeno capaces de inducir la apoptosis en las células, por ejemplo células inmunitarias específicas tipo células dendríticas u otras células, que muestran epítopos de antígenos extraños en su superficie. Estas células pueden estar infectadas por virus o por bacterias intracelulares o pueden ser células cancerosas que muestran antígenos tumorales. Otras características pueden ser la activación de macrófagos y de células asesinas naturales, permitiéndoles destruir patógenos y estimular las células para secretar diversas citoquinas que influyen en la función de otras células implicadas en las respuestas inmunitarias adaptivas y las respuestas inmunitarias innatas.
ADN: El ADN es la abreviatura habitual para ácido desoxiribonucleico. Es una molécula de ácido nucleico, es decir un polímero consistente en nucleótidos. Estos nucleótidos normalmente son monómeros desoxi-adenosina-monofosfato, desoxitimidina-monofosfato, desoxi-guanosina-monofosfato y desoxicitidina-monofosfato, que están compuestos, por si mismos, por una parte de azúcar (desoxiribosa), una parte base y una parte fosfato y que están polimerizados en una estructura esqueletal característica. La estructura de la cadena principal típicamente está formada por enlaces fosfodiéster entre la parte azúcar del nucleótido, es decir la desoxiribosa, con una primera porción fosfato de un segundo monómero adyacente. El orden específico de los monómeros, es decir el orden de las bases unidas a la cadena principal del azúcar/fosfato, se denomina secuencia de ADN. El ADN puede ser monocatenario o bicatenario. En la forma bicatenaria, los nucleótidos de la primera hebra se hibridan típicamente con los nucleótidos de la segunda hebra, por ejemplo por apareamiento de bases A/T y apareamiento de bases G/C.
Epítopo: Los epítopos (también llamados “determinantes de antígeno”) se pueden distinguir en epítopos de células T y epítopos de células B. Los epítopos de células T, o partes de proteínas en el contexto de la presente invención, pueden comprender fragmentos con una longitud preferente de aproximadamente 6 a aproximadamente 20 o más aminoácidos, por ejemplo fragmentos tales como los procesados y presentados por las moléculas MHC clase I, que preferentemente tienen una longitud de aproximadamente 8 a aproximadamente 10 aminoácidos, por ejemplo 8, 9 o 10 (o incluso 11 o 12 aminoácidos), o fragmentos tales como son procesados y presentados por las moléculas MHC clase II, que preferentemente tienen una longitud de aproximadamente 13 o más aminoácidos, por ejemplo 13, 14, 15, 16, 17, 18, 19, 20 o más aminoácidos, pudiendo seleccionarse estos fragmentos de cualquier parte de la secuencia de aminoácidos. Estos fragmentos típicamente son reconocidos por las células T en forma de un complejo consistente en un fragmento peptídico y una molécula MHC, es decir los fragmentos no son típicamente reconocidos en su forma nativa. Los epítopos de células B son típicamente fragmentos localizados en la superficie exterior de los antígenos de proteína o péptido (nativos) como se definen aquí, preferentemente con 5 a 15 aminoácidos, de manera más preferente 5 a 12 aminoácidos, con especial preferencia 6 a 9 aminoácidos, que pueden ser reconocidos por anticuerpos, es decir en su forma nativa. Estos epítopos de proteínas o péptidos se pueden seleccionar además de cualquiera de las variantes aquí mencionadas de estas proteínas o péptidos. En este contexto, los determinantes antigénicos pueden ser epítopos conformacionales o discontinuos que se componen de segmentos de proteínas o péptidos como se definen aquí que son discontinuos en la secuencia de aminoácidos de las proteínas o péptidos como se define aquí, pero portados juntos en epítopos de estructura tridimensional o continuos o lineales que se componen de una única cadena polipeptídica.
Fragmento de una secuencia: Un fragmento de una secuencia puede ser típicamente una porción más corta de una secuencia de longitud completa de, por ejemplo, una molécula de ácido nucleico o una secuencia de aminoácidos. Por consiguiente, un fragmento típicamente consiste en una secuencia que es idéntica al tramo correspondiente dentro de la secuencia de longitud completa. Un fragmento preferente de una secuencia en el contexto de la presente invención consiste en un tramo continuo de entidades, tales como nucleótidos o aminoácidos, que corresponden a un tramo continuo de entidades en la molécula de la que se deriva el fragmento, que presenta al menos el 5%, 10%, 20%, de manera preferente al menos el 30%, de manera más preferente al menos el 40%, de manera especialmente preferente al menos el 50%, de manera particularmente preferente al menos el 60%, de manera aún más preferente al menos el 70%, y de manera totalmente al menos el 80% de la molécula total (es decir longitud completa) de la cual se deriva el fragmento.
Modificado en G/C: Un ácido nucleico modificado en G/C puede ser típicamente un ácido nucleico, preferentemente una molécula de ácido nucleico artificial como se aquí, basada en una secuencia de tipo natural modificada que comprende un número preferentemente mayor de nucleótidos guanosina y/o citosina en comparación con la secuencia de tipo natural. Este número incrementado se puede generar por sustitución de codones que contienen nucleótidos adenosina o timidina por codones que contienen nucleótidos guanosina o citosina. Si el contenido en G/C enriquecido está presente en una región de codificación del ADN o ARN, se hace uso de la degeneración del código genético. Por consiguiente, las sustituciones de codón preferentemente no alteran los residuos aminoácidos codificados, sino exclusivamente incrementan el contenido en G/C de la molécula de ácido nucleico.
Terapia génica: La terapia génica se puede entender típicamente como un tratamiento del cuerpo de un paciente o de elementos aislados del cuerpo de un paciente, por ejemplo tejidos/células aisladas, mediante ácidos nucleicos que codifican un péptido o proteína. Puede comprender típicamente al menos uno de las etapas de a) administrar un ácido nucleico, preferentemente una molécula de ácido nucleico artificial como se define aquí, directamente al paciente - por cualquier vía de administración - o in vitro a células/tejidos aislados del paciente, dando como resultado la transfección de las células del paciente ya sea in vivo/ex vivo o in vitro; b) la transcripción y/o traducción de la molécula de ácido nucleico introducida; y opcionalmente c) re-administrar las células transfectadas aisladas al paciente si el ácido nucleico no ha sido administrado directamente al paciente.
Vacunación genética: La vacunación genética se puede entender típicamente como la vacunación mediante la administración de una molécula de ácido nucleico que codifica un antígeno o un inmunógeno o fragmentos de los mismos. La molécula de ácido nucleico se puede administrar al cuerpo de un sujeto o a células aisladas de un sujeto. En la transfección de ciertas células del cuerpo o en la transfección de células aisladas, el antígeno o inmunógeno puede ser expresado por esas células y presentarse entonces al sistema inmunitario, induciendo una respuesta inmunitaria adaptiva, es decir específica de antígeno. Por consiguiente, la vacunación genética comprende típicamente al menos uno de las etapas de a) administrar un ácido nucleico, preferentemente una molécula de ácido nucleico artificial como se define aquí, a un sujeto, de manera preferente a un paciente, o a células aisladas de un sujeto, de manera preferente de un paciente, dando como resultado habitualmente la transfección de las células al sujeto, ya sea in vivo o in vitro; b) la transcripción y/o traducción de la molécula de ácido nucleico introducida; y opcionalmente c) re-administrar las células transfectadas aisladas al sujeto, preferentemente al paciente, si el ácido nucleico no ha sido administrado directamente al paciente.
Secuencia heteróloga: Típicamente, se entiende que dos secuencias son “heterólogas” si no son derivables del mismo gen. Es decir, aunque las secuencias heterólogas pueden derivarse del mismo organismo, no están presentes naturalmente (en la naturaleza) en la misma molécula de ácido nucleico, tal como en el mismo ARNm.
Inmunidad humoral/respuesta inmune humoral: La inmunidad humoral se refiere típicamente a la producción de anticuerpos y opcionalmente a procesos accesorios que acompañan a la producción de anticuerpos. Una respuesta inmunitaria humoral se puede caracterizar típicamente, por ejemplo, por la activación de Th2 y por la producción de citoquinas, formación del centro germinal y cambio de isotipos, maduración por afinidad y generación de células de memoria. La inmunidad humoral también se puede referir típicamente a las funciones efectoras de los anticuerpos, incluyendo la neutralización de patógenos y toxinas, la activación clásica de complemento y la promoción de opsonina de fagocitosis y eliminación de patógenos.
Inmunógeno: En el contexto de la presente invención, un inmunógeno se puede entender típicamente como un compuesto capaz de estimular una respuesta inmunitaria. Preferentemente, un inmunógeno es un péptido, polipéptido o proteína. En una realización particularmente preferente, un inmunógeno en el sentido de la presente invención es el producto de la traducción de una molécula de ácido nucleico proporcionada, preferentemente de una molécula de ácido nucleico artificial como se define aquí. Típicamente, un inmunógeno induce al menos una respuesta inmune adaptiva.
Composición inmunoestimuladora: En el contexto de la invención, una composición inmunoestimuladora se puede entender típicamente como una composición que contiene al menos un componente capaz de inducir una respuesta inmunitaria o de la cual es derivable un componente que es capaz de inducir una respuesta inmunitaria. Preferentemente, esta respuesta inmunitaria puede ser una respuesta inmune innata o una combinación de una respuesta inmune adaptiva e innata. De manera preferente, una composición inmunoestimuladora en el contexto de la invención contiene al menos una molécula de ácido nucleico artificial, con mayor preferencia un ARN, por ejemplo una molécula de ARNm. El componente inmunoestimulador, tal como el ARNm, puede estar complejado con un vehículo adecuado. Así, la composición inmunoestimuladora puede comprender un complejo ARNm/vehículo. Además, la composición inmunoestimuladora puede comprender un adyuvante y/o un vehículo adecuado para el componente inmunoestimulador, tal como el ARNm.
Respuesta inmunitaria: Una respuesta inmunitaria puede ser típicamente una reacción específica del sistema inmunitario adaptivo a un antígeno particular (la llamada respuesta inmunitaria específica o adaptiva) o una reacción no específica del sistema inmunitario innato (la llamada respuesta inmunitaria no específica o innata), o una combinación de ambas.
Sistema inmunitario: El sistema inmunitario puede proteger los organismos de la infección. Si un patógeno tiene éxito, traspasa una barrera física de un organismo y entra en éste, el sistema inmunitario innato proporciona una respuesta inmediata, pero no específica. Si los patógenos evaden esta respuesta innata, los vertebrados poseen una segunda barrera de protección, el sistema inmunitario adaptivo. Así, el sistema inmunitario adapta su respuesta durante una infección para mejorar su reconocimiento del patógeno. Esta respuesta mejorada entonces se mantiene después de que el patógeno haya sido eliminado en forma de una memoria inmunológica y permite que el sistema inmunitario adaptivo realice ataques más rápidos y potentes cada vez que se encuentra con este patógeno. Así, el sistema inmunitario comprende el sistema inmunitario innato y adaptivo. Cada una de etas dos partes contiene típicamente los llamados componentes humorales y celulares.
ARN inmunoestimulador: Un ARN inmunoestimulador (ARNis) en el contexto de la invención puede ser típicamente un ARN capaz de inducir una respuesta inmunitaria innata. Usualmente no tiene un marco de lectura abierto y, por ello, no proporciona un péptido-antígeno o inmunógeno, pero induce una respuesta inmune, por ejemplo mediante el enlace a una clase específica de receptor tipo Toll (TLR) u otros receptores adecuados. Sin embargo, por supuesto también los ARNm que tienen un marco de lectura abierto y codifican para un péptido/proteína pueden inducir una respuesta inmune innata y así pueden ser ARN inmunoestimuladores.
Sistema inmunitario innato: El sistema inmunitario innato, también conocido como sistema inmunitario no específico (o inespecífico), comprende típicamente células y mecanismos que defienden al huésped de la infección por otros organismos de manera no específica. Esto significa que las células del sistema inmunitario pueden reconocer y responder a patógenos de forma genérica, pero a diferencia del sistema inmunitario adaptivo, no confieren inmunidad protectora a largo protectora al huésped. El sistema inmunitario innato puede ser activado, por ejemplo, por ligandos de receptores tipo Toll (TLR) y otras sustancias auxiliares, tal como lipopolisacáridos, TNF-alfa, ligando CD40, o citoquinas, monocinas, linfocinas, interleucinas o quimiocinas, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-alfa, IFN-beta, IFN-gamma, GM-CSF, G-CSF, M-CSF, LT-beta, TNF-alfa, factores de crecimiento y hGH, un ligando del receptor tipo Toll humano TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, un ligando de receptor tipo Toll murino TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 o TLR13, un ligando de un receptor tipo NOD, un ligando de un receptor tipo RIG-I, un ácido nucleico inmunoestimulador, un ARN inmunoestimulador (ARNis), un CpG-ADN, un agente antibacteriano o un agente antiviral. La composición farmacéutica de acuerdo con la presente invención puede comprender una o más de estas sustancias. Típicamente, una respuesta del sistema inmunitario innato incluye reclutar células inmunitarias a los sitios de infección mediante la producción de factores químicos, incluyendo los mediadores químicos especializados llamados citoquinas; la activación de la cascada de complemento; la identificación y eliminación de sustancias extrañas presentes en los órganos, tejidos, sangre y linfa mediante glóbulos blancos especializados; la activación del sistema inmunitario adaptivo; y/o actuar como una barrera física o química frente a agentes infecciosos.
Sitio de clonación: Un sitio de clonación se entiende típicamente como un segmento de una molécula de ácido nucleico adecuado para la inserción de una secuencia de ácido nucleico, por ejemplo una secuencia de ácido nucleico que comprende un marco de lectura abierto. La inserción se puede llevar a cabo por cualquier método biológico molecular conocido por el experto en la técnica, por ejemplo mediante restricción y ligación. Un sitio de clonación comprende típicamente uno o más sitios de reconocimiento de enzimas de restricción (sitios de restricción). Estos o más sitios de restricción pueden ser reconocidos por las enzimas de restricción, que escinden el ADN en estos sitios. Un sitio de clonación que comprende más de un sitio de restricción también puede denominarse sitio de clonación múltiple (MCS) o poli-ligador.
Molécula de ácido nucleico: Una molécula de ácido nucleico es una molécula que comprende, preferentemente que consiste en componentes de ácido nucleico. Preferentemente el término molécula de ácido nucleico se refiere a moléculas de ADN o ARN. Preferentemente se usa de forma sinónima con el término “polmudeótido”. De manera preferente, una molécula de ácido nucleico es un polímero que comprende o consiste en monómeros de nucleótidos unidos covalentemente entre sí por enlaces fosfodiéster a una cadena principal de azúcar/fosfato. El término “molécula de ácido nucleico” también abarca moléculas de ácido nucleico modificadas, tales como moléculas de ADN o ARN modificadas en su base, modificadas con azúcar o modificadas en la cadena principal, etc.
Marco de lectura abierto: Un marco de lectura abierto (ORF) en el contexto de la invención puede ser típicamente una secuencia de varios tripletes de nucleótidos que se pueden traducir en un péptido o proteína. Preferentemente un marco de lectura abierto contiene un codón de inicio, es decir una combinación de tres nucleótidos subsecuentes que codifican usualmente para el aminoácido metionina (ATG), en su extremo 5', y una región subsecuente que muestra usualmente una longitud múltiplo de 3 nucleótidos. Típicamente, este es el único codón de parada del marco de lectura abierto. Así, un marco de lectura abierto en el contexto de la presente invención preferentemente es una secuencia de nucleótidos consistente en un número de nucleótidos divisible entre tres, que se inicia con un codón de inicio (por ejemplo ATG) y preferentemente termina con un codón de parada (por ejemplo TAA, TGA o TAG). El marco de lectura abierto puede estar aislado o incorporarse en una secuencia de ácido nucleico más larga, por ejemplo en un vector o en un ARNm. Un marco de lectura abierto también puede denominarse “región de codificación de proteínas”.
Péptido: Un péptido o polipéptido es típicamente un polímero de monómeros aminoácidos unidos por enlaces peptídicos. Contiene típicamente menos de 50 unidades de monómero. No obstante, el término péptido no está limitado a moléculas que tienen menos de 50 unidades de monómero. Los péptidos largos también se denominan polipéptidos, típicamente con entre 50 y 600 unidades monoméricas.
Cantidad farmacéuticamente efectiva: Una cantidad farmacéuticamente efectiva en el contexto de la invención se entiende típicamente como una cantidad suficiente para inducir un efecto farmacéutico, tal como una respuesta inmune, que altera un nivel patológico de un péptido o proteína expresados o que sustituye un producto génico que falta, por ejemplo en el caso de una situación patológica.
Proteína: Una proteína comprende típicamente uno o más péptidos o polipéptidos. Una proteína típicamente está plegada en forma tridimensional, lo cual puede ser requerido para que la proteína ejerza su función biológica.
Secuencia Poli(A): Una secuencia poli(A), también llamada cola poli(A) o cola 3'-poli(A) se entiende típicamente como una secuencia de nucleótidos de adenosina, por ejemplo de hasta aproximadamente 400 nucleótidos de adenosina, por ejemplo de aproximadamente 20 a aproximadamente 400, preferentemente de aproximadamente 50 a aproximadamente 400, de manera más preferente de aproximadamente 50 a aproximadamente 300, incluso más preferentemente de aproximadamente 50 a aproximadamente 250, de manera mucho más preferente de aproximadamente 60 a aproximadamente 250 nucleótidos de adenosina. Típicamente la secuencia poli(A) se sitúa en el extremo 3' de un ARNm. En el contexto de la presente invención, una secuencia poli(A) se puede situar dentro de un ARNm o de cualquier otra molécula de ácido nucleico, tal como, por ejemplo, en un vector, por ejemplo en un vector que sirve como plantilla para la generación de un ARN, preferentemente un ARNm, por ejemplo por transcripción del vector.
Poliadenilación: Se entiende típicamente por poliadenilación la adición de una secuencia poli(A) a una molécula de ácido nucleico, tal como una molécula de ARN, por ejemplo a un ARNm prematuro. La poliadenilación se puede inducir mediante la llamada señal de poliadenilación. Esta señal preferentemente se localiza dentro de un tramo de nucleótidos en el extremo 3' de una molécula de ácido nucleico, tal como una molécula de ARN, que se poliadenila. Una señal de poliadenilación comprende típicamente un hexámero consistente en nucleótidos de adenina y uracilo/timina, de manera preferente la secuencia hexámera AAUAAA. Otras secuencias, preferentemente secuencias de hexámeros, también son concebibles. La poliadenilación típicamente sucede durante el procesamiento de un pre-ARNm (también llamado ARNm prematuro). Típicamente, la maduración del ARN (del pre-ARNm a ARNm maduro) comprende el paso de poliadenilación.
Sitio de restricción: Un sitio de restricción, también llamado sitio de reconocimiento de enzimas de restricción es una secuencia de nucleótidos reconocida por una enzima de restricción. Un sitio de restricción es típicamente una secuencia de nucleótidos corta, preferentemente palindrómica, por ejemplo una secuencia que comprende de 4 a 8 nucleótidos. Preferentemente un sitio de restricción es específicamente reconocido por una enzima de restricción. La enzima de restricción escinde típicamente una secuencia de nucleótidos que comprende un sitio de restricción en este sitio. En una secuencia de nucleótidos de doble hebra, tal como una secuencia de ADN bicatenaria, la enzima de restricción corta típicamente ambas hebras de la secuencia de nucleótidos.
ARN, ARNm: ARN es la abreviatura usual para el ácido ribonucleico. Es una molécula de ácido nucleico, es decir un polímero consistente en nucleótidos. Estos nucleótidos son usualmente monómeros de adenosina-monofosfato, uridina monofosfato, guanosina-monofosfato y citidina-monofosfato que se unen entre sí a lo largo de la llamada cadena principal. La cadena principal está formada por enlaces fosfodiéster entre el azúcar, es decir la ribosa, de un primer monómero y una porción fosfato de un segundo monómero adyacente. La asociación específica de los monómeros es la llamada secuencia de ARN. Usualmente el ARN puede obtenerse por transcripción de la secuencia de ADN, por ejemplo dentro de una célula. En las células eucariotas, la transcripción se lleva a cabo típicamente dentro del núcleo o la mitocondria. Típicamente, la transcripción del ADN da como resultado el llamado ARN prematuro. que tiene que ser procesado en el llamado ARN mensajero, usualmente abreviado ARNm. El procesamiento del ARN prematuro, por ejemplo en los organismos eucariotas, comprende una variedad de diferentes modificaciones pos-transcripcionales, tal como empalme, cap 5', poliadenilación, exportación del núcleo o la mitocondria y similares. La suma de estos procesos también se denomina maduración del ARN. Habitualmente, el ARN mensajero maduro proporciona la secuencia de nucleótidos que se puede traducir en una secuencia de aminoácidos de un péptido o proteína particular. Típicamente, un ARNm maduro comprende una cap 5', una 5'-UTR, un marco de lectura abierto, una 3'-UTR y una secuencia poli(A). Además del ARN mensajero, existen varios tipos de ARN no codificantes que pueden estar implicados en la regulación de la transcripción y/o traducción.
Secuencia de una molécula de ácido nucleico: Por secuencia de una molécula de ácido nucleico se entiende típicamente el orden particular e individual, es decir la sucesión, de nucleótidos. La secuencia de una proteína o péptido se entiende típicamente que es el orden, es decir, la asociación de sus aminoácidos.
Identidad de secuencia: Dos o más secuencias son idénticas si tienen la misma longitud y orden de nucleótidos o aminoácidos. El porcentaje de identidad describe típicamente el grado al cual dos secuencias son idénticas, es decir, describe típicamente el porcentaje de nucleótidos que corresponden a su posición en la secuencia con los nucleótidos idénticos de una secuencia de referencia. Para determinar el grado de identidad, se considera que las secuencias a comparar tienen la misma longitud, es decir la longitud de la secuencia más larga de las secuencias a comparar. Esto significa que una primera secuencia consistente en 8 nucleótidos es un 80% idéntica a una segunda secuencia que consiste en 10 nucleótidos que comprende la primera secuencia. En otras palabras, en el contexto de la presente invención, la identidad de secuencia preferentemente se refiere al porcentaje de nucleótidos de una secuencia que están en la misma posición en dos o más secuencias de la misma longitud. Habitualmente, los espacios se consideran como posiciones no idénticas, independientemente de su posición real en una alineación.
Molécula de ácido nucleico estabilizada: Una molécula de ácido nucleico estabilizada es una molécula de ácido nucleico, preferentemente una molécula de ADN o ARN, que está modificada de manera que es más estable a la desintegración o a la degradación, por ejemplo por factores ambientales o digestión enzimática, tal como por gradación por exo- o endonucleasas, que la molécula de ácido nucleico no modificada. De manera preferente, una molécula de ácido nucleico estabilizada en el contexto de la presente invención está estabilizada en una célula, tal como una célula procariota o eucariota, preferentemente en una célula de mamífero, tal como una célula humana. El efecto de estabilización también se puede ejercer fuera de las células, por ejemplo en una solución tampón, etc., por ejemplo durante el proceso de fabricación de una composición farmacéutica que comprende la molécula de ácido nucleico estabilizada.
Transfección: El término “transfección” se refiere a la introducción de moléculas de ácido nucleico, tal como moléculas de ADN o ARN (por ejemplo ARNm), en las células, preferentemente en células eucariotas. En el contexto de la presente invención, el término “transfección” abarca cualquier método conocido por el experto para introducir moléculas de ácido nucleico en las células, preferentemente en células eucariotas, tales como células de mamífero. Estos métodos abarcan, por ejemplo, electroporación, lipofección, por ejemplo basada en lípidos y/o liposomas catiónicos, precipitación con fosfato de calcio, transfección basada en nanopartículas, transfección basada en virus o transfección basada en polímeros catiónicos, tal como DEAE-dextrano o polietilenimina, etc. Preferentemente, la introducción no es viral.
Eficiencia de traducción (o eficacia de traducción): Este término, tal como se utiliza aquí, se refiere típicamente a una propiedad de una molécula de ácido nucleico (por ejemplo un ARNm) que comprende un marco de lectura abierto (ORF). La eficiencia de traducción es experimentalmente cuantificable. La eficiencia de traducción se mide típicamente determinando la cantidad de proteína traducida del ORF. Para la cuantificación experimental de la eficiencia de traducción, preferentemente el ORF codifica una proteína reporter o cualquier otra proteína que se pueda cuantificar. Sin embargo, sin limitarse a una teoría particular, se entiende que se consigue una alta eficiencia de traducción alta mediante un elemento UTR específico (un elemento 5'-UTR específico o un elemento 3'-UTR específico). Así, en el contexto de la presente invención, el término eficiencia de traducción se utiliza particularmente en relación con las moléculas de ácido nucleico que, además del ORF, comprenden al menos un elemento 5'-UTR y opcionalmente al menos un elemento 3'-UTR como se definen aquí. Mientras que para los propósitos de cuantificar experimentalmente la eficiencia de traducción, el ORF codifica adecuadamente una proteína reporter o cualquier otra proteína que se puede cuantificar, la presente invención no se limita a estos propósitos; en consecuencia, el al menos un elemento 5'-UTR y/o el al menos un elemento 3'-UTR de la invención (que proporciona una alta eficiencia de traducción) pueden estar comprendidos en una molécula de ácido nucleico que comprende un ORF que no codifica una proteína reporter.
La eficiencia de la traducción es un término relativo. Así, la eficiencia de traducción de varias, por ejemplo dos o más, moléculas de ácido nucleico se puede determinar y comparar, por ejemplo, por cuantificación experimental de la proteína codificada por el ORF. Esto se puede hacer bajo condiciones estandarizadas, por ejemplo en un ensayo estandarizado como es describe aquí. De esta manera, la eficiencia de traducción determinada bajo condiciones estandarizadas es una característica objetivo. De manera preferente, la eficiencia de la traducción de dos moléculas de ácido nucleico se determina y se compara. La primera de las dos moléculas de ácido nucleico se puede referir como “molécula de ácido nucleico sujeto” o “constructo sujeto” y la segunda de las dos moléculas de ácido nucleico de referencia” o “constructo de referencia”. La molécula de ácido nucleico sujeto puede ser una molécula de ácido nucleico artificial de acuerdo con la presente invención. Para este propósito, la molécula de ácido nucleico de referencia y la molécula de ácido nucleico sujeto comparten el mismo ORF (secuencia de ácido nucleico idéntica) y preferentemente la secuencia de ácido nucleico de la molécula de ácido nucleico sujeto es idéntica a la secuencia de ácido nucleico de la molécula de ácido nucleico de referencia, con la excepción del elemento 3'-UTR que se está ensayando; en otras palabras, la molécula de ácido nucleico sujeto y la molécula de ácido nucleico de referencia preferentemente difieren entre sí solo en que el elemento 3'-UTR tiene una secuencia de ácido nucleico diferente, de modo que el elemento 3'-UTR es la única característica estructural que distingue la molécula de ácido nucleico sujeto de la molécula de ácido nucleico de referencia. De acuerdo con la reivindicación 1, el ácido nucleico de referencia tiene una 3'-UTR correspondiente a la secuencia según la SEQ ID NO.: 207.
En el ensayo aquí descrito, la molécula de ácido nucleico sujeto y la molécula de ácido nucleico de referencia se transfectan en células de mamífero y se determina la eficiencia de la traducción. Cuando la eficiencia de la traducción de la molécula de ácido nucleico sujeto es más alta que la eficiencia de traducción de la molécula de ácido nucleico de referencia, entonces la molécula de ácido nucleico sujeto se dice que se caracteriza por una eficiencia de traducción alta. En este caso, el elemento 3'-UTR que distingue la molécula de ácido nucleico sujeto de la molécula de ácido nucleico de referencia se dice que proporciona una alta eficiencia de traducción (a la molécula de ácido nucleico sujeto). En otras palabras, la alta eficiencia de traducción se dice que es “proporcionada” por el elemento 3'-UTR específico que está presente en la molécula de ácido nucleico sujeto pero no en la molécula de ácido nucleico de referencia; y la molécula de ácido nucleico sujeto (o la molécula de ácido nucleico artificial) que comprende este 3'-UTR y al menos un ORF se dice que “se caracteriza por” una alta eficiencia de traducción.
Vacuna: Una vacuna se entiende típicamente como un material profiláctico terapéutico que proporciona al menos un antígeno, preferentemente un inmunógeno. El antígeno o inmunógeno se puede derivar de cualquier material que sea adecuado para la vacunación. Por ejemplo, el antígeno o inmunógeno se puede derivar de un patógeno, tal como de bacterias o partículas virales, etc., o de un tejido tumoral o canceroso. El antígeno o inmunógeno estimula el sistema inmunitario adaptivo del cuerpo para proporcionar una respuesta inmune adaptiva.
Vector: El término “vector” se refiere a una molécula de ácido nucleico, preferentemente a una molécula de ácido nucleico artificial. Un vector en el contexto de la presente invención es adecuado para incorporar o alojar una secuencia de ácido nucleico deseada, tal como una secuencia de ácido nucleico que comprende un marco de lectura abierto. Estos vectores pueden ser vectoies de almacenamiento, vectores de expresión, vectores de clonación, vectores de transferencia, etc. Un vector de almacenamiento es un vector que permite el almacenamiento conveniente de una molécula de ácido nucleico, por ejemplo de una molécula de ARNm. Así, el vector puede comprender una secuencia que corresponde, por ejemplo, a una secuencia de ARNm deseada o a parte de la misma, tal como una secuencia que se corresponde con un marco de lectura abierto y la 3'-UTR y/o la 5'-UTR de un ARNm. Se puede emplear un vector de expresión para la producción de productos de expresión, tales como ARN, por ejemplo ARNm, o péptidos, polipéptidos o proteínas. Por ejemplo, un vector de expresión puede comprender las secuencias necesarias para la transcripción de un tramo de secuencia del vector, tal como una secuencia promotora, por ejemplo una secuencia promotora de ARN polimerasa. Un vector de clonación es típicamente un vector que contiene un sitio de clonación, el cual se puede utilizar para incorporar las secuencias de ácido nucleico en el vector. Un vector de clonación puede ser, por ejemplo, un vector plásmido o un vector bacteriófago. Un vector de transferencia puede ser un vector para transferir moléculas de ácido nucleico a células u organismos, por ejemplo vectores virales. Un vector en el contexto de la presente invención puede ser, por ejemplo, un vector de ARN o un vector de ADN. Preferentemente, un vector es una molécula de ADN. Preferentemente, un vector en el sentido de la presente solicitud comprende un sitio de clonación, un marcador de selección, tal como un factor de resistencia a antibióticos, y una secuencia adecuada para la multiplicación del vector, tal como un origen de replicación. Preferentemente, un vector en el contexto de la presente solicitud es un vector plásmido.
Vehículo: Un vehículo se entiende típicamente como un material adecuado para almacenar, transportar y/o administrar un compuesto, tal como un compuesto farmacéuticamente activo. Puede ser, por ejemplo, un líquido fisiológicamente aceptable adecuado para almacenar, transportar y/o administrar un compuesto farmacéuticamente activo.
Región 3’ no traducida (3’-UTR): En general, el término “3'-UTR” se refiere a una parte de la molécula de ácido nucleico artificial localizada sitúa 3’ (es decir “aguas abajo”) de un marco de lectura abierto y que no es traducida en proteína. Típicamente, una 3’-UTR es la parte de un ARNm que se sitúa entre la región de codificación de proteína (marco de lectura abierto (ORF) o secuencia de codificación (CDS)) y la secuencia poli(A) del ARNm. El contexto de la invención, el término 3’-UTR también puede comprender elementos que no se codifican en la plantilla a partir de la cual se transcribe un ARN, sino que se añaden después de la transcripción, durante la maduración, por ejemplo una secuencia poli(A). Una 3’-UTR del ARNm no se traduce en una secuencia de aminoácidos. En general, la secuencia 3’-UTR es codificada por el gen que se transcribe en el ARNm respectivo durante el proceso de expresión génica. La secuencia genómica primero se transcribe en el ARNm prematuro, que comprende intrones opcionales. El ARNm prematuro después es procesado adicionalmente en ARNm en un proceso de maduración. Este proceso de maduración comprende los pasos de cap 5’, empalme de ARNm prematuro para escindir intrones opcionales y modificaciones del extremo 3', tal como poliadenilación del extremo 3' del ARNm prematuro y escisiones de endo- o exo-nucleasas opcionales, etc. En el contexto de la presente invención, una 3'-UTR corresponde a la secuencia de un ARNm maduro dispuesta entre el codón de detección de la región de codificación de la proteína, preferentemente inmediatamente 3' al codón de detección de la región de codificación de proteína, y la secuencia poli(A) del ARNm. El término “corresponde a” significa que la secuencia 3'-UTR puede ser una secuencia de ARN, tal como en la secuencia ARNm utilizada para definir la secuencia 3'-UTR, o una secuencia de ADN que corresponde a la secuencia de ARN. En el contexto de la presente invención, el término “una 3'-UTR de un gen” es la secuencia que corresponde a la 3'-UTR del ARNm maduro derivado de este gen, es decir, el ARNm obtenido por transcripción del gen y maduración del ARNm prematuro. El término “3'-UTR de un gen” abarca la secuencia de ADN y la secuencia de ARN (tanto la de hebra sentido como la anti-sentido y ambas maduras e inmaduras) de la 3'-UTR. Preferentemente, las 3'-UTR tienen una longitud de más de 20, 30, 40 o 50 nucleótidos.
Región 5’ no traducida (5’-UTR): En general, el término “5'-UTR” se refiere a una parte de la molécula de ácido nucleico artificial localizada 5' (es decir “aguas arriba”) de un marco de lectura abierto y que no se traduce en la proteína. Una 5'-UTR se entiende típicamente como una sección particular del ARN mensajero (ARNm) dispuesta 5' del marco de lectura abierto del ARNm. Típicamente, la 5'-UTR comienza con el sitio de inicio transcripcional y termina con un nucleótido antes del codón de parada del marco de lectura abierto. Preferentemente, las 5'-UTR tienen una longitud superior a 20, 30, 40 o 50 nucleótidos. La 5'-UTR puede comprender elementos para controlar la expresión génica, también llamados segmentos reguladores. Estos elementos reguladores pueden ser, por ejemplo, sitios de enlace ribos ómicos. La 5'-UTR se puede modificar pos-transcripcionalmente, por ejemplo mediante la adición de una cap 5'. Una 5'-UTR del ARNm no se traduce en una secuencia de aminoácidos. En general, la secuencia 5'-UTR es codificada por el gen que se transcribe en el ARNm respectivo durante el proceso de expresión génica. La secuencia genómica primero se transcribe en el ARNm prematuro, que comprende intrones opcionales. El ARNm prematuro entonces se procesa. Este proceso de maduración comprende los pasos de cap 5', empalme del ARNm prematuro para escindir los intrones opcionales y modificaciones del extremo 3', tal como poliadenilación del extremo 3' del ARNm prematuro y escisiones de endo- o exo-nucleasas opcionales, etc. En el contexto de la presente invención, una 5'-UTR corresponda a la secuencia de un ARNm maduro localizada entre el codón de inicio y, por ejemplo, la cap 5'. Preferentemente, la 5'-UTR corresponde a la secuencia que se extiende desde un nucleótido situado 3' a la cap 5', en especial del nucleótido situado inmediatamente 3' a la cap 5', a un nucleótido situado 5' al codón de inicio de la región de codificación de la proteína, preferentemente al nucleótido situado inmediatamente 5' al codón de inicio de la región de codificación de la proteína. El nucleótido situado inmediatamente 3' a la cap 5' de un ARNm maduro corresponde típicamente al sitio de inicio transcripcional. El término “corresponde a” significa que la secuencia 5'-UTR puede ser una secuencia de ARN, tal como en la secuencia ARNm utilizada para definir la secuencia 5'-UTR, o una secuencia de ADN que corresponde a la secuencia de ARN. En el contexto de la presente invención, el término “una 5'-UTR de un gen” es la secuencia que corresponde a la 5'-UTR del ARNm maduro derivado de ese gen, es decir el ARNm obtenido por transcripción del gen y maduración del ARNm prematuro. El término “5'-UTR de un gen” abarca la secuencia de ADN y la secuencia de ARN (ambas hebras sentido y anti-sentido y ambas maduras e inmaduras) de la 5'-UTR.
Tracto de oligopirimidina 5'-terminal (TOP): El tracto de oligopirimidina 5'-terminal (TOP) es típicamente un tramo de nucleótidos pirimidina situados en la región 5'-terminal de una molécula de ácido nucleico, tal como la región 5'-terminal de ciertas moléculas de ARNm o la región 5'-terminal de una entidad funcional, por ejemplo la región transcrita de ciertos genes. La secuencia comienza con una citidina, que normalmente corresponde al sitio de inicio transcripcional, y es seguida por un tramo de normalmente aproximadamente 3 a 30 nucleótidos pirimidina. Por ejemplo, el TOP puede comprender 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 o aún más nucleótidos. El tramo de pirimidina, y por ello el 5'-TOP, termina en un nucleótido 5' al primer nucleótido purina situado aguas abajo del TOP. Con frecuencia, al ARN mensajero que contiene un tracto de oligopirimidina 5'-terminal se le denomina ARNm TOP. Por consiguiente, los genes que proporcionan estos ARN mensajeros son referidos como genes TOP. Las secuencias TOP se han encontrado, por ejemplo, en genes y ARNm que codifican factores de alargamiento y péptidos y proteínas ribosómicos.
Motivo TOP: En el contexto de la presente invención, un motivo TOP es una secuencia de ácido nucleico que corresponde a un 5'-TOP como se ha definido anteriormente. Así, un motivo TOP en el contexto de la presente invención preferentemente es un tramo de nucleótidos pirimidina con una longitud de 3-30 nucleótidos. Preferentemente, el motivo TOP consiste en al menos 3 nucleótidos pirimidina, de manera preferente al menos 4 nucleótidos pirimidina, de manera especialmente preferente al menos 5 nucleótidos pirimidina, de manera más preferente al menos 6 nucleótidos, de manera más preferente al menos 7 nucleótidos, de manera mucho más preferente al menos 8 nucleótidos de pirimidina, donde el tramo de nucleótidos pirimidina preferentemente comienza en su extremo 5' con un nucleótido citosina. En los genes TOP y los ARNm TOP, preferentemente el motivo TOP comienza en su extremo 5' con el sitio de inicio transcripcional y termina con un nucleótido 5' al primer residuo purina en el gen o ARNm. Un motivo TOP en el sentido de la presente invención preferentemente se localiza en el extremo 5' de una secuencia que representa una 5'-UTR o en el extremo 5' de una secuencia que codifica para una 5'-UTR. Así, preferentemente, un tramo de 3 o más nucleótidos pirimidina se denomina “motivo TOP” en el sentido de la presente invención si este tramo está en el extremo 5' de una secuencia respectiva, tal como la molécula de ácido nucleico artificial, el elemento 5'-UTR de la molécula de ácido nucleico artificial o la secuencia de ácido nucleico que se deriva de la 5'-UTR de un gen TOP como se describe aquí. En otras palabras, un tramo de 3 o más nucleótidos pirimidina que no están en el extremo 5' de una 5'-UTR o de un elemento 5'-UTR sino en cualquier lugar dentro de una 5'-UTR o de un elemento 5'-UTR preferentemente no es referido como “motivo TOP”.
Gen TOP: Los genes TOP se caracterizan típicamente por la presencia de un tracto de oligopirimidina 5'-terminal. Además, la mayoría de los genes TOP se caracterizan por una regulación traduccional asociada al crecimiento. Sin embargo, también son conocidos genes TOP con una regulación traduccional específica de tejido. Como se ha definido anteriormente, la 5'-UTR de un gen TOP corresponde a la secuencia de una 5'-UTR de un ARNm maduro derivado de un gen TOP, que se extiende preferentemente desde el nucleótido situado 3' a la cap 5' al nucleótido situado 5' al codón de inicio. Una 5'-UTR de un gen TOP no comprende típicamente cualquiera de los codones de inicio, preferentemente ningún AUG aguas arriba (uAUG) o marcos de lectura abiertos aguas arriba (uORF). En este punto, los AUG aguas arriba y los marcos de lectura abiertos aguas arriba se entienden típicamente como AUG y marcos de lectura abiertos presentes 5' del codón de inicio (AUG) del marco de lectura abierto a ser traducido. En general, las 5'-UTR de los genes TOP son más bien cortas. La longitud de las 5'-UTR de los genes TOP pueden variar entre 20 nucleótidos y 500 nucleótidos y son típicamente inferiores a aproximadamente 200 nucleótidos, preferentemente inferiores a aproximadamente 150 nucleótidos, con especial preferencia inferiores a aproximadamente 100 nucleótidos. Ejemplos de 5'-UTR de los genes TOP en el sentido de la presente invención son las secuencias de ácido nucleico que se extienden desde el nucleótido en la posición 5 al nucleótido situado inmediatamente 5' al codón de inicio (por ejemplo ATG) en las secuencias de acuerdo con las SEQ ID NO.: 1-1.363 de la solicitud de patente WO2013/143700, cuya descripción se cita aquí. En este contexto, un fragmento particularmente preferido de una 5'-UTR de un gen TOP es una 5'-UTR de un gen TOP que carece del motivo 5'-TOP. Los términos “5'-UTR de un gen TOP “ o “5'-UTR TOP” preferentemente se refieren a la 5'-UTR de un gen TOP de origen natural. Un ejemplo preferente es el representado por la SEQ ID NO: 208 (5'-UTR de la proteína ribosómica humana grande 32 que carece del tracto de oligopirimidina 5' terminal); que corresponde a la SEQ ID NO. 1.368 de la solicitud de patente WO2013/143700).
Tipo natural, por ejemplo molécula de ácido nucleico de tipo natural: El término “tipo natural” se puede entender como una secuencia que está presente en naturaleza. Una molécula de ácido nucleico de tipo natural se puede entender típicamente como una molécula de ácido nucleico, por ejemplo ADN o ARN, que está presente naturalmente. En otras palabras, una molécula de ácido nucleico artificial se puede entender como una molécula de ácido nucleico natural. Esta molécula de ácido nucleico puede ser natural debido a su secuencia individual (que está presente naturalmente) y/o debido a otras modificaciones, por ejemplo modificaciones estructurales de nucleótidos que está presentes naturalmente. Una molécula de ácido nucleico de tipo natural puede ser una molécula de ADN, una molécula de ARN o una molécula híbrida, que comprende porciones de ADN y ARN. En este punto, el término “tipo natural” se refiere a cualquier secuencia siempre y cuando esté presente en la naturaleza, su reflejo en las colecciones de secuencias públicamente accesibles, tal como el Instituto Nacional de Salud (NIH), proporciona una colección anotada públicamente accesible de secuencias de nucleótidos públicamente disponibles (“GenBank”, accesible a través del NCBI Entrez retieval system: http://www.ncbi.nlm.nih.gov), (Nucleic Acids Research, 2013; 41(D1):D36-42), incluyendo secuencias de tipo natural públicamente disponibles. A cada registro del GenBank se asigna un identificador constante único llamado número de acceso y aparece en la línea de ACCESO de un registro de GenBank; y los cambios en los datos de secuencia son rastreados por una extensión numérica entera del número de acceso que aparece en la línea VERSIÓN del registro de GenBank. Además, el término “molécula de ácido nucleico de tipo natural” no está limitado a “una molécula individual” sino, típicamente, se entiende que comprende un conjunto de moléculas idénticas. Por consiguiente, puede referirse a una pluralidad de moléculas idénticas contenidas en una alícuota.
DESCRIPCIÓN DETALLADA
La invención se refiere a una molécula de ácido nucleico artificial segú8n la reivindicación 1 que comprende al menos un marco de lectura abierto y al menos un elemento de región 3' no traducida (elemento 3'-UTR) y, opcionalmente, al menos un elemento de región 5' no traducida (elemento 5'-UTR), donde dicha molécula de ácido nucleico artificial se caracteriza por una alta eficiencia de traducción. A la eficiencia de traducción contribuye, al menos en parte, el elemento 5'-UTR o tanto el elemento 5'-UTR como el elemento 3'-UTR. La invención se refiere además al uso de esta molécula de ácido nucleico artificial en la terapia génica y/o la vacunación genética. Además, se describen nuevos elementos 3'-UTR y 5'-UTR.
En un primer aspecto, la presente invención, de acuerdo con su reivindicación 1, se refiere a una molécula de ácido nucleico artificial que comprende
a. al menos un marco de lectura abierto (ORF); y
b. al menos un elemento de región 3' no traducida (elemento 3'-UTR) que comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de secuencia de al menos el 90% con la secuencia de ácido nucleico según la SEQ ID NO: 164 o con su correspondiente secuencia de ARN,
donde el al menos un marco de lectura abierto es heterólogo a el al menos un elemento 3'-UTR,
donde dicha molécula de ácido nucleico artificial se caracteriza por una alta eficiencia de traducción, donde la eficiencia de traducción de la molécula de ácido nucleico artificial se compara con la eficiencia de traducción de una molécula de ácido nucleico de referencia,
donde la molécula de ácido nucleico de referencia es idéntica a la molécula de ácido nucleico artificial excepto por el elemento 3'-UTR, donde el elemento 3'-UTR de la molécula de ácido nucleico de referencia tiene la secuencia según la SEQ ID NO: 207 o la correspondiente secuencia de ARN,
donde la eficiencia de traducción de la molécula de ácido nucleico artificial y la eficiencia de traducción de la molécula de ácido nucleico de referencia se comparan por un método que comprende los siguientes pasos: i. transfectar células de mamífero con la molécula de ácido nucleico artificial y medir la cantidad de proteína expresada codificada por el ORF de la molécula de ácido nucleico artificial en un cierto instante de tiempo después de la transfección,
ii. transfectar células de mamífero con la molécula de ácido nucleico de referencia y medir la cantidad de proteína expresada codificada por el ORF de la molécula de ácido nucleico de referencia en el mismo instante de tiempo después de la transfección,
iii. calcular la proporción entre la cantidad de proteína expresada a partir de la molécula de ácido nucleico artificial y la cantidad de proteína expresada a partir de la molécula de ácido nucleico de referencia, donde la proporción calculada en iii. es > 1.
La molécula de ácido nucleico artificial de la invención puede diferir de otras moléculas de ácido nucleico (por ejemplo de tipo natural o artificiales) en que al menos un elemento 3'-UTR (preferentemente un elemento 3'-UTR) es reemplazado por al menos un elemento 3'-UTR no idéntico (preferentemente un elemento 3'-UTR) que comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de secuencia de al menos el 90% con la secuencia de ácido nucleico según la SEQ ID NO: 164 o con su correspondiente secuencia de ARN y, opcionalmente, en que al menos un elemento 5'-UTR (preferentemente un elemento 5'-UTR) es reemplazado por al menos un elemento 5'-UTR no idéntico (preferentemente un elemento 5'-UTR).
En general, el reemplazo de un elemento 3'-UTR (o al menos uno) u, opcionalmente, el reemplazo de uno (o al menos uno) elemento 5' UTR (en una molécula de ácido nucleico de partida o en una molécula de ácido nucleico de referencia) significa normalmente que una secuencia de al menos algunos nucleótidos de dicho elemento 3'-UTR o de dicho elemento 5'-UTR es reemplazada por una secuencia de ácido nucleico no idéntica. Preferentemente, cuando se reemplaza un elemento 5'-UTR, una secuencia continua de nucleótidos del elemento 5'-UTR es reemplazada por una secuencia continua no idéntica (elemento) de nucleótidos; y cuando se reemplaza un elemento 3'-UTR, una secuencia continua de nucleótidos del elemento 3'-UTR es reemplazada por una secuencia continua no idéntica (elemento) de nucleótidos. La secuencia continua de nucleótidos del elemento original (reemplazado) y del elemento de reemplazo puede ser, en cada caso, independientemente de cualquier longitud, tal como de 1 a más de 500 nucleótidos, de 20 a 500 nucleótidos, de 40 a 400 nucleótidos, de 60 a 300 nucleótidos, de 80 a 200 nucleótidos o de 100 a 150 nucleótidos. Cuando un elemento UTR (5'-o 3'-) es reemplazado, esto no significa necesariamente que todos los nucleótidos situados 5' al codón de inicio o todos los nucleótidos situados 3' al codón de parada se reemplacen. En realizaciones preferentes, se reemplaza una secuencia continua, que es un subconjunto de todos los nucleótidos situados 5' del codón de inicio o un subconjunto de todos los nucleótidos situados 3' del codón de parada, respectivamente. Ejemplos de esto se muestran en la Fig. 1B (5') y 1C (3'). Es posible reemplazar exactamente un elemento 5'-UTR conocido o un elemento 3'-UTR conocido presente en la secuencia de partida o de referencia. Por ejemplo, cuando un ácido nucleico (por ejemplo de referencia) comprende un elemento 5'-UTR que corresponde a la secuencia de acuerdo con la SEQ ID NO: 208; la molécula de ácido nucleico artificial de la presente invención se puede hacer reemplazando exactamente la secuencia continua completa de acuerdo con la SEQ ID NO: 208 por un elemento 5'-UTR continuo no idéntico de acuerdo con la presente invención, es decir un elemento 5'-UTR que proporciona una alta eficiencia de traducción. Alternativamente, es posible que un elemento UTR conocido no se reemplaza exactamente, por ejemplo se reemplaza una secuencia de ácido nucleico continua que comprende nucleótidos adicionales, es decir además del elemento UTR conocido, o por ejemplo se reemplaza solo una fracción (normalmente una fracción mayor, es decir del 90% de la longitud o más) de un elemento UTR conocido. Mientras que estas posibilidades se han ilustrado en este punto para el caso de elementos 5'-UTR, la misma posibilidad también existe para los elementos 3'-UTR. En otras palabras, el elemento UTR reemplazado no necesita estar confinado necesariamente por los límites exactos de un elemento UTR conocido. Estas posibilidades se ilustran adicionalmente, a modo ejemplo, en la Fig. 1B y Fig. 1C, respectivamente, en cada caso en comparación con la Fig. 1A. Del mismo modo, el elemento UTR de reemplazo no necesita estar confinado necesariamente por los límites exactos de un elemento UTR conocido.
Preferentemente, la molécula de ácido nucleico artificial de acuerdo con la presente invención no comprende una 3' -UTR (elemento) y/o una 5'-UTR (elemento) de la proteína ribosómica S6, de RPL36AL, de rps16 o de la proteína ribosómica L9. De manera más preferente, la molécula de ácido nucleico artificial de acuerdo con la presente invención no comprende una 3'-UTR (elemento) y/o una 5'-UTR (elemento) de la proteína ribosómica S6, de RPL36AL, de rps16 o de la proteína ribosómica L9 y el marco de lectura abierto de la molécula de ácido nucleico artificial de acuerdo con la presente invención no codifica para una proteína GFP. De manera aún más preferente, la molécula de ácido nucleico artificial de acuerdo con la presente invención no comprende una 3'-UTR (elemento) y/o una 5'-UTR (elemento) de la proteína ribosómica S6, de RPL36AL, de rps16 o de la proteína ribosómica L9 y el marco de lectura abierto de la molécula de ácido nucleico artificial de acuerdo con la presente invención no codifica para una proteína reporter, por ejemplo seleccionada del grupo consistente en proteínas de globina (particularmente beta-globina), proteína de luciferasa, proteínas GFP, proteínas de glucuronidasa (particularmente beta-glucuronidasa) o variantes de las mismas, por ejemplo variantes que tienen al menos un 70% de identidad de secuencia con una proteína globina, luciferasa, GFP o glucuronidasa.
El término “elemento 3'-UTR” se refiere a una secuencia de ácido nucleico que comprende o consiste en una secuencia de ácido nucleico que se deriva de una 3'-UTR o de una variante o un fragmento de una 3'-UTR. Preferentemente, un elemento “3'-UTR” se refiere a una secuencia de ácido nucleico que está comprendida por una 3'-UTR de una secuencia de ácido nucleico artificial, tal como un ARNm artificial. Por consiguiente, en el sentido de la presente invención, preferentemente un elemento 3'-UTR puede estar comprendido por la 3'-UTR de un ARNm, de manera preferente de un ARNm artificial, o un elemento 3'-UTR puede estar comprendido por la 3'-UTR de la plantilla de transcripción respectiva. Preferentemente, un elemento 3'-UTR es una secuencia de ácido nucleico que corresponde a la 3'-UTR de un ARNm, de manera preferente a la 3'-UTR de un ARNm artificial, tal como un ARNm obtenido por la transcripción de un constructo de vector genéticamente diseñado. De manera preferente, un elemento 3'-UTR en el sentido de la presente invención funciona como una 3'-UTR o codifica para una secuencia de nucleótidos que cumple la función de una 3'-UTR.
Por consiguiente, el término “elemento 5'-UTR” se refiere a una secuencia de ácido nucleico que comprende o consiste en una secuencia de ácido nucleico que se deriva de una 5'-UTR o de una variante o un fragmento de una 5'-UTR. Preferentemente, un “elemento 5'-UTR” se refiere a una secuencia de ácido nucleico que está comprendida por una 5'-UTR de una secuencia de ácido nucleico artificial, tal como un ARNm artificial. Por consiguiente, en el sentido de la presente invención, preferentemente un elemento 5'-UTR puede estar comprendido por la 5'-UTR de un ARNm, de manera preferente de un ARNm artificial, o un elemento 5'-UTR puede estar comprendido por la 5'-UTR de la plantilla de transcripción respectiva. Preferentemente, un elemento 5'-UTR es una secuencia de ácido nucleico que corresponde a la 5'-UTR de un ARNm, preferentemente a la 5'-UTR de un ARNm artificial, tal como un ARNm obtenido por la transcripción de un constructo de vector genéticamente modificado. De manera preferente, un elemento 5'-UTR en el sentido de la presente invención funciona como una 5'-UTR o codifica para una secuencia de nucleótidos que cumple la función de una 5'-UTR.
El elemento 3'-UTR y, opcionalmente el elemento 5'-UTR, en la molécula de ácido nucleico artificial de acuerdo con la presente invención proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial. Así, la molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender en particular:
- un elemento 3'-UTR tal como se define en la reivindicación 1 que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial,
- un elemento 3'-UTR tal como se define en la reivindicación 1 que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial y un elemento 5'-UTR que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial.
Preferentemente, la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende un elemento 3'-UTR tal como se define en la reivindicación 1 que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial y, opcionalmente, un elemento 5'-UTR que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial.
Preferentemente, la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende al menos un elemento 3'-UTR como se define en la reivindicación 1 y al menos un elemento 5'-UTR, es decir, al menos un elemento 3'-UTR como se define en la reivindicación 1 que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial y al menos un elemento 5'-UTR que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial.
Como se describe en detalle a continuación, dicho al menos un elemento 3'-UTR como se define en la reivindicación 1 que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial u, opcionalmente, dicho al menos un elemento 5'-UTR que proporciona una eficiencia de traducción a dicha molécula de ácido nucleico artificial se pueden seleccionar de elementos 3'-UTR de origen natural (preferentemente heterólogos) y elementos 5'-UTR (junto con elementos UTR de origen natural o elementos UTR de tipo natural) y de elementos 3'-UTR artificiales y elementos 5'-UTR artificiales (junto con elementos UTR artificiales). Los elementos UTR de tipo natural se pueden seleccionar del grupo que comprende elementos UTR de tipo natural publicados en la literatura y en las bases de datos públicamente accesibles, tales como GenBank (NCBI), y elementos UTR de tipo natural no previamente publicados. Éstos últimos pueden identificarse secuenciando los ARNm encontrados en células, preferentemente de mamífero. Usando este procedimiento, los presentes inventores identificaron varios elementos UTR de tipo natural no publicados previamente y en la presente descripción se proporcionan elementos UTR de este tipo. El término elemento UTR artificial no está particularmente limitado y puede referirse a cualquier secuencia de ácido nucleico no encontrado en la naturaleza, es decir no idéntica a un elemento UTR de tipo natural. En realizaciones preferentes, sin embargo, el elemento UTR artificial utilizado en la presente invención es una secuencia de ácido nucleico que muestra un cierto grado de identidad de secuencia con un elemento UTR de tipo natural, tal como de un 10 a un 99,9%, 20 a 99%, 30 a 98%, 40 a 97%, 50 a 96%, 60 a 95%, 70 a 90%. En realizaciones preferentes, la UTR artificial utilizada en la presente invención es idéntica a una UTR de tipo natural excepto porque uno o dos o tres o cuatro o cinco o más de cinco nucleótidos han sido sustituidos por el mismo número de nucleótidos (por ejemplo un nucleótido que se sustituye por otro nucleótido). Preferentemente, la sustitución de un nucleótido es una sustitución por el nucleótido complementario respectivo. Los elementos UTR artificiales preferentes corresponden a elementos UTR de tipo natural, excepto porque (i) algunos o todos los tripletes ATG en un elemento 5'-UTR de tipo natural (si está presente) se convierten en el triplete TAG; y/o (ii) los sitio(s) de escisión seleccionados para una enzima de restricción particular en un elemento 5'-UTR de tipo natural o en un elemento 3'-UTR de tipo natural (si está presente) se eliminan sustituyendo un nucleótido dentro del sitio de escisión para dicha enzima de restricción específica por el nucleótido complementario, eliminando así los sitios de escisión para dicha enzima de restricción específica. Normalmente es deseable esto último cuando un elemento UTR (por ejemplo de tipo natural) comprende un sitio de escisión para dicha enzima de restricción específica y cuando dicha enzima de restricción particular se (se planea que se) utiliza en pasos de clonación posteriores. Dado que esta escisión interna de los elementos 5'-UTR y 3'-UTR no es deseable, se puede generar un elemento UTR artificial donde se elimina el sitio de escisión de restricción para dicha enzima de restricción específica. Esta sustitución se puede hacer por cualquier método adecuado conocido por el experto en la técnica, por ejemplo, mediante el uso de cebadores modificados por PCR.
Opcionalmente, la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende al menos un elemento 3'-UTR tal como se define en la reivindicación 1 y al menos un elemento 5'-UTR; es decir, al menos un elemento 3'-UTR tal como se define en la reivindicación 1 que prolonga y/o incrementa la producción de proteínas a partir de dicha molécula de ácido nucleico artificial y al menos un elemento 5'-UTR que prolonga y/o incrementa la producción de proteínas a partir de dicha molécula de ácido nucleico artificial.
Producción de proteína: Ensayo para determinar si la producción de proteína se prolonga y/o se incrementa
“Prolongación y/o incremento de la producción de proteínas a partir de dicha molécula de ácido nucleico artificial” en general se refiere a la cantidad de proteína producida a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención con el elemento 3'-UTR respectivo y, opcionalmente, con el elemento 5'-UTR en comparación con la cantidad de proteína producida a partir de un ácido nucleico de referencia tal como se define en la reivindicación 1.
En particular, el al menos un elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención prolonga la producción de proteínas a partir de la molécula de ácido nucleico artificial según la presente invención, por ejemplo a partir de un ARNm de acuerdo con la presente invención, en comparación con la molécula de ácido nucleico respectiva de referencia tal como se define en la reivindicación 1.
En particular, el al menos un elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención incrementa la producción de proteínas, en particular la expresión de la proteína y/o la producción de proteína total, a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención, por ejemplo a partir de un ARNm de acuerdo con la presente invención, en comparación con la molécula de ácido nucleico respectiva de referencia tal como se define en la reivindicación 1.
Preferentemente, el al menos un elemento 3'-UTR y, opcionalmente el al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención no influye negativamente en la eficiencia de traducción de un ácido nucleico en comparación con la eficiencia de traducción de la molécula de ácido nucleico respectiva de referencia tal como se define en la reivindicación 1.
Los términos “molécula de ácido nucleico respectiva” o “molécula de ácido nucleico de referencia” como se utilizan aquí significan que, excepto por las diferentes 3'-UTR, la molécula de ácido nucleico de referencia es idéntica a la molécula de ácido nucleico artificial de la invención que comprende el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR.
Con el fin de evaluar la producción de proteínas in vivo o in vitro como se define aquí (es decir in vitro en referencia a células (“vivas”) y/o tejidos, incluyendo tejido de un sujeto vivo; células de líneas celulares particulares, células primarias, células de tejido o de un sujeto, preferentemente células de mamífero, por ejemplo células humanas y de ratón y con especial preferencia líneas celulares humanas HeLa, HEPG2 y U-937 y líneas celulares de ratón NIH3T3, JAWSII y L929, además las células primarias son particularmente preferentes, en realizaciones preferentes particulares fibroblastos dérmicos humanos (HDF)) por la molécula de ácido nucleico artificial inventiva, se determina la expresión de la proteína codificada después de la inyección/transfección de la molécula de ácido nucleico artificial inventiva en células/tejido diana y se compara con la expresión de proteína inducida por el ácido nucleico de referencia. En la técnica son conocidos métodos cuantitativos para determinar la expresión de proteínas (por ejemplo, Western-Blot, FACS, ELISA, espectrometría de masas). Particularmente útil en este contexto es la determinación de la expresión de proteínas reportera tipo luciferasa, proteína fluorescente Verde (GFP) o fosfatasa alcalina secretada (SEAP). Así, se introduce un ácido nucleico artificial de acuerdo con la invención o un ácido nucleico de referencia en el tejido o la célula diana, por ejemplo vía transfección o inyección, preferentemente en un sistema de expresión mamífero, tal como en células de mamífero, por ejemplo células HDF, L929, HepG2 y/o Hela. Varias horas o varios días (por ejemplo 6, 12, 24, 48 o 72 horas) tras el inicio de la expresión o tras la introducción de la molécula de ácido nucleico, se recoge una muestra de células diana se recolecta y se mide por FACS y/o se lisa. Después, se pueden emplear los lisados para detectar la proteína expresada (y así determinar la eficiencia de expresión de la proteína) utilizando diversos métodos, por ejemplo Western-Blot, FACS, ELISA, espectrometría de masas o por fluorescencia o medida de la luminiscencia.
Por tanto, si la expresión de proteína a partir de una molécula de ácido nucleico artificial de acuerdo con la invención se compara con la expresión de proteína de una molécula de ácido nucleico de referencia en un momento de tiempo específico (por ejemplo 6, 12, 24, 48 o 72 horas tras el inicio de la expresión o tras la introducción de la molécula de ácido nucleico), introduciéndose ambas moléculas de ácido nucleico por separado en el tejido/células diana, se recoge una muestra de tejido/células después de un momento de tiempo específico, se preparan los lisados de proteína de acuerdo con el protocolo particular ajustado al método de detección particular (por ejemplo Western Blot, ELISA, medida de fluorescencia o de luminiscencia, etc., como es conocido en la técnica) y se detecta la proteína por el método de detección elegido. Como alternativa a la medida de la cantidad de proteína expresada en los lisados celulares - o, además de la medida de la cantidad de proteína en los lisados celulares antes de la lisis de las células recolectadas o utilizando una alícuota en paralelo - se puede determinar también la cantidad de proteína empleando un análisis FACS.
El término “prolongar la producción de proteína” a partir de una molécula de ácido nucleico artificial, tal como un ARNm artificial, preferentemente significa que la producción de proteínas a partir de la molécula de ácido nucleico artificial, tal como el ARNm artificial, se prolonga en comparación con la producción de proteína a partir de una molécula de ácido nucleico de referencia, tal como un ARNm de referencia, por ejemplo comprendiendo una 3'-UTR de referencia, preferentemente en un sistema de expresión mamífero, tal como células HDF, L929, HEP2G o HeLa. Así, la proteína producida a partir de la molécula de ácido nucleico artificial, tal como el ARNm artificial, es observable para un período de tiempo más prolongado que el que se puede observar para una proteína producida a partir de una molécula de ácido nucleico de referencia. En otras palabras, la cantidad de proteína producida a partir de la molécula de ácido nucleico artificial, tal como el ARNm artificial, medida en un punto en el tiempo posterior a la transfección, por ejemplo 48 horas o 72 horas después, es más grande que la cantidad de proteína producida a partir de una molécula de ácido nucleico de referencia, tal como un ARNm de referencia, en un punto de tiempo posterior correspondiente. Este “punto posterior en el tiempo” puede ser, por ejemplo, cualquier tiempo más allá de 24 horas tras el inicio de la expresión, tal como tras la transfección de la molécula de ácido nucleico, por ejemplo 36, 48, 60, 72, 96 horas tras el inicio de la expresión, es decir después de la transfección. Además, para el mismo ácido nucleico, la cantidad de proteína producida en el punto de tiempo posterior se puede normalizar a la cantidad producida en el punto de tiempo anterior (de referencia), por ejemplo se puede expresar la cantidad de proteína en un punto posterior en el tiempo como porcentaje de la cantidad de proteína 24 horas después de la transfección.
Preferentemente, este efecto de prolongar la producción de proteína se determina (i) midiendo la cantidad de proteína, por ejemplo obtenida por la expresión de una proteína reporter codificada tal como luciferasa, preferentemente en un sistema de expresión mamífero, tal como en células HDF, L929, HEP2G o HeLa, con el tiempo, (ii) determinando la cantidad de proteína observada en un punto de tiempo “de referencia” t i , por ejemplo t i = 24 h, después de la transfección y ajustando esta cantidad de proteína al 100%, (iii) determinando la cantidad de proteína observada en uno o más puntos posteriores de tiempo t2, t3, etc., por ejemplo t2 = 48 h y t3 = 72 h, después de la transfección y calculando la cantidad relativa de proteína observada en un punto de tiempo posterior como porcentaje de la cantidad de proteína en un punto de tiempo t1. Por ejemplo, para una proteína que se expresa en t i en una cantidad de “80”, en t2 en una cantidad de “20” y en t3 en una cantidad de “10”, la cantidad relativa de proteína en t2 sería 25% y en t3 12,5%. Estas cantidades relativas en un punto de tiempo posterior entonces se pueden comparar en un paso (iv) con la cantidad de proteína relativa para puntos de tiempo correspondientes para una molécula de ácido nucleico de referencia como se define en la reivindicación 1. Comparando la cantidad de proteína relativa producida a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención con la cantidad de proteína relativa producida a partir de la molécula de ácido nucleico de referencia como se define en la reivindicación 1 se puede determinar el factor al cual se prolonga la producción de proteína a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención en comparación con la producción de proteína a partir de la molécula de ácido nucleico de referencia.
Preferentemente, el al menos un elemento 3'- y, opcionalmente, el 5'-UTR en la molécula de ácido nucleico artificial de acuerdo con la invención prolonga la producción de proteínas a partir de dicha molécula de ácido nucleico artificial al menos 1,2 veces, preferentemente al menos 1,5 veces, de manera más preferente al menos 2 veces, aún con mayor preferencia al menos 2,5 veces, en comparación con la producción de proteínas a partir de una molécula de ácido nucleico de referencia como se define en la reivindicación 1. En otras palabras, la cantidad (relativa) de proteína producida a partir de la molécula de ácido nucleico artificial de acuerdo con la invención en un cierto punto del tiempo posterior como se describe anteriormente se incrementa en un factor de al menos 1,2, preferentemente en al menos 1,5, de manera más preferente en al menos 2, con mayor preferencia en al menos 2,5, en comparación con la cantidad (relativa) de proteína producida a partir de una molécula de ácido nucleico de referencia tal como se define en la reivindicación 1 para el mismo punto de tiempo posterior.
Alternativamente, el efecto de prolongar la producción de proteínas también se puede determinar (i) midiendo la cantidad de proteína, por ejemplo obtenida por la expresión de una proteína reporter codificada, tal como luciferasa, preferentemente en un sistema de expresión mamífero, tal como células HDF, L929, HEP2G o HeLa, con el tiempo, (ii) determinando el punto de tiempo en el cual la cantidad de proteína está por debajo de la cantidad de proteína observada, por ejemplo 1, 2, 3, 4, 5 o 6 horas tras el inicio de la expresión, por ejemplo 1, 2, 3, 4, 5 o 6 horas tras el inicio de la transfección, de la molécula de ácido nucleico artificial, y (iii) comparando el punto de tiempo en el que la cantidad de proteínas está por debajo de la cantidad de proteína observada en 1, 2, 3, 4, 5 o 6 horas tras el inicio de la expresión con el punto de tiempo determinado para una molécula de ácido nucleico de referencia tal como se define en la reivindicación 1.
Por ejemplo, la producción de proteína a partir de la molécula de ácido nucleico artificial, tal como el ARNm artificial, en una cantidad que es al menos la cantidad observada en la fase inicial de la expresión, tal como 1, 2, 3, 4, 5 o 6 horas tras el inicio de la expresión, tal como tras la transfección de la molécula de ácido nucleico, se prolonga en al menos aproximadamente 5 horas, preferentemente en al menos aproximadamente 10 horas, de manera más preferente en al menos aproximadamente 24 horas, en comparación con la producción de proteína a partir de una molécula de ácido nucleico de referencia, tal como un ARNm de referencia, en un sistema de expresión mamífero, tal como en células de mamífero, por ejemplo en células HDF, L929, HEP2G o HeLa. Así, la molécula de ácido nucleico artificial de acuerdo con la presente invención preferentemente permite una producción de proteínas prolongada en una cantidad que es al menos la cantidad observada en la fase inicial de la expresión, tal como 1, 2, 3, 4, 5 o 6 horas tras el inicio de la expresión, tal como tras la transfección, en al menos aproximadamente 5 horas, preferentemente en al menos aproximadamente 10 horas, de manera más preferente en al menos aproximadamente 24 horas, en comparación con una molécula de ácido nucleico de referencia como se define en la reivindicación 1.
En realizaciones preferentes, el período de producción de proteína a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención se extiende al menos 1,2 veces, preferentemente al menos 1,5 veces, de manera más preferente al menos 2 veces, aún más preferentemente al menos 2,5 veces, en comparación con la producción de proteína a partir de una molécula de ácido nucleico de referencia como se define en la reivindicación 1.
Preferentemente, este efecto de prolongar la producción de proteína se consigue mientras que la cantidad total de proteína producida a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención, por ejemplo dentro de un lapso de tiempo de 48 o 72 horas, corresponde al menos a la cantidad de proteína producida a partir de una molécula de ácido nucleico de referencia como se define en la reivindicación 1, tal como una 3'-UTR y/o 5'-UTR de origen natural con el ORF de la molécula de ácido nucleico artificial. De esta manera, la presente invención proporciona una molécula de ácido nucleico artificial que permite una producción de proteínas prolongada en un sistema de expresión mamífero, tal como en células de mamífero, por ejemplo en células HDF, L929, HEP2G o HeLa, se ha especificado anteriormente, donde la cantidad total de proteína producida a partir de dicha molécula de ácido nucleico artificial, por ejemplo en un lapso de tiempo de 48 o 72 horas, es al menos la cantidad total de proteína producida, por ejemplo dentro de dicho lapso de tiempo, a partir de una molécula de ácido nucleico de referencia como la definida en la reivindicación 1, tal como una 3'- y/o 5'-UTR de origen natural con el ORF de la molécula de ácido nucleico artificial.
Por otra parte, el término “expresión de proteína prolongada” también incluye “expresión de proteína estabilizada”, con lo cual “expresión de proteína estabilizada” preferentemente significa que hay una producción de proteínas más uniforme a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención durante un período de tiempo determinado, tal como durante 24 horas, de manera más preferente durante 48 horas, con mayor preferencia durante 72 horas, en comparación con una molécula de ácido nucleico de referencia, por ejemplo un ARNm que comprende una 3'-UTR de referencia como se define en la reivindicación 1.
Por consiguiente, el nivel de producción de proteína, por ejemplo en un sistema mamífero, a partir de la molécula de ácido nucleico artificial que comprende un elemento 3'- y, opcionalmente un 5'-UTR, de acuerdo con la presente invención, por ejemplo a partir de un ARNm de acuerdo con el presente invención, preferentemente no cae al grado observado para una molécula de ácido nucleico de referencia, tal como un ARNm de referencia como se ha descrito anteriormente. Para evaluar a qué grado cae la producción de proteína a partir de una molécula de ácido nucleico específica, por ejemplo la cantidad de una proteína (codificada por el ORF respectivo) observada 24 horas después del inicio de la expresión, por ejemplo 24 horas pos-transfección, a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención en una célula, tal como una célula de mamífero, se puede comparar con la cantidad de proteína observada 48 horas después del inicio de la expresión, por ejemplo 48 horas pos-transfección. Así, la relación entre la cantidad de proteína codificada por el ORF de la molécula de ácido nucleico artificial de acuerdo con la presente invención, tal como la cantidad de proteína reporter, por ejemplo luciferasa, observada en un punto de tiempo posterior, por ejemplo 48 horas, pos-inicio de la expresión, por ejemplo pos-transfección, y la cantidad de proteína observada en un punto de tiempo anterior, por ejemplo 24 horas pos-inicio de la expresión, por ejemplo pos-transfección, preferentemente es más alta que la relación correspondiente (incluyendo los mismos puntos de tiempo) para una molécula de ácido nucleico de referencia como se define en la reivindicación 1.
Preferentemente, la relación entre la cantidad de proteína codificada por el ORF de la molécula de ácido nucleico artificial de acuerdo con la presente invención, tal como la cantidad de una proteína reporter, por ejemplo luciferasa, observada en un punto de tiempo posterior, por ejemplo 48 horas pos-inicio de expresión, por ejemplo pos-transfección, y la cantidad de proteína observada en un punto de tiempo anterior, por ejemplo 24 horas pos-inicio de la expresión, por ejemplo postransfección, preferentemente es al menos 0,2, de manera más preferente al menos aproximadamente 0,3, aún más preferentemente al menos aproximadamente 0,4, con mayor preferencia al menos aproximadamente 0,5 y con particular preferencia al menos aproximadamente 0,7. Para una molécula de ácido nucleico de referencia respectiva, por ejemplo un ARNm que comprende una 3'- y, opcionalmente una 5'-UTR, de referencia como se define en la reivindicación 1, dicha relación puede estar, por ejemplo, entre aproximadamente 0,05 y aproximadamente 0,35.
Así, la presente invención proporciona una molécula de ácido nucleico artificial que comprende un ORF y un elemento 3'-y, opcionalmente, un elemento 5'-UTR como se describe anteriormente donde la relación entre la cantidad de proteína, por ejemplo la cantidad de luciferasa, observada 48 horas después del inicio de la expresión y la cantidad de proteína observada 24 horas después del inicio de la expresión, preferentemente en un sistema de expresión mamífero, tal como en células de mamífero, por ejemplo en células HDF o en células HeLa, preferentemente es al menos 0,2, de manera más preferente al menos aproximadamente 0,3, de manera más preferente al menos aproximadamente 0,4, aún más preferentemente al menos aproximadamente 0,5, con mayor preferencia al menos aproximadamente 0,6 y con particular preferencia al menos aproximadamente 0,7. Por tanto, preferentemente, la cantidad total de proteína producida a partir de dicha molécula de ácido nucleico artificial, por ejemplo en un lapso de tiempo de 48 horas, corresponde al menos a la cantidad total de proteína producida, por ejemplo dentro del lapso de tiempo, a partir de una molécula de ácido nucleico de referencia como se define en la reivindicación 1, tal como una 3'-UTR y/o 5'-UTR de origen natural con el ORF de la molécula de ácido nucleico artificial.
De manera preferente, la presente invención proporciona una molécula de ácido nucleico artificial que comprende un ORF y un elemento 3'-UTR y, opcionalmente un elemento 5'-UTR, como se describe anteriormente donde la relación entre la cantidad de proteína, por ejemplo la cantidad de luciferasa, observada 72 horas después del inicio de la expresión y la cantidad de proteína observada 24 horas después del inicio de la expresión, preferentemente en un sistema de expresión mamífero, tal como en células de mamífero, por ejemplo en células HeLa o HDF, preferentemente está por encima de aproximadamente 0,05, de manera más preferente por encima de aproximadamente 0,1, más preferentemente por encima de aproximadamente 0,2, aún con mayor preferencia por encima de aproximadamente 0,3, donde preferentemente la cantidad total de proteína producida a partir de la molécula de ácido nucleico artificial, por ejemplo en un lapso de tiempo de 72 horas, es al menos la cantidad total de proteína producida, por ejemplo dentro del lapso de tiempo, a partir de una molécula de ácido nucleico de referencia, tal como una 3'- y/o 5'-UTR de origen natural con el ORF de la molécula de ácido nucleico artificial.
“Expresión de proteína incrementada” o “expresión de proteína mejorada” en el contexto de la presente invención significa preferentemente una expresión de proteína incrementada/mejorada en un punto de tiempo después del inicio de la expresión o una cantidad total incrementada/mejorada de la proteína expresada comparada con la expresión inducida por una molécula de ácido nucleico de referencia. Así, el nivel de proteína observado en un cierto punto del tiempo después del inicio de la expresión, por ejemplo después de la transfección, a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención, por ejemplo después de la transfección de un ARNm de acuerdo con la presente invención, por ejemplo 6, 12, 24, 48 o 72 horas pos-transfección, preferentemente es mayor que el nivel de proteína observado en el mismo punto del tiempo después del inicio de la expresión, por ejemplo después de la transfección, a partir de una molécula de ácido nucleico de referencia, tal como un ARNm de referencia como se define en la reivindicación 1. En una realización preferente, la cantidad máxima de proteína (determinada por ejemplo por la actividad de la proteína o la masa) expresada a partir de la molécula de ácido nucleico artificial se incrementa con respecto a la cantidad de proteína expresada a partir de un ácido nucleico de referencia como se define en la reivindicación 1. Preferentemente, los niveles de expresión pico se alcanzan dentro de las 48 horas, de manera más preferente dentro de las 24 horas y aún más preferentemente dentro de las 12 horas después de, por ejemplo, la transfección.
Preferentemente, el término “producción de proteína total incrementada” o “producción de proteína total mejorada” a partir de una molécula de ácido nucleico artificial de acuerdo con la invención se refiere a una producción de proteínas incrementada/mejorada durante un lapso de tiempo en el que la proteína se produce a partir de una molécula de ácido nucleico artificial, por ejemplo, 48 horas o 72 horas, de manera preferente en un sistema de expresión mamífero, tal como en células de mamífero, por ejemplo células HDF, L929, HEP2G o HeLa, en comparación con una molécula de ácido nucleico de referencia como la definida en la reivindicación 1. De acuerdo con una realización preferente, la cantidad acumulativa de proteína expresada con el tiempo se incrementa cuando se utiliza la molécula de ácido nucleico artificial de acuerdo con la invención.
La cantidad total de proteína para un período de tiempo específico se puede determinar (i) recogiendo el tejido o las células en varios momentos de tiempo después de introducir la molécula de ácido nucleico artificial (por ejemplo 6, 12, 24, 48 y 72 horas tras el inicio de la expresión o tras la introducción de la molécula de ácido nucleico) y determinándose la cantidad de proteína por momento temporal como se ha explicado anteriormente. Con el fin de fin de calcular la cantidad de proteína acumulada, se puede utilizar un método matemático para determinar la cantidad total de proteína, por ejemplo se puede determinar el área bajo la curva (AUC) de acuerdo con la siguiente fórmula:
b
AUC = j f [ x ) d ( x )
a
Con el fin de calcular el área bajo la curva para una cantidad total de proteína, se calcula la integral de la ecuación de la curva de expresión a partir de cada punto de extremo (a y b).
Así, “producción de proteína total” preferentemente se refiere al área bajo la curva (AUC) que representa la producción de proteína en el tiempo.
Preferentemente, el al menos un elemento 3'- y, opcionalmente, el elemento 5'-UTR de acuerdo con la presente invención incrementa la producción de proteína a partir de la molécula de ácido nucleico artificial en al menos 1,5 veces, de manera preferente al menos en 2 veces, de manera más preferente en al menos 2,5 veces, en comparación con la producción de proteína de una molécula de ácido nucleico de referencia como se define en la reivindicación 1. En otras palabras, la cantidad total de proteína producida a partir de la de molécula de ácido nucleico artificial de acuerdo con la invención en un cierto momento del tiempo, por ejemplo 48 horas o 72 horas tras el inicio de la expresión, por ejemplo pos-transfección, se incrementa en un factor de al menos 1,5, preferentemente de al menos 2, de manera más preferente en al menos 2,5, en comparación con la cantidad (relativa) de proteína producida a partir de una molécula de ácido nucleico de referencia como se define en la reivindicación 1 para el momento de tiempo posterior correspondiente.
El ARNm y/o la producción de proteína que prolonga el efecto y eficiencia y/o la producción de proteína que incrementa el efecto y la eficiencia de variantes, fragmentos y/o fragmentos de variantes de la 3'-UTR y opcionalmente de la 5'-UTR, así como la producción de ARNm y/o proteína que prolonga el efecto y la eficiencia y/o la producción de proteína que incrementa el efecto y la eficiencia del al menos un elemento 3'-UTR y, opcionalmente, del al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención se puede determinar por cualquier método adecuado para este propósito conocido por el experto.
Por ejemplo, se pueden generar moléculas de ARNm artificiales que comprenden una secuencia de codificación/marco de lectura abierto (ORF) para una proteína reporter, tal como luciferasa, y un elemento 3'-UTR de acuerdo con la presente invención, es decir que prolonga y/o incrementa la producción de proteína a partir de dicha molécula ARNm artificial. Además, esta molécula de ARNm inventiva puede comprender un elemento 5'-UTR de acuerdo con la presente invención, es decir que prolonga y/o aumenta la producción de proteína a partir de dicha molécula ARNm artificial, ningún elemento 5'-UTR o un elemento 5'-UTR que no es según la presente invención, por ejemplo un 5'-UTR de referencia. Por consiguiente, se pueden generar moléculas de ARNm artificiales que comprenden una secuencia de codificación/marco de lectura abierto (ORF) para una proteína reporter, tal como una luciferasa, y un elemento 3'-UTR de acuerdo con la presente invención y un elemento 5'-UTR de acuerdo con la presente invención, es decir que prolonga y/o incrementa la producción de proteína a partir de dicha molécula ARNm artificial.
De acuerdo con la presente invención, se puede generar ARNm, por ejemplo, por transcripción in vitro de vectores respectivos, tal como vectores plasmídicos, por ejemplo comprendiendo un promotor T7 y una secuencia que codifica las secuencias ARNm respectivas. Las moléculas ARNm generadas se pueden transfectar en células por cualquier método de transfección adecuado para transfectar ARNm, por ejemplo se pueden lipofectar en células de mamífero, tales como células HeLa o células HDF, y las muestras se pueden analizar en ciertos momentos en el tiempo después de la transfección, por ejemplo 6 horas, 24 horas, 48 horas, y 72 horas tras la transfección. Dichas muestras se pueden analizar para una cantidad de ARNm y/o de proteína por métodos bien conocidos por el experto. Por ejemplo, la cantidad de ARNm reporter presente en las células en los momentos de tiempo de la muestra se pueden determinar por métodos PCR cuantitativos. La cantidad de proteína reporter codificada por los ARNm respectivos se pueden determinar, por ejemplo, mediante Western Blot, ensayos ELISA, análisis FACS o ensayos reporter, tal como ensayos de luciferasa, dependiendo de la proteína reporter utilizada. El efecto de estabilizar la expresión de proteínas y/o prolongar la expresión de proteínas puede analizarse, por ejemplo, determinando la relación entre el nivel de proteína observado 48 horas tras la transfección y el nivel de proteínas observado 24 horas después de la transfección. Cuanto dicho valor es más cercano a 1, es más estable la expresión de la proteína dentro de ese período de tiempo. Estas medidas por supuesto también se pueden llevar a cabo a las 72 o más horas y se puede determinar la relación entre el nivel de proteína observado 72 horas tras la transfección y el nivel de proteína observado 24 horas tras la transfección para determinar la estabilidad de la expresión de la proteína.
Eficiencia de Traducción; Ensayo para determinar la eficiencia de traducción
Tal como se describe ha descrito con detalle anteriormente, la eficiencia de la traducción es una propiedad de una molécula de ácido nucleico (por ejemplo ARNm) que comprende un marco de lectura abierto (ORF) y típicamente es proporcionada por un elemento 3'-UTR específico y, opcionalmente, por un elemento 5'-UTR específico comprendidos en la molécula de ácido nucleico. La eficiencia de traducción se mide típicamente por medio de la cantidad de proteína traducida a partir del ORF. A este respecto, la presente invención proporciona métodos generales así como un ensayo específico. Se puede comparar la eficiencia de traducción de varios, por ejemplo dos o más, moléculas de ácido nucleico, por ejemplo mediante cuantificación experimental de la proteína codificada por el ORF.
En general, con el fin de evaluar la eficiencia de traducción, se emplean métodos basados en células. La eficiencia de la traducción se ensaya experimentalmente in vivo o in vitro como se define aquí (es decir, in vitro en referencia a células (“vivas”) y/o tejido, incluyendo tejido de un sujeto vivo; las células incluyen en particular líneas celulares, células primarias, células de tejido o sujetos, se prefieren células de mamífero, por ejemplo, células humanas y células de ratón, y se prefieren particularmente las líneas celulares humanas HeLa, HEPG2 y U-937 y las líneas celulares de ratón NIH3T3, JAWSII y L929, además son particularmente preferentes las células primarias, en realizaciones de particular preferencia fibroblastos dérmicos humanos (HDF)) mediante la molécula de ácido nucleico artificial inventiva, la expresión de la proteína codificada se determina después de la inyección/transfección de la molécula de ácido nucleico artificial inventiva en las células/tejido diana y se compara la expresión de proteína inducida por el ácido nucleico de referencia. En la técnica se conocen métodos cuantitativos para determinar la expresión de proteínas (por ejemplo Western-Blot, FACS, ELISA, espectrometría de masas). Particularmente útil en este contexto es la determinación de la expresión de proteínas reporter tipo luciferasa, proteína fluorescente verde (GFP) o fosfatasa alcalina secretada (SEAP). Así, se introduce un ácido nucleico artificial de acuerdo con la invención o un ácido nucleico de referencia en el tejido o la célula diana, por ejemplo por transfección o inyección, preferentemente en un sistema de expresión mamífero, tal como en células de mamífero, por ejemplo en células HDF, L929, HepG2 y/o Hela. Varias horas o varios días (por ejemplo 6, 12, 24, 48 o 72 horas) tras el inicio de la expresión 0 tras la introducción de la molécula de ácido nucleico, se recoge una muestra de células diana y se mide mediante FACS y/o se lisa. Después, se pueden emplear los lisados para detectar la proteína expresada (y así determinar la eficiencia de la traducción) mediante diversos métodos, por ejemplo Western Blot, FACS, ELISA, espectrometría de masas o por medida de la fluorescencia o la luminiscencia.
Por tanto, si la expresión de proteína a partir de una molécula de ácido nucleico artificial de acuerdo con la invención se compara con la expresión de proteína a partir de una molécula de ácido nucleico de referencia en un momento de tiempo específico (por ejemplo 6, 12, 24, 48 o 72 horas tras el inicio de la expresión o tras la introducción de la molécula de ácido nucleico), ambas moléculas de ácido nucleico se introducen por separado en el tejido/células diana, se recoge una muestra del tejido/células después de un momento en el tiempo específico, se preparan los lisados de proteína de acuerdo con el protocolo particular ajustado al método de detección particular (por ejemplo Western Blot, ELISA, medida de fluorescencia o luminiscencia, etc., como es conocido en la técnica) y se detecta la proteína por el método de detección elegido. Como alternativa a medir la cantidad de proteína expresada en los lisados celulares - o, además de medir la cantidad de proteína en los lisados celulares antes de la lisis de las células recolectadas utilizando una alícuota en paralelo - también se puede determinar la cantidad de proteína utilizando un análisis FACS.
Otros aspectos generales corresponden a aspectos descritos anteriormente en relación con la producción de proteínas, a menos que el contexto lo indique claramente de otra manera.
Preferentemente, la alta eficiencia de traducción de la molécula de ácido nucleico artificial de la presente invención es proporcionada por al menos un elemento de la región 3' no traducida (elemento 3'-UTR) como se define en la reivindicación 1 y, opcionalmente, por el al menos un elemento de la región 5' no traducida (elemento 5'-UTR). “Proporcionado por” significa que, en ausencia del al menos un elemento de región 3' no traducida (elemento 3'-UTR) y, opcionalmente, del al menos un elemento de la región 5' no traducida (elemento 5'-UTR), la eficiencia de la traducción no es alta, como se define aquí.
El término “alta eficiencia de traducción” se puede utilizar para comparar la eficiencia de la traducción de una molécula de ácido nucleico artificial de la presente invención con una molécula de ácido nucleico de referencia como de define en la reivindicación 1. El término “molécula de ácido nucleico de referencia” tal como se utiliza aquí significa que - a parte de las diferentes 3'-UTR - la molécula de ácido nucleico de referencia es idéntica a la molécula de ácido nucleico artificial de la invención que comprende el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR. Así, la eficiencia de la traducción de la molécula de ácido nucleico artificial se puede comparar con la eficiencia de la traducción de una molécula de ácido nucleico de referencia. Se proporciona aquí un método respectivo para comparar la eficiencia de la traducción tal como se define en la reivindicación 1.
Todos los aspectos descritos anteriormente relativos a la determinación de la producción de proteínas se aplican al método para comparar la eficiencia de traducción también, a menos que el contexto lo indique claramente de otra manera. Dado que el método para comparar la eficiencia de traducción implica la comparación de dos moléculas de ácido nucleico, se llevan a cabo dos experimentos en paralelo, la única diferencia entre estos experimentos es la naturaleza de la molécula de ácido nucleico. En otras palabras, todas las condiciones, por ejemplo el medio de crecimiento, la temperatura, el pH, son idénticas en ambos experimentos. El experto elegirá de forma rutinaria las condiciones apropiadas con basadas en el conocimiento general común y la guía aquí dada, con la condición de elegir condiciones idénticas para ambos experimentos paralelos. Típicamente, uno de los experimentos en paralelo se refiere a una molécula de ácido nucleico de referencia (que puede ser de origen natural o artificial) y el otra se refiere a una molécula de ácido nucleico artificial (también llamada molécula de ácido nucleico sujeto). Este método permite comparar si la molécula de ácido nucleico sujeto se caracteriza por una alta eficiencia de traducción; es decir si es una molécula de ácido nucleico artificial de acuerdo con la presente invención. Los aspectos particulares del método para comparar la eficiencia de traducción son los siguientes: En este método, la molécula de ácido nucleico de referencia comprende al menos un marco de lectura abierto (ORF) que es idéntico a al menos un marco de lectura abierto (ORF) de la molécula de ácido nucleico artificial; y la molécula de ácido nucleico de referencia es como se define en la reivindicación 1. La eficiencia de traducción de la molécula de ácido nucleico artificial y la eficiencia de traducción de la molécula de ácido nucleico de referencia se comparan por un método que comprenden los pasos de:
i. transfectar células de mamífero con la molécula de ácido nucleico artificial y medir la cantidad expresada de la proteína codificada por el ORF de la molécula de ácido nucleico artificial en un cierto momento en el tiempo después de la transfección (por ejemplo 24 o 48 horas),
ii. transfectar células de mamífero con la molécula de ácido nucleico de referencia y medir la cantidad expresada de la proteína codificada por el ORF de la molécula de ácido nucleico de referencia en el mismo momento en el tiempo después de la transfección,
iii. calcular la relación entre la cantidad de proteína expresada a partir de la molécula de ácido nucleico artificial y la cantidad de proteína expresada a partir de la molécula de ácido nucleico de referencia,
siendo la relación calculada en (iii) > 1.
De esta manera, comparando la cantidad de proteína relativa producida a partir de la molécula de ácido nucleico sujeto de acuerdo con la presente invención con la cantidad de proteína relativa producida a partir de la molécula de ácido nucleico de referencia, se puede determinar el factor en el cual se incremente la eficiencia de traducción a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención en comparación con la eficiencia de traducción a partir de la molécula de ácido nucleico de referencia.
“Después de la transfección” se utiliza para referirse al momento de tiempo en el que se han transfectado las células con la molécula de ácido nucleico sujeto y la molécula de ácido nucleico de referencia.
Preferentemente, el al menos un elemento 3'- y, opcionalmente, el elemento 5'-UTR en la molécula de ácido nucleico artificial de acuerdo con la invención incrementa la eficiencia de la traducción a partir de la molécula de ácido nucleico artificial al menos 1,2 veces, de manera preferente al menos 1,5 veces, de manera más preferente al menos 2 veces, aún con mayor preferencia al menos 2,5 veces, en comparación con la producción de proteína a partir de una molécula de ácido nucleico de referencia como se define en la reivindicación 1 (es decir, la relación calculada en (iii) es al menos 1,2, preferentemente al menos 1,5, de manera más preferente al menos 2, con mayor preferencia preferente al menos 2,5). En otras palabras, la eficiencia de traducción se incrementa en un factor de al menos 1,2, preferentemente de al menos 1,5, de manera más preferente de al menos 2, con mayor preferencia de al menos 2,5, en comparación con la eficiencia de traducción a partir de una molécula de ácido nucleico de referencia para el mismo momento en el tiempo.
La alta eficiencia de la traducción es conferida por la 3'-UTR y, opcionalmente por la 5'-UTR, en la que la molécula de ácido nucleico sujeto difiere de la molécula de ácido nucleico de referencia.
De acuerdo con la invención, la molécula de ácido nucleico de referencia comprende un elemento 3'-UTR que se deriva de una 3'-UTR de un gen de albúmina que corresponde a la secuencia de acuerdo con la SEQ ID NO: 207, o la secuencia de ARN correspondiente.
También se describe aquí que (i) la molécula de ácido nucleico de referencia no comprende ningún elemento de región 3' no traducida (elemento 3'-UTR), o (ii) la molécula de ácido nucleico de referencia no comprende ningún elemento de región 5' no traducida (elemento 5'-UTR).
En una realización preferente, las células utilizadas en el paso de transfección de la molécula de ácido nucleico artificial y de la molécula de ácido nucleico de referencia son células de mamífero, preferentemente seleccionadas del grupo de células HDF, L929, HEP2G y HeLa. También puede ser preferente que los métodos se lleven a cabo en paralelo en más de un tipo de células de mamífero, tal como en paralelo en una combinación de cualquiera de dos, de manera preferente cualquiera de tres, de manera más preferente en las cuatro líneas celulares anteriores. Cuando el método se lleva a cabo en paralelo en más de un tipo de células de mamífero, una molécula de ácido nucleico sujeto se puede considerar caracterizada por una alta eficiencia de traducción cuando la relación calculada en el paso (iii) es > 1 en al menos un tipo de células de mamífero utilizado. Sin embargo, es preferente que una molécula de ácido nucleico sujeto se considere caracterizada por una alta eficiencia de traducción cuando la relación calculada en el paso (iii) es > 1 en al menos dos tipos, tal como al menos tres tipos, tal como cuatro tipos de células de mamífero utilizadas.
La cantidad expresada de la proteína codificada por el ORF a partir de la molécula de ácido nucleico artificial y de la molécula de ácido nucleico de referencia se miden en un cierto momento del tiempo después de la transfección (por ejemplo 12 horas, 24 horas, 36 horas, 48 horas o 72 horas). Preferentemente, la cantidad expresada de proteína codificada por el ORF se mide 24 horas después de la transfección.
La presente invención también proporciona un constructo de referencia preferido específico que se puede utilizar en el método de la presente invención. Es particularmente preferente que la molécula de ácido nucleico de referencia sea un ARNm de SEQ ID NO: 205 (Figura 1A). La molécula de ácido nucleico de referencia difiere de la molécula de ácido nucleico artificial solo en que el al menos un elemento 3'-UTR se ha remplazado por al menos otro elemento 3'-UTR (preferentemente un elemento 3'-UTR). Esto permite ensayar directamente si el otro elemento 3'-UTR proporciona una alta eficiencia de traducción.
Es particularmente preferente que el método para determinar la eficiencia de traducción se caracterice adicionalmente como sigue:
a) en el paso de transfección, las células son células de mamífero seleccionadas del grupo de células HDF, L929, HEP2G y HeLa; y
b) el momento en el tiempo para la medida es 24 horas después de la transfección; y
c) la molécula de ácido nucleico de referencia es un ARNm de SEQ ID NO: 205 (Figura 1A); y
d) la molécula de ácido nucleico de referencia difiere de la molécula de ácido nucleico artificial solo en que (i) el al menos un elemento 3'-UTR (preferentemente un elemento 3'-UTR) se ha remplazado por al menos otro elemento 3'-UTR (preferentemente un elemento 3'-UTR); en otras palabras, la molécula de ácido nucleico sujeto es idéntica a la molécula de ácido nucleico de referencia excepto en que el al menos un elemento 3'-UTR difiere de la 3'-UTR mostrada en la Figura 1A. Un ejemplo de reemplazo del elemento 5'-UTR se muestra en la Figura 1B; un ejemplo de reemplazo del elemento 3'-UTR se muestra en la Figura 1C.
Cuando se cumplen todas de (a) a (d), el método también se denomina “ensayo estandarizado para determinar la eficiencia de traducción” o simplemente “ensayo para determinar la eficiencia de traducción”. Una molécula de ácido nucleico artificial de la invención se caracteriza por una alta eficiencia de traducción tal como es determinado por este ensayo estándar para determinar la eficiencia de traducción. Este ensayo estándar permite la identificación sencilla de moléculas de ácido nucleico artificiales particularmente ventajosas.
Se utilizó el ensayo estándar en el Ejemplo 3 de la presente invención. Así, los presentes inventores encontraron que un grupo de nuevos ácidos nucleicos artificiales comparten la característica ventajosa de una alta eficiencia de traducción, es decir más alta que la eficiencia de traducción de la molécula de ácido nucleico de referencia de la Figura 1A, ver Ejemplo 3.5. Esto es un descubrimiento muy sorprendente y ventajoso, particularmente del antecedente de que la molécula de ácido nucleico de referencia comprende un elemento 3'-UTR que se deriva de una 3'-UTR de un gen de albúmina (un 3'-UTR que corresponde a la secuencia de ADN de acuerdo con la SEQ ID NO: 207) y un elemento 5'-UTR que se deriva de una 5' -UTR de un gen TOP, en particular una 5' -UTR de la proteína ribosómica humana grande 32 que carece del tracto de oligopirimidina 5' terminal (una 5'-UTR que corresponde a la secuencia de ADN de acuerdo con la SEQ ID NO: 208). Estos elementos 3'-UTR y 5'-UTR son conocidos por ser ventajosos en el contexto de la traducción de proteínas en una célula (para una 3'-UTR derivada de un gen de albúmina, ver WO2013/143700; para una 5'-UTR TOP, ver WO2013/143700). La presente invención proporciona una mejora adicional.
En algunas realizaciones, el ORF de la molécula de ácido nucleico artificial codifica una proteína que se puede cuantificar, preferentemente una proteína reporter. Estas realizaciones son muy adecuadas en el método para comparar la eficiencia de traducción de acuerdo con la presente invención. En otras realizaciones, el ORF de la molécula de ácido nucleico artificial no codifica una proteína que se puede cuantificar, preferentemente una proteína reporter. Por ejemplo, cuando se ha determinado una 5'-UTR o una 3'-UTR particular por el método de la invención, empleando un ORF de la molécula de ácido nucleico artificial que codifica una proteína que se puede cuantificar, para proporcionar una alta eficiencia de traducción, dicha 3'-UTR y, opcionalmente, 3'-UTR se pueden recombinar con cualquier ORF. Por ejemplo, cuando en el ensayo estandarizado para determinar la eficiencia de traducción el ORF codifica una proteína reporter, los ácidos nucleicos artificiales de la presente invención no se limitan al ORF utilizado en el ensayo estandarizado.
Estos métodos también se pueden utilizar iterativamente; es decir, una molécula de ácido nucleico artificial que ha sido determinada por el presente método caracterizada por una alta eficiencia de traducción puede emplearse en sí misma como “constructo de referencia” para una ronda posterior del presente método. Esto permite comprobar si todavía la molécula de ácido nucleico artificial adicional se caracteriza por una eficiencia de traducción incluso más alta (o si una UTR comprendida en la molécula de ácido nucleico artificial adicional proporciona una eficiencia de traducción aún más alta). Esto permite la identificación de moléculas de ácido nucleico artificiales y UTR aún más mejoradas adicionales.
ARNm estable
En algunas realizaciones, el al menos un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR en la molécula de ácido nucleico artificial de acuerdo con la presente invención se deriva de un ARNm estable. Así, “derivado” de un ARNm estable significa que el al menos un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR comparte al menos un 50%, preferentemente al menos un 60%, de manera preferente al menos un 70%, de manera más preferente al menos un 75%, con mayor preferencia al menos un 80%, de manera más preferente al menos un 85%, de manera aún más preferente al menos un 90%, de manera especialmente preferente al menos un 95% y con particular preferencia al menos un 98% de identidad de secuencia con un elemento 3'-UTR y, opcionalmente, con un elemento 5'-UTR de un ARNm estable. Preferentemente, el ARNm estable es un ARNm de origen natural y, por ello, un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR de un ARNm estable se refiere a una 3'-UTR y, opcionalmente, a una 5'-UTR, o fragmentos o variantes de las mismas, de un ARNm de origen natural. Además, un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR derivado de un ARNm estable preferentemente también se refiere a un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR que está modificado en comparación con un elemento 3'-UTR y, opcionalmente, con un elemento 5'-UTR, de origen natural por ejemplo para incrementar la estabilidad del ARN aun más y/o para prolongar y/o aumentar la producción de proteínas. Sobra decir que estas modificaciones son preferentes, que no deterioran la estabilidad del ARN, por ejemplo en comparación con un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR (no modificado) de origen natural. En particular, el término ARNm tal como se utiliza aquí se refiere a una molécula de ARNm, sin embargo, también puede deferirse a una especie ARNm como se define aquí.
De manera preferente, la estabilidad del ARNm, es decir la descomposición del ARNm y/o su vida media, se evalúa bajo condiciones estándar, por ejemplo condiciones estándar (medio estándar, incubación, etc.) para una cierta línea celular empleada.
En general, el término “ARNm estable” tal como se utiliza aquí se refiere a un ARNm que presenta una descomposición de ARNm lenta. Así, un “ARNm estable” tiene típicamente una vida media prolongada. La vida media de un ARNm es el tiempo requerido para degradar el 50% de las moléculas de ARNm existentes in vivo o in vitro. Por consiguiente, la estabilidad del ARNm se evalúa habitualmente in vivo o in vitro. Así, in vitro se refiere en particular a células y/o tejidos (“vivos”), incluyendo tejido de un sujeto vivo. Las células incluyen en particular líneas celulares, células primarias, células de tejido o de sujetos. En realizaciones específicas, para la presente invención pueden ser adecuados los tipos de células que permiten el cultivo celular. Son particularmente preferentes células de mamífero, por ejemplo células humanas y células de ratón. En realizaciones particularmente preferentes se emplean las líneas celulares humanas HeLa, HEPG2 y U-937 y las líneas celulares de ratón NIH3T3, JAWSII y L929. Además, son particularmente preferentes las células primarias, en realizaciones preferentes particulares pueden emplearse fibroblastos dérmicos humanos (HDF). Alternativamente, también puede usarse un tejido de un sujeto.
Preferentemente, la vida media de un “ARNm estable” es al menos 5 horas, al menos 6 horas, al menos 7 horas, al menos 8 horas, al menos 9 horas, al menos 10 horas, al menos 11 horas, al menos 12 horas, al menos 13 horas, al menos 14 horas y/o al menos 15 horas. Puede determinarse la vida media de un ARNm de interés por diferentes métodos conocidos por el experto en la técnica. Típicamente, la vida media de un ARNm de interés se obtiene determinando la constante de descomposición, asumiendo habitualmente una situación in vivo ideal (o in vitro como se define anteriormente), donde la transcripción del ARNm de interés se puede “ inactivar” completamente (o al menos a un nivel no detectable). En esta situación ideal se asume usualmente que la descomposición del ARNm sigue una cinética de primer orden. Por consiguiente, normalmente la descomposición de un ARNm se puede describir con la siguiente ecuación:
Figure imgf000026_0001
donde A0 es la cantidad (o concentración) de ARNm de interés en el tiempo 0, es decir antes de que comience la descomposición, A(t) que es la cantidad (o concentración) de ARNm de interés en un tiempo t durante la descomposición y A es la constante de descomposición. Así, si se conoce la cantidad (o concentración) de ARNm de interés en el tiempo 0 (Ac) y la cantidad (o concentración) de ARNm de interés en un cierto tiempo t durante el proceso de descomposición (A(t) y t), se puede calcular la constante de descomposición A. En base a la constante de descomposición A se puede calcular la vida media t1/2 con la siguiente ecuación:
ti /2 = In2 / X.
dado que, por definición A(t)/A0 = 1/2 en t i /2. Así, normalmente, para evaluar la vida media de un ARNm de interés, se determina la cantidad o concentración de ARNm durante el proceso de descomposición del ARN in vivo (o in vitro como se define anteriormente).
Para determinar la cantidad o concentración de ARNm durante el proceso de descomposición del ARN in vivo (o in vitro como se define anteriormente) se pueden utilizar diversos métodos conocidos por el experto. Ejemplos no limitantes de estos métodos incluyen inhibición general de transcripción, por ejemplo con un inhibidor de transcripción tal como actinomicina D, uso de promotores inducibles para promover específicamente la transcripción transitoria, por ejemplo el sistema promotor sero-inducible c-fos y el sistema promotor regulador Tet-off, y técnicas de etiquetado cinético, por ejemplo etiquetado por pulso, por ejemplo por 4-tiouridina (4sU), 5-etiniluridina (EU) o 5'-bromouridina (BrU). A continuación se describen otros detalles y realizaciones preferentes relativas a cómo determinar la cantidad o concentración de ARNm durante la descomposición del ARN en el contexto de un método para identificar un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR de acuerdo con la presente invención. La descripción respectiva y las realizaciones preferentes de cómo determinar la cantidad o concentración de ARNm durante la descomposición de ARN también aplican en este punto.
De manera preferente, un “ARN estable” en el sentido de la presente invención tiene una descomposición de ARNm más lenta en comparación con un ARNm medio, preferentemente evaluado in vivo (o in vitro como se define anteriormente). Por ejemplo, la “descomposición media de ARNm” se puede evaluar investigando la descomposición de un ARNm de múltiples especies de ARNm, preferentemente de 100, al menos 300, al menos 500, al menos 1.000, al menos 2.000, al menos 3.000, al menos 4.000, al menos 5.000, al menos 6.000, al menos 7.000, al menos 8.000, al menos 9.000, al menos 10.000, al menos 11.000, al menos 12.000, al menos 13.000, al menos 14.000, al menos 15.000, al menos 16.000, al menos 17.000, al menos 18.000, al menos 19.000, al menos 200000, al menos 21.000, al menos 22.000, al menos 23.000, al menos 24.000, al menos 25.000, al menos 26.000, al menos 27.000, al menos 28.000, al menos 29.000, al menos 30.000 especies de ARNm. Se prefiere particularmente que se evalúe el transcriptoma completo o tantas especies de transcriptoma de ARNm como sea posible. Esto se puede lograr, por ejemplo, utilizando una micro-array que proporciona la cobertura del transcrito completo.
Una “especie de ARNm” tal como se utiliza aquí corresponde a una unidad de transcripción genómica, es decir usualmente a un gen. Así, dentro de una “especie de ARNm” pueden estar presentes transcriptos diferentes, por ejemplo debido al procesamiento de ARNm. Por ejemplo, una especie de ARNm puede estar representada por una mancha en una microarray. Por consiguiente, una micro-array proporciona una herramienta ventajosa para determinar la cantidad de una pluralidad de especies de ARNm, por ejemplo en un cierto momento del tiempo durante la descomposición del ARNm. Sin embargo, también se pueden emplear otras técnicas conocidas por el experto, por ejemplo ARN-seq, PCR cuantitativa etc.
En la presente invención se prefiere particularmente que un ARNm estable se caracterice por una descomposición de ARNm donde la relación entre la cantidad de ARNm en el segundo momento de tiempo y la cantidad de ARNm en un primer momento de tiempo sea al menos 0,5 (50%), al menos 0,6 (60%), al menos 0,7 (70%), al menos 0,75 (75%), al menos 0,8 (80%), al menos 0,85 (85%), al menos 0,9 (90%) o al menos 0,95 (95%). Aquí, el segundo momento en el tiempo es posterior en un proceso de descomposición que el primer momento en el tiempo.
Preferentemente, el primer momento en el tiempo se selecciona de manera que solo se considera el ARNm que se somete a un proceso de descomposición, es decir se evita un ARNm emergente - por ejemplo en la transcripción en curso. Por ejemplo, si se aplican técnicas de etiquetado cinéticas, por ejemplo etiquetado por pulso, el primer momento en el tiempo se selecciona preferentemente de manera que la incorporación de la etiqueta en el ARNm está completa, es decir no hay ninguna incorporación en curso de la etiqueta en el ARNm. De esta manera, si se utiliza el etiquetado cinético, el primer momento en el tiempo puede ser al menos 10 min, al menos 20 min, al menos 30 min, al menos 40 min, al menos 50 min, al menos 60 min, al menos 70 min, al menos 80 min o al menos 90 min después del final del procedimiento de etiquetado experimental, por ejemplo después del final de la incubación de las células con la etiqueta.
Por ejemplo, preferentemente, el primer momento en el tiempo puede ser de 0 a o 6 horas después de terminar la transcripción (por ejemplo con un inhibidor transcripcional), de parar la inducción del promotor en el caso de promotores inducibles o después de terminar el pulso o suministro de etiqueta, por ejemplo después del final del etiquetado. De manera más preferente, el primer momento en el tiempo puede ser 30 minutos a 5 horas, de manera aún más preferente de 1 hora a 4 horas y de manera particularmente preferente aproximadamente 3 horas después de parar la transcripción (por ejemplo con un inhibidor de transcripción), de parar la inducción del promotor en el caso de promotores inducibles o tras el suministro de un pulso o etiqueta, por ejemplo después del final del etiquetado.
Preferentemente, el segundo momento en el tiempo se selecciona lo más tarde posible durante el proceso de descomposición del ARNm. Sin embargo, si se consideran múltiples especies de ARNm, preferentemente el segundo momento en el tiempo se selecciona de forma que una cantidad considerable de la pluralidad de especies de ARNm, de manera preferente al menos un 10% de las especies de ARNm, está todavía presente en una cantidad detectable, es decir en una cantidad superior a 0. De manera preferente, el segundo momento en el tiempo es al menos 5 horas, al menos 6 horas, al menos 7 horas, al menos 8 horas, al menos 9 horas, al menos 10 horas, al menos 11 horas, al menos 12 horas, al menos 13 horas, al menos 14 horas o al menos 15 horas después del final de la transcripción o del final del procedimiento de etiquetado experimental.
De esta manera, el lapso de tiempo entre el primer momento en el tiempo y el segundo momento en el tiempo preferentemente es lo mayor posible dentro de los límites descritos anteriormente. Por tanto, el lapso de tiempo entre el primer momento en el tiempo y el segundo momento en el tiempo preferentemente es de al menos 4 horas, al menos 510 horas, al menos 6 horas, al menos 7 horas, al menos 8 horas, al menos 9 horas, al menos 10 horas, al menos 11 horas o al menos 12 horas.
Además, es posible identificar el al menos un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR en la molécula de ácido nucleico artificial de acuerdo con la presente invención mediante un método para identificar un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR de acuerdo con la presente invención como se describe aquí. Es particularmente preferente que el al menos un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR en la molécula de ácido nucleico artificial de acuerdo con la presente invención se identifique por un método para identificar un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR, que proporcione una alta eficiencia de traducción a una molécula de ácido nucleico artificial, como se describe aquí.
Realizaciones preferentes de la molécula de ácido nucleico artificial de la presente invención
Cuando el al menos un elemento 3'-UTR de la molécula de ácido nucleico artificial de la invención es como se define en la reivindicación 1, preferentemente el al menos un elemento 3'-UTR adicional y, opcionalmente, el al menos un elemento 5'-UTR en la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en una secuencia de ácido nucleico que se deriva de la 3'-UTR y/o de la 5'-UTR de un gen de codificación de proteína eucariota, preferentemente de la 3'-UTR y/o la 5'-UTR de 10 un gen de proteína de vertebrado, de manera más preferente de la 3'-UTR y/o la 5'-UTR de un gen de codificación de proteína de mamífero, por ejemplo de genes de codificación de proteína de ratón y humano, de manera aún más preferente de la 3'-UTR y/o la 5'-UTR de un gen de codificación de proteína de primate o roedor, en particular de la 3'-UTR y/o la 5'-UTR de un gen de codificación de proteína de humano o murino.
En general, se entiende que el al menos un elemento 3'-UTR adicional de la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en una secuencia de ácido nucleico que preferentemente se deriva de una 3'-UTR de origen natural (en la naturaleza), mientras que el al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en una secuencia de ácido nucleico que preferentemente se deriva de una 5'UTR de origen natural (en la naturaleza).
El al menos un marco de lectura abierto es heterólogo a el al menos un elemento 3'-UTR y, opcionalmente, a el al menos un elemento 5'-UTR. El término “heterólogo” en este contexto significa que los dos elementos de secuencia comprendidos en la molécula de ácido nucleico artificial, tal como el marco de lectura abierto y el elemento 3'-UTR y, opcionalmente, el marco de lectura abierto y el elemento 5'-UTR no se presentan naturalmente (en la naturaleza) en esta combinación. Son típicamente recombinantes. El elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR es/son derivados de un gen diferente que el marco de lectura abierto. Por ejemplo, el ORF puede derivarse de un gen diferente que el elemento 3'-UTR y, opcionalmente, que el al menos un elemento 5'-UTR, por ejemplo que codifica una proteína diferente o la misma proteína pero de una especie diferente, etc. Es decir, el marco de lectura abierto se deriva de un gen que es distinto del gen del cual se deriva el elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR. En una realización preferente, el ORF no codifica una proteína ribosómica humana o vegetal (por ejemplo, Arabidopsis), preferentemente no codifica la proteína ribosómica humana S6 (RPS6), la proteína ribosómica humana tipo L36a (RPL36AL) o la proteína ribosómica de Arabidopsis S16 (RPS16). En una realización preferente adicional, el marco de lectura abierto (ORF) no codifica la proteína ribosómica S6 (RPS6), la proteína ribosómica tipo L36a (RPL36AL) o la proteína ribosómica S16 (RPS16).
En realizaciones específicas, es preferente que el marco de lectura abierto no codifique para una proteína repórter, por ejemplo seleccionada del grupo consistente en proteínas globina (particularmente beta-globina), proteína luciferasa, proteínas GFP o variantes de las mismas, por ejemplo variantes que tienen al menos un 70% de identidad de secuencia con una proteína globina, con una proteína luciferasa o con una proteína GFP. Así, se prefiere particularmente que el marco de lectura abierto no codifique para una proteína GFP. También es particularmente preferente que el marco de lectura abierto (ORF) no codifique para un gen reporter o no se derive de un gen reporter, donde el gen reporter preferentemente no se selecciona del grupo consistente en proteínas globina (en particular beta-globina), proteína luciferasa, beta-glucuronidasa (GUS) y proteínas GFP o variantes de las mismas, de manera preferente no seleccionadas de EGFP, o variantes de cualquiera de los genes anteriores, que muestran típicamente al menos un 70% de identidad de secuencia con cualquiera de estos genes reporter, de manera preferente una proteína globina, una proteína luciferasa o una proteína GFP.
De manera aún más preferente, el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR es heterólogo a cualquier otro elemento comprendido en el ácido nucleico artificial como se define aquí. Por ejemplo, si el ácido nucleico artificial de acuerdo con la invención comprende un elemento 3'-UTR de un gen dado, preferentemente no comprende cualquier otra secuencia de ácido nucleico, en particular ninguna secuencia de ácido nucleico funcional (por ejemplo un elemento de secuencia de codificación o regulador) del mismo gen, incluyendo sus secuencias reguladoras en los extremos 5'- y 3'- del ORF del gen. Por consiguiente, por ejemplo, si el ácido nucleico artificial de acuerdo con la invención comprende un elemento 5'-UTR de un gen dado, preferentemente no comprende ninguna otra secuencia de ácido nucleico, en particular ninguna secuencia de ácido nucleico funcional (por ejemplo un elemento de secuencia de codificación o regulador) del mismo gen, incluyendo sus secuencias reguladoras en los extremos 5'- y 3'- del ORF del gen.
Además, es preferente que el ácido nucleico artificial de acuerdo con la presente invención comprenda al menos un marco de lectura abierto, al menos una 3'-UTR (elemento) y al menos una 5'-UTR (elemento) donde el al menos un 3'-UTR (elemento) es un elemento 3'-UTR de acuerdo con la presente invención y, opcionalmente, el al menos un 5'-UTR (elemento) es un elemento 5'-UTR de acuerdo con la presente invención. En este ácido nucleico artificial preferente de acuerdo con la presente invención, que comprende al menos un marco de lectura abierto, al menos una 3'-UTR (elemento) y al menos una 5'-UTR (elemento), es particularmente preferente que cada uno de el al menos un marco de lectura abierto, la al menos una 3'-UTR (elemento) y la al menos una 5' UTR (elemento) sean heterólogos, es decir ninguno de el al menos un 3'-UTR (elemento) y el al menos un 5'-UTR (elemento) ni el marco de lectura abierto o el 5'-UTR (elemento), respectivamente, sean de origen natural (en la naturaleza) en esta combinación. Esto significa que la molécula de ácido nucleico artificial comprende un ORF, un 3'-UTR (elemento) y un 5'-UTR (elemento) todos ellos heterólogos entre sí, por ejemplo todos son recombinantes ya que cada uno se deriva de genes diferentes (y sus 5'- y 3'-UTR'). En otra realización preferente, el 3'-UTR (elemento) no se deriva de un 3'-UTR (elemento) de un gen viral o no es de origen viral.
El al menos un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR están unidos funcionalmente al ORF. Esto significa que, preferentemente, el elemento 3'UTR y, opcionalmente, el al menos un elemento 5'-UTR está asociado al ORF de manera que puede ejercer una función, tal como una función de mejora o estabilización de la expresión del péptido o proteína codificada o una función de estabilización de la molécula de ácido nucleico artificial. Preferentemente, el ORF y el elemento 3'-UTR están asociados en la dirección 5 '^ 3 ' y, opcionalmente, el elemento 5'-UTR y el ORF están asociados en la dirección 5 '^3 '. Así, preferentemente, la molécula de ácido nucleico artificial comprende en general la estructura 5'-[elemento 5'-UTR]-(opcional)-enlazador-ORF-(opcional)-enlazador-[elemento3'-UTR]-3', donde la molécula de ácido nucleico artificial puede comprender solo un elemento 3'-UTR y no el elemento 5' UTR o ambos, un elemento 3'-UTR y un elemento 5'-UTR. Además, el enlazador puede estar presente o ausente. Por ejemplo, el enlazador puede ser uno o más nucleótidos, tal como un tramo de 1-50 o 1-20 nucleótidos, por ejemplo, que comprenden o consisten en uno o más sitios de reconocimiento de enzimas de restricción (sitios de restricción).
Cuando el al menos un elemento 3'-UTR de la molécula de ácido nucleico artificial se deriva de PSMB3 y comprende o consiste en una secuencia de ácido nucleico con una identidad de secuencia de al menos un 90% con la secuencia de ácido nucleico SEQ ID NO.: 164, o con la secuencia de ARN correspondiente, el al menos un elemento 3'-UTR adicional y/o el al menos un elemento 5'-UTR comprende o consiste en una secuencia de ácido nucleico que se deriva de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen seleccionado del grupo consistente en ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3 5'-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (todos preferentemente humanos) y Dpysl2, Ccndl, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox11, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (todos preferentemente de ratón).
Preferentemente, el al menos un elemento 3'-UTR y/o el al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en un “fragmento funcional”, una “variante funcional” o un “fragmento funcional de una variante” de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen.
Preferentemente, el al menos un elemento 5'-UTR comprende una secuencia de ácido nucleico que se deriva de la 5'-UTR de un transcripto de un gen seleccionado del grupo consistente en ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB35'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (preferentemente todos humanos) y Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, ltga7-5'- UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (preferentemente todos de ratón).
Preferentemente, el al menos un elemento 3'-UTR comprende o consiste en una secuencia de ácido nucleico que se deriva de la 3'-UTR de un transcripto de un gen seleccionado del grupo consistente en NDUFS7-3'-UTR, PHGDH-3'- UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'- UTR, BRATI-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'- UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (preferentemente todos humanos) y Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR (preferentemente todos de ratón).
También es preferente que el ácido nucleico artificial de la invención comprenda ambas de (i) al menos una 5'-UTR preferente y (i) al menos una 3'-UTR preferente adicional, además del elemento 3'-UTR definido en la reivindicación 1.
En una realización particularmente preferente, el al menos un elemento 5'-UTR comprende una secuencia de ácido nucleico que se deriva de la 5'-UTR de un transcripto de un gen seleccionado del grupo consistente en ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'-UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (todos humanos), Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5-UTR, Ankrd1-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (todos de ratón). Estos elementos UTR han demostrado contribuir a una alta eficiencia de traducción.
En una realización particularmente preferente, el al menos un elemento 3'-UTR adicional comprende una secuencia de ácido nucleico que se deriva de la 3'-UTR de un transcripto de un gen seleccionado del grupo consistente en NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (preferentemente todos humanos) y Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'- UTR, Aarsd1-3'-UTR (preferentemente todos de ratón). Estos elementos UTR han demostrado contribuir a una alta eficiencia de traducción.
Estas realizaciones particularmente preferentes son combinables, de modo que el ácido nucleico artificial de la invención comprende tanto (i) al menos una 5'-UTR particularmente preferente como (i) al menos una 3'-UTR particularmente preferente adicional.
La frase “secuencia de ácido nucleico que se deriva de la 3'-UTR y/o la 5'-UTR de un transcripto de un gen” preferentemente se refiere a una secuencia de ácido nucleico que se basa en la secuencia 3'-UTR y/o en la secuencia 5'-UTR de un transcripto de un gen o fragmento o parte del mismo, preferentemente de un gen de origen natural o de un fragmento o parte del mismo. En este contexto, el término de origen natural se utiliza de forma sinónima al término tipo natural. Está frase incluye secuencias que corresponden a la secuencia 3'-UTR completa y/o a la secuencia 5'-UTR completa, es decir las secuencias 3'-UTR y/o 5'-UTR de longitud completa de un transcripto de un gen, y las secuencias correspondientes a un fragmento de las secuencia s 3'-UTR y/o 5'-UTR de un transcripto de un gen. De manera preferente, un fragmento de un 3'-UTR y/o 5'-UTR de un transcripto de un gen consiste en un tramo continuo de nucleótidos que corresponden a un tramo continuo de nucleótidos del 3'-UTR y/o 5'-UTR de longitud completa de un transcripto de un gen que tiene al menos el 5%, 10%, 20%, preferentemente al menos el 30%, más preferentemente al menos el 40%, de manera más preferente al menos el 50%, de manera aún más preferente al menos el 60%, de manera aún más preferente al menos el 70%, de manera aún más preferente al menos el 80% y con total preferencia al menos el 90% de la 3'-UTR y/o 5'-UTR de longitud completa de un transcripto de un gen. Este fragmento, en el sentido de la presente invención, preferentemente es un fragmento funcional como se describe aquí. De manera preferente, el fragmento mantiene una función reguladora para la traducción del ORF unido a la 3'-UTR y/o 5'-UTR o a un fragmento de las mismas.
Los términos “variante de la 3'-UTR y/o variante de la 5'-UTR de un transcripto de un gen” y “variante de la misma” en el contexto de una 3'-UTR y/o una 5'-UTR de un transcripto de un gen se refiere a una variante de la 3'-UTR y/o 5'-UTR de un transcripto de un gen de origen natural, preferentemente a una variante de la 3'-UTR y/o 5'-UTR de un transcripto de un gen vertebrado, de manera más preferente a una variante de la 3'-UTR y/o 5'-UTR de un transcripto de un gen mamífero, de manera aún más preferente a una variante de la 3'-UTR y/o 5'-UTR de un transcripto de un gen de primate, en particular un gen humano, como se describe anteriormente. Esta variante puede ser una 3'-UTR y/o 5'-UTR modificada de un transcripto de un gen. Por ejemplo, una variante de 3'-UTR y/o una variante de 5'-UTR puede presentar una o más deleciones, inserciones, adiciones y/o sustituciones de nucleótidos en comparación con las 3'-UTR y/o 5'-UTR de origen natural de las cuales se deriva la variante. Preferentemente, una variante de una 3'-UTR y/o de la 5'UTR de un transcripto de un gen es al menos un 40%, de manera preferente al menos un 50%, de manera más preferente al menos un 60%, de manera más preferente al menos un 70%, de manera aún más preferente al menos un 80%, de manera aún más preferente al menos un 90%, de manera mucho más preferente al menos un 95% idéntica a la 3'-UTR y/o 5'-UTR de origen natural de la cual se deriva la variante. Preferentemente, la variante es una variante funcional como se describe aquí.
La frase “una secuencia de ácido nucleico que se deriva de una variante de la 3'-UTR y/o de una variante de la 5'-UTR de un transcripto de un gen” preferentemente se refiere a una secuencia de ácido nucleico que está basada en una variante de la secuencia 3'-UTR y/o de la 5'-UTR de un transcripto de un gen o en un fragmento o parte del mismo como se describe anteriormente. Esta frase incluye secuencias que corresponden a la secuencia completa de la variante de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen, es decir, la secuencia 3'-UTR variante de longitud completa y/o la secuencia 5'UTR variante de longitud completa de un transcripto de un gen, y las secuencias que corresponden a un fragmento de la secuencia 3'-UTR variante y/o un fragmento de la secuencia 5'-UTR variante de un transcripto de un gen. Preferentemente, un fragmento de una variante de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen consiste en un tramo continuo de nucleótidos que corresponde a un tramo continuo de nucleótidos de la variante de longitud completa de la 3'-UTR y/o la 5'-UTR de un transcripto de un gen, que presenta al menos el 20%, de manera preferente al menos 30%, de manera más preferente al menos 40%, de manera más preferente al menos 50%, de manera aún más preferente al menos 60%, de manera aún más preferente al menos 70%, de manera aún más preferente al menos 80% y con mayor preferencia al menos el 90% de la variante 3'UTR y/o la 5'-UTR de longitud completa de un transcripto de un gen. En el sentido de la presente invención, este fragmento de una variante preferentemente es un fragmento funcional de una variante como se describe aquí.
Los términos “variante funcional”, “fragmento funcional” y “fragmento funcional de una variante” (también llamado “fragmento variante funcional”) en el contexto de la presente invención significan que el fragmento de la 3'-UTR y/o la 5'-UTR, la variante de la 3'-UTR y/o la 5'-UTR o el fragmento de una variante de la 3'-UTR y/o la 5'-UTR de un transcripto de un gen cumple al menos una función, preferentemente más de una función, de la 3'-UTR y/o 5'-UTR de origen natural de un transcripto de un gen del cual se deriva la variante, el fragmento o el fragmento de variante. Esta función puede ser, por ejemplo, estabilización del ARNm y/o mejora, estabilización y/o prolongación de la producción de proteína a partir de un ARNm y/o incremento de la expresión de la proteína o producto de proteína total de un ARNm, preferentemente en una célula de mamífero, tal como una célula humana. Preferentemente, la función de la 3'-UTR y/o de la 5'-UTR se refiere a la traducción de la proteína codificada por el ORF. De manera más preferente, la función comprende mejorar la eficiencia de traducción del ORF unido a la 3'-UTR y/o a la 5'-UTR o fragmento o variante de los mismos. Es particularmente preferente que la variante, el fragmento y el fragmento de variante en el contexto de la presente invención cumplan la función de estabilizar un ARNm, de manera preferente en una célula de mamífero, tal como una célula humana, en comparación con un ARNm que comprende una 3'-UTR de referencia como se define en la reivindicación 1 y/o la función de aumentar la producción de proteína a partir de un ARNm, preferentemente en una célula de mamífero, tal como una célula humana, en comparación con un ARNm que comprende una 3'-UTR de referencia como se define en la reivindicación 1. Una 3'-UTR de referencia y/o una 5'-UTR de referencia pueden ser, por ejemplo, una 3'-UTR y/o una 5'-UTR de origen natural en combinación con el ORF. Además, una variante funcional, un fragmento funcional o un fragmento de variante funcional de una 3'-UTR y/o una 5'-UTR de un transcripto de un gen preferentemente no tiene un efecto de disminución sustancial de la eficiencia de traducción del ARNm que comprende dicha variante, fragmento, o un fragmento de variante de una 3'-UTR y/o de una 5'-UTR, en comparación con la 3'-UTR de tipo natural y/o la 5'-UTR de tipo natural de la cual se deriva la variante, el fragmento o el fragmento de variante. Una función particularmente preferente de un “fragmento funcional”, de una “variante funcional” o de un “fragmento funcional de una variante” de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen en el contexto de la presente invención es la mejora, estabilización y/o prolongación de la producción de proteínas por la expresión de un ARNm que porta el fragmento funcional, la variante funcional o el fragmento funcional de una variante como se describe anteriormente.
Preferentemente, la eficiencia de la una o más funciones ejercida por la variante funcional, el fragmento funcional o el fragmento de variante funcional, tal como proporcionar una eficiencia de traducción, se incrementa en al menos el 5%, de manera más preferente en al menos el 10%, de manera más preferente en al menos el 20%, de manera más preferente en al menos el 30%, de manera más preferente en al menos el 40%, de manera más preferente en al menos el 50%, de manera más preferente en al menos el 60%, de manera aún más preferente en al menos el 70%, de manera aún más preferente en al menos el 80%, de manera especialmente preferente en al menos el 90% con respecto a la eficiencia de traducción mostrada por la 3'-UTR y/o la 5'-UTR de origen natural de un transcripto de un gen del cual se deriva la variante, el fragmento o el fragmento de variante.
En el contexto de la presente invención, un fragmento de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen o de una variante de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen preferentemente tienen una longitud de al menos aproximadamente 3 nucleótidos, de manera preferente de al menos aproximadamente 5 nucleótidos, más preferentemente de al menos aproximadamente 10, 15, 20, 25 o 30 nucleótidos, de manera aún más preferente de al menos aproximadamente 50 nucleótidos, de manera mucho más preferente de al menos aproximadamente 70 nucleótidos. Preferentemente, este fragmento de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen o de una variante de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen es un fragmento funcional como se describe anteriormente. En una realización preferente, la 3'-UTR y/o la 5'-UTR de un transcripto de un gen o un fragmento o variante de las mismas tienen una longitud de entre 3 y aproximadamente 500 nucleótidos, de manera preferente de entre 5 y aproximadamente 150 nucleótidos, de manera más preferente de entre 10 y 100 nucleótidos, de manera aún más preferente de entre 15 y 90, de manera mucho más preferente de entre 20 y 70. Típicamente, el elemento 5'-UTR y/o el elemento 3'-UTR se caracteriza por tener menos de 500, 400, 300, 200, 150 o menos de 100 nucleótidos.
Elementos 5’-UTR
Preferentemente, el al menos un elemento 5'-UTR comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 1, 2, 3, 4, 5, 10, 15, 20, 30 o 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, incluso más preferentemente de al menos aproximadamente un 99% con una secuencia de ácido nucleico seleccionada del grupo que consiste en las SEQ ID NO: 1 a 151 o las secuencias de ARN correspondientes, respectivamente.
Entre las secuencias detalladas a continuación, las SEQ ID NO: 1 a 136 se puede considerar como secuencias 5'-UTR de tipo natural y las SEQ ID NO: 136 a 151 se pueden considerar como secuencias 5'-UTR artificiales.
SEQ ID NO: 1 - ZNF4605'-UTR de Homo sapiens
N M _ 00 6 6 3 5 .3
G A A A C A G T G T G G G G C C T A G A G C G C T G G G T G G G C G C G T T C T G C G G C C T G A G C A G G G A C G G G T A G T G A A G C G G T T A C G C C C C T T C T T C G C G T C T T G G C G G G A G C C T G A C G C C C C G C T T C T C C C C T A A C G A G G T G
T C C C A C C G G C G C C C G C C G A G G C C T A G G C C T C C G C A G C C G C C C T C C G T C T C C T C A G C C C C G A C G C T G C G C C T T G G G C C T T G T G C G C A T T T T T T T C G G G G G A A A A C T G A G G C T C G G A G T G C G A A A G T C A G C C G A G G T C G C C C C G C C C A G G A C A G A G A A G G G C T G T G G T C G G C T G A T C C G C G G C A T T C C C G G G SEQ ID NO: 2 - TGM25'-UTR de Homo sapiens
N M _ 00 4 6 1 3 .2
A T A A G T T A G C G C C G C T C T C C G C C T C G G C A G T G C C A G C C G C C A G T G G T C G C A C T T G G A G G G T C T C G C C G C C A G T G G A A G G A G C C A C C G C C C C C G C C C G A C C SEQ ID NO: 3 - IL7R 5'-UTR de Homo sapiens
N M _ 002185 .3
A T C T A A G C T T C T C T G T C T T C C T C C C T C C C T C C C T T C C T C T T A C T C T C A T T C A T T T C A T A C A C A C T G G C T C A C A C A T C T A C T C T C T C T C T C T A T C T C T C T C A G A SEQ ID NO: 4 - BGN 5'-UTR de Homo sapiens
N M _ 001711 .4
C C T T T C C T C C C T C C C C G C C C T C T C C C C G C T G T C C C C T C C C C G T C G G C C C G C C T G C C C A G C C T T T A G C C T C C C G C C C G C C G C C T C T G T C T C C C T C T C T C C A C A A A C T G C C C A G G A G T G A G T A G C T G C T T T C G G T C C G C C G G A C A C A C C G G A C A G A T A G A C G T G C G G A C G G C C C A C C A C C C C A G C C C G C C A A C T A G T C A G C C T G C G C C T G G C G C C T C C C C T C T C C A G G T C C A T C C G C C SEQ ID NO: 5 - TK1 5'-UTR de Homo sapiens
SEQ ID NO: 6 - RAB3B 5'-UTR de Homo sapiens
NM_002 8 6 7 .3
A G A C T C C G C C C T T G G G C G G G G C C T G G A T G C G G C C G G A G C G G A G C A G T G C T G G A G C G G G A G C C T C A G C C C T C A G G C G C C A C T G T G A G G A C C T G A C C G G A C C A G A C C A T C C C G C A G C G C C C C G C C C C G G C C C C C T C C G C G C C C T C C C G A C G C C A G G T C C T G C C G T C C C G C C G A C C G T C C G G G A G C G A A C C C G T C G T C C C G C A C T C G G A G T C C G C G SEQ ID NO: 7 - CBX6 5'-UTR de Homo sapiens
N M _ 01 4 29 2 .3
G A G C G G T G C C G C A C C G G C C G C G G G C G C A G G G A G T A T T A T G G G C T G T G G G T G C C G C T G A G C A A G SEQ ID NO: 8 - FZD25'-UTR de Homo sapiens
N M _ 001 4 6 6 .3
G A G G A G A G A G G G C A G C A G C G C G C G G T G T C T C C G G C T G C T C A G T C C G A C C G C G G C A A G C A A G C G G G C A G G C G C A C C G G C C C C T C C C C C G C C C G G C C T C C C C A A C T C T G C G G C C G C G A G T A A A G T T T G C A A A G A G G C G C G G G A G G C G G C A G C C G C A G C G A G G A G G C G G C G G G G A A G A A G C G C A G T C T C C G G G T T G G G G G C G G G G G C G G G G G G G G C G C C A A G G A G C C G G G T G G G G G G C G G C G G C C A G C SEQ ID NO: 9 - COL8A1 5'-UTR de Homo sapiens
N M _00135 0 .4
A T C A C A G C C C T T C C C C G A T C C T C T C C G T G G G A G C C A G C G A G C C T C T C T C C C T G A T C T T A C G T G C T C A A G G G A G C T C A C A C G T T C A C C A A C T C A C C C T T G A A G T C A T C T C A A G A A C A A A A G A C A A C T G A A A G A A G C T G T T G T G A A G G C A G A G C A G C A T C T G C T G A A G A G A C A G A A A C C A G C C C C A G A G G T G T C A C A G G A A G G C A C C A G C A A G G A C A T T G G T C T T T G A T T T G A T T C A G C A G T C C T G T C A A G T A T A A A T G T G SEQ ID NO: 10 - NDUFS7 5'-UTR de Homo sapiens
NM_0 2 4 40 7 . 4
AAGGAGAA CG GACCTCAGA GG TTGTCTG AA GGCCG AG GCCAA G SEQ ID NO: 11 - PHGDH 5'-UTR de Homo sapiens
NM_00 6 6 2 3 . 3
G C A G G G A T T T G G C A A C C T C A G A G C C G C G A G G A G G A G G C G G A G T C G C G G A G A G T T T G A G T A T T T C C G T C C A A T C A A A A G G A G A C T G T A A G A G G A G G A G G A G G A G G A G A T G A C T G G G G A G C G G G A G C T G G A G A A T A C T G C C C A G T T A C T C T A G C G C G C C A G G C C G A A C C G C A G C T T C T T G G C T T A G G T A C T T C T A C T C A C A G C G G C C G A T T C C G A G G C C A A C T C C A G C A SEQ ID NO: 12 - PLK2 5'-UTR de Homo sapiens
NM_00 662 2.3 TCCGCCCCCTTCCCGCCTCCCCGTATñTAAGACTTCGCCGñGCGCTCTCACTCGCñCAAGTGGACC GGGGTGTTGGGTGCTAGTCGGCACCAGAGGCAAGGGTGCGAGGACCACGGCCGGCTCGGACGTGTG ACCGCGCCTAGGGGGTGGCAGCGGGCAGTGCGGGGCGGCAAGGCGACC
S E Q ID NO: 13 - T S P O 5 '-U T R de H om o sap iens
N M _ 00071 4 .5
G G CG G C TG G G A G G G G C G G G G C G G A TG C G G G G A C A G C G G C C TG G C TA A C TC C TG C C A G G C A G TG C C C T T C C C G G A G C G T G C C C T C G C C G C T G A G C T C C C C T G A A C A G C A G C T G C A G C A G C C SEQ ID NO: 14 - PTGS1 5'-UTR de Homo sapiens
Figure imgf000035_0001
SEQ ID NO: 15 - FBXO32 5'-UTR de Homo sapiens
N M _0582 2 9 .3
G C TG C G G C C G G C TG C G G G G A TA A A TA C TG C G G C A G C TA C TG C C G C G C A G C A C TC C C G G A G C C TG C A A C G C T T G A G A T C C T C T C C G C G C C C G C C A C C C C G C A G G G T G C C C C G C G C C G T T C C C G C C G C C C C G C C G C C C C C G T C G C G G G C C C C TG C A C C C C G A G C A T C C G C C C C G G G TG G C A C G TC C C C G A G C C C A C C A G G C C G G C C C C G T C T C C C C A T C C G T C T A G T C C G C T C G C G G T G C C SEQ ID NO: 16 - NID25'-UTR de Homo sapiens
N M _ 007361 .3
G C C T TA G A A A A G T T A A C G A G A A C C A G A T G T G G T G G C C A C T G C C G A A C T T T C T C A G A G C C G G T G A T T G G T C C C C A G C C G A G G G C C T C A G C C A A T T A G C T T G C T G G G T G G G C C T G G A G T C C C G C C C C G C C C A G G C G CC C G C G G A G A TC C A G G TTC G A G G C TG G C G C G G C G C G G A G A G TG G G C TG G A G G C C G G G G C G G G A C G C G T TG TG C A G C G G G TA A G C G C A C G G C C G A G C G A G C SEQ ID NO: 17 - ATP5D 5'-UTR de Homo sapiens
N M _ 00168 7 .4
C A G A C G T C C C T G C G C G T C G T C C T C C T C G C C C T C C A G G C C G C C C G C G C C G C G C C G G A G T C C G C T G T C C G C C A G C T A C C C G C T T C C T G C C G C C C G C C G C T G C C SEQ ID NO: 18 - EXOSC4 5'-UTR de Homo sapiens
N M _ 01 9 0 3 7 .2
A T G G C G G A C C T C C G G A A A C C G T A G A T T C C G G G C G G T C G G A G C C G C C G G G A G C T G T A G T T C T C C C G C G G C T C A G A G A A G T A G G C A G A G A G C G G A C C T G G C G G C C G G G C A G C SEQ ID NO: 19 - NOL95'-UTR de Homo sapiens
Figure imgf000035_0002
S E Q ID NO: 20 - T U B B 4 B 5 '-U T R de H o m o sap ie ns
N M _00 608 8 .5
A TA TA A G C G TTG G C G G A G C G TC G G TTG TA G CA C TC TG C G C G CC CG CTCTTC TG C TG CTG TTTG TC T A C T TC C T C C TG C TTC C C C G C C G C C G C C G C C G C C A TC SEQ ID NO: 21 - VPS18 5'-UTR de Homo sapiens
N M _ 02085 7.2
GCCCGCGTCA CGG GGGCGG GAG TC A G CTG A G CTG CC G G G G C G A G G TTG G G A TCA C CTG G C A C CG G C TG A A G G G A G CC TG TG A TTTTTTTG TA G CG G G G G CG G G G A G TA A G G TG C A A G A CTG C G CC A G A TTC A A G G ñ C G A G G G C T G C C C G A T T A T C T C G C T G C A T A ñ G G C A A G A G C ñ ñ G ñG G ñT C C T C A G G A T T T T flñ A G A G G A G G CG A C G G C TG C A G G TTC CC A G G A TCTG TCA G A G G C TG G G G A G TTA CA G C TTCC A TTC TG G GG CGA CG GGG ACCCCG GGGG GGTA G CC CTTTTG TA A TCC CC A G G CC CC G G A CA A A G A G C CC A G A G G CCGG GCACC SEQ ID NO: 22 - ORMDL2 5'-UTR de Homo sapiens
N M _ 014182
A A G G G G C A G A A G G A G A G G C G T T A C T T C C T G G A G A C T T C A G G T G T G G T A G C C G G C G C C G C G C C C A T A G C C G G A C G G G G A TC TG A G C TG G C A G G SEQ ID NO: 23 - FSCN1 5'-UTR de Homo sapiens
N M _00308 8 .3
A G CTG G G CTTT G TG G A G C G C T G C G G A G G G T G C G T G C G G G C C G C G G C A G C C G A A C A A A G G A G C A G G G G C G C C G C C G C A G G G A C C C G C C A C C C A C C T C C C G G G G C C G C G C A G C G G C C T C T C G T C T A C T G C C A C C SEQ ID NO: 24 - TMEM335'-UTR de Homo sapiens
N M _ 01 8 1 26 .2
A C G G A A A T G A A A G G A G C A C T T C C G G G T T C G G C A A T A A C C T G G A G C C G G C G G C G T A G G T T G G C T C T T T A G G G C T T C A C C C C G A A G C T C C A C C T T C G C T C C C G T C T T T C T G G A A A C A C C G C T T T G A T C T C G G C G G T G C G G G A C A G G T A C C T C C C G G C T G C T G C G G G T G C C C T G G A T C C A G T C G G C T G C A C C A G G C G A G C G A G A C C C T T C C C T G G T G G A G G C T C A G A G T T C C G G C A G G G T G C A T C C G G C C T G T G T G T G G C G C G A G G C
A G G G A A G C C G G T A C C C G G G T C C T G G C C C C A G C G C T G A C G T T T T C T C T C C C C T T T C T T C T C T C T T C G C G G T T G C G G C G T C G C A G A C G C T A G T G T G A G C C C C C SEQ ID NO: 25 - TUBA4A 5'-UTR de Homo sapiens
Figure imgf000036_0001
S E Q ID NO: 26 - E M P 3 5 '-U T R de H om o sap iens
N M _ 001425.2 CGGGAGCAAGAGAGAAGGAGGCCCAGACAGTGAGGGCAGGAGGGAGAGAAGAGACGCAGAAGGAGA GCGAGCGAGAGAGAAAGGGTTCTGGATTGGAGGGGAGAGCAAGGGAGGGAGGAAGGCGGTGAGAGA GGCGGGGGCCTCGGGAGGGTGAAAGGAGGGAGGAGAAGGGCGGGGCACGGAGGCCCGAGCGAGGGA CAA GA CTCCGACTCCAGCTCTGACTTTTTTCGCGGCTCTCGGCTTCCACTGCAGCC SEQ ID NO: 27 - TMEM201 5'-UTR de Homo sapiens
NM_0 01010866.3 CTACCCGCCTACCCGCCTACCCCCCTGCCGGCCTGCCGTCCTTCCACGCGGAGAGCC SEQ ID NO: 28 - CRIP2 5'-UTR de Homo sapiens
N M _ 001312 .3 GGACAGCCGGGCAGGCGGGGCTGGGCGCGGGCGGCGGCGGCCCGGAGGAGAACGGGCGGAGGGCGC GGGCCGACCGGGCGCACCGACC SEQ ID NO: 29 - BRAT1 5'-UTR de Homo sapiens
N M _ 1527 43 .3
A C C G G A T G C T C G G C A T G A A C C A C T A G G C G C C T G G C G G G G G T G A T C T G T C G G A G C G A C C G G C T T G G C G C C T G C C T G T C C C C A G C C C C T C T C A G G T T G A A C T C C T T C C T T C A A G T C T G G G C C C T C G A G G C T T C C A G A G C G G C C T C C A G G G G T G C A G T C T C A G T T C C C C A C G C C A G C C G T C T C C G T C C T C C G C C T C C T C C G G G C C TG G C A G G T G G C A C TG TC C G G A G G C G G A G C C TT G G G C G A G G G G T G G T TG C G G C G G A G G A C G C A A C C G A G C G G G C C T G C G G C C T C A C C SEQ ID NO: 30 - SERPINH1 5'-UTR de Homo sapiens
NM_001235.3 AGTAGGACCCAGGGGCCGGGAGGCGCCGGCAGAGGGAGGGGCCGGGGGCCGGGGAGGTTTTGAGGG A G G TC TTTG G C TTTTTTTG G C G G A G C TG G G G C G C C C TC C G G A A G C G TTTC C A A C TTTC C A G A A G TT TCTCGGGACGGGCAGGAGGGGGTGGGGACTGCCATATATAGATCCCGGGAGCAGGGGAGCGGGCTA AGAGTAGAATCG TGTCG CGG CTCG AGA GCGA GA GTCACGTCCCG GCG CTAGCCCA GCCCG ACCCAG G C CC A C CG TG G TG CA CG C A A A CC A C TTCC TG G CC SEQ ID NO: 31 - CD9 5'-UTR de Homo sapiens
N M _0017 6 9 .3
C T T T T C C C G G C A C A T G C G C A C C G C A G C G G G T C G C G C G C C C T A A G G A G T G G C A C T T T T T A A A A G T G C A G C C G G A G A C C A G C C T A C A G C C G C C T G C A T C T G T A T C C A G C G C C A G G T C C C G C C A G T C C C A G C T G C G C G C G C C C C C C A G T C C C G C A C C C G T T C G G C C C A G G C T A A G T T A G C C C T C A C C
S E Q ID NO: 32 - D P Y S L2 5 '-U T R de H o m o sap ie ns
NM_00138 6 .5 ATATCCCAGGATCGCGGCCAATCGCTGCTCGTCTCTCTCGAAGCGGATGGCTTTTGCCTGAGAGGA AAGGGAGTGGCTGGCGGCGCATGCGCCACGGTGGCCGACTTGAACCGAGGCTTTTATTGCTGTAGT T T A T T T C C A C C C C C T T C C C T C C T G T T T C T C T C T C T C C T T C T C T C T C T C T C T C T C T C T C T C T C T T T T TTTTCCGCCCTAGCTGGGGCTGTGTTGGAGGAGAGGAAGfiAAGAGAGACAGAGGflTTGCATTCATC CGTTACGTTCTTGAA ATTTCCTA ATAGCAA GACCA GCGA AGCG GTTGCA CCCTTTTCAA TCTTGCA AAGGAAAAAAACAAAACAAAACAAAAAAAACCCAAGTCCCCTTCCCGGCAGTTTTTGCCTTAAAGC TG CCCTCTTGAAATTAATTTTTTCCCAGGAGAGAG SEQ ID NO: 33 - CDK9 5'-UTR de Homo sapiens
NM_0012 6 1. 3 AAGTGGCCGTGGAGGCGGAAGTGGCGCGGCCGCGGAGGGGCCTGGAGTGCGGCGGCGGCGGGACCC GGAGCAGGAGCGGCGGCAGCAGCGACTGGGGGCGGCGGCGGCGCGTTGGAGGCGGCC SEQ ID NO: 34 - SSSCA1 5'-UTR de Homo sapiens
NM_0063 9 6 . 1
C C G G C G G T G A C A A C G G C A A C SEQ ID NO: 35 - POLR2L 5'-UTR de Homo sapiens
NM_0 2 11 2 8. 4
A G TC TG G G A C G C G C C G C C G C C SEQ ID NO: 36 - LIN7C 5'-UTR de Homo sapiens
NM_018362
C T G T G G G T C T G T A G G T T A A G G G A G A A G SEQ ID NO: 37 - UQCR10 5'-UTR de Homo sapiens
N M _ 0010 03 6 84 .1
G C G G T G G C G C G A G TT G G A C TG T G A A G A A A C SEQ ID NO: 38 - TFRC 5'-UTR de Homo sapiens
NM_0011 28 14 8 .1 ACGCACAGCCCCCCTGGGGGCCGGGGGCGGGGCCAGGCTATAAACCGCCGGTTAGGGGCCGCCATC CCCTCAGAGCGTCGGGATATCGGGTGGCGGCTCGGGACGGAGGACGCGCTAGTGTTCTTCTGTGTG GCAGTTCAGA SEQ ID NO: 39 - PSMB3 5'-UTR de Homo sapiens
N M _ 002795 .2
G A G C G G T TG C G C A G TG A A G G C TA G A C C C G G TT TA C T G G A A TT G C T C T G G C G A TC G A G G G G TC C T A G T A C A C C G C A A T C
S E Q ID NO: 40 - FA S N 5 '-U T R de H om o sap iens
NM_004104.4 GAGAGACGGCAGCGGCCCCGGCCTCCCTCTCCGCCGCGCTTCAGCCTCCCGCTCCGCCGCGCTCCA GCCTCGCTC TCCGCCGCCCGCACCGCCGCCCGCGCCCTCACCAGAGCAGCC SEQ ID NO: 41 - PSMB6 5'-UTR de Homo sapiens
NM_0027 98.2
G TG A C A G A G C G C T TT A C G A C A G T TG C TT TG A G G C A G T A C C G G A G G A G A A A G SEQ ID NO: 42 - PYCRL 5'-UTR de Homo sapiens
NM_02 3 07 8.3
CTAGATCTGTGGGCGGGGCGCGGCCTGTGG SEQ ID NO: 43 - PRSS56 5'-UTR de Homo sapiens
NM_001195129.1 GATGATTTGAGGGACAAGAATTCAGTGCCCGGGGGCCGAAAGGCAGCAGAAGGCGGGCACCAAAGG ATAGGCACCCGGAAGGTGGACTCCGAGGAGGAGAGAGGACAGGGGTCTCTCACCCCAGCTCCTGGT CACC SEQ ID NO: 44 - KPNA6 5'-UTR de Homo sapiens
Figure imgf000039_0001
SEQ ID NO: 45 - SFT2D2 5'-UTR de Homo sapiens
N M _ 19 934 4 .2
C C G T C A A C T T A G C G A G C G C A A C A G G C T G C C G C T G A G G A G C T G G A G C T G G T G G G G A C T G G G C C G C A SEQ ID NO: 46 - PARD6 B 5'-UTR de Homo sapiens
N M _ 03252 1 .2
G A G G G A G G G A G C T G C T T C C C C G C C T G C C G C G C C A C C A G T C C G A C C C T C G G T C C C G C C G T G T G A G C A G C T G G T G G A G T G G A G C T C A G C G C G G A C G C C G G A G C T G C G G C C G C C C C C T C T G C A G G T G C C T G T G A G G A G G C G C C C G G G C C G C A A C C G C T T T C C G A G A T C C C C A G T C G C G C A C T C G C T C C C C G C G C T C C T G A G G G G C C G C C C G G C C G G A G G A G G C C G T C G C G G G G C T C G G C G T T C A G C
S E Q ID NO: 47 - LP P 5 '-U T R de H om o sap ie ns
G A G G A A G G A G G G G G A A A G G C A C C A A C C A G C A G C C G C T C C A G C C C T G C C G A A G T T T C A C T T T IT G T C T G T G G G T T C G T T C C C G G G T C C C G C G C G A G C T T T C C C G G G A T A A G T A G C T T T A G C G A T C G G G A G A C A G C C G G G C G C T G C A A G T G G G A A C T T T G A G G C T C A G A G A C A G A G C A G A A G A C A G A A C C T G G T C T T C T G A T T C C C T G T G T T C T G C T T T T T T C A T T G T T C C A C T G G A C G C T C A T C A G A G G G A A G A T C T T T T T C C T C A A T T G C A T T G C A G T T G G C T G A A C C T T G T G T C A A C C A T C C A T T C C A G G A G C C A G C T A T C T G A G A T T C C A A C A SEQ ID NO: 48 - SPARC 5'-UTR de Homo sapiens
N M _ 003118. 3 GGGAGAAGGAGGAGGCCGGGGGAAGGAGGAGACAGGAGGAGGAGGGACCACGGGGTGGAGGGGAGA TA G A C C C A G C C C A G A G C TC TG A G TG G TTTC C TG TTG C C TG TC TC TA A A C C C C TC C A C A TTC C C G C G G TCC TTCA G A CTG C CC G G A G A G C G C G C TC TG C C TG C C G C C TG C C TG C C TG C C A C TG A G G G TTC C C A GCACC SEQ ID NO: 49 - SCAND1 5'-UTR de Homo sapiens
C T T C C G G G A G C C C G C A A G C G G C T T C C G G G T G C T C G C G C G C C G A C C T G G A C G C A G A G A A G C C A G A G A C T T T C G C T T C C G G C T G C C G C A G G C G C T T C G C T G G T G C A G G T A A G C T C C G C A C A C T C T C G G C C G G T C C C G A G T C C G A C T C C C T C A A G G G T G A C G C G A G C T C T G C C C T T T A A C C G G A A A C G T C T C C C T G C T C A C C C C A C C C C C G C G C A G A C G C A G T G C T G A G C A C A C A G C T A C C G G A C A A A G A G T G A C G C C C G G A G C T G G A G T T SEQ ID NO: 50 - VASN 5'-UTR de Homo sapiens
NM_138 4 4 0.2
G A C T C C G G A G C C C G A G C C C G G G G C G G G T G G A C G C G G A C T C G A A C G C A G T T G C T T C G G G A C C C A G G A C C C C C T C G G G C C C G A C C C G C C A G G A A A G A C T G A G G C C G C G G C C T G C C C C G C C C G G C T C C C T G C G C C G C C G C C G C C T C C C G G G A C A G A A G SEQ ID NO: 51 - SLC26A1 5'-UTR de Homo sapiens
NM_0 2 2 04 2.3
A C A G A C C A C T G C C T G C A G G T T G G C G C C A C C A C C C C C A C T C T C C C C G C T G C T C G C G G G A G C C A G A G G G C C C T G C G G T C C T C G G T G G T C T T G C C A G C C C C T C G T C A T C C C A G G G C C C T C C G C G C C T G T G A G G A C T C C C T C A G G T C G G C C A C G G G A C C T G A C G C A A C A G G SEQ ID NO: 52 - LCLAT1 5'-UTR de Homo sapiens
NM_182551.3
G G C C G G A C G C C T C C G C G T T A C G G G A T G A A T T A A C G G C G G G T T C C G C A C G G A G G T T G T G A C C C C T A C G G A G C C C C A G C T T G C C C A C G C A C C C C A C T C G G C G T C G C G C G G C G T G C C C T G C T T G T C A C A G G T G G G A G G C T G G A A C T A T C A G G C T G A A A A A C A G A G T G G G T A C T C T C T T C T G G G A A G C T G G C A A C A A A T G G A T G A T G T G A T A T
S E Q ID NO: 53 - F B X L18 5 '-U T R de H o m o sap ie ns
N M _ 02 4 9 6 3 .4
G C G G T G G A C G C G C C G G C T T C G A G C A T C C C T A G C C G G G C A G G T G G G A G G C A C G G G G T T G C G G A T C C C G C G G C C G C G G T T C G G A C C C G C C G G C G A C SEQ ID NO: 54 - SLC35F6 5'-UTR de Homo sapiens
N M _ 017877 .3 GGAAGCGCTCGCGCAGGAGACCCCGGGTGACGGGGCCCGGCGCCGCTAACTGGAGCGAACCCCAGC G TCCGCCGA C SEQ ID NO: 55 - RAB3D 5'-UTR de Homo sapiens
N M _ 0 0 428 3 .3
C C T T C C T C C G C C T T C T G G G C G G A G C C C G C G C G G G A T C C G G G T G G C T G C A G G C T G C T G G C T T C T G C G G C T G C G G G G T C G G G G T C G C G G C C A G G G C C A A G C C G C A G C G A G T T C A C A G G C G G A A C C C C T G C A G G C G G C G C C C C C T A C G C G A G G T C A C C C C T G G G A A G G A G C G C A G C C C A C C C G G C C C C T C C G C A T C C G A G C A G G A C G C C C G T C T C C T C T C C C T G A G G A T T T C A G G T C T C C C T G T C C C A G G A G G C T T G T G C C A A G SEQ ID NO: 56 - MAP1B 5'-UTR de Homo sapiens
N M _ 005 9 0 9 .3
G C C T A G T C T C C A T A T A A A A G C G G C G C C G C C T C C C C G C C C T C T C T C A C T C C C C G C T C C T C T C C G C C G C G C A C T C T C C G C G G C G C T G G G A G A G G G C G G A G G G G G A G G C G G C G C G C G G C G C C A G A G G A G G G G G G A C G C A G G G G G C G G A G C G G A G A C A G T A C C T T C G G A G A T A A T C C T T T C T C C T G C C G C A G T G G A G A G G A G C G G C C G G A G C G A G A C A C T T C G C C G A G G C A C A G C A G C C G G C A G G SEQ ID NO: 57 - VMA21 5'-UTR de Homo sapiens
N M _001 01 79 80 .3
G C A C T T C C G G C G C G A A C C G C T A C T T C C G G T G C G A A C C G C C T C G G C C G T T C C C T C G C G G A G C T T A C T G A G C G C G G C C G C C G A G C C C A G C T C C G C C G C C G A G C G C C T G T G C C G G C A C G G C T A C A C C SEQ ID NO: 58 - AMN 5'-UTR de Homo sapiens
N M _ 030 94 3 .3
G T C T C C T G G T G G G G T G C A A G G A G C C G A G G C G A G SEQ ID NO: 59 - CYBA 5'-UTR de Homo sapiens
N M _ 0001 01 .3
G G C G G G G TTC G G C C G G G A G C G C A G G G G C G G C A G TG C G C G C C TA G C A G TG TC C C A G C C G G G TTC G TG T C G C C
S E Q ID NO: 60 - S E Z 6L 2 5 '-U T R de H o m o sap ie ns
N M _ 012 410 .3
A CC A C A G A G C C G CG A G A A G A GGA CA GA GGA GA CTGA GCA A AGG GGG GTG GGCTCCA GGCGA CCCCT A G C C C A A T T C T G C C C C T C C A T C C C A A G G G G C A G A G A A A T T G T C T T T C T T T G C T G A C T C C T A C G A G G AAAAAAAAAAAAAAAAAAAAAACAATTAAAGGGAAAGATAAACGGAGACGGAGGAAAGGTGGCAGC C A G A TTA CTTA G A G A G G CA C A G A G G A G A G A G A TC G G G G TG A G TC G CC SEQ ID NO: 61 - PCOLCE 5'-UTR de Homo sapiens
N M _ 002593.3 GACCTAGAGAGGTCCCAGGACACGCCACTGTCCCGCCTTCCCCATTGCCCGCCCCACTGGCCAGTC CCCACGCCCACACACCCAAGGCTGCCCCATCTGGCGCTGATTATCCTGCTGCTGCCGCCACCGCTG CTGCTGCTCTGCAAAATTCAGCTGCTGCCTCTGTCTTGAGGACCCCAGCGCCTTTCCCCCGGGGCC SEQ ID NO: 62 - MAP1S 5'-UTR de Homo sapiens
N M _ 01817 4 .4
G G CCCGA A G SEQ ID NO: 63 - VTN 5'-UTR de Homo sapiens
N M _ 000 638 .3
G A G C A A A C A G AG CA GCAG AA AA GGCA GTTCCTCTTCTCCAG TGCCCTCCTTCCCTGTCTCTG CCTC TCCCTCCCTTCCTCAGGCATCAGAGCGGAGACTTCAGGGAGACCAGAGCCCAGCTTGCCAGGCACT GAGCTAGAAGCCCTGCC SEQ ID NO: 64 - ALDH16A1 5'-UTR de Homo sapiens
NM _001 1 45 3 96 .1
A TTCC CA TTAG CCCCGCCCCTTTG GGCTG GAA CCGG AGG TG TCGCTCTTCGGA CCTCA AGG TTCCC CTTAACACAGAGCGCCCCGCAGTCTTCGCGGAAAGCGTTCGGGGTAGGCG SEQ ID NO: 65 - RAVER1 5'-UTR de Homo sapiens
N M _ 13345 2.2 TTAGCCAACGGGGCAAGGGGGGCGGGAAGGAGGTGGGGTTTCTCCCAGCCAATCGACGGGCGCGCC C TC G TT G C C G C TC T SEQ ID NO: 66 - KPNA6 5'-UTR de Homo sapiens (idéntica a SEQ ID NO: 44)
Figure imgf000042_0001
SEQ ID NO: 67 - SERINC5 5'-UTR de Homo sapiens
NM_178276.5 GTTTTTACCCAGGCCTCGGCGCCTAGGCGCTTCGCCGAGGCTGATCTTCGTTCAAGTGTGAGCTGC
G G CTG A G C C C A G C G C T C G A G G C G C G A G G C A G C C A G G A G G G C C C G T G C G G C G C G G G G A G C C A G C G A G C G C G C C T T C G G C A T T G G C C G C C G C G SEQ ID NO: 68 - JUP 5'-UTR de Homo sapiens
N M _ 002230 .2
TG A G TT G C T G C C T TG G C C A G A G TC C G G A G C A G C C G C C G C C C G A C C A C G C C G A G C T C A G TT C G C T G T C C G C G C C G G C T C C C A C C C C G G C C C G A C C C C G A C C C G G C C C G G T C A G G C C C C A TA C T C A G T A G C C A C
SEQ ID NO: 69 - CPN2 5'-UTR de Homo sapiens
NM _001 0 80 5 13 .2
GG ATTGA GCTG ACCACAGGCCACACCAGACTCCTCTCTGCTCCTGAGGAAGACAGGGCAGCCCGGC GCCACCCG CTCG GCCCTCA CG AA G SEQ ID NO: 70 - CRIP2 5'-UTR de Homo sapiens
N M _ 00131 2.3 GGACAGCCGGGCAGGCGGGGCTGGGCGCGGGCGGCGGCGGCCCGGAGGAGAACGGGCGGAGGGCGC GGGCCGACCGGGCGCACCGACC SEQ ID NO: 71 - EPT1 5'-UTR de Homo sapiens
N M _ 03350 5. 2
A C G C G T G C G C G G TG G G C G G A G C G C G G C TC TC C TA C C TTC TC G G G C A G C C C A G TC TTTG C C A TC C TT G C C C A G C C G G TG TG G TG CTTG TG TG TCA CA G C CTTG TA G CC G G G A G TC G CTG C CG A G TG G G CG C TC A G T T T T C G G G T C G T C SEQ ID NO: 72 - PNPO 5'-UTR de Homo sapiens
N M _ 01812 9 .3
C A TTG G C TC C G A G G A C TTA G G A C C TG TTA G C TTG G TTG G G C G A C TG G C A A A TC C TTC C TTC C C C G G GG TA GA AGTCCA GGGTGAGAAATTGGTTCCGAACTCAAAGGAACCCAGTGCCGGGCCACAGCCGGG TC A C G TG G C CG G C G G C CC CC C SEQ ID NO: 73 - Dpysl2 5'-UTR de Mus musculus
NM_009955.3
C TC TC TC C C TC T T T C T T T T T T C C G C C C T A G C T G G A T C T G T G T T G G A G G A G A G G A A A A G A G A C A G A G G A T T G C A T C T G T T T T G A A A T C T C C T A A T A G C A A G A C C A G T T A A G G G A T T G T A C C T T T T T C C T A C A ñ A T A T A A A T A T A T A T A T A T T T T A A A C C A A G T C T T T T T T T T T C C G G C T A T C T T T G C T T T A A A G C T G T C C T C T T G A G A T T A C T T C C T C C C G C C C C C C G G A G A G
S E Q ID NO: 74 - C c n d l 5 '-U T R de M us m uscu lu s
N M _ 007 631 .2
TTTTCTCTG C CC G G C TTTG A TCTCTG CTTA A CA A C A G TA A C G TCA CA CG G A CTA C A G G G G A G TTTT GTTG AA GTTGCAAAGTCCTGCAGCCTCCAGAGGGCTGTCGGCGCAGTAGCAGAGAGCTACAGACTC CGCGCGCTCCGGAGACCGGCAGTACAGCGCGAGGCAGCGCGCGTCAGCAGCCGCCACCGGAGCCCA A CCGAGACCACAGCCCTCCCCAGACGGCCGCGCC SEQ ID NO: 75 - Acox2 5'-UTR de Mus musculus
N M _ 0011 61 6 67 .1
C G CTG TC C C A G G A C A G A G G TG A G TC A A G A G TTTA G TC C C A G G C C A G C C A G A G A A C TG A C A G A A C A T A C C A A A G G TT C T TG G TA C C T C C C G G TG C TC A G A G C A G A C C C T A A A G G A A G C C A A G T C C TT C C TG A G A CA GGC A G A TCC A G G SEQ ID NO: 76 - Cbx6 (Npcd) 5'-UTR de Mus musculus
N M _001013 36 0 .2 GAGCGCGCGCCCCGCCGAGCGCCCGCCCGCCGGGGGCCTGAGCGCTGGGGCGCGTGCGCGAGCGGT GCAGCACCGGCCGCGGGAGCAGGGAGTATTATGGGCTGTGGGTGCCGCTGAGCAAG SEQ ID NO: 77 - Ubc 5'-UTR de Mus musculus AGTTCCGTGGAGACTGCGAGTTCCGTCTGCTGTGTGAGGACTGCCGCCACCACCGCTGACG SEQ ID NO: 78 Ldlr 5'-UTR de Mus musculus
N M _ 00125 2 65 9 .1
G C A G A C T C C T C C C C C G C C T G G A A A C C T C G C C C C T A G T A C T G G G A A T G A C T C T G G G C G T G C G G C G T A G T T T G C A G C C G G G A C A C C G T G A G G C T T G C G A G C C C A G A T T C G C A G C C G A G A C A C C G T G G G G C C C G C G A TC C A G T G T T T G C A G C G G G A A C A T T T C G G G G T C T G T G A T C C G A G T G A G G A C G C A A C G C A G A A G C T AAGG SEQ ID NO: 79 - Nudt22 5'UTR de Mus musculus
G G C C G G G C C A G C C G C T A A A T T C C G A G A T C A A G C T T C C A G A T C C T G G G A G T A G A T C A A G C G T G T C C A G G T T G G A G A G C T G C C C T G T C A G A C T SEQ ID NO: 80 - Pcyoxll 5'-UTR de Mus musculus
N M _17 2 8 3 2 . 4 GAGCGCCAACCGCTAGAGGCCGATCCGGAGCGTGCTGCCCGGTCACCACCCGCC SEQ ID NO: 81 - Ankrdl 5'-UTR de Mus musculus
N M _ 01346 8. 3
C C A C A G G G C C A G T T C C A G G G G T T C A T C C A C A A G A G A G A A A A A C A T A G A C T C A C G G C T G C C A A C S E Q ID NO: 82 - T m e m 37 5 '-U T R de M us m uscu lu s
N M _ 019 4 3 2 .2 GAGTGCGACAGCTAGGCCAGGCGACAGCGCTGCCTACCAGAGCGCAGC SEQ ID NO: 83 - Tspyl4 5'-UTR de Mus musculus
N M _ 030203.2 AGAAGGAAAAGGGGTGGAGCTAAGCACTCACTGCGGTTTTGCGCTGCGTCTGCAGAGGACAAGGAA AGCTCTGCAGGGCTGTCAGCTGCCAAA SEQ ID NO: 84 - Slc7a35'-UTR de Mus musculus GGGCGCTTGGCTTGCAAGGACCCTGAGCTGCGGCATTGAAGCACACCCAACCCAACTCGACTGAAG TCAGCCTCACTGAACCGGATCTGAGAATCTTCTCTCTCTGGGCTTGCCAGGGCTCTCCGAACCTAG CTAGCATCCTCTTCAATTCCAACTAGA SEQ ID NO: 85 Cst6 5'-UTR de Mus musculus CGCGAAGGCTGTAAAAGCCGCGCAGGATGGAAGTCCAGACACTGAATCCGCGGCT SEQ ID NO: 86 - Aacs 5'-UTR de Mus musculus
N M _ 030210.1 GAGTCTCGCGCTGTGGTTCGTCGGCGCACCGCTGATCCGCTCCACGCCTTGCGCTCTCCGCTCTCA GCCAAAGCCCGGCAGCCCCGGCCACGCAGCTCCGCAACC SEQ ID NO: 87 - Nosip 5'-UTR de Mus musculus
NM_001163684.1 CTCCTGTCGGGCGGAAGTAGGAGGAGTAGAGTTTAAAAACAGTACTCTTTTTCCGGTTCGGGACGT AGTTGAAGCAACGACAAGCCGGATAACCGCTCTTGAGACAGG SEQ ID NO: 88 - Itga75'-UTR de Mus musculus
N M _00 839 8 .2 GTACTTAGCTGGTCCTGGGGCAGCAGCGGGAAGGGACTGAAGAGGGGTGCTGAGGTGAAAGATTGG AAGACCCGGAAAGATCAGCTAGATTTCGGAAACCAGAAACACCCTCGGGGAGACCTGGGGCTCCCG GCGCGCGACGATTTCCTCGCACTAGCTGGGAGAGCGTTGATCCC SEQ ID NO: 89 - Ccnd25'-UTR de Mus musculus
N M _ 00 982 9 .3 TGCCTGAGCGAGAGAGGAGAGCGAGCTGAGGAGAGCCGGGCAGTTCGGAGGGAAGGACCGGTGCGA GTCAGGCGGCCCTTGAGGCTCCGCTCGCCCACCTTCCACTCTTCTCTCTCTCTCTCCCTCTCTCTC T T T G C C A T T T C T T T C C T C T C C C A A A T C T C C C A T T C A G C C A A A G G A A G G A G G T A A G G G A A G C A C T C C C C G A C C C C C C C G C A C C T C C A A A A A A T A A T A A T A A T A A A A A A A A T T T A C A G T C G G G A C C G A G T G G T G GCCGGCTGGCT
S E Q ID NO: 90 - E bp 5 '-U T R de M us m uscu lu s
C G G A A C TG G G G C TA TT A G G G A G C C T G C A G G TC TT C C TG G A A A G TC G C A A G C C T G TG TT A G G A A G T C G C C C T G C G A T C G C G C C G C C T G G G G T T T T T C T G T C C C T T T G T C C T C G T T T A T G T A C G A A G C T G C C A G C GGGCCA TA GA A AC SEQ ID NO: 91 Sf3b5 5'-UTR de Mus musculus
NM_00982 9 .3
G A A A A G A C T G T C T A C T C C T G C G T C T C G G T G G C G T C T T T C T C C C G C G C C T G C A C G A A C T G A G G T T T T G C G T G G C G G C G G C G G C A C C G G C A G C G G C A G C G T C T C T C A C T T G A A C G C C G C G A G C G G C A G C T T C T C G T C T G T G T C C T G A C C T C G G A G C C T A C G A G C A G A G C G G C G C G SEQ ID NO: 92 - Fasn 5'-UTR de Mus musculus
G C A G C G G C G T C C C G T C C A G T T C G C C T G C C G C G C T C C T C G C T T G T C G T C T G C C T C C A G A G C C C A G A C AGAGAAGAGCC SEQ ID NO: 93 - Hmgcsl 5'-UTR de Mus musculus
C C C G G C G C T G C C C G A G T C G G G T G G G T C G G T G G C T A T A A A G C T G C G G A G G G C G G G A G G C A C A G T C T G C G G T C T C C T T G C T T T G C T C G T T C T T C T T C C A G G G T C T G A T C C C C T T T G G T G G C T G A A G G A G G A A C C G G T G A C C G A C C T G G A G A C C A C A G T T C T C T G T C C T T C A C A C A G C T C T T T C A C C SEQ ID NO: 94 - Osr1 5'-UTR de Mus musculus
N M _ 01185 9 .3 TAGGCGGCTCGGTGCTAAGGGATGAGTGAGACGTAGCTCGGCCTCTCCCCAGCAAGTTCTCGCCGG CACTGGTTCAGATTCAGAAAGGGAGCCAGGAGCGAGGCTCAGCAGACCCCGGCGGGTAGAACTCCG GGGCTGTGAAGCGCTCCCGCGTGTCCGACTCTTGGAGTCACCGCAGCTACAGAAGCGTCAGAAGTC TAGTTCGGCAGGGGTGCCAGTCGGCTCCAGAGTCTCTGGTCACTCAAGTCCAGCGCAGCGACCCTC ACAGACGCGCTCTGCCCTGGGACCGCGGCGGAACAAGATATTTGAAATCATTGCGGTTCCCAGCGA CAGAA SEQ ID NO: 95 - Lmnbl 5'-UTR de Mus musculus
N M _ 011121 .3
G C CC G C CTCTCG C CG CC C TC C TC C TC G G C C C G C C C G C C G C TC TG A G C A G C C C G A G A G G A A A C A A A G TG C T G C G G G C G G G A G A C TC G C G TC C G C C G C G C A C A G C C G TC TG C G TC TC C C G G C TG C C C TG G C C TC TTCCCG CG CG C G TCTG CG A G TG TG C G TG TA CA CTCA C A A A G G G C G TC TG G C G G G C G A TC G C G G C CC T C C C G C T T C G C T C T TT G TG C G G TA G C C C C G C C G C C A C C G C C A G C C C A G G T C C G C TC G A T C C TC A C C G G C C T G T G G T TT G T A C C T TC G G T C C C G C C G C C C G C C SEQ ID NO: 96 - Aarsdl 5'-UTR de Mus musculus
N M _ 1 4 4 8 2 9 .1
CCGGCTTTTCTGCGCGCGCGGGTCTCTCCGGCCTAGGAGACCGCG
S E Q ID NO: 97 - V m a21 5 '-U T R de M us m uscu lu s
N M _001081356 .2 GCTTCGGCAGGGGCACTTCCGGCGCGACCGGCCTAGACTGTCACCCTGTTAGCCGCCGCTGAGCCT CCGCTAACTACCCGGCGCCTGCTGCTGCCCTCCCGGCCACGCC SEQ ID NO: 98 - Kif20a 5'-UTR de Mus musculus AACAAAGCTGTTCCTCGTGGGCGGAGTTGTGCTCTCCAGCCGCAGGAGTCTTGCTGCGCGGGTGGG TAGAAGCTGGGATCAGAGAAGCGGCGAGGCAGACAGTCTTCGGACATAGACTGACTCTGCTTGTC SEQ ID NO: 99 - Cdca8 5'-UTR de Mus musculus
N M _ 02 65 60 .4 TGTGCCCGTTGAGTTTGAATTGGGTGGCGGTTAACCGAGGAGCCGCCCGTCCCTTAGTTGGAGCTG TGAGGGTTCCTCAGACTGTGTTTTGGGACCTGCAGGTAGGTTTCGGCAGAGTTCTGGAAACCTAGA CTCCAACGACTGAACTTTCTCAGCTCTCCGACCGCTCACACCCTCTCCCCGTCTCAGTCGCGGAGC CGGCTGCTTGGCCCCTCGCTCGACGCAGCCAGGCGCC SEQ ID NO: 100 - Slc7a1 5'-UTR de Mus musculus
N M _00 75 13 .4 GGTGCCCTGGAAGCTGACGCGCAGCACTGGCCGTGGCCGTGGGGCCCGCGGAGGGCGGCGCGCGGC TGATGAAACCGGCTCGGATTCCGCCCGCGTGCGCCATCCCCTCAGCTAGCAGGTGTGAGAGGCTTT CTACCCGCGGTCTCCACACAGCTCAACATCTTGCCGCCTCCTCCGAGCCTGAAGCTACCGTGGACT CTGCTGTGGCGTCTTGGCCCCCAGGTGCGGATCCTCCCCAGTGAGAAGTCCCACGAGTCTTACAGC AGATTCGCTCAGCACA SEQ ID NO: 101 - Ubqln25'-UTR de Mus musculus
N M _ 018798. 2 CGGAGACGGCCTGCAGGACCTGCTCTCTCAGCCCTCAGCCGAGGCCTACGCCGAGCCGAGTGCGCA GCCGACGACCGGGAGGAGCCGCAGCCTTCAACTCTGAGGTACTGTGATCCGCGCTGCCCGCCGGGC CGCCCCAGTCCGCTGCTGCGGCACCTCCTTCCCTCGCGCCCTCTTCGCTCGCCAGCGCCTTCCCTG TGAGCCTGCGTCACCGCGGCCGCC SEQ ID NO: 102 - Prps25'-UTR de Mus musculus
NM _Q 2 66 62 .4 AGCCCAGGCCACCGCAGCAGCAGCAGCAACAGCCGCAGCAACGGTAGCAGTAGTCTGCATCGCAGT CCCTTTCTCCTTCTCCAGCGCGCTCCTCAGTCCCCGGTCACC
SEQ ID NO: 103 - Shmt25'-UTR de Mus musculus
N M _ 02 66 6 2 . 4 CTCTTTCACTCGAACTTCACGGGGGCAATTTTCTCGCGCACGCGTTCTAAGAGCAGCTGGTTTTCG ACCCCGGTACTACACCGATACAGAGTTAGTGGCTAGTCCTCCTGTGCCTCCTGTAGCG
S E Q ID NO: 104 - K if22 5 '-U T R de M us m uscu lu s
N M _ 14 5 5 8 8 . 1
GGCCGAAGAAGGGAAGGCT SEQ ID NO: 105 - Aurkb 5'-UTR de Mus musculus
N M _ 0114 9 6 .1
G G A G A T T C G A A A G C G T C C G G G T C G C G G G G T A A A C C G G T T C T C C G T G T G C G A G C G C C T A G T G G C G T A G G C T G C G G C T T T G C G G G G A A C T G C G G G G G C T G C A G T G G T C C A C G G G G C T G A T C G G G T T C C G T T G G G C G G A T C C A C G T G C C C G C T A T C C G C C T G G A A G G A G A G G T G C A G G A G T A C C C C C G A C C T T G G C T G C G T G C T G A C T C G C T T C C T T C T G C C C G C C C A G G C T T G C A C T C C C C G G G G A T C T G C C T C T G C A T C T C T T G C C T T C G C T G T T G T T T C C C T C T C T G T C C A G C T C C C C T C C C G C T C T C G C C C T G G A G A SEQ ID NO: 106 - Fignll 5'-UTR de Mus musculus
G IC A C T T C G C G C A G G C G C A C T T C G A A A G G C G C G C T T T T C G G T G G C T G C G G T C C C G G C A G G G A G C A C A G C T C A T C C T G T G C T G A T A A C A T C G A G A A G T G T T C A G T G C C T G G T A A A G T A C A T A G A C C T T G C T T C A C T T G G A A C T C G G C C T T G A T T T C T G C C G T T G G T C A T A A T C A G C A G A G T T C T C T C T A A A C C T T T G A C SEQ ID NO: 107 - Cad 5'-UTR de Mus musculus
N M _023 5 25 .2
A G T C G T G C T T C A G C T C A C T A C G C T T A G G G C T C T G G C T T G C C G C T C C C G C C T G C T C T C C A G C G C C C C G C G C A G C G A G C C A C G T G G A C C A A C T C C G G C G C G C G G T G T T C G C T T G G T T C C A G T G G G G C T C G C C G C G C C T C C C G C G T C T G C G T G C T T G C C C T G T C T C A G C T C C G A C C C G SEQ ID NO: 108 - Anln 5'-UTR de Mus musculus
N M _ 02839 0. 3
G T G T C G T C C G G G G C G C T G A A A T T C A A A T T T T G A A C G G C C G T G G T A G C C T A C C G A C T C C G T G G G T G C G G A G G G C A G A G C C G A C TG G G T G TG A G A G C G C C C G C C G C C T C G A C TG C A G TC C T C C TC C A G G A G C TG C G C C G A G C C T G C A C T C A C T T C T T T C C T C T T C C T G A G T T T G A A C C G T C G G A C C C A C C G T C T A G C C G T C C A C T G G T G A G G C C T G G G G C G SEQ ID NO: 109 - Slfn9 5'-UTR de Mus musculus
G G G A A T T C C A C G C C A C C T C C G C G C G C T C T G C G C T C T G G G A T C C G G A G C G A C C A G G A C C T G G T G A G A C C C T C A G C T C C C C T C C A C C T T C C C C G A G G T C C A G C A C A C C A G A A C T G G A A C C T G A G C A G C C C A G A A G C C A G G G T G G C A C C A C T G T G T C T C T C C T G T C T G A A G A C C C G G A T A T T T T C T C A G A C T T G G C G A C A C G T T C C T T T A A A A G A T C A G C SEQ ID NO: 110 - Ncaph 5'-UTR de Mus musculus
NM_144818.3
A A A G A C C A C G C C C C A G T G A C G T C A C G C G G C G G T T A C C G C G C T T G G C G C T C G C G A T T T A A A A C T T A C T C C G G A G A C G T G G A G A G C A A G
SEQ ID NO: 111 - Cth 5'-UTR de Mus musculus
N M _ 14 5 9 5 3 . 2
AG CCAAAGCAACACCTCGCACTCCTGCCCCAGC SEQ ID NO: 112 - Pole 5'-UTR de Mus musculus
N M _ 011 13 2. 2
G C C T C G C G A G A G C A C G T G G A G A G C G C G C C A A A T T C T C C C C G G A G C C T G A G G G A G C T T IG G A G C G T C G C A SEQ ID NO: 113 - Uhrfl 5'-UTR de Mus musculus
N M _001 1 11 0 7 9 .1
A A T T G G G G T G G A A G TC TC C C G C A G C A G C C TG TG C A C A C T A A TA A A A A C G C C C TG A G T TT TC G C G G G A A A A A A A G T C C TA G C A G C T G G A A G G A A C C C G C G C T C T A G TG C TC A C T TG G G TC TT C A G C C A C T C A C G C G G C TC C C TT C T G G G TC A C C C A G C C G C A G A G C C C TA G C C T A G A A C C A G G C G TT C C A A G G G A G A G G A G A G TG C G G A TC G C C G C C G TG A G A G A G TA C A TC G G C A TC SEQ ID NO: 114 - Gja1 5'-UTR de Mus musculus
N M _ 010288 .3
T T TT A A A A G C T C T G TG C T C C A A G T TA A A A A A C G C TT TT A C G A G G T A TC A G C A C T TT TC TTT C A T TG GGGGAAAGGCGTGAGGGAAGTACCCAACAGCAGCAGACTTTGAAACTTTAAACAGACAGGTCTGAG A G C C C G A A C T C T C C TT TT C C TT TG A C TT C A G C C T C C A A G G A G T TC C A C C A C TT TG G C G TG C C G G C T T C A C T T TCATTAAGTGAAAGAGAGGT GCCCAGAC SEQ ID NO: 115 - Fam64a 5'-UTR de Mus musculus
C G G TG G G C TA G G A G A G G G TG TT G A T C T TC G G G TC C G G G T A T C G A G C A G G G A G G A T C T A G C G G G C A G C G G A AA CTGGA C CAAGCAC SEQ ID NO: 116 - Kif2c 5'-UTR de Mus musculus
N M _ 1344 71 .4
T G A C G T T G T A G G G A G G C T G G C G C G C G G G A T T T A A A C T G C A G C G G T T T A G G C G T T G T T A A C A C A G C G C A G T A T T A G C A G A G T C G T G G T T T C C A A G C T T C T T T C A T T T G T G T T G C C T G T T G T T G T T C C T G A G T C C SEQ ID NO: 117 - Tspan10 5'-UTR de Mus musculus
N M _ 14536 3. 2
C A C T G G A G G A G G A G C T T G C A G C T C T C C A G C T C T G G C T T A T A C A G T T C A C A G A G A A G C C A A G G G A C A C C G G G A C A C C G T T A T T T T A G G A C T G T A A C C T G T T C A G A G A G A C C C T G G C C A C T G C T C T C C G T G G T T T T C T C C A A T T G T G T G G SEQ ID NO: 118 - Scandl 5'-UTR de Mus musculus
T T C A T T T C C G G C C A C C G A G G A G C T T C G C G G G T C G A G A C G C A G G C G A G G C G C C G G A C T G C G A A A C A A A G G G G G A C G C C A A C A G C C G T A G T C
S E Q ID NO: 119 - G p r84 5 '-U T R de M us m uscu lus
N M _ 0307 2 0. 1
T T A T A T G T C C A G C T G G A A G C C T G G C T G T C C C T A G A A A A G C T G G A A G C C T G A C T G C C C C T C A A A A G A C C T G C T C T T T A G G A G A G C T A G A T A T T G T T T A C T G A A G A C A A G T G T G A A A A C T G G G A A C C T C A G T C T C C A T C SEQ ID NO: 120 - Tpgsl 5'-UTR de Mus musculus
B C 1 38 516 .1
A A A T G G T C G T C G A G G G A A G G C G C C T C A T C G C G C C G T G A A T T SEQ ID NO: 121 - Ccl17 5'-UTR de Mus musculus
NM_011332.3
A A G A C A G G C A G A A G G A C C C SEQ ID NO: 122 - Fads3 5'-UTR de Mus musculus
NM_0 218 9 0 .3
A A G G G A G G G A A A A G T TC C C TG C G C G G A G A G C C G G G C A G G C G C A C G C TC TT A C G G C G G C C G C A G C G G C A G G G C G G G G C C G G T G G G G C G G G C G G A G G A A G A C C C C T G A T T G C C A C C T C G C C T C C C T C A G T G T C T C T C T T A G A C C T T G G T C A C G T A C C G G G G T C C G G A G G A C T T G T G T A C A G C G G C A SEQ ID NO: 123 - Cers6 5'-UTR de Mus musculus
NM_172856.3
A G C G C G C A T C C C C A G T G C C C T G A G C T G C A G A G A G C T C G G A G G A G C G C G G G A G C A G C G A C A C C G G A G TG G A C A A A G C A A G SEQ ID NO: 124 - Alkbh7 5'-UTR de Mus musculus
NM_0 27 372.1
A G C C T G C T G T G G T C A A T C C C T G A A G SEQ ID NO: 125 - Ms4a8a 5'-UTR de Mus musculus
GTAGAGAGGACTTTGGATCATTCTAA SEQ ID NO: 126 - Cxcr4 5'-UTR de Mus musculus
NM_00 9 9 1 1. 3
A A T TT TG T T G C C T G G T G C A G C A G G T A G C A G T G A A A C C T C T G A G G C G T T T G G T G C T C C G G T A A C C A C C A C G G C TG T A G A G C G A G T G T TG C C SEQ ID NO: 127 - Gprc5c 5'-UTR de Mus musculus
C A G A A A C T C C G A T C G C C T T T C C C A A C C C G A A A G T G C G C G T C G G C C G A G C C T G G A G G G A C C C A G C T G A A G C C T G G C C T G G G A G C C A G G SEQ ID NO: 128 - Fen1 5'-UTR de Mus musculus
N M _007 9 9 9 . 4
A G A T C A C G T G A C G A G A G C G C G G G C T T T G G A A G G C G G C G A A G C T G G G A A C G A T A C T G A A A G A A C G G G C T C G G G A C T G T C C A G A G A A C G C T G T G G A C T C C A A A C C A C T G C T A G C T G C T T A A G G C T C G T G C A C T C G A G A C G G G G T G A G G T C T C G C G G A A G C G T C T C T G A A A G C G G C A G A G C C G C G G G A A C A G C A C C G G G C A G C C C G G G C T T G G G C C A T T C G C T C T G C T C C G A A C A T T C C T C T T C G C C G G T A G G A A G A A G C C A T T G C T C C T G T G C T A C C SEQ ID NO: 129 - Cspg4 5'-UTR de Mus musculus
Figure imgf000051_0001
SEQ ID NO: 130 - Mrpl34 5'-UTR de Mus musculus
NM_053162.2 GAAGGCATTGTCAAGGAGCCCAGAGTGTAGGAACTGGCATTGACCCGGACGACCGGACCATTGACC CGCCGCTGGAT SEQ ID NO: 131 - Comtdl 5'-UTR de Mus musculus
C G G C TC TG TG G G CA G G G CC CG G A C A A G G TG G A G CC CTG TC G G C TTA C TG G TCC CA G TC CC A TC CTC G C TA CTCC A G CA CA C G TG A C CTCC G C CG C CG CTG CTA A C CTG CA C C SEQ ID NO: 132 - Armc6 5'-UTR de Mus musculus
N M _ 13397 2. 2
C G C T G C T C A C T T C T C A G G G C C G A G T C T A C C T A G G T G A A A A C T A T C T C T T T T G A G G G G A A G C G A C A C C T A G G A G T A G C A T T G A G A G T A C T G C A A G A G T C T C A G G C C C A C G C G T A T T C T G T G G C T C C C T T C G C T T T A C C T G T G C T C G C G G T C G C C C T C G T T G C C C C G G A A A G G A G C C T C T C G G C T G A A G G A G G G A C G C C G A G G C G A G G C G G C G C C T C T G C G C T T G C G C T T A T A T G G T G G C T C G A A G G A G C C A A A G G C A A A G T C T C G G G T G A C A G C T G C G A G C C C C A C C C T T T C C C C A C G T G G C T G C G T A G A C C C G G C A G T G SEQ ID NO: 133 - Emr4 5'-UTR de Mus musculus
N M _ 13 9 13 8 .3
A A C A T T C C T T G A G A A A G A G A G A A C A A G A T A A G C A G T G G T G C A C T T C C T C C T T C A T T G C T G C T G A G A A T G T T C C A G G C T G A G T G A G A A G T A A A A A T T C A T C A T C T C T G A A G A A C T C T T A C C C A G C C C T G T T G A A G A A A T T C C C A G A SEQ ID NO: 134 - Atp5d 5'-UTR de Mus musculus
N M _ 02531 3. 2
C C T T C G G A G A A T C C T G T G C G C G T G C G T T C T T G T G G G A A C T G C G C C T C C C A G A A G G C A C C G C G C G T C G T C C T T C T C C C T C C C T G A A G G C C G C C T C G C T T G C C C A G T G T G T C G G C C G C C C G C G A A G C T A G A G T C C A C T G A C T T T T C C G C C A C C
S E Q ID NO: 135 - 1110001 J 03 R ik 5 '-U T R de M us m uscu lu s
G C G G A G T G G G C G G G G G A A C A C C T C G C C C G A G G C A G T G A G G G A C C A G G C T C T C C A A G G A C A G A A A A SEQ ID NO: 136 - Csf2ra 5'-UTR de Mus musculus
C C C A A C C T G C A G A IG A G G A A G A G G A A G C G G G A G A C A G A C G G A C A G A C G G A C G G A C A C A G A C G C T G C G C C C A G G C C T C A C C A T C C A T C G C A G G A A G C C C C C T G T C T C A G
Algunos de estos elementos 5'-UTR de tipo natural difieren de las secuencias 5'-UTR públicamente disponibles identificadas por el GenBank en NCBI, ver la Tabla 1 (Ejemplo 1). Esta tabla refleja los resultados de secuenciación de los presentes inventores.
Así, los elementos 5'-UTR seleccionados del grupo que consiste en las SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135 son proporcionadas por la presente invención y se pueden emplear en cualquier aspecto de la presente invención.
Ejemplos de elementos 5'-UTR artificiales útiles en la presente invención
En algunas realizaciones, el elemento 5'-UTR de acuerdo con la presente invención difiere de un elemento 5'-UTR de tipo natural. Estos elementos 5'-UTR se denominan “elementos 5'-UTR artificiales”.
Es preferente que un elemento 5'-UTR artificial tenga un grado de identidad de secuencia con un elemento 5'-UTR de tipo natural que es (a) inferior al 100% y al mismo tiempo (B) más del 10%, más del 20%, más del 30%, más del 40%, más del 50%, más del 60%, más del 70%, más del 80%, más del 90%, más del 95%, seleccionándose este elemento 5'-UTR de tipo natural del grupo consistente en las SEQ ID NO: 1 a 136. Típicamente, el elemento 5'-UTR artificial difiere del elemento 5'-UTR de tipo natural en base a que se intercambia al menos un nucleótido, tal como dos nucleótidos, tres nucleótidos, cuatro nucleótidos, cinco nucleótidos, seis nucleótidos, siete nucleótidos, ocho nucleótidos, nueve nucleótidos, diez nucleótidos o más de diez nucleótidos. Por ejemplo, este intercambio de nucleótidos puede ser recomendable en caso de que el elemento 5'-UTR de tipo natural comprenda un elemento nucleótido que se considere desventajoso. Por ejemplo, en algunas realizaciones, un elemento nucleótido que se considera desventajoso se selecciona de (i) un triplete ATG interno (es decir un triplete ATG diferente al codón de inicio del marco de lectura abierto del ácido nucleico de la invención) o (ii) un sitio de reconocimiento de enzima de restricción (sitio de escisión), en particular el sitio de reconocimiento de enzima de restricción (sitio de escisión) reconocido (escindible) por una enzima de restricción utilizada en el proceso para fabricar (clonar) el ácido nucleico artificial de la presente invención. Por consiguiente, es posible introducir específicamente ciertas bases (en intercambio, preferentemente sustitución, para la(s) base(s) de tipo natural respectivas) de modo que el elemento 5'-UTR artificial no contenga un elemento nucleótido que se considere desventajoso. En realizaciones específicas, los elementos 5'-UTR artificiales se seleccionan del grupo consistente en las SEQ ID NO: 137 a 151:
SEQ ID NO: 137 - Secuencia Artificial (basada en SEQ ID NO: 3)
A T C T T A G C T T C T C T G T C T T C C T C C C T C C C T C C C T T C C T C T T A C T C T C A T T C A T T T C A T A C A C A C T G G C T C A C A C A T C T A C T C T C T C T C T C T A T C T C T C T C A G A
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que AAGCTT se reemplaza por TAGCTT, subrayado para énfasis]
SEQ ID NO: 138 - Secuencia Artificial (basada en SEQ ID NO: 9)
A T C A C A G C C C T T C C C C G A T C C T C T C C G T G G G A G C C A G C G A G C C T C T C T C C C T G A T C T T A C G T G C T C A A G G G A G C T C A C A C G T T C A C C A A C T C A C C C T T G A A G T C A T C T C A A G A A C A A A A G A C A A C T G A A A G A A G C T G T T G T G A A G G C A G A G C A G C A T C T G C T G A A G A G A C A G A A A C C A G C C C C A G A G G T G T C A C A G G A A G G C A C C A G C A A G G A C A T T G G T C T T T G A T T T G A T T C A G C A G T C C T G T C A A G T A T A A T A G T G
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que ATG se reemplaza por TAG, subrayado para énfasis]
SEQ ID NO: 139 - Secuencia Artificial (basada en SEQ ID NO: 14)
T A G G G C T G G A G C T C C G G G C A G T G T G C G A G G C G C A C G C A C A G G A G C C T G C A C T C T G C G T C C C G C A C C C C A G C A G C C G C G C C
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que ATG se reemplaza por TAG, subrayado para énfasis]
SEQ ID NO: 140 - Secuencia Artificial (basada en SEQ ID NO: 17)
C A G T C G T C C C T G C G C G T C G T C C T C C T C G C C C T C C A G G C C G C C C G C G C C G C G C C G G A G T C C G C T G T C C G C C A G C T A C C C G C T T C C T G C C G C C C G C C G C T G C C
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que GACGTC se reemplaza por GTCGTC, subrayado para énfasis]
SEQ ID NO: 141 - Secuencia Artificial (basada en SEQ ID NO: 18)
T A G G C G G A C C T C C G G A A A C C G T A G A T T C C G G G C G G T C G G A G C C G C C G G G A G C T G T A G T T C T C C C G C G G C T C A G A G A A G T A G G C A G A G A G C G G A C C T G G C G G C C G G G C A G C
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que ATG se reemplaza por TAG, subrayado para énfasis]
SEQ ID NO: 142 - Secuencia Artificial (basada en SEQ ID NO: 29)
A C C G G T A G T A G C T C G G C T A G A A C C A C T A G G C G C C T G G C G G G G G T G A T C T G T C G G A G C G A C C G G C T T G G C G C C T G C C T G T C C C C A G C C C C T C T C A G C T T G A A C T C C T T C C T T C A A G T C T G G G C C C T C G A G G C T T C C A G A G C G G C C T C C A G G G G T G C A G T C T C A G T T C C C C A C G C C A G C C G T C T C C G T C C T C C G C C T C C T C C G G G C C T G G C A G G T G G C A C T G T C C G G A G G C G G A G C C T T G G G C G A G G G G T G G T T G C G G C G G A G G A C G C A A C C G A G C G G G C C T G C G G C C T C A C C
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que dos ATG ambos han sido reemplazados por TAG, subrayados para énfasis]
SEQ ID NO: 143 - Secuencia Artificial (basada en SEQ ID NO: 31)
C T T T T C C C G G C A C T A G C G C A C C G C A G C G G G T C G C G C G C C C T A A G G A G T G G C A C T T T T T A A A A G T G C A G C C G G A G A C C A G C C T A C A G C C G C C T G C A T C T G T A T C C A G C G C C A G G T C C C G C C A G T C C C A G C T G C G C G C G C C C C C C A G T C C C G C A C C C G T T C G G C C C A G G C T A A G T T A G C C C T C A C C
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que ATG se reemplaza por TAG, subrayado para énfasis]
SEQ ID NO: 144 - Secuencia Artificial (basada en SEQ ID NO: 42)
CTTG ATCTGTGGGCGGGGCGCGGCCTGTGG
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que AGATCT se reemplaza por TGATCT, subrayado para énfasis]
S E Q ID NO: 145 - S e cu e n c ia A rtif ic ia l (ba sad a en S E Q ID NO: 43 )
Figure imgf000054_0001
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto (i) que ATG se reemplaza por TAG, y (ii) que GAATTC se reemplaza por CAATTC, subrayados para énfasis]
SEQ ID NO: 146 - Secuencia Artificial (basada en SEQ ID NO: 52)
G G C C G G A C G C C T C C G C G T T A C G G G A T G A A T T A A C G G C G G G T T C C G C A C G G A G G T T G T G A C C C C T A C G G A G C C C C A G C T T G C C C A C G C A C C C C A C T C G G C G T C G C G C G G C G T G C C C T G C T T G T C A C A G G T G G G A G G C T G G A A C T A T C A G G C T G A A A A A C A G A G T G G G T A C T C T C T T C T G G G A A G C T G G C A A C A A T A G GT A G T A G T G A T A T
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que tres ATG han sido reemplazados por TAG, subrayados para énfasis]
SEQ ID NO: 147 - Secuencia Artificial (basada en SEQ ID NO: 109)
G G C A A T T C C A C G C C A C C T C C G C G C G C T C T G C G C T C T G G G A T C C G G A G C G A C C A G G A C C T G G T G A G A C C C T C A G C T C C C C T C C A C C T T C C C C G A G G T C C A G C A C A C C A G A A C T G G A A C C T G A G C A G C C C A G A A G C C A G G G T G G C A C C A C T G T G T C T C T C C T G T C T G A A G A C C C G G A T A T T T T C T C A G A C T T G G C G A C A C G T T C C T T T A A A A G A T C A G C
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que GAATTC se reemplaza por CAATTC, subrayado para énfasis]
SEQ ID NO: 148 - Secuencia Artificial (basada en SEQ ID NO: 110)
A A A G A C C A C G C C C C A G T C A C G T C A C G C G G C G G T T A C C G C G C T T G G C G C T C G C G A T T T A A A A C T T A C T C C G G A G A C G TG G A G A G C A A G
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que GACGTC se reemplaza por CACGTC, subrayado para énfasis]
SEQ ID NO: 149 - Secuencia Artificial (basada en SEQ ID NO: 119)
T T A T T A G T C C A G C T G G A A G C C T G G C T G T C C C T A G A A A A G C T G G A A G C C T G A C T G C C C C T C A A A A G A C C T G C T C T T T A G G A G A G C T A G A T A T T G T T T A C T G A A G A C A A G T G T G A A A A C T G G G A A C C T C A G T C T C C A T C
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que ATG se reemplaza por TAG, subrayado para énfasis]
SEQ ID NO: 150 - Secuencia Artificial (basada en SEQ ID NO: 120)
A A T A G GTCGTCGAGGGAAGGCGCCTCATCGCGCCGTGAATT
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que ATG se reemplaza por TAG, subrayado para énfasis]
SEQ ID NO: 151 - Secuencia Artificial (basada en SEQ ID NO: 136)
C C C A A C C T G C A G A A G A G G A A G A G G A A G C G G G A G A C A G A C G G A C A G A C G G A C G G A C A C A G A C G C T G C G C C C A G G C C T C A C C A T C C A T C G C A G G A A G C C C C C T G T C T C A G
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que ATG se reemplaza por TAG, subrayado para énfasis]
Elementos 3'-UTR
Cuando la molécula de ácido nucleico artificial comprende al menos un elemento 3'-UTR que comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos un 90% con la SEQ ID NO.: 164 o su secuencia de ARN correspondiente, preferentemente el al menos un elemento 3'-UTR comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 1,2, 3, 4, 5, 10, 15, 20, 30 o 40%, preferentemente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, incluso con mayor preferencia de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99% con una secuencia de ácido nucleico seleccionada del grupo consistente en las SEQ ID NO: 152 a 204 o la secuencia de ADN o ARN correspondiente, respectivamente.
Entre las secuencias detalladas a continuación, las SEQ ID NO: 152 a 203 se puede considerar como secuencias 3'-UTR de tipo natural y la SEQ ID NO: 204 se puede considerar como secuencia 5'-UTR artificial.
SEQ ID NO: 152 - NDUFS73'-UTR de Homo sapiens
NM_024407.4
C G C C G C C G C C G C C G C C G C C G G A G C C T G T C G C C G T C C T G T C C C C A G C C T G C T T G T G T C C C G T G A G G T T G T C A A T A A A C C T G C C C T C G G G C T G C C G C C T C C C SEQ ID NO: 153 - PHGDH 3'-UTR de Homo sapiens
N M _ 00 662 3 .3
C C T T G G A G C T C A C T G G T C C C T G C C T C T G G G G C T T T T C T G A A G A A A C C C A C C C A C T G T G A T C A A T A G G G A G A G A A A A T C C A C A T T C T T G G G C T G A A C G C G G G C C T C T G A C A C T G C T T A C A C T G C A C T C T G A C C C T G T A G T A C A G C A A T A A C C G T C T A A T A A A G A G C C T A C C C C C A A C T C C T T C T G C SEQ ID NO: 154 - TSPO 3'-UTR de Homo sapiens
N M _ 00071 4 .5
G T G C C C G G C C C A C C A G G G A C T G C A G C T G C A C C A G C A G G T G C C A T C A C G C T T G T G A T G T G G T G G C C G T C A C G C T T T C A T G A C C A C T G G G C C T G C T A G T C T G T C A G G G C C T T G G C C C A G G G G T C A G C A G A G C T T C A G A G G T G G C C C C A C C T G A G C C C C C A C C C G G G A G C A G T G T C C T G T G C T T T C T G C A T G C T T A G A G C A T G T T C T T G G A A C A T G G A A T T T T A T A A G C T G A A T A A A G T T T T T G A C T T C C T T T
S E Q ID NO: 155 - A T P 5 D 3 '-U T R de H o m o sap ie ns
NM_001687.4
G C G G T G C G T A C C C G G T G T C C C G A G G C C C G G C C A G G G G C T G G G C A G G G A T G C C A G G T G G G C C C A G C C A G C T C C T G G G G T C C C G G C C A C C T G G G G A A G C C G C G C C T G C C A A G G A G G C C A C C A G A G G G C A G T G C A G G C T T C T G C C T G G G C C C C A G G C C C T G C C T G T G T T G A A A G C T C T G G G G A C T G G G C C A G G G A A G C T C C T C C T C A G G T T T G A G C T G T G G C T G G C A C C C A T G G G G C T C T C C T T C C G C C T C T C A A G A T C C C C C C A G C C T G A C G G G C C G C T T A C C A T C C C C T C T G C C C T G C A G A G C C A G C C G C C A A G G T T G A C C T C A G C T T C G G A G C C A C C T C T G G A T G A A C T G C C C C C A G C C C C C G C C C C A T T A A A G A C C C G G A A G C C T G SEQ ID NO: 156 - EXOSC4 3'-UTR de Homo sapiens
N M _ 019 0 3 7 . 2
C C A C C C A G C C A C C C A T G T C C A G A A T A A A A C C C T C C T C T G C C C A C A C SEQ ID NO: 157 - TUBB4B 3'-UTR de Homo sapiens
NM_0 0 608 8.5
A G C C T T C A G T C A C T G G G G A A A G C A G G G A A G C A G T G T G A A C T C T T T A T T C A C T C C C A G C C T G T C C T G T G G C C T G T C C C A C T G T G T G C A C T T G C T G T T T T C C C T G T C C A C A T C C A T G C T G T A C A G A C A C C A C C A T T A A A G C A T T T T C A T A G T G SEQ ID NO: 158 - TUBA4A 3'-UTR de Homo sapiens
NM_006000.1
A G C A G C T G C C T G G A G C C T A T T C A C T A T G T T T A T T G C A A A A T C C T T T C G A A A T A A A C A G T T T C C T T G C A C G G T T SEQ ID NO: 159 - EMP3 3'-UTR de Homo sapiens
G C G C C C C G C C T C G C T C G G C T G C C C C C G C C C C T T C C C G G C C C C C C T C G C C G C G C G T C C T C C A A A A A A T A A A A C C T T A A C C G C G G SEQ ID NO: 160 - CRIP2 3'-UTR de Homo sapiens
NM_0 01312.3
G C T A C A G C G G C T C T C A T G A T G T G G G C T C A C C T G C G C C C C A G A C C C T G C A G G G G C C C C C C T G C T T G G C T C T G C T G G G A G A G T G C T C A G C C G C C C A G T C C T G C C T G C A A G C C C A G G G C G A G T A T T G G A G G A G G G G C A G C C A C G G G C A G A G C A C C A T G C C C A T C C C C G A G T C T C T G G T G T G T C T G C C C C C T C T G G C A T C C T C T G G G C G T C C C A T G A T C C C T T C T G T G T C T G C G T G T C C G A A T C C C C G T G T G A C C C T G T C C C A G C A T T T T C C G G C C G A C C C T G C G T G T C G C C G T G G C G C T G T C C G C T C T C C C T C T C C T G C T G C G G A C C G A C C T G C C A G T G T T A T T T A T G C T C C C T T C G T G G G T G A T G G C C A C G C C C T C A C C A T G T C C C T G G C A G A G G G C T T C C C T C C G G G A T C C C C T G C C T G G T G C C C A C A C T G C C T C G C A A G C G C T C G C C A C C C T C A C G T G G C T C A C C T G C T G T T G A G C C T T G T G C T G T C A A T A A A C G G T T T G A G G A T T G C A G G A T T G T C
S E Q ID NO: 161 - BRAT1 3 '-U T R de H o m o sap ie ns
N M _ 15 2 7 4 3 .3
G C A G A A C C A G A G T C T G C C A C T G G G G C T C A G G A C C A A G G G A G G C A G C A C C A T G T C C T T C T G T G G G A C A C T G C C A G C C C C A G G G C T C C A G C C C A G C C C G G T G G A T C C T C T G G G G A A G C C A G G A C C A G G A G A G A A G C A A G G T C A A G A A A T C C C A C A G T T T G A T G T A T T A A A G A A A T G A C T T A T T T C T A C T C A A A A T A A A T G G C A T T G A A G T C T T T C T T T A A C C C T T T T T G A G T T A A T T T A A T A A T A A T G A T C T G A G A C A A G G SEQ ID NO: 162 - CD9 3'-UTR de Homo sapiens
N M _001 7 6 9 .3
A G T C A G C T T A C A T C C C T G A G C A G G A A A G T T T A C C C A T G A A G A T T G G T G G G A T T T T T T G T T T G T T T G T T T T G T T T T G T T T G T T G T T T G T T G T T T G T T T T T T T G C C A C T A A T T T T A G T A T T C A T T C T G C A T T G C T A G A T A A A A G C T G A A G T T A C T T T A T G T T T G T C T T T T A A T G C T T C A T T C A A T A T T G A C A T T T G T A G T T G A G C G G G G G G T T T G G T T T G C T T T G G T T T A T A T T T T T T C A G T T G T T T G T T T T T G C T T G T T A T A T T A A G C A G A A A T C C T G C A A T G A A A G G T A C T A T A T T T G C T A G A C T C T A G A C A A G A T A T T G T A C A T A A A A G A A T T T T T T T GT C T T T A A A T A G A T A CA A A T G T C T A T C A A C T T T A A T C A A G T T GT A A C T T A T A T T G A A G A C A A T T T G A T A C A T A A T A A A A A A T T A T G A C A A T G T C C T G G A C T G G T SEQ ID NO: 163 - CDK9 3'-UTR de Homo sapiens
N M _0012 6 1 .3
G G G C C G G C G C T T G C C A C T A G G G C T C T T G T G T T T T T T T T C T T C T G C T A T G T G A C T T G C A T C G T G G A G A C A G G G C A T T T G A G T T T A T A T C T C T C A T G C A T A T T T T A T T T A A T C C C C A C C C T G G G C T C T G G G A G C A G C C C G C T G A G T G G A C T G G A G T G G A G C A T T G G C T G A G A G A C C A G G A G G G C A C T G G A G C T G T C T T G T C C T T G C T G G T T T T C T G G A T G G T T C C C A G A G G G T T T C C A T G G G G T A G G A G G A T G G G C T C G C C C A C C A G T G A C T T T T T C T A A G A G C T C C C G G C G T G G T G G A A G A G G G G A C A G G T C C C T C A C C C A C C C A C A A T C C T A T T C T C G G G C T G A G A A C C C T G C G T G G G G A C A G G G C T C G C C T C A G G A A T G G G C T G T T T T T G G C C T A A C C C T C A G A A A C A C T G G G G C T G G C A C A A A C T C T T G G T T T C T T C A A C A G G A G A A T T T T A C T G T G T T T C T T T T G G T T C C A T T G T T T G G A G A C A T T C C T G G G C A C A G T T T G G T C C G T T A G A A T T A A A A G T T G A A SEQ ID NO: 164 - PSMB3 3'-UTR de Homo sapiens
N M _ 0 0 2 79 5 .2
C C C TG TTC C C AG AG C C C AC TTTTTTTTC TTTTTTTG AAA TAA AATA G C C TG TC TTTC SEQ ID NO: 165 - PSMB6 3'-UTR de Homo sapiens
N M _ 002798 .2
A TC CT G G G A T TC TA G TA TG C A A T A A G A G A TG C C C T G TA C TG A TG C A A A A TT TA A T A A A G TT TG T C A C A G A G A A T C T TT G T A
S E Q ID NO: 166 - P R S S 56 3 '-U T R de H o m o sap ie ns
N M _0011 95 1 2 9 .1
G C C A TG TC TG G G C C C C C A G C C C C TG G G G A G G A C C TA C TG C TC C C A G G G G C TG A G A G G G G TTC G G G A G C A T A A T G A C A A A C TG TC G C TG C C C C A G TG G C TG G G TG TG TG TG G G TG G G A TG G G G TG G G G G TC C T G G G C C C C C C G T G T C T T C C C A G G T T T A C A A T C A G A G A A T C A C A G C T G C T T T A A T A A A T G T T A T T T A T A A TACACGGA A SEQ ID NO: 167 - SCAND1 3'-UTR de Homo sapiens
N M _ 016558
G C G G T G G A G C T G C G G G C G G C C A G G G C C G G G C G C T C T G T G C G G A C T G G G G C C A T G A T C G G G C C C G G G G G C C T G A G C C T G G G A C C C C A C C C C G T G T T A A T G A A A A A T G A G T T T T G G C A G C G C C T G T G G T C SEQ ID NO: 168 - AMN 3'-UTR de Homo sapiens
NM_030943.3
G C G G C C G C C T G A C C G T C G A C C T T G G G G C T C T C C A C C C G C T C T G G C C C C A G T C G A A C T G G G G G C T A G C C A C C T C C T C G T C C A G C C C C C A A A C C T C C C C T T C C T T T C C C C C T C C T C C G G G G G C C A A G G A C A G G G T G G C C T T A C T C A G T A A A G G T G T T T C C T G C SEQ ID NO: 169 - CYBA 3'-UTR de Homo sapiens
N M _ 0001 01 .3
C C T C G C C C C G G A C C T G C C C T C C C G C C A G G T G C A C C C A C C T G C A A T A A A T G C A G C G A A G C C G G G SEQ ID NO: 170 - PCOLCE 3'-UTR de Homo sapiens
Figure imgf000058_0001
S E Q ID NO: 173 - A LD H 16A 1 3 '-U T R de H om o sap iens
N M _0011 4 53 9 6 .1
TG C C TG A G C G C CA CC TA CTG C A TTTTG G A C A CC TC A C A C CA A G G G G A G A TG CA C CC CA CA G A CA CC T G G G A C T T T C C C C T T C T G G T T C C T G T G T C T C C C A A T A A A C T C T C T G A C C A A C C C T A G C T G T G C T T C T G C G A G A A G A A A G G G T G T A G C A A C T T C T G G C A G A T A T G A G G C T T T T T T C T T T T T T T T T T T T T T T T T TG A G A C A A CG TC TG G CTCTG TCA CC CA G G C TG G A G CG CA G TG G C A C A A TC TC G G C CC A CTG CA G C C TC G A CC TC TG G G G C TC A A G G G A TC C TC A TG C C TC A G C C TC A TA TG TA G C TG G G G C C A C A G A C A TG C A CC A C CA C A C C TG G C TC G A G G C C A TTTTA G TTC TG A G G TTG A G C A G C TC A G G A G C C G G C TC C A G C A C G G TG CTG TG TTTG TG A A ACAG AGA A AG GGGA CCCCCGAG GA CCCCAGA CAGG GCCTTA GGA CTCT C A T A T C T T C T T G T C T T C T C C A T C T G G T G G C T C T T G C T C T C T G G T T T T C T C T A C C T T T T C A T G G C C C C A G A A TC C A TA TG C A G TA A A G G A A CTCTCTG G A A TA A A A TTA A A G TC CTCC T SEQ ID NO: 174 -Acox2 3'-UTR de Mus musculus
N M _ 001 16 16 6 7. 1
A A A G C C A A A G G A T T C A G G A C C A A G C A G C A C C A T G G C C T T C C T A T G G C A C A T A T G C A T A T A A A G A A T T T A A A G C A C G G G G T G G C G T G C G G C T T G T T C A G A T C A G C G A G T A A A C T G G T A C A T G A A A G G A T G T T C A T C A T A T T A T T C T G C T A C T G A G T A C A T C T G A A A C T T T C C C T T G T C T G T T T G T A G T A C G T A T T T G G C T A A A T G C T A G A A T T T T G C T T T A A A T A C A G C A A A A G C T A A T A A A C T T G T T A G T A A C T A SEQ ID NO: 175 - Ubc 3'-UTR de Mus musculus
B C 006 6 S 0 .1
T G G G G G A G G T G T C T T A G T T T T C C C T A T C T T T T A A G C T G T T A A C A A G T T T C A T T G C A C T T T G A A T A A A G T T C T T G C A T T C C SEQ ID NO: 176 - Slpi 3'-UTR de Mus musculus
NM 0 1 14 1 4 .3
G C CTG A TC CC TG A C A TTG G C G C C G G C TC TG G A C TC G TG C TC G G TG TG C TC TG G A A A C TA C TTC C C T G C TC C C A G G C G TC C C TG C TC C G G G TTC C A TG G C TC C C G G C TC C C TG TA TC C C A G G C TTG G A TC C TG TG G A C C A G G G T TA C T G TTTTA C C A C TA A C A TC TC C TTTTG G C TC A G C A TTC A C C G A TC TTTA G G G A A ATGCTGTTGG A G A G CA A A TA A A TA A A C G C A TTC A TTTCTCTA TG C A SEQ ID NO: 177 - Nudt22 3'-UTR de Mus musculus
NM_0 2 667 5 .2
AGACAATAAAGGACTTTATTCTTGT
S E Q ID NO: 178 - P c y o x ll 3 '-U T R de M us m uscu lu s
N M _17 283 2 .4
G G G C TC C C A G G A G A G C C C A G G G A CTCTG C G CC A CA CTG A A G A TA A CTG A G A TG G A G C G C A C TC CA G C C G C G C A G G A C T G A C G A G G C C A C A C C C A T G G G C T C T G T G G C T T T C T C T G C T C T C A T G G A T T G A A C ñ G G G TC G C G C A TG TG G G C G G G G G C G A TC T G G TG TG T G C TT A T C TA A G G A T G C TG TTA G A G G C T G G C T TTTTTTTTTTTTTTTTT^ GGñGCGATTAAGAAAAGGGñAGGAñATTCAñGTCAGTGTTTTGGCTG T T T T T G T T T T T T G T T T G T T T G T T T T T G T T T G T T T T T T G T G G T G T T G G G T T T T G A G G T T T T T T G T T T G G T T G G T T T G G T T T T G G G A T C G T G T G T T T A T T T T A T T G T T T T T G T T T T G G G G G G T T G G T C G T T T G T T G T T T T G G G G G G T T G T T T T G T T T T G T T T G T T T G T T G G T T A C T G T T T T T C A A G A A G A A A T A T A A A T T C A T C C T C C A A G C T SEQ ID NO: 179 - Igf2bp1 3'-UTR de Mus musculus
C C C C G C C C C C TC C T G T C C C A TT G G C TC C A A G A T C A G C A G G A G G A A C A C A G A A C TG G A G G G G C G G G T G G A G G G C C G G T G T G C T C TT C C C A G G A G G C C TG A G A A T G A G TG G G A A T C A G G G C A T TTG G G G C T G G C T G G A G A T C A G G T T T G C A C A C T G T C T T G A G A A C A A T G T T C C A G T G A G G A A T C C T G A T C T C T C G C C C C C A A T T G A G C C A G C T G G C C A C A G C C C A C C C C T T G G A A T A T C A C C A T T G C A A T C A T A G C T T G G G T T G C T T T T A A A C G T G G A T T G T C T T G A A G T T C T C C A G C C T C C A T G G A A G G A T G G G T C A G A T C C C A G SEQ ID NO: 180 - T mem37 3'-UTR de Mus musculus
G A C C T C T G G C T G A G A T T G A A T A G G A C A A C C A A T G A C C T T G A C A C T G C C T C T T A G G C A C T T A G C T C T A G C A A T G C C C T G G A A G T C T C T T C A G C T G A G C T C C A G G G C A A A G G C A G A A G G G T G C C T C T G T A C G A C G G C A C A G T G A G C T G G A TA G G T T A G T C A T G C SEQ ID NO: 181 - Slc7a3 3'-UTR (240) de Mus musculus
NM_0 07 51 5
C C T A A C C A T A C C T A A T T G T T G T C T T G T T C T C C T A T A C A A T A A T G G A G A G T A C T C T T G A C C C C A C G A A G A G C T G G G C C T C T C A T G T G G T G T T A G T G A C G G A T A T G A A A T A A T G C T C T G T A T T T C T T G T G A A A T G A T G G C T A T G T C T T T G C T G T T T C T C A T T T G T T T T T A A C T T G T A T A C T T T G A A A T A G T C T C T G T A G T T G T T T C C T G G C T T T G A A A A A A A T G T T A T T A A A G G A A A A T T G T SEQ ID NO: 182 - Cst6 3'-UTR de Mus musculus
C C G G C C C C A G G G T G A C A G A G T C A G G G C C C C A T G G G A A C A A G C A T G G T G G A G G C G C C T C A G G G C C A C G G G C C A C G T C T G T T G C A A T A A A T C T G C A G C T C T G C T T C T T G C SEQ ID NO: 183 - Ebp 3'-UTR de Mus musculus
A G A G C C G G A G A G T G G G C T G A G T C C C T G C T G A T G A G G C G C T C T C C T C A C T T C C C A G A A G A C T C A A A T C T T C T T C C T C C T C G C A C A G G T T G G G G G G G T C A G A A C T A T C G G A C T T G T C C C A C T C A A A C A T G A T G A G T G A G C A C A C A A A G G G C C A G A G T C A G A A A A G G A A G G G A A C A A G T T G A G C T A C T G C T A G G A A C C T G A G G G A A A A G A T G G A T G A G A A G G T G G C A A G T C C G T G A C G G T G G C A A C T T C C C A A A C C A G G A A A T A A A A T G T C T T T T A C T A T A A
S E Q ID NO: 184 - S f3b 5 3 '-U T R de M us m uscu lu s
N M _ 0 0 982 9 .3
G G T G A G C G C T G C C C A G T C T T C C C C G T G T G C C G G C T G C G A G C C T C C T T G C T C C T G C A T C T C G A C C A T T C C G T G T T G G C T G T G T C G C C T G A C C T G C G T A C C T G T G G A G G A T T C G G A A C A A G T C A T G G A G A G A C T G T C C G G G T C C G C T C C T T G T G A A C T G T G C A G A A G G A G T G A T C C C A G C A T C G G C A A G C G A G G G A G A A G A C T G C A C G A G A G T G A T G C G C A T T T C G A G T C T G C T T T T C G A T A G T T G A T G T C T T C T T G C C T SEQ ID NO: 185 - Plk1 3'-UTR de Mus musculus
N M _ 01 1 1 2 1 .3
G T C T C T C T C C T T C G G A C T G G T G C C C C T T C A C T C T G C T A G C T C T G A G C C T G C A C T G T A G G C T C C T G G G G G C T G C T G T T C A G T G C C C C T G G C C C T G G G G G C T G G G C A G G A G C A G G G C C C C C T T T G A A G G G G T T G C T G T G T G T A A G T T A T T T T G T A C A T G T C T G G G T G T G G G T T T A C A T C T G C T T C C C T G C C C T C G C T C A G C C C A C T G T A T G A A T T G T A T A A A T G T T T C T A T T A A A T T G G G A C T G C T C T T T C C T T A G C T T T A T A T A T A T T A A A A T G T G T A C A T C T C T C SEQ ID NO: 186 - Aarsdl 3'-UTR de Mus musculus
N M _ 144 82 9 .1
G G G G C C A G G A C G T C G T C C C T G T G A C C A A C A G T A A A A T A T T G T G A C T C SEQ ID NO: 187 - Cdca8 3'-UTR de Mus musculus
N M _ 02 65 60 .4
G A G G A C A A CA G G A C A C A C A G TG G CA G C A G G G A CTG TG G TA G C A G A G TG C A C A CA TC TG TCC TTCTT C T G T G G G G T C C T T C A C T G C C A A C A C C T G C A A C G G T G C T T T G T C T C T C T G A C A G C T A T G G T G T C T T G C T G C A C A C TT C TA G TT A G TG G G A A TTT TA G A C G G G G A A C A C A G G G C T A G T C A G G G C C TT TG TG T G C TTG G T G TG G A G TG A C TG A G A A C C G T C TA TG G TT C A A G G TC C C A C T G G G G A TA A A C TG C TTA G A G C A C TG TC C TA G A G G G C A A G TG TA G C C TTC G C C TC C G G G C C C A G G C A G G C TA TG C A G TC A G C A G TA G G G T C T G T G C T C C A T G C G G G T C C A G G C G C A C G G C T C T C C T A T T C T G T T G T C A T T T G T G C C C T C T A T G G G C A G G T G T G T T T C A A G T T G G T T T T C T G T T G C T G A G G C T T T C A T A C A C A T C A G T T A C C A T C T C A G C T G A T T T G T C T A C T G A A A G C T T G C T G T T T T C A A T A A A T C T T A G T T T G C C A T G G T T T T A A G T C SEQ ID NO: 188 - Kif223'-UTR de Mus musculus
N M _ 145 58 8 .1
A C A C T A C C T T C T T T T A A A A A T C C T T G T A T A G T G A C G T G T T G T G T A A A T A C A G T T T T T A T T C C S E Q ID NO: 189 - C ad 3 '-U T R de M us m uscu lu s
N M _02 35 25 .2
G T C C C A G C T T C C T T T C T T G T C T C T T C A G G C C C A G C T G C T G G G C A A G G A A T C C C G A T G C C C C C C C C A C G G G G G C A G C A C A C T T A G C A G A C A A T C C T G G A G C A T A C A G A T A G C C C A A G C A C A T A G A T G T A C T A A A C T G G G A C C A T G C T T T A G G C T C C A G A C G A G A G T C T T T T C T A A C T T G G G G A T G C A G T C T C A G A T A C T G G G G G C C C C T C T G C C T C A T C T C C A T T C T T A C A C C T C A A A T C T G T A C A G T T A C T T T T G T A C T G A C T G TA A T A A A C A G C C A A A C A G T T SEQ ID NO: 190 - Cth 3'-UTR de Mus musculus
N M _ 145 95 3 .2
A A G T T C G A G T C A A A G C T G T C A T T C C A G T G C T G C C A T C A G G A G C A G C A T C C A A G G G G C C A A A T C T T C G G A A T A A C T G G A C A G A T C A T T A C G G A G C A T A C G C A G A A C T G C A C T G A A T A T T T T A A G G C C C T A A T G A G T T T A C A G C T G T A A C C T T C C A T G G A T C T T C C C T T A A G A A C T G T C T T C T G T T T A T C T T C T A A C T A A C A G G T T G T T C T G T T A G T A T C A T T T C G G T A A T T T T G C T A T A T T T G T G T C C A A G G A A G T A A G A G T T G T T C T G T T T T G G G A T C A T G T T G T C T T T T T T C T T T C T T C A G T A G C T T A T G A T A T A T T T T A A T C A T G T T T A C A A T G T T A C A A T T T A G T A T T G A T G T T T T A T G A A G T T A A A T T A T T A A A T G A A T G G T C T T A A A T C C A C T G T G G T G G T T T T T T T T T G A A A A A T T A T A T A A T T A C C A T A A G C C A A A A A T C A A A T A T T T G G A A T A C C T A C T G T G A A A T T C A A G A G A T T A A A G G T T G T A C T T G A T A C T T G T T A T T T T T C T T A A A T A A A T C T A G T T A T C A A G T T A T T T T T C T T A A A T A A A T C T A G T T A T C A A A T G T SEQ ID NO: 191 - Pole 3'-UTR de Mus musculus
N M _ 011132 .2
C A A G C C TA G G C TA A A G A C A C TTTG G TA TC C C A C A C C TA C TG C C TG C TC C A A A A G G C A G A A C C A C TG A C C A C C T TG C T TTT C C A A A C TC A TG A G C A C A G C C C A G A A G G A A C A G A A G A C TTC TG C TA A C G TC A T C A T G CC A TA A A CA G A CA G A A G CA G G G A A TG G CTCTA TCC CTA G CTG C CTG CTA A G TA A A CA CG G TT TTG A A G CG TC SEQ ID NO: 192 - Kif2c 3'-UTR de Mus musculus
N M _ 13447 1 .4
T G A C T T C A A A T A A A G A T C T G T T T G A T A T C A C A C T A G C C T C T T C C C C T C C C C A G A A A A C T T T G G G C A C C T T C T G G C T T T G G T T A G G A A C T G A G T T G G A C A G G T T G G G T A A A T T T C A A C C T C A G G G C A T C A T G C C CAGGAAAG C TG G G G A G A G G C G A T G T T C T T T T C C T C A G T T T G G A G C G G G A A G A A G G A G T T T T A A T G A C T G T G C T T C C T C T T C T C C T C C C C A T G G A A G G G G G G G G G G A T C C C T G G C T C A G C A T C C A C T G C T G G T G G A A A C C TC G C TG C G A G G T G C C G C TG TG A G G TG T G C C G C T G TG A G G TG C G T G C TC TG G A A G A G A G G C G G A G C T T G T C G G C T T C C T G C T G C C T C T G C C T G C A G T A C C A C C C T C G G T C T A A G C A G T C A T G A T T T T A T A C T T T C A G A A A A A A G T T T T A A G A C T T C T T T G G G T T T T T T G T T T T T G T T T T G A A G C C T A A G A A A G T C A C T A G T T C T T G C C T T T A T G T A T T T A T A T G C T G T A C C T A A C A A T A A A G A A A G A A G A A A A A A A A CAAA
SEQ ID NO: 193 - Scandl 3'-UTR de Mus musculus
NM_020255.3
G C G G C G G A G C C T G G G G C T C C C IG G A C IG A C A C C C T A C C C C T G A G T T A A T A A A A G T T G A A T T T T G A C A G C T C C C A SEQ ID NO: 194 - Gpr84 3'-UTR de Mus musculus
N M _0307 2 0 .1
A G C T A T T T A A A G C T A G T A G T C C A T T C A C C A G G A C A G G C C A A A C A T C C G G A A C C A G A G T G G C C T G C A G A G G A C A G G A C A G G A G C C C T T C A G T C C T T G G G T A T T T C A C A G A C A A C C T C A G T G G T A T A G A G G T A C A C C A C T T T C C C A T T C A G G A A T C A G T G C G T C A A C C C T G T G T G A C C C A A G G A G T G T G G T T A A T T A T T A A T A A A G A C A T T G C A T C C C C C C C T C SEQ ID NO: 195 - Tpgsl 3'-UTR de Mus musculus
N M _ 148 9 34 .2
G A C C A C G A T G C A C C C A C A T C C C G C C A C C T G C C C A G G A C T T G G G A C C T G C A A A C T G A T G T C C C G G C A T T C T G C A C A G G G T C A T C A C C C A G G A A G G G G T A C C C G C T T G G A C T T T G C A G G A C C A G C A C C T G C A G C T C A A T C C C C T C T G T A C T G G C C T G C C T A C C C C A C T C A C A G A A A T A A A A T C T A A A A C G A C SEQ ID NO: 196 - Ccl17 3'-UTR de Mus musculus
N M _ 0113 32 .3
C C T T C C C G C T G A G G C A T T T G G A G A C G C C A G G G C T G C T G T C C A T G G T T T C A A C A T A A A A C G G C C T G T G A C C A G C A G A G C C C A A G A G C A G C C A C A G A G C A G A A G T C C C T G T T C C C T T T T T T A T G G A C T C T T A T G C A C T A C A G G C G A A C A C A A A A A A A A G C A A C G G A A T A A A G C C T T C C T C C C T C SEQ ID NO: 197 - Alkbh7 3'-UTR de Mus musculus
CCTCCC AC ATATC CTCC ATATTTG T G A ATAA AGTAG G G AAAATGCTG TC AT SEQ ID NO: 198 - Ms4a8a 3'-UTR de Mus musculus
N M _ 022 43 0 . 2
GTGA ACCTGAAGATTCTAGAGACCAAGTGACATCCTCTCCTACCTAGACTCCTATAAACCAAGTTC TTCCTTTC CTG A CG A A G G G TA A A TA TCTTTC TTG TG G C CTA A A TTA TA G A C TC TTG CTTC A A C TC A CCCTGGAAAAATCTCTATTAAAACGAGATGGGAGATTGAAATGGATTCAAATAAAGATGCTCTAGC AGGA
SEQ ID NO: 199 - Mrpl34 3'-UTR de Mus musculus
NM_053162.2
G G A G C G C A A C G TC G C A G G G A A T A G A C TC A G A C G C C G G T A G A G TT G C C C G A G G G C G A G A A G T TG G G G C A A G C T G A A A G T G G G G G T C T G T C C C T T C G T A G G T T T T T A G A C G C A T C C C C C G T C G A C G G C T G C T T A C C A A C C A C C A G C A C C T G C G A T A C C T C A T C C A T T T C T G T G A A T A T A T T T G A A G G C A T C T T T G C A A G A C G G G G T C A T T A A A A C A C A G A C A C C A C C C C T A C G T T T C C A G C C A T T C C A A A G T A T T A C C G A C T T A A T A A A T A T T C A C G T T T C T T G A A C C A C T SEQ ID NO: 200 - Comtdl 3'-UTR de Mus musculus
G G TTA A C A C G A A G C TT A G G G C C T G G G T G T G A G A A C C TA A G A C C C C C A G C C A G TG A C C T G A C T TT TA A A C C T G A CA A TA AA GGTACTG GA CA C GCG SEQ ID NO: 201 - Armc6 3'-UTR de Mus musculus
N M _ 133 97 2 .2
C C T T A G C T C A G A G A A C T C T G A C T C C A G A A C G T G G G T G G C T A T G G G G C C C T G C C T C T C T G T C C T C C T T C C C A T G C T A C C C A G A G C A C A A G T G T G C T A G C A G G G C A G G G G G T G G G G A G G G C A G A A G C A G T G A T G A C C T G G T G G C C C A C C A C T G C C A G T G T C C C T T C T A C C A C A G C T G C T C T C T G C A G C T T T G G G A C A A A G G G C A C A T G G A A C T G C A G T G T T C T G T C T G G A G T T T G A G G C C T C C A C A A G C T G G T G T C C C A G C A G G G C C A G C C T G C A A T C C G G G C A C C A C T C C A A G C A G T T G A T A A C C C T G C T C C T T G G G C A G G C C C C C T G G G T A G A G G T G C T T C A G C C A A G G C T G A T T C C C C A A G A T C C G C A T G A T G G G A G G A G G G A G G T G T C T C C T C C A A A T T G T C C T C T G A A C T C T G T A T G T G T G C T G T G G T G C A C A C A T A C A T G C T A G C T A A A T A A A C A A A C A A A C A A A T A A SEQ ID NO: 202 - Atp5d 3'-UTR de Mus musculus
N M _ 0 2 5 3 1 3 .2
G T G G T A C C T A C T G T C T G A C A C C C A C G G G G A A A C T G A G C C A G G T C C A G G C C G A T G A G A A G T T C C C A G T G G G C T G A A G T G G C C A C C A G G G G T C A G C A G T G C T C C A G T T G C T G G G C T T A A A G C T T C C T G G T G C C T G T C T G C C A G G T C A T G G A G G A T T C C C C A A T C T G G C A T C C C C A C G A T G C C T C T G G A G A G A T G G C C T T G A T T G C C C C T C A A A G C C A C C T G A A C C G T C G T C A A C T T A C C C A G C C T G T C T C C A T T A A A C A C C A G G A A C C A A C T G A G SEQ ID NO: 203 - 1110001J03Rik 3'-UTR de Mus musculus
N M _ 02536 3. 3
TG CA GA GA GTCCTCA G A TG TTCC TTCA TTCA A G A G TTTA A C CA TTTC TA A C A A TA TG TA G TTA TC A TT A A A TC TTTTTTA A A G TG TG
Algunos de estos elementos 3'-UTR de tipo natural difieren da las secuencias 3'-UTR públicamente disponibles identificadas por GenBank en NCBI, ver la Tabla 2 (Ejemplo 1). Esta tabla refleja los resultados de secuenciación de los presentes inventores.
Así, los elementos 3'-UTR seleccionados del grupo consistente en las SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200 son contribuciones de la presente invención y se pueden emplear en cualquier aspecto de la presente invención como un al menos un elemento 3'-UTR.
Ejemplo de elementos 3’-UTR artificiales útiles en la presente invención
En algunas realizaciones, el elemento 3'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención difiere de un elemento 3'-UTR de tipo natural. Estos elementos 3'-UTR son designados “elementos 3'-UTR artificiales”.
Es preferente que un elemento 3'-UTR artificial tenga un grado de identidad de secuencia con un elemento 3'-UTR de tipo natural que es (a) inferior al 100% y al mismo tiempo (B) más del 10%, más del 20%, más del 30%, más del 40%, más del 50%, más del 60%, más del 70%, más del 80%, más del 90%, más del 95%, este elemento 3'-UTR de tipo natural se selecciona del grupo consistente en las SEQ ID NO: 152 a 203. Típicamente, el elemento 3'-UTR artificial difiere del elemento 3'-UTR de tipo natural en que se cambian al menos un nucleótido, tal como dos nucleótidos, tres nucleótidos, cuatro nucleótidos, cinco nucleótidos, seis nucleótidos, siete nucleótidos, ocho nucleótidos, nueve nucleótidos, diez nucleótidos, o más que diez nucleótidos. Por ejemplo, este cambio de nucleótidos puede ser recomendable en caso de que el elemento 3'-UTR de tipo natural comprenda un elemento nucleótido que se considere desventajoso. Por ejemplo, en algunas realizaciones, un elemento nucleótido que se considera desventajoso es un sitio de reconocimiento de enzimas de restricción (sitio de escisión), en particular el sitio de reconocimiento de enzimas de restricción (sitio de escisión) que es reconocido (escindible) por una enzima de restricción utilizada en el proceso para fabricar (clonar) el ácido nucleico artificial de la presente invención. Así, es posible introducir específicamente ciertas bases (en el cambio, preferentemente sustitución, para las bases de tipo natural respectivas) de modo que el elemento 3'-UTR artificial no contenga un elemento nucleótido que se considera desventajoso. En una realización específica, el elemento 3'-UTR artificial es la SEQ ID NO: 204:
SEQ ID NO: 204 - Secuencia Artificial (basada en SEQ ID NO: 192)
T G A C T T C A A A T A A T G A T C T G T T T G A T A T C A C A C T A G C C T C T T C C C C T C C C C A G A A A A C T T T G G G C A C C T T C T G G C T T T G G T T A G G A A C T G A G T T G G A C A G G T T G G G T A A A T T T C A A C C T C A G G G C A T C A T G C C C A G G A A A G C T G G G G A G A G G C G A T G T T C T T T T C C T C A G T T T G G A G C G G G A A G A A G G A G T T T T A A T G A C T G T G C T T C C T C T T C T C C T C C C C A T G G A A G G G G G G G G G G A T C C C T G G C T C A G C A T C C A C T G C T G G T G G A A A C C T C G C T G C G A G G T G C C G C T G T G A G G T G T G C C G C T G T G A G G T G C G T G C T C T G G A A G A G A G G C G G A G C T T G T C C G C T T C C T G C T G C C T C T G C C T G C A G T A C C A C C C T C G G T C T A A G C A C T C A T G A T T T T A T A C T T T C A G A A A A A A G T T T T A A G A C T T C T T T G G G T T T T T T G T T T T T G T T T T G A A G C C T A A G A A A G T C A C T A G T T C T T G C C T T T A T G T A T T T A T A T G C T G T A C C T A A C A A T A A A G A A A G A A G A A A A A A A A C A A A
[Esta secuencia corresponde a la secuencia de tipo natural en que se basa, excepto que AGATCT se reemplaza por TGATCT, subrayado para énfasis]
Nuevos elementos 5’-UTR y 3’-UTR
La presente descripción también proporciona nuevos elementos 5'-UTR y 3'-UTR; es decir, elementos 5'-UTR y elementos 3'-UTR que los presentes inventores han encontrado que se expresan en células humanas y células de ratón, respectivamente, pero que no son conocidos de las bases de datos públicas (ver Ejemplo 1). Cualquier 5 '-UTR se seleccionada del grupo consistente en SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49 puede ser preferente en algunas realizaciones de esta invención. Cualquier 5'-UTR seleccionada del grupo consistente en SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135 puede ser preferente en algunas realizaciones de esta invención. Cualquier 3'-UTR seleccionada del grupo consistente en SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ ID NO: 200 puede ser preferente en algunas realizaciones de esta invención.
Descripción de elementos 5’-UTR y elementos 3’-UTR preferentes
Preferentemente, el al menos un elemento 3'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99%, de manera mucho más preferente de un 100% con la secuencia 3'-UTR de un transcripto de un gen seleccionado del grupo consistente en NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (todos humanos), Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR (todos de ratón). Con mayor preferencia, el al menos un elemento 3'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99%, de manera mucho más preferente de un 100% con una secuencia seleccionada del grupo consistente en SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternativamente SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, o sus secuencias de ARN correspondientes, respectivamente.
Preferentemente, el al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99%, de manera mucho más preferente del 100% con la secuencia 5'-UTR de un transcripto deZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, CD9-5'-UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'- UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (todos humanos), Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5-UTR, Ankrd1-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, ltga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'- UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (todos de ratón). Con mayor preferencia, el al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99%, de manera mucho más preferente del 100% con una secuencia de acuerdo con SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternativamente SEQ ID NO: 3), SEQ ID NO: 138 (alternativamente SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternativamente SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternativamente SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44 , SEQ ID NO: 45, SEQ ID NO: 146 (alternativamente SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66 , SEQ ID NO: 6 8 , SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternativamente SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80 , SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 87, SEQ ID NO: 88 , SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95 , SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternativamente SEQ ID NO: 109), SEQ ID NO: 148 (alternativamente SEQ ID NO: 110), SEQ ID NO: 112 , SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115 , SEQ ID NO: 117, SEQ ID NO: 118 , SEQ ID NO: 149 (alternativamente SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternativamente SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124 , SEQ ID NO: 125 o la secuencia de ARN correspondiente, respectivamente.
El al menos un elemento 3'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención también puede comprender o consistir en un fragmento de una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99%, con mayor preferencia del 100% con la secuencia de ácido nucleico de la 3'-UTR de un transcripto de un gen, tal como la 3'-UTR de una secuencia de acuerdo con las SEQ ID NO: 152 a 204, donde preferentemente el fragmento es un fragmento funcional o un fragmento de variante funcional como se ha descrito anteriormente. Este fragmento preferentemente tiene una longitud de al menos aproximadamente 3 nucleótidos, de manera preferente de al menos aproximadamente 5 nucleótidos, de manera más preferente de al menos aproximadamente 10, 15, 20, 25 o 30 nucleótidos, incluso más preferentemente de al menos aproximadamente 50 nucleótidos, de manera especialmente preferente de al menos aproximadamente 70 nucleótidos. En una realización preferente, el fragmento o su variante tiene una longitud de entre 3 y aproximadamente 500 nucleótidos, de manera preferente de entre 5 y aproximadamente 150 nucleótidos, de manera más preferente de entre 10 y 100 nucleótidos, de manera aún más preferente de entre 15 y 90, de manera mucho más preferente de entre 20 y 70. Preferentemente, dichas variantes, fragmentos o fragmentos de variantes son variantes funcionales o fragmentos funcionales o fragmentos de variantes funcionales de la 3'-UTR, prolongan la producción de proteína a partir de la molécula de ácido nucleico artificial de acuerdo con la invención con una eficiencia de al menos un 30%, de manera preferente con una eficiencia de al menos 40%, de manera más preferente de al menos 50%, de manera más preferente de al menos 60%, de manera aún más preferente de al menos 70%, de manera aún más preferente de al menos 80%, de manera mucho más preferente de al menos un 90% de la eficacia de la prolongación de la producción de proteínas que muestra una molécula de ácido nucleico artificial que comprende la secuencia de ácido nucleico seleccionada del grupo consistente en las SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternativamente SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177.
El al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención también puede comprender o consistir en un fragmento de una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente 40%, de manera preferente de al menos aproximadamente 50%, de manera preferente de al menos aproximadamente 60%, de manera preferente de al menos aproximadamente 70%, de manera más preferente de al menos aproximadamente 80%, de manera más preferente de al menos aproximadamente 90%, de manera aún más preferente de al menos aproximadamente 95%, de manera aún más preferente de al menos aproximadamente 99%, de manera mucho más preferente del 100% con la secuencia de ácido nucleico de la 5'-UTR de un transcripto de un gen, tal como con la 5'-UTR de una secuencia de acuerdo con las SEQ ID NO: 1 a 151, donde el fragmento preferentemente es un fragmento funcional o un fragmento de variante funcional como se ha descrito anteriormente. Este fragmento preferentemente tiene una longitud de al menos aproximadamente 3 nucleótidos, de manera preferente de al menos aproximadamente 5 nucleótidos, de manera más preferente de al menos aproximadamente 10, 15, 20, 25 o 30 nucleótidos, de manera aún más preferente de al menos aproximadamente 50 nucleótidos, de manera mucho más preferente de al menos aproximadamente 70 nucleótidos. En una realización preferente, el fragmento o su variante tiene una longitud de entre 3 y aproximadamente 500 nucleótidos, de manera preferente de entre 5 y aproximadamente 150 nucleótidos, de manera más preferente de entre 10 y 100 nucleótidos, de manera aún más preferente de entre 15 y 90, de manera mucho más preferente de entre 20 y 70. Preferentemente, las variantes, fragmentos o fragmentos de variantes son variantes funcionales, fragmentos funcionales o fragmentos de variantes funcionales de la 5'-UTR, incrementan la producción de proteínas de la molécula de ácido nucleico artificial de acuerdo con la invención con una eficiencia de al menos 30%, de manera preferente con una eficiencia de al menos 40%, de manera más preferente de al menos 50%, de manera más preferente de al menos 60%, de manera aún más preferente de al menos 70%, de manera aún más preferente de al menos 80%, de manera mucho más preferente de al menos 90% de la eficiencia incrementada de la producción de proteínas mostrada por una molécula de ácido nucleico artificial que comprende la secuencia de ácido nucleico seleccionada del grupo consistente en la SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternativamente SEQ ID NO: 3), SEQ ID NO: 138 (alternativamente SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternativamente SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternativamente SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternativamente SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66 , SEQ ID NO: 6 8 , SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternativamente SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 87, SEQ ID NO: 88 , SEQ ID NO: 589, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternativamente SEQ ID NO: 109), SEQ ID NO: 148 (alternativamente SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternativamente SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternativamente SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125.
Otras realizaciones preferentes
Preferentemente, el al menos un elemento 3'-UTR y/o el al menos un elemento 5'-UTR de la molécula de ácido nucleico artificial de acuerdo con la presente invención tiene una longitud de al menos aproximadamente 3 nucleótidos, de manera preferente de al menos aproximadamente 5 nucleótidos, de manera más preferente de al menos aproximadamente 10, 15, 20, 25 o 30 nucleótidos, de manera aún más preferente de al menos aproximadamente 50 nucleótidos, de manera mucho más preferente de al menos aproximadamente 70 nucleótidos. El límite superior para la longitud de el al menos un elemento 3'-UTR y/o el al menos un elemento 5'-UTR puede ser 500 nucleótidos o menos, por ejemplo 400, 300, 200, 150 o 100 nucleótidos. Para otras realizaciones, el límite superior se puede elegir dentro del intervalo de 50 a 100 nucleótidos. Por ejemplo, el fragmento o su variante puede tener una longitud de entre 3 y aproximadamente 500 nucleótidos, preferentemente de entre 5 y aproximadamente 150 nucleótidos, de manera más preferente de entre 10 y 100 nucleótidos, de manera aún más preferente de entre 15 y 90, con mayor preferencia de entre 20 y 70.
También puede ser preferible que el elemento UTR comprendido en la molécula de ácido nucleico artificial comprenda (o consista en) una secuencia continua que es más corta que cualquier secuencia seleccionada de las SEQ ID NO: 1 a 204 aquí proporcionada, pero que aún comparta un grado de identidad del 70% o más, 80% o más, 90% o más o 95% o más con la secuencia respectiva de cualquier secuencia seleccionada de las SEQ ID NO: 1 a 204. En este caso, preferentemente, el elemento UTR de reemplazo comprende una secuencia continua que está encima de su longitud completa idéntica de cualquier secuencia seleccionada de las SEQ ID NO: 1 a 204; sin embargo, el elemento UTR de reemplazo es más corto, por ejemplo tiene una longitud del 70% o más, 80% o más, 90% o más o 95% o más con respecto a la longitud total de la secuencia que de otra manera es idéntica a y que se selecciona de las SEQ ID NO: 1 a 204.
Además, la molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender más de uno de los elementos 3'-UTR y/o más de uno de los elementos 5'-UTR antes descritos. Por ejemplo, la molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender uno, dos, tres, cuatro o más elementos 3'-UTR y/o uno, dos, tres, cuatro o más elementos 5'-UTR, donde los elementos 3'-UTR individuales pueden ser iguales o pueden ser diferentes, y de forma similar, los elementos 5'-UTR individuales pueden ser iguales o pueden ser diferentes. Por ejemplo, la molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender dos elementos 3 '-UTR esencialmente idénticos tal como se describe anteriormente, por ejemplo dos elementos 3'-UTR que comprenden o que consisten en una secuencia de ácido nucleico que se deriva de la 3'-UTR de un transcripto de un gen, tal como de una secuencia de acuerdo con las SEQ ID NO: 152 a 204 o de un fragmento o variante de la 3'-UTR de un transcripto de un gen, variantes funcionales de las mismas, fragmentos funcionales de las mismas o fragmentos de variantes funcionales de las mismas como se describe anteriormente. Por consiguiente, por ejemplo, la molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender dos elementos 5'-UTR esencialmente idénticos como se ha descrito anteriormente, por ejemplo dos elementos 5'-UTR que comprenden o consisten en una secuencia de ácido nucleico que se deriva de la 5' UTR de un transcripto de un gen, tal como de una secuencia de acuerdo con las SEQ ID NO: 1 a 151, o de un fragmento o variante de la 5'-UTR de un transcripto de un gen, variantes funcionales de las mismas, fragmentos funcionales de las mismas o fragmentos de variantes funcionales de las mismas como se describe en lo anterior.
Sorprendentemente, los inventores encontraron que una molécula de ácido nucleico artificial que comprende un elemento 3'-UTR como se describe anteriormente y, opcionalmente, un elemento 5'-UTR como se describe anteriormente puede representar o puede proporcionar una molécula de ARNm que proporciona una alta eficiencia de traducción. Así, un elemento 3'-UTR como se describe aquí y, opcionalmente, un elemento 5'-UTR como se describe aquí pueden mejorar la eficiencia de traducción de una molécula de ARNm.
En particular, la molécula de ácido nucleico artificial de acuerdo con la invención puede comprender (i) al menos un elemento 3'-UTR y al menos un elemento 5'-UTR, que proporcionan una alta eficiencia de traducción; (ii) al menos un elemento 3'-UTR que proporciona una alta eficiencia de traducción, pero no un elemento 5'-UTR que proporciona una alta eficiencia de traducción.
Sin embargo, en el caso particular (ii), pero posiblemente también en el caso (i), la molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender además uno o más “elementos 3'-UTR adicionales y/o elementos 5'-UTR”, es decir elementos 3'-UTR y/o elementos 5'-UTR que no cumplen los requisitos arriba indicados. Por ejemplo, una molécula de ácido nucleico artificial de acuerdo con la invención, que comprende un elemento 3'-UTR como se define en la reivindicación 1, es decir un elemento 3'-UTR que proporciona una alta eficiencia de traducción a la molécula de ácido nucleico artificial, puede comprender además cualquier 3'-UTR adicional y/o cualquier 5'-UTR adicional, en particular una 5'-UTR adicional, por ejemplo una TOP 5'-UTR, o cualquier otra 5'-UTR o elemento 5'-UTR. Similarmente por ejemplo, una molécula de ácido nucleico artificial de acuerdo con la invención, que comprende un elemento 3'-UTR y un elemento 5'-UTR de acuerdo con la presente invención, es decir un elemento 5'-UTR que proporciona una alta eficiencia de traducción a la molécula de ácido nucleico artificial, puede comprender además cualquier 3'-UTR adicional y/o cualquier 5'-UTR adicional, en particular una 3'-UTR adicional, por ejemplo una 3'-UTR derivada de una 3'-UTR de un gen de albúmina, con particular preferencia una 3'-UTR que comprende una secuencia de acuerdo con las SEQ ID NO: 206 o 207, en particular con la SEQ ID NO: 207, o cualquier otra 3'-UTR o elemento 3'-UTR. Si además del al menos un elemento 3'-UTR y, opcionalmente, el 5'-UTR, que proporcionan una alta eficiencia de traducción, está presente una 3'-UTR (elemento) adicional y/o una 5'-UTR (elemento) adicional en la molécula de ácido nucleico artificial de acuerdo con la invención, la 5'-UTR (elemento) adicional y/o la 3'-UTR (elemento) adicional puede interactuar con el elemento 3'-UTR y, opcionalmente, con el elemento 5'-UTR y así apoyar el efecto de la eficiencia de la traducción del elemento 3'-UTR y, opcionalmente, del elemento 5'-UTR, respectivamente. Esta 3'-UTR y/o 5'-UTR (elementos) adicionales pueden apoyar además la estabilidad y eficiencia de traducción. Además, si ambos, un elemento 3'-UTR y un elemento 5'-UTR están presentes en la molécula de ácido nucleico artificial de acuerdo con la invención, un efecto de eficiencia de traducción del elemento 5'-UTR y del elemento 3'-UTR resulta preferentemente en la provisión de la alta eficiencia de traducción de forma sinérgica.
Preferentemente, la 3'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de una 3'-UTR de un gen seleccionado del grupo consistente en un gen de albúmina, un gen de a-globina, un gen de p-globina, un gen de tirosina-hidroxilasa, un gen de lipoxigenasa y un gen de colágeno alfa, tal como un gen de colágeno alfa 1(I), o de una variante de una 3'-UTR de un gen seleccionado del grupo consistente en un gen de albúmina, un gen de a-globina, un gen de p-globina, un gen de tirosina-hidroxilasa, un gen de lipoxigenasa y un gen de colágeno alfa, tal como un gen de colágeno alfa 1(I) de acuerdo con las SEQ ID NO.: 1369-1390 de la solicitud de patente WO2013/143700. En una realización particularmente preferente, la 3'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de una 3'-UTR de un gen de albúmina, preferentemente de un gen de albúmina de vertebrado, de manera más preferente de un gen de albúmina de mamífero, de manera mucho más preferente de un gen de albúmina humano de acuerdo con la SEQ ID NO: 206:
SEQ ID NO: 206
C A T C A C A T T T A A A A G C A T C T C A G C C T A C C A T G A G A A T A A G A G A A A G A A A A T G A A G A T C A A A A G C T T A T T C A T C T G T T T T T C T T T T T C G T T G G T G T A A A G C C A A C A C C C T G T C T A A A A A A C A T A A A T T T C T T T A A T C A T T T T G C C T C T T T T C T C T G T G C T T C A A T T A A T A A A A A A T G G A A A G A A T C T
(3'-UTR de albúmina humana; que corresponde con la SEQ ID NO:1369 de la solicitud de patente WO 2013/143700). En otra realización particularmente preferente, la 3'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de una 3'-UTR de un gen de a-globina, preferentemente de un gen de a- o p-globina de vertebrado, de manera más preferente de un gen de a- o p-globina de mamífero, de manera mucho más preferente de un gen de a- o p-globina humano de acuerdo con la SEQ ID NO: 1370 de la solicitud de patente WO 2013/143700 (3'-UTR de hemoglobina de Homo sapiens, alfa 1 (HBA1)), o de acuerdo con la SEQ ID NO: 1371 de la solicitud de patente WO 2013/143700 (3'-UTR de hemoglobina de Homo sapiens, alfa 2 (HBA2)), y/o de acuerdo con la SEQ ID NO: 1372 de la solicitud de patente WO 2013/143700 (3'-UTR de hemoglobina de Homo sapiens, beta (HBB)).
Por ejemplo, la 3'-UTR adicional puede comprender o consistir en la porción de unión al complejo a central de la 3'-UTR de un gen de a-globina de acuerdo con la SEQ ID NO: 1393 de la solicitud de patente WO 2013/143700.
En este contexto, es particularmente preferente que la molécula de ácido nucleico inventiva comprenda un elemento 3'-UTR adicional derivado de ácidos nucleicos de acuerdo con las SEQ ID NO: 1369-1390 de la solicitud de patente WO 2013/143700 o un fragmento, homólogo o variante de las mismas.
Con mayor preferencia, la 3'-UTR adicional comprende la secuencia de ácido nucleico derivada de un fragmento del gen de albúmina humano de acuerdo con la SEQ ID NO: 207:
SEQ ID NO: 207
C A T C A C A T T T A A A A G C A T C T C A G C C T A C C A T G A G A A T A A G A G A A A G A A A A T G A A G A T C A A T A G C T T A T T C A T C T C T T T T T C T T T T T C G T T G G T G T A A A G C C A A C A C C C T G T C T A A A A A A C A T A A A T T T C T T T A A T C A T T T T G C C T C T T T T C T C T G T G C T T C A A T T A A T A A A A A A T G G A A A G A A C C T
(albúmina7 3'-UTR; que corresponde a la SEQ ID NO: 1376 de la solicitud de patente WO 2013/143700)
En este contexto, es particularmente preferente que la 3'-UTR adicional de la molécula de ácido nucleico artificial inventiva comprenda o consista en la secuencia de ácido nucleico de acuerdo con la SEQ ID NO: 207, o una secuencia de ARN correspondiente.
En algunas realizaciones, la 3'-UTR adicional comprende o consiste en una secuencia de ácido nucleico derivada de un gen de codificación de proteína ribosómica, preferentemente como se describe en las solicitudes de patente internacional WO 2015/101414 o WO 2015/101415.
La 3'-UTR adicional también puede comprender o consistir en una secuencia de ácido nucleico derivada de un gen de codificación de proteína ribosómica, donde los genes de codificación de la proteína ribosómica de los cuales se puede derivar una 3'-UTR adicional incluyen, pero no se limitan a, proteína ribosómica L9 (RPL9), proteína ribosómica L3 (RPL3), proteína ribosómica L4 (RPL4), proteína 15 ribosómica L5 (RPL5), proteína ribosómica L6 (RPL6 ), proteína ribosómica L7 (RPL7), proteína ribosómica L7a (RPL7A), proteína ribosómica L11 (RPL11), proteína ribosómica L12 (RPL12), proteína ribosómica L13 (RPL13), proteína ribosómica L23 (RPL23), proteína ribosómica L18 (RPL18), proteína ribosómica L18a (RPL18A), proteína ribosómica L19 (RPL19), proteína ribosómica L21 (RPL21), proteína ribosómica L22 (RPL22), proteína ribosómica L23a (RPL23A), proteína ribosómica L17 (RPL17), proteína ribosómica L24 (RPL24), proteína ribosómica L26 (RPL26), proteína ribosómica L27 (RPL27), proteína ribosómica L30 (RPL30), proteína ribosómica L27a (RPL27A), proteína ribosómica L28 (RPL28), proteína ribosómica L29 (RPL29), proteína ribosómica L31 (RPL31), proteína ribosómica L32 (RPL32), proteína ribosómica L35a (RPL35A), proteína ribosómica L37 (RPL37), proteína ribosómica L37a (RPL37A), proteína ribosómica L38 (RPL38), proteína ribosómica L39 (RPL39), proteína ribosómica, grande, P0 (RPLP0), proteína ribosómica grande, P1 (RPLP1), proteína ribosómica grande, P2 (RPLP2), proteína ribosómica S3 (RPS3), proteína ribosómica S3A (RPS3A), proteína ribosómica S4 ligada a X_ (RPS4X), proteína ribosómica S4, ligado a Y 1(RPS4Y1), proteína ribosómica S5 (RPS5), proteína ribosómica S6 (RPS6 ), proteína ribosómica S7 (RPS7), proteína ribosómica S8 (RPS8 ), proteína ribosómica S9 (RPS9), proteína ribosómica S10 (RPS10), proteína ribosómica S11 (RPS11), proteína ribosómica S12 (RPS12), proteína ribosómica S13 (RPS13), proteína ribosómica S15 (RPS15), proteína ribosómica S15a (RPS15A), proteína ribosómica S16 (RPS16), proteína ribosómica S19 (RPS19), proteína ribosómica S20 (RPS20), proteína ribosómica S21 (RPS21), proteína ribosómica S23 (RPS23), proteína ribosómica S25 (RPS25), proteína ribosómica S26 (RPS26), proteína ribosómica S27 (RPS27), proteína ribosómica S27a (RPS27a), proteína ribosómica S28 (RPS28), proteína ribosómica S29 (RPS29), proteína ribosómica L15 (RPL15), proteína ribosómica S2 (RPS2), proteína ribosómica L14 (RPL14), proteína ribosómica S14 (RPS14), proteína ribosómica L10 (RPL10), proteína ribosómica L10a (RPL10A), proteína ribosómica L35 (RPL35), proteína ribosómica L13a (RPL13A), proteína ribosómica L36 (RPL36), proteína ribosómica L36a (RPL36A), proteína ribosómica L41 (RPL41), proteína ribosómica S18 (RPS18), proteína ribosómica S24 (RPS24), proteína ribosómica L8 (RPL8 ), proteína ribosómica L34 (RPL34), proteína ribosómica S17 (RPS17), proteína ribosómica SA (RPSA), producto 1 de fusión de proteína ribosómica de residuo de ubiquitina A-52 (UBA52), virus de sarcoma murino Finkel-Biskis-Reilly (FBR-MuSV) ubicuamente expresado (FAU) 1 tipo proteína ribosómica 15 L22 (RPL22L1), proteína ribosómica S17 (RPS17), tipo proteína ribosómica L39 (RPL39L), tipo proteína ribosómica L10 (RPL10L), tipo proteína ribosómica L36a (RPL36AL), tipo proteína ribosómica L3 (RPL3L), tipo proteína ribosómica S27 (RPS27L), 1 tipo proteína ribosómica L26 (RPL26L1), 1 tipo proteína ribosómica L7 (RPL7L1), pseudogén de proteína ribosómica L13a (RPL13AP), pseudogén 8 de proteína ribosómica L37a (RPL37AP8), pseudogén 5 de proteína ribosómica S10 (RPS10P5), pseudogén 11 de proteína ribosómica S26 (RPS26P11), pseudogén 5 de proteína ribosómica L39 (RPL39P5), pseudogén 6 de proteína ribosómica, grande, P0 (RPLP0P6) y pseudogén 14 de proteína ribosómica L36 (RPL36P14).
Preferentemente, la 5'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de la 5'-UTR de un gen TOP o que se deriva de un fragmento, homólogo o variante de la 5'-UTR de un gen de TOP.
Es particularmente preferente que el elemento 5'-UTR no comprenda un motivo TOP o un 5'-TOP como se ha definido anteriormente. En particular, es preferente que una 5'-UTR de un gen TOP sea una 5'-UTR de un gen TOP que carece del motivo TOP.
La secuencia de ácido nucleico que se deriva de la 5'-UTR de un gen TOP se deriva de un gen TOP eucariota, de manera preferente un gen TOP vegetal o animal, de manera más preferente de un gen TOP cordado, de manera aún más preferente de un gen TOP vertebrado, de manera mucho más preferente un gen TOP mamífero, tal como un gen TOP humano.
Por ejemplo, preferentemente, la 5'-UTR adicional se selecciona de los elementos 5'-UTR que comprenden o que consisten en una secuencia de ácido nucleico que se deriva de una secuencia de ácido nucleico seleccionada del grupo consistente en las SEQ ID NO: 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO. 1422 de la solicitud de patente WO2013/143700, de los homólogos de SEQ ID NO. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO. 1422 de la solicitud de patente WO2013/143700, de variantes de las mismas, o preferentemente de una secuencia de ARN correspondiente. El término “homólogo de SEQ ID NO. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO. 1422 de la solicitud de patente WO2013/143700” se refiere a la secuencia de otras especies no Homo sapiens que son homólogas a las secuencias de acuerdo con las SEQ ID NO. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO.
1422 de la solicitud de patente WO2013/143700.
En una realización preferente, la 5'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de una secuencia de ácido nucleico que se extiende desde la posición de nucleótido 5 (es decir el nucleótido situado en la posición 5 de la secuencia) a la posición de nucleótido inmediatamente 5' al codón de inicio (localizada en el extremo 3' de las secuencias), por ejemplo la posición de nucleótido inmediatamente 5' a la secuencia ATG, de una secuencia de ácido nucleico seleccionada de las SEQ ID NO. 11363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO. 1422 de la solicitud de patente WO2013/143700, de los homólogos de SEQ ID NO. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO. 1422 de la solicitud de patente WO2013/143700, de variantes de las mismas, o de una secuencia de ARN correspondiente. Es particularmente preferente que la 5'-UTR adicional se derive de una secuencia de ácido nucleico que se extiende desde la posición de nucleótido inmediatamente 3' al 5'-TOP a la posición de nucleótido inmediatamente 5' al codón de inicio (situado en el extremo 3' de las secuencias), por ejemplo la posición de nucleótido inmediatamente 5' a la secuencia ATG, de una secuencia de ácido nucleico seleccionada de las SEQ ID NO. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO. 1422 de la solicitud de patente WO2013/143700, de los homólogos de SEQ ID NO. 1-1363, SEQ ID NO. 1395, SEQ ID NO. 1421 y SEQ ID NO. 1422 de la solicitud de patente WO2013/143700, de variantes de las mismas, o una secuencia de ARN correspondiente.
En una realización particularmente preferente, la 5'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de una 5'-UTR de un gen TOP que codifica una proteína ribosómica o de una variante de una 5'UTR de un gen TOP que codifica una proteína ribosómica. Por ejemplo, el elemento 5'-UTR comprende o consiste en una secuencia de ácido nucleico que se deriva de una 5'-UTR de una secuencia de ácido nucleico de acuerdo con cualquiera de las SEQ ID NO: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352 1355, 1356, 1357, 1358, 1359 o 1360 de la solicitud de patente WO2013/143700, una secuencia de ARN correspondien un homólogo de la misma, o una variante de la misma como se describe aquí, preferentemente que carece del motivo 5'-TOP. Como se describe anteriormente, la secuencia que se extiende desde la posición 5 al nucleótido inmediatamente 5' a ATG (que se sitúa en el extremo 3' de la secuencia) corresponde a la 5'-UTR de dichas secuencias.
Preferentemente, la 5'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de una 5'-UTR de un gen TOP que codifica una proteína ribosómica grande (RPL) o de un homólogo o de una variante de una 5'-UTR de un gen TOP que codifica una proteína ribosómica grande (RPL). Por ejemplo, el elemento 5'-UTR comprende o consiste en una secuencia de ácido nucleico que se deriva de una 5'-UTR de una secuencia de ácido nucleico de acuerdo con cualquiera de las SEQ ID NO: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 y 1422 de la solicitud de patente WO2013/143700, una secuencia de ARN correspondiente, un homólogo de la misma o una variante de la misma como se describe aquí, preferentemente que carece del motivo 5'-TOP.
En una realización particularmente preferente, el elemento 5'-UTR comprende o consiste en una secuencia de ácido nucleico que se deriva de la 5'-UTR de un gen de proteína ribosómica Grande 32, preferentemente de un gen de proteína ribosómica Grande 32 (L32) de vertebrado, de manera más preferente de un gen de proteína ribosómica Grande 32 (L32) de mamífero, de manera mucho más preferente de un gen de proteína ribosómica grande 32 (L32) humana, o de una variante de la 5'-UTR de un gen de proteína ribosómica Grande 32, de manera preferente de un gen de proteína ribosómica Grande 32 (L32) de vertebrado, de manera más preferente de un gen de proteína ribosómica Grande 32 (L32) de mamífero, de manera mucho más preferente de un gen de proteína ribosómica grande 32 (L32) humana, donde preferentemente la 5'-UTR adicional no comprende el 5'TOP de dicho gen.
Por consiguiente, en una realización particularmente preferente, la 5'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente 50%, de manera preferente de al menos aproximadamente 60%, de manera preferente de al menos aproximadamente 70%, de manera más preferente de al menos aproximadamente 80%, de manera más preferente de al menos aproximadamente 90%, de manera aún más preferente de al menos aproximadamente 95%, de manera aún más preferente de al menos aproximadamente un 99% con la secuencia de ácido nucleico de acuerdo con la SEQ ID NO:
208 (5'-UTR de proteína ribosómica grande 32 humana que carece del tracto de oligopirimidina 5' terminal:
GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC (SEQ ID NO: 208); que corresponden a la SEQ ID NO. 1368 de la solicitud de patente WO2013/143700) o, preferentemente, con una secuencia de ARN correspondiente, o donde la 5'-UTR adicional comprende o consiste en un fragmento de una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente 50%, de manera preferente de al menos aproximadamente 60%, de manera preferente de al menos aproximadamente 70%, de manera más preferente de al menos aproximadamente 80%, de manera más preferente de al menos aproximadamente 90%, de manera aún más preferente de al menos aproximadamente 95%, de manera aún más preferente de al menos aproximadamente 99% con la secuencia de ácido nucleico de acuerdo con la SEQ ID NO: 208 o, con mayor preferencia, con una secuencia de ARN correspondiente, donde, de manera preferente, el fragmento es como se describe anteriormente, es decir, es un tramo continuo de nucleótidos que representa al menos un 20%, etc., de la 5'-UTR de longitud completa. Preferentemente, el fragmento tiene una longitud de al menos aproximadamente 20 nucleótidos o más, de manera preferente de al menos aproximadamente 30 nucleótidos o más, de manera más preferente de al menos aproximadamente 40 nucleótidos o más. Preferentemente, el fragmento es un fragmento funcional como se describe aquí.
En algunas realizaciones, la molécula de ácido nucleico artificial comprende una 5'-UTR adicional que comprende o consiste en una secuencia de ácido nucleico que se deriva de la 5'-UTR de un gen TOP vertebrado, tal como de mamífero, por ejemplo un gen TOP humano, seleccionado de RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6 , RPS7, RPS8 , RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6 , RPL7, RPL7A, RPL8 , RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLP0, RPLP1, RPLP2, RPLP3, RPLP0, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB o de un homólogo o variante de los mismos, donde preferentemente la 5'-UTR adicional no comprende un motivo TOP o el 5'-TOP de dichos genes y donde opcionalmente la 5'-UTR adicional comienza en su extremo 5' con un nucleótido situado en la posición 1, 2, 3, 4, 5, 6 , 7, 8 , 9 o 10 aguas abajo del tracto de oligopirimidina 5' terminal (TOP) y donde además opcionalmente la 5'-UTR adicional que se deriva de una 5'-UTR de un gen TOP termina en su extremo 3' con un nucleótido situado en la posición 1,2, 3, 4, 5, 6 , 7, 8 , 9 o 10 aguas arriba del codón de inicio (A(U/T)G) del gen del que se deriva. En ciertas realizaciones, una 5'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de una 5'-UTR como se describe en la solicitud de patente internacional WO 2016/107877.
La molécula de ácido nucleico artificial de acuerdo con la presente invención puede ser ARN, tal como ARNm o ARN viral o un replicón, ADN, tal como ADN plasmídico o ADN viral, o puede ser una molécula de ARN o ADN modificada. Se puede proporcionar como una molécula de doble hebra con una hebra sentido y una hebra anti-sentido, por ejemplo como una molécula de ADN que tiene una hebra sentido y una hebra anti-sentido.
La molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender además opcionalmente una cap 5'. La cap 5' opcional preferentemente se sitúa 5' al ORF, de manera más preferente 5' a la al menos una 5'-UTR o a cualquier 5'-UTR adicional dentro de la molécula de ácido nucleico artificial de acuerdo con la presente invención. Preferentemente, la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende además una secuencia poli(A) y/o una señal de poliadenilación. De manera preferente, la secuencia poli(A) opcional se sitúa 3' al al menos un elemento 3'-UTR o a cualquier 3'-UTR opcional, preferentemente la secuencia poli(A) opcional se une al extremo 3' de un elemento 3'-UTR. La unión puede ser directa o indirecta, por ejemplo mediante un tramo de 2, 4, 6 , 8 , 10, 20, etc. nucleótidos, tal como a través de un enlazador de 1-50, de manera preferente de 1-20 nucleótidos, por ejemplo que comprende o que consiste en uno o más sitios de restricción.
En una realización, la señal de poliadenilación opcional se sitúa aguas abajo del 3' del elemento 3'-UTR. Preferentemente, la señal de poliadenilación comprende la secuencia consenso NN(U/T)ANA, con N = A o U, de manera preferente AA(U/T)AAA o A(U/T)(U/T)AAA. Estas secuencias consenso pueden ser reconocidas por la mayoría de sistemas celulares animales y bacterianos, por ejemplo por factores de poliadenilación, tal como factor de especificidad de escisión/ poliadenilación (CPSF) que coopera con CstF, PAP, PAB2, CFI y/o CFII. De manera preferente, la señal de poliadenilación, preferentemente la secuencia consenso NNUANA, se sitúa a menos de 50 nucleótidos, de manera más preferente a menos de aproximadamente 30 bases, de manera mucho más preferente a menos de aproximadamente 25 bases, por ejemplo 21 bases, aguas abajo del extremo 3' del elemento 3'-UTR.
La transcripción de una molécula de ácido nucleico artificial de acuerdo con la presente invención, por ejemplo de una molécula de ADN artificial, que comprende una señal de poliadenilación aguas abajo del elemento 3'-UTR resultará en un ARN prematuro que contiene la señal de poliadenilación aguas abajo de su elemento 3'-UTR.
El uso de un sistema de transcripción apropiado entonces conducirá a la unión de una secuencia poli(A) al ARN prematuro. Por ejemplo, la molécula de ácido nucleico artificial inventiva puede ser una molécula de ARN que comprende un elemento 3'-UTR como se describe anteriormente y una señal de poliadenilación, que puede resultar en la poliadenilación de un ARN con la transcripción de esta molécula de ADN. Por consiguiente, un ARN resultante puede comprender una combinación del elemento 3'-UTR inventivo seguido por una secuencia poli(A).
Sistemas de transcripción potenciales son sistemas de transcripción in vitro, sistemas de transcripción celulares, etc. Por consiguiente, la transcripción de una molécula de ácido nucleico artificial de acuerdo con la invención, por ejemplo la transcripción de una molécula de ácido nucleico artificial que comprende un marco de lectura abierto, un elemento 3' -UTR y, opcionalmente, un elemento 5'-UTR y opcionalmente una señal de poliadenilación puede resultar en una molécula de ARNm que comprende un marco de lectura abierto, un elemento 3'-UTR y opcionalmente una secuencia poli(A).
Así, la invención también proporciona una molécula de ácido nucleico artificial que es una molécula ARNm que comprende un marco de lectura abierto, un elemento 3'-UTR como se describe arriba y, opcionalmente, un elemento 5'-UTR como se describe anteriormente y opcionalmente una secuencia poli(A).
En otra modalidad, la 3'-UTR de la molécula de ácido nucleico artificial de acuerdo con la invención no comprende una señal de poliadenilación o una secuencia poli(A). con mayor preferencia, la molécula de ácido nucleico artificial de acuerdo con la invención no comprende una señal de poliadenilación o una secuencia poli(A). De manera más preferente, la 3'UTR de la molécula de ácido nucleico artificial o la molécula de ácido nucleico artificial inventiva como tal no comprende una señal de poliadenilación, en particular no comprende la señal de poliadenilación AAU/TAAA.
En una realización preferente, la invención proporciona una molécula de ácido nucleico artificial que es una molécula de ARN artificial que comprende un marco de lectura abierto, un elemento 3'-UTR con un secuencia de ARN que es al menos un 90% idéntica a la secuencia de ARN correspondiente a la SEQ ID NO: 164 y una secuencia de ARN que corresponde a una secuencia de ADN seleccionada del grupo consistente de las secuencias de acuerdo con las SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternativamente SEQ ID NO: 3), SEQ ID NO: 138 (alternativamente SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternativamente SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternativamente SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44 , SEQ ID NO: 45, SEQ ID NO: 146 (alternativamente SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 6 6 , SEQ ID NO: 6 8 , SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternativamente SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 87, SEQ ID NO: 88 , SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98 , SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternativamente SEQ ID NO: 109), 20 SEQ ID NO: 148 (alternativamente SEQ ID NO: 110), SEQ ID NO: 112 , SEQ ID NO: 113 , SEQ ID NO: 114 , SEQ ID NO: 115 , SEQ ID NO: 117, SEQ ID NO: 118 , SEQ ID NO: 149 (alternativamente SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternativamente SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125 o un fragmento de las mismas como se describe anteriormente. Además, también se proporciona una molécula de ADN artificial correspondiente.
En otra realización preferente, la invención proporciona una molécula de ácido nucleico artificial que es una molécula de ADN artificial que comprende un marco de lectura abierto, un elemento 3'-UTR con una secuencia que es al menos un 90% idéntica a la SEQ ID No: 164 y una secuencia seleccionada del consistente en las secuencias de acuerdo con las SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternativamente SEQ ID NO: 3), SEQ ID NO: 138 (alternativamente SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternativamente SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternativamente SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44 , SEQ ID NO: 45, SEQ ID NO: 146 (alternativamente SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 6 6 , SEQ ID NO: 6 8 , SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternativamente SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80 , SEQ ID NO: 81 , SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 87, SEQ ID NO: 88 , SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternativamente SEQ ID NO: 109), SEQ ID NO: 148 (alternativamente SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118 , SEQ ID NO: 149 (alternativamente SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternativamente SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125.
Por consiguiente, la invención proporciona una molécula de ácido nucleico artificial que puede servir como plantilla para una molécula de ARN, preferentemente para una molécula de ARNm, que se caracteriza por una alta eficiencia de traducción tal como se define en la reivindicación 1. En otras palabras, la molécula de ácido nucleico artificial puede ser un ADN que se puede utilizar como plantilla para la producción de un ARNm. El ARNm obtenible, puede, a su vez, ser traducido para la producción de un péptido o proteína deseada codificada por el marco de lectura abierto. Si la molécula de ácido nucleico artificial es un ADN, puede utilizarse, por ejemplo, como una forma de almacenamiento de doble hebra para la producción in vitro o in vivo continua y repetitiva de ARNm. Así, in vitro se refiere en particular a células (“vivas”) y/o tejido, incluyendo tejido de un sujeto vivo. Las células incluyen en particular líneas celulares, células primarias, células de tejido o sujetos. En realizaciones específicas, los tipos de células permiten que el cultivo celular pueda ser adecuado para la presente invención. Son particularmente preferentes células de mamífero, por ejemplo células humanas y células de ratón. En realizaciones particularmente preferentes se utilizan las líneas celulares humanas HeLa, HEPG2 y U-937 y las líneas celulares de ratón NIH3T3, JAWSII y L929. Adicionalmente, son particularmente preferentes las células primarias, en realizaciones preferentes particulares se pueden utilizar fibroblastos dérmicos humanos (HDF).
Alternativamente también se puede emplear un tejido de un sujeto.
En una realización, la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende además una secuencia poli(A). Por ejemplo, una molécula de ADN que comprende un ORF, seguido de una 3'-UTR como se define en la reivindicación 1 puede contener un tramo de nucleótidos timidina que se pueden transcribir en una secuencia poli(A) en el ARNm resultante. La longitud de la secuencia poli(A) puede variar. Por ejemplo, la secuencia poli(A) puede tener una longitud de aproximadamente 20 nucleótidos adenina a aproximadamente 300 nucleótidos adenina, de manera preferente de aproximadamente 40 a aproximadamente 200 nucleótidos adenina, de manera más preferente de aproximadamente 50 a aproximadamente 100 nucleótidos adenina, tal como aproximadamente 60, 70, 80, 90 o 100 nucleótidos adenina. Con mayor preferencia, el ácido nucleico inventivo comprende una secuencia poli(A) de aproximadamente 60 a aproximadamente 70 nucleótidos, con especial preferencia de 64 nucleótidos adenina.
Las moléculas de ADN artificiales también pueden obtenerse in vitro por métodos comunes de síntesis química sin ser necesariamente transcritos a partir de un ADN progenitor.
En una realización particularmente preferente, la molécula de ácido nucleico artificial de acuerdo con la presente invención es una molécula de ARN, de manera preferente una molécula de ARNm que comprende en la dirección 5'-a-3'- un marco de lectura abierto, un elemento 3'-UTR como se define en la reivindicación 1 y una secuencia poli(A).
El marco de lectura abierto se deriva de un gen que es distinto del gen del cual se deriva el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR del ácido nucleico artificial inventivo. En otras realizaciones preferentes, el marco de lectura abierto no codifica para un gen seleccionado del grupo consistente en ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6 , FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3, FASN, PSMB6 , PRSS56, KPNA6 , SFT2D2, PARD6 B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6 , SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6 , PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (todos preferentemente humanos) y Dpysl2, Ccnd1, Acox2, Cbx6 , Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6 , Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8 , SIc7a1, UbqIn2, Prps2, Shmt2, Aurkb, FignI1, Cad, AnIn, SIfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6 , Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6 , Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Ccl17, AIkbh7, Ms4a8a, Acox2, Ubc, SIpi, Pcyox1I, Igf2bp1, Tmem37, SIc7a3, Cst6 , Ebp, Sf3b5, PIk1, Cdca8 , Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, CcI17, Alkbh7, Ms4a8a, MrpI34, Comtd1, Armc6 , Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (todos preferentemente de ratón), o variantes de los mismos, con la condición de que el elemento 3'-UTR y, opcionalmente el elemento 5'-UTR, sea una secuencia que se selecciona del grupo consistente en las secuencias de acuerdo con las SEQ ID NO: 1 a 204 y de que el elemento 3'-UTR sea como se define en la reivindicación 1.
En una realización preferente, el ORF no codifica proteínas ribosómicas humanas o vegetales, en particular proteínas ribosómicas de Arabidopsis, en particular no codifica la proteína ribosómica humana S6 (RPS6 ), la proteína ribosómica humana tipo L36a (RPL36AL) o la proteína ribosómica S16 de Arabidopsis (RPS16). En una realización preferente adicional, el marco de lectura abierto (ORF) no codifica la proteína ribosómica S6 (RPS6 ), la proteína ribosómica tipo L36a (RPL36AL) o la proteína ribosómica S16 (RPS16) de cualquier origen.
En una realización, la invención proporciona una molécula de ADN artificial que comprende un marco de lectura abierto, es decir un marco de lectura abierto derivado de un gen que es distinto del gen del cual se derivan el elemento 3'-UTR y opcionalmente el elemento 5'-UTR; un elemento 3'-UTR que comprende o consiste en una secuencia que es al menos un 90% idéntica a la SEQ ID NO: 164 o a la secuencia de ARN correspondiente y, opcionalmente, un elemento 3'-UTR adicional que comprende o consiste en una secuencia que tiene al menos aproximadamente un 60%, preferentemente al menos aproximadamente un al 70%, con mayor preferencia al menos aproximadamente un 80%, más preferentemente al menos un 90%, incluso con mayor preferencia al menos un 95%; de manera aún más preferente al menos un 99%; con total preferencia un 100% de identidad de secuencia con una secuencia de ADN seleccionada del grupo consistente en las secuencias de acuerdo con las SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternativamente SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177 y, opcionalmente, un elemento 5'-UTR que comprende o consiste en una secuencia que tiene al menos aproximadamente un 60%, de manera preferente al menos aproximadamente un 70%, de manera más preferente al menos aproximadamente un 80%, de manera más preferente al menos aproximadamente un 90%, de manera aún más preferente al menos aproximadamente un 95%; de manera aún más preferente al menos un 99%; de manera aún más preferente un 100% de identidad de secuencia con una secuencia de ADN seleccionada del grupo consistente en las secuencias de acuerdo con las SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternativamente SEQ ID NO: 3), SEQ ID NO: 138 (alternativamente SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternativamente SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternativamente SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternativamente SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 6 6 , SEQ ID NO: 6 8 , SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternativamente SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 87, SEQ ID NO: 8 8 , SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternativamente SEQ ID NO: 109), SEQ ID NO: 148 (alternativamente SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternativamente SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternativamente SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125; y una señal de poliadenilación y/o una secuencia poli(A).
Además, la invención proporciona una molécula de ARN artificial, preferentemente una molécula de ARNm artificial o una molécula de ARN viral artificial, que comprende un marco de lectura abierto, es decir, un marco de lectura abierto que se deriva de un gen que es distinto del gen del cual se deriva el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR; un elemento 3'-UTR que comprende o consiste en una secuencia que tiene al menos aproximadamente un 60%, de manera preferente al menos aproximadamente 70%, de manera más preferente al menos aproximadamente 80%, de manera más preferente al menos aproximadamente 90%, de manera aún más preferente al menos aproximadamente 95%; de manera aún más preferente al menos un 99%; de manera aún más preferente el 100% de identidad de secuencia con una secuencia de ARN que corresponde a una secuencia de ADN seleccionada del grupo que consistente en las secuencias de acuerdo con las SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternativamente SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, opcionalmente, un elemento 5'-UTR que comprende o consiste en una secuencia que tiene al menos aproximadamente 60%, de manera preferente al menos aproximadamente 70%, de manera más preferente al menos aproximadamente 80%, de manera más preferente al menos aproximadamente 90%, de manera aún más preferente al menos aproximadamente 95%; de manera aún más preferente al menos un 99%; de manera aún más preferente del 100% de identidad de secuencia con una secuencia de ARN que corresponde a una secuencia de ADN seleccionada del grupo consistente en las secuencias de acuerdo con las SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternativamente SEQ ID NO: 3), SEQ ID NO: 138 (alternativamente SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternativamente SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternativamente SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (alternativamente SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 6 6 , SEQ ID NO: 68 , SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternativamente SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62, SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 87, SEQ ID NO: 8 8 , SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternativamente SEQ ID NO: 109), SEQ ID NO: 148 (alternativamente SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (alternativamente SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternativamente SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125; y una señal de poliadenilación y/o una secuencia poli(A).
La invención proporciona una molécula de ácido nucleico artificial, preferentemente un ARNm artificial, que se caracteriza por una alta eficiencia de traducción tal como se define en la reivindicación 1. Sin limitarse a ninguna teoría, la alta eficiencia de traducción puede resultar de la reducción de la degradación de la molécula de ácido nucleico artificial, tal como una molécula de ARNm artificial de acuerdo con la presente invención. Por consiguiente, el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR pueden evitar la degradación y descomposición al ácido nucleico artificial.
De manera preferente, la molécula de ácido nucleico artificial puede comprender adicionalmente un tallo-bucle de histona. Así, una molécula de ácido nucleico artificial de acuerdo con la presente invención puede comprender, por ejemplo, en la dirección 5'-a-3' un ORF, un elemento 3'-UTR como se define en la reivindicación 1, una secuencia tallo-bucle de histona opcional, una secuencia poli(A) o una señal de poliadenilación opcional y una secuencia poli(C) opcional o, en la dirección 5'-a-3', un elemento 5'-UTR, un ORF, un elemento 3'-UTR como se define en la reivindicación 1, una secuencia tallo-bucle de histona opcional, una secuencia poli(A) o señal de poliadenilación opcional y una secuencia poli(C) opcional. También puede comprender, en la dirección 5'-a-3', un elemento ORF, un elemento 3'-UTR como se define en la reivindicación 1 una secuencia poli(A) opcional, una secuencia poli(C) opcional y una secuencia tallo-bucle de histona opcional, o, en la dirección 5'-a-3', un elemento 5'-UTR, un ORF, un elemento 3'-UTR como se define en la reivindicación 1, una secuencia poli(A) opcional, una secuencia poli(C) opcional y una secuencia tallo-bucle de histona opcional.
En una realización preferente, la molécula de ácido nucleico artificial de acuerdo con la invención comprende además al menos una secuencia tallo-bucle de histona.
Estas secuencias tallo-bucle de histona preferentemente se seleccionan de las secuencias tallo-bucle de histona tal como se describen en la WO 2012/019780.
Una secuencia tallo-bucle de histona adecuada para ser utilizada en la presente invención preferentemente se selecciona de al menos una de las siguientes fórmulas (I) o (II):
fórmula (I) (secuencia tallo-bucle sin elementos frontera de tallo):
Figure imgf000077_0001
tallo 1 bucle tallo 2
fórmula (II) (secuencia de tallo-bucle con elementos frontera de tallo):
Figure imgf000077_0002
elemento frontera tallo 1 bucle tallo 2 elemento frontera
de tallo 1 de tallo 2
donde:
los elementos frontera N1-6 de tallo 1 o tallo 2 es una secuencia consecutiva de 1 a 6 , de manera preferente de 2 a 6 , de manera más preferente de 2 a 5, aún de manera más preferente de 3 a 5, de manera mucho más preferente de 4 a 5 o 5 N, donde cada N se selecciona independientemente de un nucleótido seleccionado de A, U, T, G y C, o un análogo de nucleótido del mismo;
tallo 1 [N0-2GN3-5] es una complementariedad inversa o complementariedad parcialmente inversa con el elemento tallo 2, y es una secuencia consecutiva de entre 5 a 7 nucleótidos; donde N0-2 es una secuencia consecutiva de 0 a 2, de manera preferente de 0 a 1, de manera más preferente de 1 N, en donde cada N se selecciona independientemente de un nucleótido seleccionado de A, U, T, G y C o un análogo de nucleótido del mismo; donde N3-5 es una secuencia consecutiva de 3 a 5, de manera preferente de 4 a 5, de manera más preferente de 4 N, en donde cada N se selecciona independientemente de otro nucleótido seleccionado de A, U, T, G y C o un análogo de nucleótido del mismo, y donde G es guanosina o un análogo de la misma, y se puede reemplazar opcionalmente por una citidina o un análogo de la misma, con la condición de que su citidina de nucleótido complementaria en el tallo 2 se reemplace por guanosina;
la secuencia de bucle [N0-4(U/T)N0-4] se sitúa entre los elementos tallo 1 y tallo 2, y es una secuencia consecutiva de 3 a 5 nucleótidos, de manera más preferente de 4 nucleótidos; donde cada N0-4 es independientemente una secuencia consecutiva de 0 a 4, de manera preferente de 1 a 3, de manera más preferente de 1 a 2 N, en donde cada N se selecciona independientemente de otro nucleótido seleccionado de A, U, T, G y C o un análogo de nucleótido del mismo; y donde U/T representa uridina, u opcionalmente timidina;
tallo 2 [N3-5CN0-2] es complementariedad inversa o complementariedad parcialmente inversa con el elemento tallo 1 y es una secuencia consecutiva entre 5 a 7 nucleótidos; donde N3-5 es una secuencia consecutiva de 3 a 5, de manera preferente de 4 a 5, de manera más preferente de 4 N, en donde cada N se selecciona independientemente de un nucleótido seleccionado de A, U, T, G y C o un análogo de nucleótido del mismo; donde N0-2 es una secuencia consecutiva de 0 a 2, de manera preferente de 0 a 1, de manera más preferente de 1 N, en donde cada N se selecciona independientemente de un nucleótido seleccionado de A, U, T, G o C o un análogo de nucleótido del mismo; y donde C es citidina o un análogo de la misma, y se puede reemplazar opcionalmente por una guanosina o un análogo de la misma con la condición de que su nucleósido guanosina complementario en el tallo 1 se reemplace por citidina;
donde
tallo 1 y tallo 2 son capaces de un emparejamiento de bases entre sí formando una secuencia complementaria inversa, donde el emparejamiento de bases puede presentarse entre el tallo 1 y tallo 2 , por ejemplo por el emparejamiento de bases de Watson-Crick de nucleótidos A y U/T o G y C o por el emparejamiento de bases de no Watson-Crick, por ejemplo emparejamiento de bases oscilante, emparejamiento de bases de Watson-Crick inverso, emparejamiento de bases de Hoogsteen, emparejamiento de bases de Hoogsteen inverso, o son capaces del emparejamiento de bases entre sí formando una secuencia complementaria parcialmente inversa, donde un emparejamiento de bases incompleto puede presentarse entre tallo 1 y tallo 2 , en base a que una o más bases en un tallo no tienen una base complementaria en la secuencia complementaria inversa del otro tallo.
De acuerdo con otra realización preferente adicional, la secuencia tallo-bucle de histona puede seleccionarse de acuerdo con al menos una de las siguientes fórmulas específicas (Ia) o (IIa):
fórmula (Ia) (secuencia tallo-bucle sin elementos frontera de tallo):
[N ^G N jJ [N).3(U/T)N0.2] [N^CNo.,]
^ „ -------- 'V___
tallo 1 bucle tallo 2
fórmula (IIa) (secuencia tallo-bucle con elementos frontera de tallo):
Figure imgf000078_0001
elemento tallo 1 bucle tallo 2 elemento frontera
frontera de tallo 1 de tallo 2
donde N, C, G, T y U son como se definen anteriormente.
De acuerdo con una realización particularmente preferente adicional del primer aspecto, la secuencia de la molécula de ácido nucleico puede comprender al menos una secuencia tallo-bucle de histona de acuerdo con al menos una de las siguientes fórmulas específicas (Ib) o (I Ib):
fórmula (Ib) (secuencia de tallo-bucle sin elementos frontera de tallo):
[N,GN„] [N2(U/T)N,J [N4CN,]
<--------,,------- J K_____ J '--------------------v-------- '
tallo 1 bucle tallo 2
fórmula (Ilb) (secuencia de tallo-bucle con elementos frontera de tallo):
Figure imgf000079_0001
elemento tallo 1 bucle tallo 2 elemento frontera
frontera de tallo 1 de tallo 2
donde N, C, G, T y U son como se definen anteriormente.
Una secuencia tallo-bucle de histona particularmente preferente es la secuencia de acuerdo con la SEQ ID NO: 209: CAAAGGCTCTTTTCAGAGCCACCA o, con mayor preferencia, la secuencia de ARN correspondiente de la secuencia de ácido nucleico de acuerdo con la SEQ ID NO: 209.
Como un ejemplo, los elementos individuales pueden estar presentes en la molécula de ácido nucleico artificial en el siguiente orden:
5'-cap - 5'-UTR (elemento) - ORF - 3'-UTR (elemento) - tallo-bucle de histona - secuencia poly(A)/(C);
5'-cap - 5'-UTR (elemento) - ORF - 3'-UTR (elemento) - secuencia poli(A)/(C) - tallo-bucle de histona;
5'-cap - 5'-UTR (elemento) - ORF - IRES - ORF - 3'-UTR (elemento) - tallo-bucle de histona - secuencia poli(A)/(C); 5'-cap - 5'-UTR (elemento) - ORF - IRES - ORF - 3'-UTR (elemento) - tallo-bucle de histona - secuencia poli(A)/(C) -secuencia poli(A)/(C);
5'-cap - 5'-UTR (elemento) - ORF - IRES - ORF - 3'-UTR (elemento) - secuencia poli(A)/(C) - tallo-bucle de histona; 5'-cap - 5'-UTR (elemento) - ORF - IRES - ORF - 3'-UTR (elemento) - secuencia poli(A)/(C) - secuencia poli(A)/(C) - tallobucle de histona;
5'-cap - 5'-UTR (elemento) - ORF - 3'-UTR (elemento) - secuencia poli(A)/(C) - secuencia poli(A)/(C);
5'-cap - 5'-UTR (elemento) - ORF - 3'-UTR (elemento) - secuencia poli(A)/(C) - secuencia poli(A)/(C) - tallo-bucle de histona , etc.
En algunas realizaciones, la molécula de ácido nucleico artificial comprende elementos adicionales tales como un 5'-cap, una secuencia poli(C) y/o un motivo IRES. Durante la transcripción o pos-transcripcionalmente se puede añadir un 5'-cap al extremo 5' de un ARN. Además, la molécula de ácido nucleico artificial inventiva, en particular si el ácido nucleico está en forma de un ARNm o codifica para un ARNm, puede estar modificada con una secuencia de al menos 10 citidinas, de manera preferente al menos 20 citidinas, de manera más preferente al menos 30 citidinas (la llamada “secuencia poli(C)”). En particular, la molécula de ácido nucleico artificial inventiva puede contener, especialmente si el ácido nucleico está en forma de un ARN(m) o codifica para un ARNm, una secuencia poli(C) típicamente de aproximadamente 10 a 200 nucleótidos citidina, de manera preferente aproximadamente 10 a 100 nucleótidos citidina, de manera más preferente aproximadamente 10 a 70 nucleótidos citidina o de manera aún más preferente aproximadamente 20 a 50 o aún 20 a 30 nucleótidos citidina. De manera especialmente preferente, el ácido nucleico inventivo comprende una secuencia poli(C) de 30 residuos citidina. Así, de manera preferente, la molécula de ácido nucleico artificial de acuerdo con la presente invención comprende, preferentemente en la dirección 5'-a-3', al menos un elemento 5'-UTR como se describe anteriormente, un ORF, al menos un elemento 3'-UTR como se describe anteriormente, una secuencia poli(A) o una señal de poliadenilación, y una secuencia poli(C) o, en la dirección 5'-a-3', opcionalmente un 5'-UTR adicional, un ORF, al menos un elemento 3'-UTR como se describe anteriormente, una secuencia poli(A) o una señal de poliadenilación y una secuencia poli(C), o, en la dirección 5'-a-3', al menos un elemento 5'-UTR como se describe anteriormente, un ORF, una 3'-UTR, una secuencia poli(A) o una señal de poliadenilación y una secuencia poli(C).
Una secuencia de sitio de entrada a ribosoma interno (IRES) o motivo IRES puede separar varios marcos de lectura abiertos, por ejemplo si la molécula de ácido nucleico artificial codifica para dos o más péptidos o proteínas. Una secuencia IRES puede ser particularmente útil si la molécula de ácido nucleico artificial es una molécula de ácido nucleico bi- o multicistrónica.
Adicionalmente, la molécula de ácido nucleico artificial puede comprender elementos 5' adicionales, preferente mente un promotor o secuencia que contiene un promotor. El promotor puede conducir o regular la transcripción de la molécula de ácido nucleico artificial de acuerdo con la presente invención, por ejemplo una molécula de ADN artificial de acuerdo con la presente invención.
Preferentemente, la molécula de ácido nucleico artificial de acuerdo con la presente invención, preferentemente el marco de lectura abierto está al menos parcialmente modificado en G/C. Así, la molécula de ácido nucleico artificial inventiva se puede estabilizar termodinámicamente modificando el contenido de G (guanosina)/C (citidina) de la molécula. El contenido de G/C del marco de lectura abierto de una molécula de ácido nucleico artificial de acuerdo con la presente invención se puede incrementar en comparación con el contenido de G/C del marco de lectura abierto de una secuencia de tipo natural correspondiente, preferentemente utilizando la degeneración del código genético. Así, la secuencia de aminoácidos codificada de la molécula de ácido nucleico artificial preferentemente no está modificada por la modificación G/C en comparación con la secuencia de aminoácidos codificada de la secuencia de tipo natural particular. Los codones de la secuencia de codificación o la molécula de ácido nucleico artificial completa, por ejemplo un ARNm, puede así variar en comparación con la secuencia de codificación de tipo natural de manera que incluye una mayor cantidad de nucleótidos G/C mientras se mantiene la secuencia de aminoácidos traducida. Debido al hecho de que varios codones codifican para uno y el mismo aminoácido (la llamada degeneración del código genético), es factible alterar codones siempre que no se altere la secuencia de péptido/proteína codificada (el llamado uso de codón alternativo). Por consiguiente, es posible introducir específicamente ciertos codones (cambio para los codones de tipo natural respectivos que codifican el mismo aminoácido) que son más favorables en cuanto a la estabilidad del ARN y/o en cuanto al uso de codón en un sujeto (la así llamada optimización con codón).
Dependiendo del aminoácido a ser codificado por la región de codificación de la molécula de ácido nucleico artificial inventiva como se define aquí, existen diversas posibilidades para modificar la secuencia de ácido nucleico, por ejemplo el marco de lectura abierto, en comparación con su región de codificación de tipo natural. En el caso los aminoácidos que son codificados por codones que contienen exclusivamente nucleótidos G o C, no es necesaria ninguna modificación de codón. Así, los codones para Pro (CCC o CCG), Arg (CGC o CGG), Ala (GCC o GCG) y Gly (GGC o GGG) no requieren modificación, puesto que ni A o U/T están presentes.
Por el contrario, los codones que contienen los nucleótidos A y/o U/T se pueden modificar por sustitución de otros codones que codifican para los mismos aminoácidos pero que no contienen A y/o U/T. Por ejemplo
los codones para Pro se pueden modificar de CC(U/T) o CCA a CCC o CCG;
los codones para Arg se pueden modificar de CG(U/T) o CGA o AGA o AGG a CGC o CGG;
los codones para Ala se pueden modificar de GC(U/T) o GCA a GCC o GCG;
los codones para Gly se pueden modificar de GG(U/T) o GGA a GGC o GGG.
En otros casos, aunque los nucleótidos A o (U/T) no se pueden eliminar de los codones, es posible, sin embargo, disminuir el contenido de A y (U/T) utilizando los codones que contienen un menor contenido de nucleótidos A y/o (U/T). Ejemplos de éstos son:
los codones para Phe se pueden modificar de (U/T)(U/T)(U/T) a (U/T) (U/T)C;
los codones para Leu se pueden modificar de (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) o C(U/T)A a C(U/T)C o C(U/T)G; los codones para Ser se pueden modificar de (U/T)C(U/T) o (U/T)CA o AG(U/T) a (U/T)CC, (U/T)CG o AGC;
el codón para Tyr se puede modificar de (U/T)A(U/T) a (U/T)AC;
el codón para Cys se puede modificar de (U/T)G(U/T) a (U/T)GC;
el codón para His se puede modificar de CA(U/T) a CAC;
el codón para Gln se puede modificar de CAA a CAG;
los codones para Ile se pueden modificar de A(U/T)(U/T) o A(U/T)A a A(U/T)C;
los codones para Thr se pueden modificar de AC(U/T) o ACA a ACC o ACG;
el codón para Asn se puede modificar de AA(U/T) a AAC;
el codón para Lys se puede modificar de AAA a AAG;
los codones para Val se pueden modificar de G(U/T)(U/T) o G(U/T)A a G(U/T)C o G(U/T)G;
el codón para Asp se puede modificar de GA(U/T) a GAC;
el codón para Glu se puede modificar de GAA a GAG;
el codón de parada (U/T)AA se puede modificar a (U/T)AG o (U/T)GA.
En el caso de los codones para Met (A(U/T)G) y Trp ((U/T)GG), por otra parte, no existe posibilidad de modificación de secuencia sin alterar la secuencia de aminoácidos codificada.
Las sustituciones enumeradas anteriormente se pueden utilizar ya sea individualmente o en todas las combinaciones posibles para incrementar el contenido de G/C del marco de lectura abierto de la molécula de ácido nucleico artificial inventiva como se define aquí en comparación con su marco de lectura abierto de tipo natural particular (es decir la secuencia original). Así, por ejemplo, todos los codones para Thr que están presentes en la secuencia de origen natural se pueden modificar a ACC (o ACG).
Preferentemente, el contenido G/C del marco de lectura abierto de la molécula de ácido nucleico artificial inventiva como se define aquí se incrementa en al menos un 7%, de manera más preferente al menos un 15%,con particular preferencia al menos un 20% en comparación con el contenido de G/C de la región de codificación de tipo natural sin alterar la secuencia de aminoácidos codificada, es decir, utilizando la degeneración del código genético. De acuerdo con una realización específica, al menos el 5%, 10%, 20%, 30%, 40%, 50%, 60%, de manera más preferente al menos el 70%, de manera aún más preferente al menos el 80% y de manera especialmente preferente al menos el 90%, 95% o aún el 100% de los codones sustituibles de el marco de lectura abierto de la molécula de ácido nucleico artificial inventiva o de un fragmento, variante o derivado de la misma está sustituido, incrementando así el contenido de G/C del marco de lectura abierto.
En este contexto, es particularmente preferente incrementar el contenido de G/C del marco de lectura abierto de la molécula de ácido nucleico artificial inventiva como se define aquí al máximo (es decir el 100 % de los codones sustituibles), en comparación con el marco de lectura abierto de tipo natural, sin alterar la secuencia de aminoácidos codificada.
Además, el marco de lectura abierto preferentemente está al menos parcialmente optimizado con codón. La optimización con codón se basa en el descubrimiento de que la eficiencia de traducción puede venir determinada por una frecuencia diferente en la ocurrencia de los ARN de transferencia (ARNt) en las células. De esta manera, si los llamados “codones raros” están presentes en la región de codificación de la molécula de ácido nucleico artificial como se define aquí en un nivel incrementado, la traducción de la secuencia de ácido nucleico modificada correspondiente es menos eficiente que en el caso en que están presentes codones que codifican para ARNt relativamente “frecuentes”.
De esta manera, el marco de lectura abierto de la molécula de ácido nucleico artificial inventiva preferentemente está modificado en comparación con la región de codificación de tipo natural correspondiente de manera que al menos un codón de la secuencia de tipo natural que codifica para un ARNt que es relativamente raro en las células se intercambia por un codón que codifica para un ARNt que es relativamente frecuente en la célula y lleva el mismo aminoácido que el ARNt comparativamente raro. Con esta modificación, el marco de lectura abierto de la molécula de ácido nucleico artificial inventiva como se define aquí se modifica de manera que los codones para los cuales los ARNt disponibles que están presentes con frecuencia pueden reemplazar los codones que corresponden a ARNt raros. En otras palabras, de acuerdo con la invención, mediante esta modificación todos los codones del marco de lectura abierto de tipo natural que codifica para un ARNt raro se pueden cambiar por un codón que codifica para un ARNt que es más frecuente en la célula y que lleva el mismo aminoácido que el ARNt raro. Los ARNt que están presentes de manera relativamente frecuente en la célula y aquellos que, en contraste, están presentes de manera relativamente rara son conocidos por el experto en la técnica; véase, por ejemplo, Akashi, Curr. Opin. Genet. Dev. 2001, 11(6): 660-666. Por consiguiente, preferentemente el marco de lectura abierto está optimizado con codón, de manera preferente con respecto al sistema en el que se va a expresar la molécula de ácido nucleico artificial de acuerdo con la presente invención, de manera preferente con respecto al sistema en el que se va a traducir la molécula de ácido nucleico artificial de acuerdo con la presente invención. De manera preferente, el uso de codón del marco de lectura abierto se optimiza con codón de acuerdo con el uso de codón de mamífero, de manera más preferente de acuerdo con el uso de codón humano. Preferentemente, el marco de lectura abierto se optimiza con codón y se modifica el contenido de G/C.
Para mejorar adicionalmente la resistencia a la degradación, por ejemplo la resistencia a la degradación in vivo (o in vitro como se define en lo anterior) por una exo- o endonucleasa y/o para mejorar adicionalmente la estabilidad de la expresión a partir de la molécula de ácido nucleico artificial de acuerdo con la presente invención, la molécula de ácido nucleico artificial puede comprender además modificaciones, tales como modificaciones del esqueleto principal, modificaciones de azúcar y/o modificaciones de bases, por ejemplo modificaciones lipídicas o similares. De manera preferente, la transcripción y/o la traducción de la molécula de ácido nucleico artificial de acuerdo con la presente invención no se deteriora significativamente por las modificaciones.
En general, la molécula de ácido nucleico artificial de la presente invención puede comprender cualquier nucleótido nativo (= de origen natural), por ejemplo guanosina, uracilo, adenosina y/o citosina o análogos de los mismos. A este respecto, los análogos de nucleótidos se definen como variantes nativas y no nativas de los nucleótidos de origen natural adenosina, citosina, timidina, guanosina y uridina. Por consiguiente, análogos son, por ejemplo, nucleótidos químicamente derivados con grupos funcionales no nativos que preferentemente se añaden a o se eliminan del nucleótido de origen natural o que sustituyen los grupos funcionales de origen natural o de un nucleótido. Así, cada componente de nucleótido de origen natural se puede modificar, esto es el componente base, el componente azúcar (ribosa) y/o el componente fosfato que forma el esqueleto (ver arriba) de la secuencia de ARN. Los análogos de guanosina, uridina, adenosina, timidina y citosina incluyen, sin implicar ninguna limitación, cualquier guanosina, uridina, adenosina, timidina o citosina de origen natural o no de origen natural alterada por ejemplo químicamente, por ejemplo por acetilación, metilación, hidroxilación, etc., incluyendo 1 -metiladenosina, 1 -metilguanosina, 1 -metilinosina, 2 ,2 -dimetilguanosina, 2 ,6 -diaminopurina, 2 '-amino-2 '-desoxiadenosina, 2 '-amino-2 '-desoxicitidina, 2 '-amino-2 '-desoxiguanosina, 2 '-amino-2 '-desoxiuridina, 2 -amino- 6 cloropurinaribosido, 2 -aminopurinaribosido, 2 '-araadenosina, 2 '-aracitidina, 2 '-arauridina, 2 '-azido-2 '-desoxiadenosina, 2 '-azido-2 '-desoxicitidina, 2 '-azido-2 '-desoxiguanosina, 2 '-azido-2 '-desoxiuridina, 2 -cloroadenosina, 2 '-fluor-2 '-desoxiadenosina, 2 '-fluor-2 '-desoxicitidina, 2 '-fluor-2 '-desoxiguanosina, 2 '-fluor-2 '-desoxiuridina, 2 '-fluorotimidina, 2 -metiladenosina, 2 -metilguanosina, 2-metil-tio-N6-isopenteniladenosina, 2'-O-metil-2-aminoadenosina, 2'-O-metil-2'-desoxiadenosina, 2'-O-metil-2'-desoxicitidina, 2'-O-metil-2'-desoxiguanosina, 2'-O-metil-2'-desoxiuridina, 2'-O-metil-5-metiluridina, 2'-O-metilinosina, 2'-O-metilpseudouridina, 2-tiocitidina, 2-tiocitosina, 3-metilcitosina, 4-acetilcitosina, 4-tiouridina, 5-(carboxihidroximetil)-uracilo, 5,6-dihidrouridina, 5-aminoalilcitidina, 5-aminoalil-desoxiuridina, 5-bromouridina, 5-carboximetilaminometil-2-tiouracilo, 5-carboximetilamonometil-uracilo, 5-cloroaracitosina, 5-fluorouridina, 5-iodouridina, 5-metoxicarbonilmetil-uridina, 5-metoxiuridina, 5-metil-2-tiouridina, 6 -azacitidina, 6 -azauridina, 6-cloro-7-deaza-guanosina, 6 -cloropurinaribosido, 6 -mercaptoguanosina, 6 -metilmercaptopurina-ribosido, 7-deaza-2'-desoxiguanosina, 7-deazaadenosina, 7-metilguanosina, 8 -azaadenosina, 8 -bromoadenosina, 8 -bromoguanosina, 8 -mercaptoguanosina, 8 -oxoguanosina, benzimidazol-ribosido, beta-D-manosil-queosina, dihidrouracilo, inosina, N1-metiladenosina, N6 -([6 -aminohexil]carbamoilmetil)adenosina, N6 -isopentenil-adenosina, N6 -metiladenosina, N7-metilxantosina, éster metílico de ácido N-uracilo-5-oxiacético, puromicina, queosina, ácido uracil-5-oxiacético, éster metílico de ácido uracil-5-oxiacético, wibutoxosina, xantosina y xiloadenosina. La preparación de estos análogos es conocida por el experto en la técnica, por ejemplo de las patentes US 4,373,071, US 4,401,796, US 4,415,732, US 4,458,066, US 4,500,707, US 4,668,777, US 4,973,679, US 5,047,524, US 5,132,418, US 5,153,319, US 5,262,530 y 5,700,642. En el caso de un análogo como se describe anteriormente, se da preferencia particular de acuerdo con ciertas realizaciones de la invención a aquellos análogos que incrementan la expresión de proteínas del péptido o proteína codificado o que incrementa la inmunogenicidad de la molécula de ácido nucleico artificial de la invención y/o que no interfieren con una modificación adicional de la molécula de ácido nucleico artificial que se ha introducido.
De acuerdo con una realización particular, la molécula de ácido nucleico artificial de la presente invención puede contener una modificación lipídica.
En una realización preferente, la molécula de ácido nucleico artificial comprende, preferentemente en la dirección 5' a 3', los siguientes elementos:
un elemento 5'-UTR que proporciona una lata eficiencia de traducción a dicha molécula de ácido nucleico artificial, preferentemente a una secuencia de ácido nucleico de acuerdo con cualquiera de las SEQ ID NO: 1 a 151;
o una 5'-UTR adicional, preferentemente una 5'-TOP UTR;
al menos un marco de lectura abierto (ORF), donde el ORF preferentemente comprende al menos una modificación con respecto a la secuencia de tipo natural;
un elemento 3'-UTR como se define en la reivindicación 1; y, opcionalmente
un elemento 3'-UTR adicional que proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial, preferentemente una secuencia de ácido nucleico de acuerdo con las SEQ ID NO: 152 a 204;
opcionalmente otro 3'-UTR adicional, preferentemente una 3'-UTR de albúmina;
una secuencia poli(A), preferentemente comprendiendo 64 adenilatos;
una secuencia poli(C), preferentemente comprendiendo 30 citidilatos;
una secuencia tallo-bucle de histona.
En una realización particularmente preferente, la molécula de ácido nucleico artificial de acuerdo con la invención puede comprender además una o más de las modificaciones descritas ac continuación.
Modificaciones Químicas:
El término “modificación” tal como se utiliza aquí con respecto a la molécula de ácido nucleico artificial puede referirse a modificaciones químicas que comprenden modificaciones del esqueleto principal así como modificaciones de azúcar o modificaciones de bases.
En este contexto, la molécula de ácido nucleico artificial, preferentemente una molécula de ARN tal como se define aquí, puede contener análogos/modificaciones de nucleótidos, por ejemplo modificaciones del esqueleto principal, modificaciones de azúcar y modificaciones de bases. Una modificación del esqueleto principal en relación con la presente invención es una modificación en la que los fosfatos del esqueleto principal de los nucleótidos contenidos en una molécula de ácido nucleico como se define aquí están modificados químicamente. Una modificación de azúcar en relación con la presente invención es una modificación química del azúcar de los nucleótidos de la molécula de ácido nucleico como se define aquí. Además, una modificación de bases en relación con la presente invención es una modificación química de la porción base de los nucleótidos de la molécula de ácido nucleico. En este contexto, los análogos o las modificaciones de nucleótidos preferentemente se seleccionan de análogos de nucleótidos que son aplicables para la transcripción y/o la traducción.
Modificaciones de Azúcar:
Los nucleósidos y nucleótidos modificados que se pueden incorporar en la molécula de ácido nucleico artificial, preferentemente un ARN como se describe aquí, pueden estar modificados en la porción azúcar. Ejemplos de modificaciones de grupo “oxi” -2'-hidroxilo incluyen, pero no se limitan a, alcoxi o ariloxi (-OR, por ejemplo R = H, alquilo, cicloalquilo, arilo, aralquilo, heteroarilo o azúcar); polietilenglicoles (PEG), -O(CH2CH2O)nCH2CH2OR; ácidos nucleicos “bloqueados” (LNA) donde el 2'-hidroxilo está unido, por ejemplo por un puente metileno, al carbono 4' del mismo azúcar ribosa; y grupos amino (-O-amino donde el grupo amino, por ejemplo NRR, puede ser alquilamino, dialquilamino, heterociclilo, arilamino, diarilamino, heteroarilamino o diheteroarilamino, etilendiamina, poliamino) o aminoalcoxi.
Las modificaciones “desoxi” incluyen hidrógeno, amino (por ejemplo NH2; alquilamino, dialquilamino, heterociclilo, arilamino, diarilamino, heteroarilamino, diheteroarilamino o aminoácido); o el grupo amino puede estar unido al azúcar mediante un enlazador, comprendiendo el enlazador uno o más de los átomos de C, N y O.
El grupo azúcar también puede contener uno o más carbonos que poseen la configuración estereoquímica opuesta a aquella del carbono correspondiente en la ribosa. Así, una molécula de ácido nucleico modificada puede incluir nucleótidos que contienen, por ejemplo, arabinosa como azúcar.
Modificaciones del Esqueleto Principal:
El esqueleto principal fosfato puede estar además modificado en los nucleósidos y nucleótidos modificados, que se pueden incorporar en la molécula de ácido nucleico artificial, preferentemente un ARN, tal como se describe aquí. Los grupos fosfato del esqueleto principal se pueden modificar reemplazando uno o más de los átomos de oxígeno por un sustituyente diferente. Además, los nucleósidos y nucleótidos modificados pueden incluir el reemplazo completo de una porción fosfato no modificada por un fosfato modificado tal como se describe aquí. Ejemplos de grupos fosfato modificados incluyen, pero no se limitan a, fosforotioato, fosforoselenatos, boranofosfatos, ésteres borano fosfato, hidrogenofosfonatos, fosforoamidatos, alquil- o aril-fosfonatos y fosfotriésteres. En los fosforoditioatos los dos oxígenos no enlazados se reemplazan por azufre. El enlazador de fosfato también puede modificarse reemplazando un oxígeno del enlazador por nitrógeno (fosforoamidatos enlazados), azufre (fosforotioatos enlazados) y carbono (metilenfosfonatos enlazados). Modificaciones de Bases:
Los nucleósidos y nucleótidos modificados que se pueden incorporar en la molécula de ácido nucleico artificial, preferentemente una molécula de ARN como se describe aquí, pueden estar modificados adicionalmente en la porción nucleobase. Ejemplos de nucleobases encontradas en el ARN incluyen, pero no se limitan a, adenina, guanina, citosina y uracilo. Por ejemplo, los nucleósidos y nucleótidos aquí descritos pueden estar modificados químicamente en la superficie de hendidura mayor. En algunas realizaciones, las modificaciones químicas de hendidura mayor pueden incluir un grupo amino, un grupo tiol, un grupo alquilo o un grupo halo.
En realizaciones particularmente preferentes de la presente invención, los análogos/modificaciones de nucleótidos se seleccionan de modificaciones de bases, preferentemente seleccionadas de entre 2-amino-6-cloropurinaribosido-5' trifosfato, 2-aminopurinaribosido-5'-trifosfato; 2-aminoadenosina-5'-trifosfato, 2'-amino-2'-desoxicitidinatrifosfato, 2-tiocitidina-5'-trifosfato, 2-tiouridina-5' trifosfato, 2'-fluorotimidina-5'-trifosfato, 2'-O-metilinosina-5'-trifosfato 4-tiouridina-5'-trifosfato, 5-aminoalilcitidina-5'-trifosfato, 5-aminoaliluridina-5'-trifosfato, 5-bromocitidina-5'-trifosfato, 5-bromouridina-5' trifosfato, 5-bromo-2'-desoxicitidina-5'-trifosfato, 5-bromo-2'-desoxiuridina-5'-trifosfato, 5-iodocitidina-5'-trifosfato, 5-iodo-2'-desoxicitidina-5'-trifosfato, 5-yodouridina-5'-trifosfato, 5-yodo-2'-desoxiuridina-5'-trifosfato, 5-metilcitidina-5'-trifosfato, 5-metiluridina-5'-trifosfato, 5-propinil-2'-desoxicitidina-5'-trifosfato, 5-propinil-2'-desoxiuridina-5'-trifosfato, 6-azacitidina-5'-trifosfato, 6-azauridina-5'-trifosfato, 6-cloropurinaribosido-5'-trifosfato, 7-deazaadenosina-5'-trifosfato, 7-deazaguanosina-5'-trifosfato, 8-azaadenosina-5'-trifosfato, 8-azidoadenosina-5'-trifosfato, benzimidazolribosido-5'-trifosfato, N1-metiladenosina-5'-trifosfato, N1-metilguanosina-5'-trifosfato, N6-metiladenosina-5'-trifosfato, O6-metilguanosina-5'-trifosfato, pseudouridina-5'-trifosfato o puromicin-5'-trifosfato, xantosina-5'-trifosfato. Con particular preferencia los nucleótidos base para modificaciones de base se seleccionan del grupo de nucleótidos base modificados consiste en 5-metilcitidina-5'-trifosfato, 7-deazaguanosina-5'-trifosfato, 5-bromocitidina-5'-trifosfato y pseudouridina-5'-trifosfato.
En algunas realizaciones, los nucleósidos modificados incluyen piridin-4-ona-ribonucleósido, 5-azauridina, 2-tio5-azauridina, 2-tiouridina, 4-tiopseudouridina, 2-tio-pseudouridina, 5-hidroxiuridina, 3-metiluridina, 5-carboximetiluridina, 1-carboximetilpseudouridina, 5-propiniluridina, 1-propinilpseudouridina, 5-taurinometiluridina, 1-taurinometil-pseudouridina, 5-taurinometil-2-tiouridina, 1-taurinometil-4-tiouridina, 5-metiluridina, 1-metilpseudouridina, 4-tio-1-metilpseudouridina, 2-tio-1 -metilpseudouridina, 1 -metil-1 -deazapseudouridina, 2 -tio-1 -metil-1 -deazapseudouridina, dihidrouridina, dihidropseudouridina, 2-tiodihidrouridina, 2-tiodihidropseudouridina, 2-metoxiuridina, 2-metoxi-4-tiouridina, 4-metoxipseudouridina y 4-metoxi-2-tiopseudouridina.
En algunas realizaciones, los nucleósidos modificados incluyen 5-azacitidina, pseudoisocitidina, 3-metilcitidina, N4-acetilcitidina, 5-formilcitidina, N4-metilcitidina, 5-hidroximetilcitidina, 1-metilpseudoisocitidina, pirrolocitidina, pirrolopseudoisocitidina, 2-tiocitidina, 2-tio-5-metilcitidina, 4-tiopseudoisocitidina, 4-tio-1-metilpseudoisocitidina, 4-tio-1-metil-1-deaza-pseudoisocitidina, 1-metil-1-deaza-pseudoisocitidina, zebularina, 5-azazebularina, 5-metilzebularina, 5-aza-2-tiozebularina, 2-tiozebularina, 2-metoxicitidina, 2-metoxi-5-metilcitidina, 4-metoxipseudoisocitidina y 4-metoxi-1-metilpseudoisocitidina.
En otras realizaciones, los nucleósidos modificados incluyen 2-aminopurina, 2,6-diaminopurina, 7-deazaadenina, 7-deaza-8 -azaadenina, 7-deaza-2-aminopurina, 7-deaza-8-aza-2-aminopurina, 7-deaza-2,6-diaminopurina, 7-deaza-8-aza-2,6 diaminopurina, 1-metiladenosina, N6 -metiladenosina, N6 -isopenteniladenosina, N6 -(cis-hidroxiisopentenil)adenosina, 2-metiltio-N6 -(cis-hidroxiisopentenil)adenosina, N6 -glicinilcarbamoiladenosina, N6 -treonilcarbamoiladenosina, 2-metiltio-N6-treonil carbamoiladenosina, N6 ,N6 -dimetiladenosina, 7-metiladenina, 2-metiltioadenina y 2-metoxiadenina.
En otras realizaciones, los nucleósidos modificados incluyen inosina, 1-metilinosina, wiosina, wibutosina, 7-deazaguanosina, 7-deaza-8-azaguanosina, 6 -tioguanosina, 6-tio-7-deazaguanosina, 6-tio-7-deaza-8-azaguanosina, 7-metilguanosina, 6-tio-7-metilguanosina, 7-metilinosina, 6 -metoxiguanosina, 1-metilguanosina, N2-metilguanosina, N2,N2-dimetilguanosina, 8 -oxoguanosina, 7-metil-8-oxoguanosina, 1-metil-6-tioguanosina, N2-metil-6-tioguanosina y N2,N2-dimetil-6 -tioguanosina.
En algunas realizaciones, el nucleótido puede estar modificado en la superficie de hendidura mayor y puede incluir reemplazar el hidrógeno en el C-5 de uracilo por un grupo metilo o halo. En realizaciones específicas, un nucleósido modificado es 5'-O-(1-tiofosfato)adenosina, 5'-O-(1-tiofosfato)citidina, 5'-O-(1-tiofosfato)guanosina, 5'-O-(1-tiofosfato)uridina o 5'-O-(1-tiofosfato)pseudouridina.
En otras realizaciones específicas adicionales, la molécula de ácido nucleico artificial, preferentemente una molécula de ARN, puede comprender modificaciones de nucleósidos seleccionadas de 6 -azacitidina, 2-tiocitidina, a-tiocitidina, pseudo­ isocitidina, 5-aminoalil-uridina, 5-yodouridina, N1-metilpseudouridina, 5,6-dihidrouridina, a-tiouridina, 4-tiouridina, 6 -azauridina, 5-hidroxiuridina, desoxitimidina, 5-metiluridina, pirrolocitidina, inosina, a-tioguanosina, 6 -metilguanosina, 5-metilcitidina, 8 -oxoguanosina, 7-deazaguanosina, N1-metiladenosina, 2-amino-6-cloropurina, N6-metil-2-aminopurina, pseudoisocitidina, 6 -cloropurina, N6 -metiladenosina, a-tioadenosina, 8 -azidoadenosina, 7-deazaadenosina.
Modificación Lipídica:
De acuerdo con una realización adicional, la molécula de ácido nucleico artificial, preferentemente un ARN como se define aquí, puede contener una modificación lipídica. Este ARN modificado con lípidos comprende típicamente un ARN como se define aquí. Esta molécula de ARN modificada con lípidos como se define aquí comprende típicamente además al menos un enlazador unido covalentemente a esa molécula de ARN y al menos un lípido unido covalentemente al enlazador respectivo. Alternativamente, la molécula de ARN modificada con lípido comprende al menos una molécula de ARN como se define aquí y al menos un lípido (bifuncional) unido covalentemente (sin enlazador) a esa molécula de ARN. De acuerdo con una tercera alternativa, la molécula de ARN modificada con lípidos comprende una molécula de ácido nucleico artificial, preferentemente una molécula de ARN como se define aquí, al menos un enlazador unido covalentemente a esa molécula de ARN y al menos un lípido unido covalentemente al enlazador respectivo y también al menos un lípido (bifuncional) unido covalentemente (sin enlazador) a esa molécula de ARN. En este contexto, es particularmente preferente que la modificación de lípidos esté presente en los extremos terminales de una secuencia de ARN lineal.
Modificación del extremo 5' del ARN modificado:
De acuerdo con otra realización preferente de la invención, la molécula de ácido nucleico artificial, preferentemente una molécula de ARN como se define aquí, puede estar modificada por la adición de una, así llamada, estructura “5'-CAP'”. Típicamente una 5'-cap es una entidad de nucleótidos modificada que, en general, “tapa” el extremo 5' de un ARNm maduro. Típicamente una 5'-cap puede estar formada por un nucleótido modificado, en particular por un derivado de un nucleótido guanina. Preferentemente, la 5'-cap se une al terminal 5' mediante un enlace 5'-5'-trifosfato. La 5'-cap puede estar metilada, por ejemplo m7GpppN, donde N es el nucleótido 5' terminal del ácido nucleico que lleva la 5' -cap, típicamente el extremo 5' de un ARN. m7GpppN es la estructura de la 5'-cap que está presente naturalmente en el ARNm transcrito por la polimerasa II y, por tanto, no se considera como una modificación comprendida en el ARN modificado de acuerdo con la invención. Esto significa que la molécula de ácido nucleico artificial, preferentemente una molécula de ARN, de acuerdo con la presente invención puede comprender una m7GpppN como 5'-cap, pero además la molécula de ácido nucleico artificial, preferentemente una molécula de ARN, comprende al menos una modificación adicional como se define aquí.
Otros ejemplos de estructuras 5'-cap incluyen glicerilo, residuo abásico desoxi invertido (porción), nucleótido 4',5- metileno, nucleósido 1-(beta-D-eritrofuranosilo), nucleótido 4'-tio, nucleótido carboxílico, nucleótido 1,5-anhidrohexitol, L-nucleótidos, alfa-nucleótido, nucleótido base modificado, nucleótido treo pentofuranosilo, 3',4'-sec-nucleótido acíclico, nucleótido 3,4-dihidroxibutilo acíclico, nucleótido 3,5 -dihidroxipentilo acíclico, porción de nucleótido 3'-3' -invertido, porción abásica 3'-3'-invertida, porción de nucleótido 3'-2'-invertida, porción abásica 3'-2'-invertida, fosfato de 1,4-butanodiol, 3'-fosforamidato, hexilfosfato, fosfato de aminohexilo, 3'-fosfato, 3'-fosforotioato, fosforoditioato o porción metilfosfonato de enlazante o no enlazante. Estas estructuras 5'-cap modificadas se consideran como al menos una modificación comprendida en la molécula de ácido nucleico artificial, preferentemente en una molécula de ARN, de acuerdo con la presente invención.
Estructuras 5'-cap modificadas particularmente preferente son CAP1 (metilación de la ribosa del nucleótido adyacente de m7G), CAP2 (metilación de la ribosa del segundo nucleótido aguas abajo de m7G), CAP3 (metilación de la ribosa del tercer nucleótido aguas abajo de m7G), CAP4 (metilación de la ribosa del cuarto nucleótido aguas abajo de m7G), ARCA (análogo CAP anti-inverso, ARCA modificado (por ejemplo ARCA modificado con fosfotioato), inosina, N1-metilguanosina, 2'-fluoroguanosina, 7-deazaguanosina, 8 -oxoguanosina, 2-aminoguanosina, LNA-guanosina y 2-azidoguanosina.
En una realización preferente, el al menos un marco de lectura abierto codifica una proteína o péptido terapéutico. En otra realización, un antígeno es codificado por al menos un marco de lectura abierto, tal como un antígeno patogénico, un antígeno tumoral, un antígeno alergénico o un antígeno autoinmune. Aquí, la administración de la molécula de ácido nucleico artificial que codifica el antígeno se utiliza en un procedimiento de vacunación genética contra una enfermedad en la que está implicado dicho antígeno.
En una realización alternativa, un anticuerpo o un receptor de células T específico de antígeno o un fragmento del mismo es codificado por al menos un marco de lectura abierto de la molécula de ácido nucleico artificial de acuerdo con la invención.
Antígenos:
Antígenos patogénicos:
La molécula de ácido nucleico artificial de acuerdo con la presente invención puede codificar una proteína o un péptido que comprende un antígeno patogénico o un fragmento, variante o derivado del mismo. Estos antígenos patogénicos se derivan de organismos patogénicos, en particular organismos patogénicos bacterianos, virales o protozoarios (multicelulares) que provocan una reacción inmunológica en un sujeto, en particular un sujeto mamífero, más particularmente humano. Más específicamente, los antígenos patogénicos preferentemente son antígenos de superficie, por ejemplo proteínas (o fragmentos de proteínas, por ejemplo la porción exterior de un antígeno de superficie) en la superficie del virus o del organismo bacteriano o protozoario.
Los antígenos patogénicos son antígenos peptídicos o proteicos preferentemente derivados de un patógeno asociado con una enfermedad infecciosa seleccionados preferentemente de antígenos derivados de los patógenos Acinetobacter baumannil, Anaplasma genus, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, género Aspergillus, Astroviridae, género Babesia, Bacillus anthracis, Bacillus cereus, Bartonella henselae, virus BK, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, Borrelia genus, Borrelia spp, género Brucella, Brugia malayi, familia Bunyaviridae, Burkholderia cepacia y otras especies Burkholderia, Burkholderia mallei, Burkholderia pseudomallei, familia Caliciviridae, género Campylobacter, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, CJD prion, Clonorchis sinensis, Clostridium botulinum, Clostridium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, coronavirus, Corynebacterium diphtheriae, Coxiella burnetii, virus de la fiebre hemorrágica Crimean-Congo, Cryptococcus neoformans, género Cryptosporidium, Cytomegalovirus (CMV), virus del Dengue (DEN-1, DEN-2, DEN-3 y DEN-4), Dientamoeba fragilis, virus ébola (EBOV), género Echinococcus, Ehrlichia chaffeensis, Ehrlichia ewingii, género Ehrlichia, Entamoeba histolytica, género Enterococcus, género Enterovirus, Enterovirus, principalmente virus Coxsackie A y Enterovirus 71 (EV71), Epidermophyton spp, Virus de Epstein-Barr (EBV), Escherichia coli O157:H7, O111 y O104:H4, Fasciola hepatica y Fasciola gigantica, prion FFI, superfamilia Filarioidea, Flavivirus, Francisella tularensis, género Fusobacterium, Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, prión GSS, virus Guanarito, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, Henipavirus (virus Hendra virus Nipah), virus de la Hepatitis A, virus de la Hepatitis B (VHB), virus de la Hepatitis C (VHC), virus de la Hepatitis D, virus de la Hepatitis E, virus Herpes simple 1 y 2 (HSV-1 y HSV-2), Histoplasma capsulatum, VIH (virus de inmunodeficiencia humana), Hortaea werneckii, bocavirus humano (HBoV), virus herpes humano 6 (HHV-6 ) y virus herpes humano 7 (HHV-7), metapneumovirus humano (hMPV), virus del papiloma humano (HPV), virus de parainfluenza humana (HPIV), virus de encefalitis Japonesa, virus JC, virus Junin, Kingella kingae, Klebsiella granulomatis, prión Kuru, virus Lassa, Legionella pneumophila, género Leishmania, género Leptospira, monocitógenos de Listeria, virus de coriomeningitis linfocítica (LCMV), virus Machupo, Malassezia spp, virus Marburg, virus del sarampión, Metagonimus yokagawai, Microsporidia phylum, virus contagioso de molusco (MCV), virus de paperas, lepra por micobacteria y lepromatosis de micobacteria, tuberculosis de Micobacteria, Mycobacterium ulcerans, Mycoplasma pneumoniae, Naegleria fowleri, Necator americanus, Neisseria gonorrhoeae, Neisseria meningitidis, Nocardia asteroides, Nocardia spp, Onchocerca volvulus, Orientia tsutsugamushi, vamilia Orthomyxoviridae (Influenza), Paracoccidioides brasiliensis, Paragonimus spp, Paragonimus westermani, Parvovirus B19, género Pasteurella, género Plasmodium, Pneumocystis jirovecii, virus de la polio, virus de la rabia, virus sincitial respiratorio (RSV), Rinovirus, rinovirus, Rickettsia akari, género Rickettsia, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, virus de la fiebre del Valle del Rift, Rotavirus, virus de la rubeola, virus de Sabia, género Salmonella, Sarcoptes scabiei, coronavirus SARS, género Schistosoma, género Shigella, virus Sin Nombre, Hantavirus, Sporothrix schenckii, género Staphylococcus, género Staphylococcus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stereoralis, género Taenia, Taenia solium, virus de encefalitis transmitida por garrapata (TBEV), Toxocara canis o Toxocara cati, Toxoplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, virus zoster de varicela (VZV), virus zoster de varicela (VZV), Variola mayor o Variola menor, prion vCJD, virus de la encefalitis equina de Venezuela, Vibrio cholerae, virus del oeste del Nilo, Virus de la encefalitis equina del Oeste, Wuchereria bancrofti, virus de la fiebre amarilla, Yersinia enterocolitica, Yersinia pestis y pseudotuberculosis por Yersinia.
En este contexto, son particularmente preferentes los antígenos de patógenos seleccionados del virus de la Influenza, virus sincitial respiratorio (RSV), Virus Herpes simple (HSV), virus del Papiloma humano (HPV), virus de inmunodeficiencia humana (HIV), Plasmodium, Staphylococcus aureus, virus del Dengue, Chlamydia trachomatis, Citomegalovirus (CMV), virus de la Hepatitis B (HBV), tuberculosis por Mycobacterium, virus de la rabia y virus de la Fiebre Amarilla.
Antígenos tumorales:
En una realización adicional, la molécula de ácido nucleico artificial de acuerdo con la presente invención puede codificar una proteína o péptido, comprendiendo un péptido o proteína que comprende un antígeno tumoral, un fragmento, variante o derivado de un antígeno tumoral, preferentemente donde el antígeno tumoral es un antígeno específico de melanocitos, un antígeno de cáncer de testículo o un antígeno específico de tumor, preferentemente un antígeno CT-X, un antígeno CT no X, un socio de enlace para un antígeno CT-X o un socio de enlace para un antígeno CT no X o un antígeno específico de tumor, de manera más preferente un antígeno CT-X, un socio de enlace para un antígeno CT no X o un antígeno específico de tumor o un fragmento, variante o derivado del antígeno tumoral; y donde cada una de las secuencias de ácido nucleico codifica un péptido o proteína diferente; y donde al menos una de las secuencias de ácido nucleico codifica para 5T4, 707-AP, 9D7, AFP, AlbZIP HPG1, alfa-5-beta-1-integrina, alfa-5-beta-6-integrina, alfa-actinina-4/m, alfametilacil-coenzima A racemasa, ART-4, ARTC1/m, B7H4, BAGE-1, BCL-2, bcr/abl, beta-catenina/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA 27-29, 10 CA 19-9, CA72-4, CA125, calreticulina, CAMEL, CASP-8 /m, catepsina B, catepsina L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML6 6 , COA-1/m, proteína tipo coactosina, colágeno XXIII, COX-2, CT-9/BRD6, Cten, ciclina 15 B1, ciclina D1, cyp-B, CYPB1, DAM-10, DAM-6 , DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6 , GAGE7b, GAGE-8 , GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, hepsina, Her2/neu, HERV-20K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, homeosecuencia NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6 , HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, receptor de laminina inmadura, kalikreina-2, kalikreina-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGEA6 , MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6 , MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, mamaglobina A, MART-1/melan-A, MART-2, MART-2/m, proteína de matriz 22, MC1R, M-CSF, ME1/m, mesotelina, MG50/PXDN, MMP11, MN/CA IX-antígeno, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, miosina clasa I/m, NA88 -A, N-acetilglucosaminiltransferasa-V, Neo-PAP, NeoPAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, osteocalcina, osteopontina, p15, p190 bcr-abl menor, p53, p53/m, PAGE-4, PAI-1, PAI-2, PAP, PART-1, PATE, PDEF, Pim-1Cinasa, Pin-1, Pml/PARalfa, POTE, PRAME, PRDX5/m, prosteína, proteinasa-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP-1, survivina, survivina-2B, SYT-SSX-1, SYTSSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGFbeta, TGFbetaRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8 , tirosinasa, UPA, VEGFR1, VEGFR-2/FLK-1, WT1 y un idiotipo de inmunoglobulina de una célula sanguínea linfoide o un idiotipo del receptor de células T de una célula de sangre linfoide, o un fragmento, variante o derivado del antígeno tumoral; preferentemente survivina o un homólogo de la misma, un antígeno de la familia MAGE o un socio de enlace del mismo o un fragmento, variante o derivado del antígeno tumoral. Particularmente preferentes en este contexto son los antígenos tumorales NY-ESO-1, 5T4, MAGE-C1, MAGE-C2, Survivina, Muc-1, PSA, PSMA, PSCA, STEAP y PAP.
En una realización preferente, la molécula de ácido nucleico artificial codifica una proteína o un péptido que comprende una proteína terapéutica o un fragmento, variante o derivado de la misma.
Las proteínas terapéuticas como se definen aquí son péptidos o proteínas beneficiosas para el tratamiento de cualquier enfermedad heredada o adquirida o que mejoran la condición de un individuo. En particular, las proteínas terapéuticas desempeñan una función importante en el diseño de agentes terapéuticos que podrían modificar y reparar errores genéticos, destruir células cancerosas o células infectadas por patógenos, tratar trastornos del sistema inmunitario, tratar trastornos metabólicos o endocrinos, entre otras funciones. Por ejemplo, la eritropoyetina (EPO), una hormona proteica, se puede utilizar en el tratamiento de pacientes con deficiencia de eritrocitos, que es una causa común de complicaciones renales. Además las proteínas terapéuticas también abarcan proteínas adyuvantes, anticuerpos terapéuticos y también la terapia de reemplazo hormonal, que se utiliza por ejemplo en la terapia de la mujer en menopausia. En procedimientos más recientes, se utilizan células somáticas de un paciente para reprogramarlas en células madre pluripotentes, que reemplazan la terapia de células madre disputada. También estas proteínas utilizadas para la reprogramación de las células somáticas o para la diferenciación de células madre se definen aquí como proteínas terapéuticas. Adicionalmente, las proteínas terapéuticas se pueden utilizar para otros propósitos, por ejemplo, para curar heridas, regenerar tejidos, angiogénesis, etcétera. Además, se definen aquí como proteínas terapéuticas los receptores de células B específicos de antígeno y sus fragmentos y variantes.
Así, las proteínas terapéuticas se pueden utilizar para varios propósitos, incluyendo el tratamiento de diversas enfermedades similares, por ejemplo enfermedades infecciosas, neoplasmas (por ejemplo cáncer o enfermedades tumorales), enfermedades de la sangre y órganos formadores de sangre, enfermedades endocrinas, nutricionales y metabólicas, enfermedades del sistema nervioso, enfermedades del sistema circulatorio, enfermedades del sistema respiratorio, enfermedades del sistema digestivo, enfermedades de la piel y tejido subcutáneo, enfermedades del sistema musculoesquelético y tejido conjuntivo y enfermedades del sistema genitourinario, independientemente de si son heredadas o adquiridas.
En este contexto, proteínas terapéuticas particularmente preferentes que se pueden utilizar inter alia en el tratamiento de trastornos metabólicos o endocrinos se seleccionan de (en corchetes la enfermedad particular para la cual se utiliza la proteína terapéutica en el tratamiento): Esfingomielinasa ácida (enfermedad de Niemann-Pick), Adipotido (obesidad), Agalsidasa-beta (galactosidasa humana A) (enfermedad de Fabry; previene la acumulación de lípidos que podrían conducir a complicaciones renales y cardiovasculares), Alglucosidasa (enfermedad de Pompe (enfermedad de almacenamiento de glicógeno tipo II)), alfa galactosidasa A (alfa-GAL A, Agalsidasa alfa) (enfermedad de Fabry), alfaglucosidasa (enfermedad de almacenamiento de Glucógeno (GSD), Morbus Pompe), alfa-L-iduronidasa (mucopolisacaridosas (MPS), síndrome de Hurler, síndrome de Scheie), alfa-N-acetilglucosaminidasa (síndrome de Sanfilippo), Amfiregulina (cáncer, trastorno metabólico), Angiopoyetina ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6 , ANGPTL7) (angiogénesis, vasos estabilizados), Betacelulina (trastorno metabólico), Betaglucuronidasa (síndrome de Sly), Proteína morfogenética ósea BMPs (BMP1, BMP2, BMP3, BMP4, BMP5, BMP6 , BMP7, BMP8 a, BMP8 b, BMP10, BMP15) (efecto regenerativo, afecciones relacionadas con huesos, enfermedad de riñón crónica (CKD)), proteína CLN6 (enfermedad CLN6 - Infantil Tardía Atípica, variante de Inicio Tardío, Juvenil Temprano, Lipofuscinosas Céroides Neuronales (NCL)), Factor de crecimiento epidérmico (EGF) (curación de heridas, regulación del crecimiento celular, proliferación y diferenciación), Epigeno (trastorno metabólico), Epiregulina (trastorno metabólico), Factor de Crecimiento de Fibroblastos (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6 , FGF-7, FGF-8 , FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF1520, FGF-21, FGF-22, FGF-23) (curación de heridas, angiogénesis, trastornos endocrinos, regeneración de tejidos), Galsulfasa (Mucopolisacaridosis VI), Grelina (síndrome de intestino irritable (IBS), obesidad, síndrome de Prader-Willi, diabetes mellitus tipo II), Glucocerebrosidasa (enfermedad de Gaucher), GM-CSF (efecto regenerativo, producción de glóbulos blancos, cáncer), factor de crecimiento tipo EGF de enlace a Heparina (HB-EGF) (curación de heridas, hipertrofia cardíaca y desarrollo y función cardíaca), factor de crecimiento de Hepatocitos HGF (efecto regenerativo, curación de heridas), Hepcidina (trastornos del metabolismo del hierro, Beta-talasemia), Albúmina humana (Producción disminuida de albúmina (hipoproteinaemia), pérdida incrementada de albúmina (síndrome nefrótico), hipovolaemia, hiperbilirrubinaemia), Idursulfasa (Iduronato-2-sulfatasa) (Mucopolisacaridosis II (síndrome de Hunter)), Integrinas aVp3, aVp5 y a5p1 (Macromoléculas de matriz de enlace y proteinasas, angiogénesis), luduronato sulfatasa (síndrome de Hunter), Laronidasa (formas de Hurler y Hurler-Scheie de mucopolisacaridosis I), N-acetilgalactosamina-4-sulfatasa (rhASB; galsulfasa, Arilsulfatasa A (ARSA), Arilsulfatasa B (ARSB)) (deficiencia de arilsulfatasa B, síndrome de Maroteaux-Lamy, mucopolisacaridosis VI), N-acetilglucosamina 6 -sulfatasa (síndrome de Sanfilippo), Factor de crecimiento nervioso (NGF, Factor Neurotrófico Derivado del Cerebro (BDNF), Neurotrofina-3 (NT-3) y Neurotrofina 4/5 (NT-4/5) (efecto regenerativo, enfermedades cardiovasculares, aterosclerosis coronaria, obesidad, diabetes tipo 2 , síndrome metabólico, síndromes coronarios agudos, demencia, depresión, esquizofrenia, autismo, síndrome de Rett, anorexia nerviosa, bulimia nerviosa, curación de heridas, úlceras de piel, úlceras de córnea, enfermedad de Alzheimer), Neuregulina (NRG1, NRG2, NRG3, NRG4) (trastorno metabólico, esquizofrenia), Neuropilina (NRP-1, NRP-2) (angiogénesis, guía de axones, supervivencia celular, migración), Obestatina (síndrome de intestino irritable (IBS), obesidad, síndrome de Prader-Willi, diabetes mellitus tipo II), factor de Crecimiento Derivado de Plaquetas (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (efecto regenerativo, sanación de heridas, trastorno de la angiogénesis, Arteriosclerosis, Fibrosis, cáncer), receptores TGF beta (endoglina, receptor TGF-beta 1, receptor TGF-beta 2, receptor TGF-beta 3) (fibrosis renal, enfermedad renal, diabetes, enfermedad renal de etapa terminal (ESRD), angiogénesis), Trombopoyetina (THPO) (factor de crecimiento y desarrollo de Megacariocitos (MGDF)) (trastornos plaquetario, plaquetas para donación, recuperación de conteos de plaquetas después de quimioterapia mielosupresora), factor de Crecimiento Transformante (TGF (TGF-alfa, TGF-beta (TGFbeta1, TGFbeta2 y TGFbeta3))) (efecto regenerativo, curación de heridas, inmunidad, cáncer, enfermedad cardíaca, diabetes, síndrome de Marfan, síndrome de Loeys-Dietz), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F y PIGF) (efecto regenerativo, angiogénesis, curación de heridas, cáncer, permeabilidad), Nesiritida (Insuficiencia cardíaca congestiva descompensada aguda), Tripsina (Úlcera de cubito, úlcera varicosa, debridamiento de costra, herida dehiscente, quemadura solar, meconium ileus), hormona adrenocorticotrófica (ACTH) (“enfermedad de Addison”, carcinoma de células pequeñas, adrenoleucodistrofia, hiperplasia adrenal congénita, síndrome de Cushing, síndrome de Nelson, espasmos infantiles), Péptido atril-natriurético (ANP) (trastornos endocrinos), Colecistoquinina (diversa), Gastrina (hipogastrinemia), Leptina (Diabetes, hipertrigliceridemia, obesidad), Oxitocina (estimular la lactancia materna, sin progresión del parto), Somatostatina (tratamiento sintomático del síndrome carcinoide, hemorragia varicial aguda y acromegalia, enfermedades policísticas del hígado y riñón, acromegalia y síntomas provocados por tumores neuroendocrinos), Vasopresina (hormona antidiurética) (diabetes insípida), Calcitonina (Osteoporosis posmenopáusica, Hipercalcaemia, enfermedad de Paget, metástasis ósea, dolor fantasma de extremidades, estenosis espinal), Exenatido (diabetes Tipo 2 resistente al tratamiento con metformina y una sulfonilurea), Hormona del crecimiento (GH), somatotropina (Insuficiencia de crecimiento debido a deficiencia GH o insuficiencia renal crónica, síndrome de Prader-Willi, síndrome de Turner, pérdida o caquexia por SIDA con terapia antiviral), Insulina (Diabetes mellitus, cetoacidosis diabética, hipercalemia), Factor de crecimiento 1 tipo insulina IGF-1 (Insuficiencia de crecimiento en niños con supresión del gen GH o deficiencia IGF1 primaria grave, enfermedad neurodegenerativa, enfermedades cardiovasculares, insuficiencia cardíaca), Mecasermin rinfabate, análogo de IGF-1 (Insuficiencia de crecimiento en niños con supresión del gen GH o deficiencia de IGF1 primaria grave, enfermedad neurodegenerativa, enfermedades cardiovasculares, insuficiencia cardíaca), Mecasermina, análogo de IGF-1 (Insuficiencia de crecimiento en niños con supresión del gen GH o deficiencia IGF1 primaria grave, enfermedad neurodegenerativa, enfermedades cardiovasculares, insuficiencia cardíaca), Pegvisomant (Acromegalia), Pramlintida (Diabetes mellitus, en combinación con insulina), Teriparatida (residuos de la hormona paratiroides humana 1 -34) (Osteoporosis grave), Becaplermina (Adjunto de debridamiento para úlceras diabéticas), Dibotermin-alfa (proteína 2 morfogenética ósea) (cirugía de fusión espinal, reparación de lesión ósea), Acetato de histrelina (hormona liberadora de gonadotropina; GnRH) (Pubertad precoz), Octreotida (acromegalia, alivio sintomático de adenoma secretor de VIP y tumores carcinoides metastásicos) y Palifermina (factor de crecimiento de queratinocitos; KGF) (Mucositis oral grave en pacientes que se someten a quimioterapia, cicatrización de heridas).
Estas y otras proteínas se entienden que son terapéuticas, ya que se proponen para tratar al sujeto reemplazando su producción endógena defectuosa de una proteína funcional en cantidades suficientes. Por consiguiente, estas proteínas terapéuticas son típicamente de mamífero, en particular proteínas humanas.
Para el tratamiento de trastornos sanguíneos, enfermedades del sistema circulatorio, enfermedades del sistema respiratorio, enfermedades cancerosas o tumorales, enfermedades infecciosas o inmunodeficiencias seguidas por proteínas terapéuticas se puede utilizar: Alteplasa (activador de plasminógeno tisular; tPA) (Embolismo pulmonar, infarto miocardio, apoplejía isquémica aguda, oclusión de dispositivos de acceso venoso central), Anistreplasa (Trombolisis), Antitrombina III (AT-III) (Deficiencia AT-III hereditaria, Tromboembolismo), Bivalirudina (Riesgo de coágulos sanguíneos reducidos en angioplastia coronaria y trombocitopenia inducida por heparina), Darbepoyetina-alfa (Tratamiento de anemia en pacientes con insuficiencia renal crónica e insuficiencia renal crónica (+/- diálisis)), Drotrecogina-alfa (proteína activada C) (Septicemia grave con alto riesgo de muerte), Eritropoyetina, Epoetina-alfa, eritropoyetina, ertropoyetina (Anemia de enfermedad crónica, mileodisplasia, anemia debido a insuficiencia renal o quimioterapia, preparación preoperatoria), Factor IX (Hemofilia B), Factor VIIa (Hemorragia en pacientes con hemofilia A o B e inhibidores para el factor VIII o factor IX), Factor VIII (Hemofilia A), Lepirudina (Trombocitopenia inducida por heparina), Concentrado de proteína C (Trombosis venosa, Purpura fulminans), Reteplasa (muteína de supresión de tPA) (Manejo de infarto al miocardio agudo, mejora de la función ventricular), Estreptocinasa (Infarto de miocardio transmural evolucionado agudo), embolismo pulmonar, trombosis de venas profundas, trombosis arterial o embolismo, oclusión de la cánula arteriovenosa), Tenecteplasa (Infarto de miocardio agudo), Urocinasa (Embolismo pulmonar), Angiostatina (Cáncer), Inmunotoxina anti-CD22 (Leucemia mieloide aguda CD33+ recidivante), Denileucina diftitox (Linfoma de células T cutáneo (CTCL)), Inmunocianina (cáncer de vejiga y próstata), MPS (Metalopanstimulina) (Cáncer), Aflibercept (Cáncer de pulmón de células no pequeñas (NSCLC), cáncer colorrectal metastásico (mCRC), cáncer de próstata metastásico refractario de hormonas, degeneración macular húmeda), Endostatina (Cáncer, enfermedades inflamatorias tipo artritis reumatoide, así como enfermedad de Crohn, retinopatía diabética, psoriasis y endometriosis), Colagenasa (Debridamiento de úlceras dérmicas crónicas y áreas gravemente quemadas, contractura de Dupuytren, enfermedad de Peyronie), Desoxiribonucleasa I humana, dornasa (Fibrosis cística; disminuciones de infecciones del tracto respiratorio en pacientes seleccionados con FVC mayor que 40% del predicho), Hialuronidasa (Utilizada como adyuvante para incrementar la absorción y dispersión de fármacos inyectados, en particular anestésicos en cirugía oftálmica y ciertos agentes formadores de imágenes), Papaína (Debridamiento del tejido necrótico o licuefacción de tejido muerto en lesiones agudas y crónicas, como úlceras por presión, úlceras varicosas y diabéticas, quemaduras, heridas postoperatorias, heridas císticas pilonidales, carbunclos y otras heridas), L-Asparaginasa (Leucemia linfocítica aguda, que requiere asparagina exógena para proliferación), Peg-asparaginasa (Leucemia linfocítica aguda, que requiere asparagina exógena para proliferación), Rasburicasa (Pacientes pediátricos con leucemia, linfoma y tumores sólidos sometiéndose a terapia anti-cáncer que puede provocar síndrome de lisis tumoral), Gonadotropina crónica humana (HCG) (Reproducción asistida), Hormona estimuladora de folículos humana (FSH) (Reproducción asistida), Lutropin-alfa (Infertilidad con deficiencia de hormona luteinizante), Prolactina (Hipoprolactinemia, deficiencia de prolactina en suero, disfunción de ovarios en mujeres, ansiedad, disfunción eréctil, arteriogénica, eyaculación precoz, oligozoospermia, astenospermia, hipofunción de vesículas seminales, hipoandrogenismo en hombres), Inhibidor de alfa-1proteinasa (Deficiencia anti-tripsina congénita), Lactasa (Gas, inflamación, calambres y diarrea debido a incapacidad para digerir lactosa), Enzimas pancreáticas (lipasa, amilasa, proteasa) (Fibrosis cística, pancreatitis crónica, insuficiencia pancreática, cirugía de desviación gástrica post-Billroth II, obstrucción del conducto pancreático, esteatorrea, digestión deficiente, gas, inflamación), Adenosina desaminasa (pegademasa bovina, PEG-ADA) (Enfermedad de inmunodeficiencia combinada grave debido a deficiencia de adenosina desaminasa), Abatacept (Artritis reumatoide (especialmente cuando es refractaria a la inhibición de TNFalfa), Alefacept (Psoriasis de Placas), Anakinra (Artritis reumatoide), Etanercept (Artritis reumatoide, artritis reumatoide juvenil de curso poliarticular, artritis psoriática, espondilitis anquilosante, psoriasis en placas, espondilitis anquilosante), antagonista del receptor de interleucina-1 (IL-1), Anakinra (inflamación y degradación del cartílago asociada a artritis reumatoide), Timulina (enfermedades neurodegenerativas, reumatismo, anorexia nerviosa), antagonista de TNF-alfa (trastornos autoinmunes como artritis reumatoide, espondilitis anquilosante, enfermedad de Crohn, psoriasis, hidradenitis supurante, asma refractario), Enfuvirtide (infección por VIH-1) y Timosina a l (Hepatitis B y C) (entre corchetes enfermedad particular para la que se emplea la proteína terapéutica en el tratamiento).
En un aspecto adicional, la presente invención proporciona un vector que comprende una molécula de ácido nucleico tal como se reivindica.
En general, el vector según la presente invención puede comprender una molécula de ácido nucleico artificial de acuerdo con la presente invención como se describe anteriormente. En particular, las realizaciones preferentes descritas anteriormente para una molécula de ácido nucleico artificial de acuerdo con la presente invención también se aplican para una molécula de ácido nucleico artificial de acuerdo con la presente invención que está comprendida en un vector de acuerdo con la presente invención. Por ejemplo, en el vector inventivo el al menos un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR y el ORF son como se han descrito anteriormente para la molécula de ácido nucleico artificial de acuerdo con la presente invención, incluyendo las realizaciones preferentes. Por ejemplo, en el vector de acuerdo con la presente invención, el ARNm estable del cual se deriva el al menos un elemento 3'-UTR y, opcionalmente, el al menos un elemento 5'-UTR puede caracterizarse preferentemente por una descomposición del ARNm donde la relación entre la cantidad de dicho ARNm en un segundo momento del tiempo y la cantidad de dicho ARNm en un primer momento del tiempo es al menos 0,5 (50%), al menos 0,6 (60%), al menos 0,7 (70%), al menos 0,75 (75%), al menos 0,8 (80%), al menos 0,85 (85%), al menos 0,9 (90%) o al menos 0,95 (95%).
El sitio de clonación puede ser cualquier secuencia adecuada para introducir un marco de lectura abierto o una secuencia que comprende un marco de lectura abierto, tal como uno o más sitios de restricción. Así, el vector que comprende un sitio de clonación preferentemente es adecuado para insertar un marco de lectura abierto en el vector, de manera preferente para insertar un marco de lectura abierto 5' al elemento 3'-UTR y, opcionalmente, 3' al elemento 5'-UTR. Preferentemente, el sitio de clonación o el ORF se localiza 3' al elemento 5'-UTR y 5' al elemento 3'-UTR, preferentemente lo más cercano al extremo 3' del elemento 5'-UTR y al extremo 5' del elemento 3'-UTR. Por ejemplo, el sitio de clonación o el ORF se pueden estar directamente unidos al extremo 3' del elemento 5'-UTR y al extremo 5' del elemento 3'-UTR o pueden estar unidos mediante un tramo de nucleótidos, tal como un tramo de 2, 4, 6 , 8 , 10, 20, etc. Nucleótidos, tal como se describe anteriormente para la molécula de ácido nucleico artificial de acuerdo con la presente invención.
Preferentemente, el vector de acuerdo con la presente invención es adecuado para introducir la molécula de ácido nucleico artificial de acuerdo con la presente invención, de manera preferente para producir un ARNm artificial de acuerdo con la presente invención, por ejemplo, insertando opcionalmente un marco de lectura abierto o una secuencia que comprende un marco de lectura abierto en el vector y transcribiendo el vector. Así, preferentemente, el vector comprende los elementos necesarios para la transcripción, tales como un promotor, por ejemplo un promotor de ARN polimerasa. Preferentemente, el vector es adecuado para la transcripción utilizando sistemas de transcripción eucariotas, procariotas, virales o en fago, como células eucariotas, células procariotas o sistemas de transcripción in vitro eucariotas, procariotas, virales o fagos. Así, por ejemplo, el vector puede comprender una secuencia promotora es reconocida por una polimerasa, tal como por una ARN polimerasa, por ejemplo por una ARN polimerasa eucariota, procariota, viral o de fago. En una realización preferida, el vector comprende un promotor de ARN polimerasa fago, tal como SP6 , T3 o T7, de manera preferente un promotor T7. Preferentemente, el vector es adecuado para la transcripción in vitro utilizando un sistema de transcripción in vitro basado en fago, tal como una T7 ARN polimerasa basada en el sistema de transcripción in vitro.
En otra realización preferente, el vector se puede utilizar directamente para la expresión del péptido o proteína codificados en las células o tejidos. Para ello, el vector comprende elementos particulares que son necesarios para la expresión en aquellas células/tejidos, por ejemplo secuencias promotoras particulares, tal como un promotor CMV.
El vector puede comprender además una secuencia poli(A) y/o una señal de poliadenilación como se describen anteriormente para la molécula de ácido nucleico artificial de acuerdo con la presente invención.
El vector puede ser un vector de ARN o un vector de ADN. Preferentemente, el vector es un vector de ADN. El vector puede ser cualquier vector conocido por el experto, tal como un vector viral o un vector plásmido. Preferentemente, el vector es un vector plásmido, preferentemente un vector plásmido de ADN.
En una realización preferente, el vector de acuerdo con la presente invención comprende la molécula de ácido nucleico artificial de acuerdo con la presente invención.
El vector de ADN de acuerdo con la invención comprende una secuencia de ácido nucleico que tiene una identidad de al menos un 90% con la secuencia de ácido nucleico de una 3'-UTR de un transcripto de un gen como se ilustra en la SEQ ID NO: 164.
Preferentemente, un vector de ADN de acuerdo con la invención comprende además una secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 1, 2, 3, 4, 5, 10, 15, 20, 30 o 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99%, con total preferencia del 100% con la secuencia de ácido nucleico de una 3'-UTR de un transcripto de un gen, tal como la secuencia de ácido nucleico de acuerdo con las SEQ ID NO: 152 a 204.
Preferentemente, un vector de ADN de acuerdo con la invención comprende a secuencia de ácido nucleico que tiene una identidad de al menos aproximadamente un 1, 2, 3, 4, 5, 10, 15, 20, 30 o 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%, de manera aún más preferente de al menos aproximadamente un 99%, de forma totalmente preferente de un 100% con la secuencia de ácido nucleico de un elemento 5'-UTR de un transcripto de un gen, tal como la secuencia de ácido nucleico de acuerdo con las SEQ ID NO: 1 a 151.
Preferentemente, un vector de ADN de acuerdo con la presente invención comprende una secuencia seleccionada del grupo consistente en las secuencias de ADN de acuerdo con los elementos 5'-UTR representados por las SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (alternativamente SEQ ID NO: 3), SEQ ID NO: 138 (alternativamente SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (alternativamente SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (alternativamente SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44 , SEQ ID NO: 45, SEQ ID NO: 146 (alternativamente SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 6 6 , SEQ ID NO: 68 , SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (alternativamente SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62; SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80 , SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 87, SEQ ID NO: 88 , SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ ID NO: 95 , SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (alternativamente SEQ ID NO: 109), SEQ ID NO: 148 (alternativamente SEQ ID NO: 110), SEQ ID NO: 112 , SEQ ID NO: 113, SEQ ID NO: 114 , SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118 , SEQ ID NO: 149 (alternativamente SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (alternativamente SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125, un elemento 3'-UTR representado por la SEQ ID NO: 164 o con una identidad de secuencia de al menos un 90%, y elementos 3'-UTR adicionales representados por las SEQ ID NO:152 , SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173; SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (alternativamente SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177, o una secuencia que tiene una identidad de al menos aproximadamente un 40%, de manera preferente de al menos aproximadamente un 50%, de manera preferente de al menos aproximadamente un 60%, de manera preferente de al menos aproximadamente un 70%, de manera más preferente de al menos aproximadamente un 80%, de manera más preferente de al menos aproximadamente un 90%, de manera aún más preferente de al menos aproximadamente un 95%; de manera aún más preferente de al menos aproximadamente un 99% de identidad de secuencia con cualquiera de dichas secuencias, o un fragmento de las mismas como se describe anteriormente, de manera preferente un fragmento funcional.
Preferentemente, un vector de ARN de acuerdo con la presente invención comprende una secuencia seleccionada del grupo consistente en las secuencias de acuerdo con las secuencias de ARN que corresponden a las secuencias de ADN descritas arriba en relación con el vector de ADN vector de acuerdo con la presente invención.
De manera preferente, el vector es una molécula circular. Preferentemente, el vector es una molécula de doble hebra, tal como una molécula de ADN de doble hebra. Esta molécula de ADN circular, preferentemente de doble hebra, se puede utilizar convenientemente como una forma de almacenamiento para la molécula de ácido nucleico artificial inventiva. Además, se puede utilizar para la transfección de células, por ejemplo, células cultivadas. También se puede utilizar para la transcripción in vitro para obtener una molécula de ARN artificial de acuerdo con la invención.
Preferentemente, el vector, de manera preferente el vector circular, es linealizable, por ejemplo, por digestión con enzimas de restricción. En una realización preferente, el vector comprende un sitio de escisión, tal como un sitio de restricción, preferentemente un sitio de escisión único situado inmediatamente 3' al ORF, o - si está presente - inmediatamente 3' al elemento 3'-UTR a la secuencia poli(A) o la señal de poliadenilación o - si está presente - 3' a la secuencia poli(C) o - si está presente - 3' al tallo-bucle de histona. En la realización donde el vector según la presente invención comprende la molécula de ácido nucleico artificial de acuerdo con la presente invención, un sitio de restricción, preferentemente un sitio de restricción único, se localiza preferentemente inmediatamente 3' al extremo 3' de la molécula de ácido nucleico artificial.
En un aspecto adicional, la presente invención se refiere a una célula que comprende la molécula de ácido nucleico artificial de acuerdo con la presente invención o el vector de acuerdo con la presente invención. La célula puede ser cualquier célula, tal como una célula bacteriana, de insecto, vegetal, de vertebrado, por ejemplo una célula de mamífero. Esta célula puede emplearse, por ejemplo, para la replicación del vector de la presente invención, por ejemplo en una célula bacteriana. Además, la célula se puede utilizar para transcribir la molécula de ácido nucleico artificial o el vector de acuerdo con la presente invención y/o traducir el marco de lectura abierto de la molécula de ácido nucleico artificial o del vector de acuerdo con la presente invención. Por ejemplo, la célula se puede utilizar para la producción de proteínas recombinantes.
Por ejemplo, las células de acuerdo con la presente invención se obtienen por métodos de transferencia de ácido nucleico estándar, como métodos de transfección, traducción o transformación estándares. Por ejemplo, la molécula de ácido nucleico artificial o el vector de acuerdo con la presente invención se pueden transferir en la célula por electroporación, lipofección, por ejemplo basada en lípidos catiónicos y/o liposomas, precipitación de fosfato de calcio, transfección basada en nanopartículas, transfección basada en virus, o basados en polímeros catiónicos, como DEAE-dextrano o polietilenimina, etc.
Preferentemente, la célula es una célula de mamífero, tal como una célula de un sujeto humano, un animal doméstico, un animal de laboratorio, tal como una célula de rata o ratón. De manera preferente, la célula es una célula humana. La célula puede ser una célula de una línea celular establecida, tal como CHO, BHK, 293T, COS-7, HeLa, HEPG2 y HEK, etc., o la célula puede ser una célula primaria, tal como una célula de fibroblasto dérmico humano (HDF), etc., preferentemente una célula aislada de un organismo. En una realización preferente, la célula es una célula aislada de un sujeto mamífero, de manera preferente de un sujeto humano.
En otro aspecto, la presente invención proporciona una composición farmacéutica que comprende la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención o la célula de acuerdo con la presente invención. La composición farmacéutica de acuerdo con la invención se puede utilizar, por ejemplo, como vacuna, por ejemplo para la vacunación genética. Así, el ORF puede por ejemplo codificar un antígeno que se administra a un paciente para la vacunación. Así, en una realización preferente, la composición farmacéutica de acuerdo con la presente invención es una vacuna. Además, la composición farmacéutica de acuerdo con la presente invención se puede utilizar, por ejemplo, para la terapia génica.
Preferentemente, la composición farmacéutica comprende además uno o más vehículos, diluyentes y/o excipientes farmacéuticamente aceptables y/o uno o más adyuvantes. En el contexto de la presente invención, un vehículo farmacéuticamente aceptable incluye típicamente una base líquida o no líquida para la composición farmacéutica inventiva. En una realización, la composición farmacéutica se proporciona en forma líquida. En este contexto, preferentemente el vehículo se basa en agua, tal como agua libre de pirógenos, solución salina isotónica o soluciones tampón (acuosas), por ejemplo soluciones tampón fosfato, citrato, etc. El tampón puede ser hipertónico, isotónico o hipotónico con respecto al medio de referencia específico, es decir, el tampón puede tener un contenido en sal mayor, igual o inferior respecto al medio de referencia especifico, donde, preferentemente, se emplean concentraciones de las sales mencionadas que no producen daños en las células de mamífero debido a ósmosis u otros efectos de la concentración. Medios de referencia son, por ejemplo, líquidos presentes en métodos “ in vivo”, como sangre, linfa, líquidos citosólicos, u otros líquidos corporales, o por ejemplo líquidos que se pueden utilizar como medios de referencia en métodos “ in vitro”, tal como líquidos o soluciones tampón comunes. Estos tampones o líquidos comunes son conocidos por el experto. La solución Lactato de Ringer es particularmente preferente como base líquida.
También pueden emplearse una o más cargas o diluyentes sólidos o líquidos compatibles o compuestos encapsulantes adecuados para la administración a un paciente para la composición farmacéutica inventiva. El término “compatible” como se utiliza aquí preferentemente significa que estos componentes de la composición farmacéutica inventiva pueden ser mezclados con el ácido nucleico artificial inventivo, el vector o las células como se definen aquí de manera que no se produce una interacción que reduzca sustancialmente la efectividad farmacéutica de la composición farmacéutica inventiva bajo las condiciones de uso típicas.
La composición farmacéutica de acuerdo con la presente invención puede comprender además opcionalmente uno o más componentes farmacéuticamente activos adicionales. Un componente farmacéuticamente activo en este contexto es un compuesto que tiene un efecto terapéutico para sanar, mejorar o prevenir una indicación o enfermedad particular. Estos compuestos incluyen, sin implicar ninguna limitación, péptidos o proteínas, ácidos nucleicos, compuestos orgánicos o inorgánicos de bajo peso molecular (terapéuticamente activos) (peso molecular inferior a 5.000, preferentemente inferior a 1.000 ), azúcares, antígenos o anticuerpos, agentes terapéuticos ya conocidos en la técnica anterior, células antigénicas, fragmentos celulares antigénicos, fracciones celulares, componentes de la pared celular (por ejemplo polisacáridos), patógenos modificados, atenuados o desactivados (por ejemplo químicamente o por irradiación) (virus, bacterias, etc.).
Además, la composición farmacéutica inventiva puede comprender un vehículo para la molécula de ácido nucleico artificial o el vector. Este vehículo puede ser adecuado para mediar la disolución en líquidos fisiológicamente aceptables, el transporte y la captación celular de la molécula de ácido nucleico artificial activa farmacéutica o del vector. Por consiguiente, este vehículo puede ser un componente que puede ser adecuado para el depósito y suministro de una molécula de ácido nucleico artificial o vector de acuerdo con la invención. Estos componentes pueden ser, por ejemplo, vehículo catiónicos o policatiónicos o compuestos que pueden servir como agente de transcripción o de complejación.
En una realización preferente de acuerdo con la invención, la molécula de ácido nucleico artificial o el vector está complejado con uno o más compuestos catiónicos o policatiónicos, preferentemente con polímeros catiónicos o policatiónicos, péptidos o proteínas catiónicos o policatiónicos, por ejemplo protamina, polisacáridos catiónicos o policatiónicos y/o lípidos catiónicos o policatiónicos.
De acuerdo con una realización preferente, la molécula de ácido nucleico artificial o el vector pueden estar complejados con lípidos para formar uno o más liposomas, lipoplexos o nanopartículas lipídicas. Por tanto, en una realización, la composición farmacéutica inventiva comprende liposomas, lipoplexos y/o nanopartículas lipídicas que comprenden la molécula de ácido nucleico artificial o el vector, preferentemente ARN, en especial ARNm.
Las formulaciones basadas en lípidos están siendo reconocidas como uno de los sistemas de suministro más prometedores de ácidos nucleicos, en particular para el ARN, debido a su biocompatibilidad y su facilidad de producción a gran escala. Los lípidos catiónicos se han estudiado ampliamente como materiales sintéticos para el suministro de ARN. Después de mezclarse conjuntamente, los ácidos nucleicos se condensan con los lípidos catiónicos para formar complejos lípidos/ácido nucleico, conocidos como lipoplexos. Estos complejos líquidos son capaces de proteger el material genético de la acción de las nucleasas y suministrarlo en las células interactuando con la membrana celular cargada negativamente. Los lipoplexos se pueden preparar mezclando directamente lípidos cargados positivamente a pH fisiológico con ácidos nucleicos cargados negativamente.
Los liposomas convencionales consisten en una bicapa lipídica que puede estar compuesta de (fosfo)lípidos catiónicos, aniónicos o neutros y colesterol que encierran un núcleo acuoso. Tanto la bicapa lipídica como el espacio acuoso pueden incorporar compuestos hidrofóbicos o hidrofílicos, respectivamente. Las características de los liposomas y su comportamiento in vivo se pueden modificar mediante la adición de un recubrimiento polimérico hidrofílico, por ejemplo polietilenglicol (PEG), en la superficie de liposoma para conferir estabilización estérica. Adicionalmente, los liposomas se pueden utilizar para dianas específicas por unión de ligandos (por ejemplo anticuerpos, péptidos y carbohidratos) a su superficie o al extremo terminal de las cadenas de PEG unidas (Front Pharmacol. 2015 Dec 1; 6 : 286).
Los liposomas son sistemas de suministro basados en lípidos y en agentes tensoactivos típicamente coloidales compuestos por una bicapa de fosfolípidos que rodea un compartimiento acuoso. Pueden presentarse como vesículas esféricas y pueden variar en tamaño, de 20 nm a algunas micras. Los liposomas basados en lípidos catiónicos son capaces de complejarse con ácidos nucleicos cargados negativamente mediante interacciones electroestáticas, resultando en complejos que presentan biocompatibilidad, baja toxicidad y la posibilidad de producción a gran escala, requerida para las aplicaciones clínicas in vivo. Los liposomas pueden fusionarse con la membrana plasmática para la captación; una vez dentro de la célula, los liposomas son procesados a través de la ruta endocítica y el material genético después se libera del endosoma/portador en el citoplasma. Los liposomas se han percibido durante mucho tiempo como vehículos de suministro de fármacos debido a su alta biocompatibilidad, dado que los liposomas son básicamente análogos de las membranas biológicas y se pueden preparar tanto a partir de fosfolípidos naturales como de sintéticos (Int J Nanomedicine.
2014; 9: 1833-1843).
Los liposomas catiónicos han sido tradicionalmente los sistemas de suministro no virales más comúnmente utilizados para oligonucleótidos, incluyendo ADN plasmídico, oligos anti-sentido y ARNsi/ARN-ARNsh de horquilla pequeños). Los lípidos catiónicos, tal como DOTAP, (1,2-dioleoil-3-trimetilammonio-propano) y DOTMA (metilsulfato de N-[1-(2,3-dioleoiloxi)propil]-N,N,N-trimetil-amonio) pueden formar complejos o lipoplexos con ácidos nucleicos cargados negativamente para formar nanopartículas por interacción electroestática, proporcionando una alta eficiencia de transfección in vitro. Además, se han desarrollado nanoliposomas basados en lípidos neutros para el suministro de ARN, por ejemplo nanoliposomas basados en 1,2-dioleoil-sn-glicero-3-fosfatidilcolina (DOPC) neutros (Adv Drug Deliv Rev. 2014 Feb; 6 6 : 110-116).
Por tanto, en una realización, la molécula de ácido nucleico artificial o el vector, preferentemente el ARN, de la composición farmacéutica de acuerdo con la presente invención está complejado con lípidos catiónicos y/o lípidos neutros y forma así liposomas, nanopartículas lipídicas, lipoplexos o nanoliposomas basados en lípidos neutros.
En otras realizaciones, agentes de transcripción o complejantes particularmente preferentes en este contexto son compuestos catiónicos o policatiónicos, incluyendo protamina, nucleolina, espermina o espermidina, u otros péptidos o proteínas catiónicos, tal como poli-L-lisina (PLL), poli-arginina, polipéptidos básicos, péptidos penetrantes de células (CPP), incluyendo péptidos de enlace a VIH, VIH-1 Tat (VIH), péptidos derivados de Tat, Penetratina, péptidos derivados o análogos VP22, HSV VP22 (Herpes simple), MAP, KALA o dominio de transducción de proteínas (PTD, PpT620, péptidos ricos en prolina, péptidos ricos en arginina, péptidos ricos en lisina, MPG-péptido(s), Pep-1, L-oligómeros, péptido(s) de calcitonina, péptidos derivados de Antennapedia (en particular de Drosophila antennapedia), pAntp, pIsl, FGF, lactoferrina, transportano, buforina-2, Bac715-24, SynB, SynB(1), pVEC, péptidos derivados de hCT, SAP o histonas.
Además, estos compuestos catiónicos o policatiónicos o vehículos pueden ser péptidos o proteínas catiónicos o policatiónicos que preferentemente comprenden o están adicionalmente modificados para comprender al menos una porción -SH. De manera preferente, un vehículo catiónico o policatiónico se selecciona de péptidos catiónicos de la siguiente fórmula (I):
{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x}; fórmula (I)
donde l m n o x = 3-100, y l, m, n u o, independientemente entre sí, es cualquier número seleccionado de 0, 1, 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 y 91-100, con la condición de que el contenido total de Arg (Arginina), Lys (Lisina), His (Histidina) y Orn (Ornitina) represente al menos el 10% de todos los aminoácidos del oligopéptido; y Xaa es cualquier aminoácido seleccionado de aminoácidos nativos (= de origen natural) o no nativos, excepto Arg, Lys, His u Orn; y x es cualquier número seleccionado de 0, 1, 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 6170, 71-80, 81-90, con la condición de que el contenido total de Xaa no exceda el 90% de todos los aminoácidos del oligopéptido. Cualquiera de los aminoácidos Arg, Lys, His, Orn y Xaa puede disponerse en cualquier lugar del péptido. En este contexto, los péptidos o proteínas catiónicos en el intervalo de 7-30 aminoácidos son particularmente preferentes. Péptidos y proteínas catiónicos preferentes también se describen en la solicitud de patente internacional WO 2009/030481.
Además, el péptido o proteína catiónico o policatiónico, cuando se define de acuerdo con la fórmula {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (fórmula (I)) mostrada anteriormente y que comprende o está además modificado para comprender al menos una porción -SH, puede seleccionarse, sin limitarse a, la subfórmula (Ia):
{(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa')x (Cys)y} subfórmula (la)
donde (Arg)l;(Lys)m;(His)n;(Orn)o y x son como se define aquí, Xaa' es cualquier aminoácido seleccionado de aminoácidos nativos (= de origen natural) o no nativos, excepto Arg, Lys, His, Orn o Cys, e y es cualquier número seleccionado de 0, 1, 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 y 81-90, con la condición de que el contenido total de Arg (Arginina), Lys (Lisina), His (Histidina) y Orn (Ornitina) representen al menos el 10% de todos los aminoácidos del oligopéptido. En este contexto, se cita aquí la descripción de la WO 2012/013326. Además, el péptido catiónico o policatiónico se puede seleccionar de la subfórmula (Ib):
Cysi {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} Cys2 subfórmula (Ib)
donde la fórmula empírica {(Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x} (fórmula (III)) es como se define aquí y forma un núcleo de una secuencia de aminoácidos de acuerdo con la fórmula (III) (semi-empírica) y donde Cys1 y Cys2 son cisteínas próximas a o terminales a (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x. En este contexto, se menciona la descripción de la WO 2011/026641.
Otros compuestos catiónicos o policatiónicos preferentes que se pueden utilizar como agente de transfección o complejación pueden incluir polisacáridos catiónicos, por ejemplo quitosano, polibreno, polímeros catiónicos, por ejemplo polietilenimina (PEI), lípidos catiónicos, por ejemplo DOTMA: [cloruro de 1-(2,3sioleiloxi)propil)]-N,N,N-trimetilamonio, DMRIE, di-C14amidina, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: dioleil fosfatidiletanol amina, DOSPA, DODAB, DOIC, DMEPC, DOGS: Dioctadecilamidoglicilspermina, DIMRI: bromuro de dimiristo-oxipropil-dimetilhidroxietil-amonio, DOTAP: dioleoiloxi-3-(trimetilammonio)propano, DC-6-14: cloruro de O,O-ditetradecanoil-N-(atrimetilamonioacetil)dietanolamina, CLIP1: cloruro de rac-[(2,3-dioctadeciloxipropil)(2-hidroxietil)]dimetilamonio, CLIP6 : rac-[2(2,3-dihexadeciloxipropil-oximetiloxi)etil]trimetilamonio, CLIP9: rac-[2-(2,3-dihexadeciloxipropil-oxisucciniloxi)etil]-trimetilamonio, oligofectamina, o polímeros catiónicos o policatiónicos, por ejemplo ácidos de poliamina modificados, tal como polímeros de ácido p-amino o poliamidas invertidas, etc., polietilenos modificados, tal como PVP (bromuro de poli(N-etil-4-vinilpiridio)), etc., acrilatos modificados, tal como pDMAEMA (poli(dimetilaminoetil-metilacrilato)), etc., amidoaminas modificadas como pAMAM (poli(amidoamina)), etc., poli-beta-amino ésteres modificados (PBAE), tal como polímeros diacrilato-co-5-amino-1-pentanol- 1,4-butanodiol modificados en el extremo de diamina, etc., dendrímeros, como dendrímeros de polipropilamina o dendrímeros basados en pAMAM, etc., poliimina(s), tal como PEI: poli(etileneimina), poli(propileneimina), etc., polialilamina, polímeros basados en esqueletos de azúcar, como polímeros basados en ciclodextrina, polímeros basados en dextrano, quitosano, etc., polímeros basados en esqueleto silano, como copolímeros PMOXA-PDMS, etc., copolímeros en bloque consistentes en una combinación de uno o más bloques catiónicos (por ejemplo seleccionados de polímeros catiónicos como se mencionan anteriormente y/o de uno o más bloques hidrofílicos o hidrofóbicos (por ejemplo polietilenglicol); etc.
De acuerdo con otra realización, la composición farmacéutica de acuerdo con la invención puede comprender un adyuvante para mejorar las propiedades inmunoestimuladoras de la composición farmacéutica. En este contexto, un adyuvante se puede entender como cualquier compuesto adecuado para ayudar a la administración y suministro de componentes tales como la molécula de ácido nucleico artificial o el vector comprendido en la composición farmacéutica de acuerdo con la invención. Además, este adyuvante puede, sin limitarse a, iniciar o incrementar una respuesta inmune del sistema inmunitario innato, es decir, una respuesta inmunitaria no específica. En otras palabras, cuando se administra, la composición farmacéutica de acuerdo con la invención inicia típicamente una respuesta inmunitaria adaptiva dirigida al antígeno codificado por la molécula de ácido nucleico artificial. Además, la composición farmacéutica de acuerdo con la invención puede generar una respuesta inmunitaria innata (de apoyo) debido a la adición de un adyuvante como se define aquí a la composición farmacéutica de acuerdo con la invención.
Este adyuvante se puede seleccionar de cualquier adyuvante conocido por el experto y adecuado para el presente caso, es decir que apoye la inducción de una respuesta inmunitaria en un mamífero. Preferentemente, el adyuvante se puede seleccionar del grupo consistente en, sin limitarse a, TDM, MDP, dipéptido de muramilo, plurónicos, solución de alumbre, hidróxido de aluminio, ADJUMER® polifosfazeno); gel de fosfato de aluminio; glucanos de algas; algamulina; gel de hidróxido de aluminio (alumbre); gel de hidróxido de aluminio sumamente adsorbente de proteínas; gel de hidróxido de aluminio de baja viscosidad; AF o SPT (emulsión de escualeno (5%), Tween 80 (0,2%), Pluronic L121 (1,25%), solución salina tampón fosfato, pH 7,4); AVRIDINE® (propanodiamina); BAY R1005® ((hidroacetato de N-(2-desoxi-2-L-leucilamino-b-D-glucopiranosil)-N-octadecil-dodecanoil-amida); CALCITRIOL® (1-alfa,25-dihidroxi-vitamina D3); gel de fosfato de calcio; CAP® (nanopartículas de fosfato de calcio); holotoxina de cólera, proteína de fusión de cólera-toxina-A1-proteína-A-D-fragmento, subunidad B de la toxina de cólera; CRL 1005 (copolímero de bloque P1205); liposomas que contienen citoquinas; DDA (bromuro de dimetildioctadecilamonio); DHEA (deshidroepiandrosterona); DMPC (dimiristoilfosfatidilcolina); DMPG (dimiristoilfosfatidilglicerol); complejo DOC/alumbre (sal sódica de ácido desoxicólico); adyuvante completo de Freund; adyuvante incompleto de Freund; gamma-inulina; adyuvante de Gerbu (mezcla de: i) N-acetilglucosaminil-(P1-4)-N-acetilmuramil-L-alanil-D-glutamina (GMDP), ii) cloruro de dimetildioctadecilamonio (DDA), iii) complejo de sal de zinc-L-prolina (ZnPro-8 ); GM-CSF); GMDP (N-acetilglucosaminil-(b1-4)-N-acetilmuramil-L-alanil-D isoglutamina); imiquimod (1-(2-metipropil)-1H-imidazo[4,515c]quinolin-4-amina); ImmTher® (dipalmitato de N-acetilglucosaminil-N-acetilmuramil-L-Ala-D-isoGlu-L-Ala glicerol); DRV (inmunoliposomas preparados de vesículas de deshidratación-rehidratación); interferón-gamma; interleucina-1beta; interleucina-2; interleucina-7; interleucina-12; ISCOMS®; ISCOPREP 7.0.3. ®; liposomas; LOXORIBINE® (7-alil-8-oxoguanosina); adyuvante oral LT (enterotoxinaprotoxina inestable de E.coli); microesferas y micropartículas de cualquier composición; MF59TM; (emulsión de escualenoagua); MONTANIDE ISA 51® (adyuvante de Freund incompleto purificado); MONTANIDE ISA 720® (adyuvante de aceite metabolizable); MPL® (lípido A de 3-Q-desacil-4'-monofosforilo A); liposomas MTP-PE y MTP-PE ((sal monosódica de N-acetil-L-alanil-D-isoglutaminil-L-alanina-2(1,2-dipalmitoil-sn-glicero-3-(hidroxifosforiloxi))etilamida); MURAMETIDE® (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE® y D-MURAPALMITINE® (Nac-Mur-L-Thr-D-isoGInsn-gliceroldipalmitoil); NAGO (neuraminidasa-galactosa oxidasa); nanoesferas o nanopartículas de cualquier composición; NISV (vesículas de agentes tensoactivos no iónicos); PLEURAN® (-glucano); PLGA, PGA y PLA (homo- y co-polímeros de ácido láctico y ácido glicólico; microesferas/nanoesferas); PLURONIC L121®; PMMA (polimetilmetacrilato); PODDST® (microesferas de proteinoide); derivados de carbamato de polietileno; poli-rA: poli-rU (complejo de ácido poliadenílico-ácido poliuridílico); polisorbato 80 (Tween 80); cocleatos de proteína (Avanti Polar Lipids, Inc., Alabaster, AL); STIMULON® (QS-21); Quil-A (saponina Quil-A); S-28463 (4-amino-otec-dimetil-2etoximetil-1H-imidazo[4,5c]quinolin-1-etanol); SAF-1® (“formulación adyuvante Syntex”); proteoliposomas Sendai y matrices lipídicas que contienen Sendai; Span-85 (trioleato de sorbitano); Specol (emulsión de Marcol 52, Span 85 y Tween 85); escualeno o Robane® (2,6,10,15,19,23-hexametiltetracosan-2,6,10,15,19,23-hexametil-2,6,10,14,18,22-tetracosahexano); esteariltirosina (clorhidrato de octadeciltirosina); Theramid® (N-acetilglucosaminil-N-acetilmuramil-L-Ala-D-isoGlu-L-Ala-dipalmitoxipropilamida); Teronil-MDP (Termurtide® o [thr 1]-MDP; N-acetilmuramil-L-treonil-D-isoglutamina); partículas Ty (Ty-VLP o partículas tipo virus); liposomas Walter-Reed (liposomas que contienen el lípido A adsorbido en hidróxido de aluminio) y lipopéptidos, incluyendo Pam3Cys, en particular sales de aluminio, tal como Adju-phos, Alhydrogel, Rehydragel; emulsiones que incluyen CFA, SAF, IFA, MF59, Provax, TiterMax, Montanide, Vaxfectin; copolímeros que incluyen Optivax (CRL1005), L121, Poloaxmero4010), etc.; liposomas, incluyendo Stealth, cocleatos, incluyendo BIORAL; adyuvantes derivados de plantas, incluyendo QS21, Quil A, Iscomatrix, ISCOM; adyuvantes adecuados para la co-estimulación, incluyendo Tomatina, biopolímeros, incluyendo PLG, PMM, Inulina; adyuvantes derivados de microbios, incluyendo Romurtide, DETOX, MPL, CWS, Manosa, secuencia de ácido nucleicos CpG, CpG7909, ligandos de TLR 1-10 humanos, ligandos de TLR 1-13 murinos, ISS-1018, IC31, Imidazoquinolinas, Ampligen, Ribi529, IMOxine, IRIV, VLP, toxina de cólera, toxina termolábil, Pam3Cys, Flagelina, anclaje GPI, LNFPIII/Lewis X, péptidos antimicrobianos, UC-1V150, proteína de fusión RSV, cdiGMP; y adyuvantes adecuados como antagonistas, incluyendo neuropéptido CGRP.
Adyuvantes adecuados también se pueden seleccionar de compuestos catiónicos o policatiónicos donde el adyuvante preferentemente se prepara con la complejación de la molécula de ácido nucleico artificial o con el vector de la composición farmacéutica del compuesto catiónico o policatiónico. La asociación o complejación de la molécula de ácido nucleico artificial o del vector de la composición farmacéutica con los compuestos catiónicos o policatiónicos como se definen aquí preferentemente proporciona propiedades adyuvantes y confiere un efecto estabilizante a la molécula de ácido nucleico artificial o al vector de la composición farmacéutica. Con particular preferencia, estos compuestos catiónicos o policatiónicos se seleccionan de péptidos o proteínas catiónicos o policatiónicos, incluyendo protamina, nucleolina, espermina o espermidina, u otros péptidos o proteínas catiónicos, tal como poli-L-lisina (PLL), poli-arginina, polipéptidos básicos, péptidos de penetración de células (CPP), incluyendo péptidos de enlace a VIH, VIH-1 Tat (HIV), péptidos derivados de Tat, Penetratina, péptidos derivados de VP22 o análogos, HSV VP22 (Herpes simple), MAP, KALA o dominio de transducción de proteínas (PTD, PpT620, péptidos ricos en prolina, péptidos ricos en arginina, péptidos ricos en lisina, MPG-péptido(s), Pep-1, L-oligómeros, péptido(s) de Calcitonina, péptidos derivados de Antennapedia (en particular de Drosophila antennapedia), pAntp, pIsl, FGF, Lactoferrina, Transportano, Buforina-2, Bac715-24, SynB, SynB(1), pVEC, péptidos derivados de hCT, SAP, protamina, espermina, espermidina o histonas. Compuestos catiónicos o policatiónicos preferentes adicionales pueden incluir polisacáridos catiónicos, por ejemplo quitosano, polibreno, polímeros catiónicos, por ejemplo polietileneimina (PEI), lípidos catiónicos, por ejemplo DOTMA: cloruro de 1-(2,3-sioleiloxi)propil)-N,N,N-trimetilamonio, DMRIE, di-C14 amidina, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: Dioleil fosfatidiletanol amina, DOSPA, DODAB, DOIC, DMEPC, DOGS: Dioctadecilamidoglicilespermina, DIMRI: bromuro de dimiristo-oxipropil-dimetil-hidroxietil-amonio, DOTAP: dioleoiloxi-3-(trimetilamonio)propano, DC-6-14: cloruro de O,O-ditetradecanoil-N-(-trimetilammnioacetil)dietanolamina, CLIP1: cloruro de rac-[(2,3-dioctadeciloxipropil)(2-hidroxietil)]-dimetilamonio, CLIP6: rac-[2-(2,3-dihexadeciloxipropil-oximetiloxi)etil]trimetilamonio, CLIP9: rac-[2-(2,3-dihexadeciloxipropil-oxisucciniloxi)etil]trimetilamonio, oligofectamina, o polímeros catiónicos o policatiónicos, por ejemplo poliaminoácidos modificados, tal como polímeros de aminoácido o poliamidas inversas, etc., polietilenos modificados, tal como PVP (bromuro de poli(N-etil-4-vinilpiridinio)), etc., acrilatos modificados, tal como pDMAEMA (metilacrilato de poli(dimetilaminoetilo)), etc., amidoaminas modificadas, tal como pAMAM (poli(amidoamina)), etc., poli-beta-aminoésteres modificados (PBAE), tal como polímeros de diacrilato-co-5-amino-1-pentanol 1,4-butanodiol modificados en el extremo diamina, etc., dendrímeros, tal como dendrímeros de polipropilamina o dendrímeros basados en pAMAM, etc., poliimina(s), tal como PEI: poli(etilenimina), poli(propilenimina), etc., polialilamina, polímeros basados en cadena principal de azúcar, tal como polímeros basados en ciclodextrina, polímeros basados en dextrano, quitosano, etc., polímeros basados en cadena principal de silano, tal como copolímeros de PMOXA-PDMS, etc., polímeros en bloque consistentes en una combinación de un o más bloques catiónicos (por ejemplo seleccionados de un polímero catiónico como se menciona anteriormente) y de uno o más bloques hidrofílicos o hidrofóbicos (por ejemplo polietilenglicol); etc.
Adicionalmente, proteínas o péptidos catiónicos o policatiónicos preferentes que se pueden utilizar como adyuvante en la complejación de la molécula de ácido nucleico artificial o el vector, preferentemente un ARN de la composición, se pueden seleccionar de las siguientes proteínas o péptidos con la siguiente fórmula total (I): (Arg)l;(Lys)m;(His)n;(Orn)o;(Xaa)x, donde l m n o x = 8-15, y l, m, n u o independientemente entre sí pueden ser cualquier número seleccionado de 0, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 o 15, con la condición de que el contenido total de Arg, Lys, His y Orn represente al menos el 50% de todos los aminoácidos del oligopéptido; y Xaa puede ser cualquier aminoácido seleccionado de aminoácidos nativos (= de origen natural) o no nativos excepto de Arg, Lys, His u Orn; y x puede ser cualquier número seleccionado de 0, 1, 2, 3 o 4, con la condición de que el contenido total de Xaa no exceda el 50% de todos los aminoácidos del oligopéptido. Oligoargininas particularmente preferentes en este contexto son, por ejemplo, Arg7, Args, Argg, Arg7, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R, etc.
La relación entre el ácido nucleico artificial o el vector y el compuesto catiónico o policatiónico se puede calcular sobre la base de la relación nitrógeno/fosfato (relación N/P) del complejo de ácido nucleico completo. Por ejemplo, 1 pg de ARN contiene típicamente aproximadamente 3 nmol de residuos fosfato, siempre que el ARN muestre una distribución estadística de bases. Además, 1 pg de péptido contiene típicamente aproximadamente x nmol de residuos nitrógeno, dependiendo del peso molecular y del número de aminoácidos básicos. Cuando se calculan a modo de ejemplo para (Arg)9 (peso molecular 1.424 g/mol, 9 átomos de nitrógeno), 1 pg de (Arg)9 contiene aproximadamente 700 pmol de (Arg)9 y así 700 x 9 = 6.300 pmol de aminoácidos básicos = 6,3 nmol de átomos de nitrógeno. Para una relación en masa de aproximadamente 1:1 ARN/(Arg)9, se puede calcular una relación N/P de aproximadamente 2. Cuando se calcula a modo de ejemplo para la protamina (peso molecular de aproximadamente 4.250 g/mol, 21 átomos de nitrógeno, empleando protamina de salmón) con una relación en masa de aproximadamente 2:1 con 2 pg RNA, se calculan 6 nmol de fosfato para el ARN; 1 pg de protamina contiene aproximadamente 235 pmol de moléculas de protamina y así 235 x 21 = 4.935 pmol de átomos de nitrógeno básicos = 4,9 nmol de átomos de nitrógeno. Para una relación en masa de aproximadamente 2:1 ARN/protamina, se puede calcular una relación N/P de aproximadamente 0,81. Para una relación en masa de aproximadamente 8:1 ARN/protamina, se puede calcular una relación N/P de aproximadamente 0,2. En el contexto de la presente invención, preferentemente la relación N/P está en el intervalo de aproximadamente 0,1-10, de manera preferente en un intervalo de aproximadamente 0,3-4 y de manera mucho más preferente en un intervalo de aproximadamente 0,5-2 o 0,7-2 con respecto a la relación ácido nucleico:péptido en el complejo, y de manera mucho más preferente en el intervalo de aproximadamente 0,7-1,5.
La solicitud de patente WO2010/037539 describe una composición inmunoestimuladora y métodos para la preparación de una composición inmunoestimuladora. Por consiguiente, en una realización preferente de la invención, la composición se obtiene en dos pasos separados a fin de obtener tanto un efecto inmunoestimulador eficiente como una traducción eficiente de la molécula de ácido nucleico artificial de acuerdo con la invención. Aquí, el llamado “componente adyuvante” se prepara con la complejación - en un primer paso, la molécula de ácido nucleico artificial o vector, preferentemente un ARN, del componente adyuvante con un compuesto catiónico o policatiónico en una relación específica para formar un complejo estable. En este contexto, es importante, que no quede libre el compuesto catiónico o policatiónico o que solo una cantidad insignificativamente pequeña permanezca en el componente adyuvante después de complejar el ácido nucleico. Así, la relación entre el ácido nucleico y el compuesto catiónico o policatiónico en el componente adyuvante se selecciona típicamente en un intervalo en que el ácido nucleico se compleja por completo y donde no queda compuesto catiónico o policatiónico o solo una cantidad insignificantemente pequeña en la composición. Preferentemente, la relación del componente adyuvante, es decir la relación entre el ácido nucleico y el compuesto catiónico o policatiónico se selecciona de un intervalo de aproximadamente 6:1 (p/p) a aproximadamente 0,25:1 (p/p), más preferentemente de aproximadamente 5:1 (p/p) a aproximadamente 0,5:1 (p/p), de manera aún más preferente de aproximadamente 4:1 (p/p) a aproximadamente 1:1 (p/p) o de aproximadamente 3:1 (p/p) a aproximadamente 1:1 (p/p), y de manera mucho más preferente una relación de aproximadamente 3:1 (p/p) a aproximadamente 2:1 (p/p).
De acuerdo con una realización preferente, la molécula de ácido nucleico artificial o el vector, preferentemente una molécula de ARN, de acuerdo con la invención es añadida en un segundo paso a la molécula de ácido nucleico complejada, preferentemente un ARN, del componente adyuvante con el fin de formar la composición (inmunoestimuladora) de la invención. Aquí, la molécula de ácido nucleico artificial o el vector, preferentemente un ARN, de la invención se agrega como ácido nucleico libre, es decir como un ácido nucleico no complejado con estos compuestos. Antes de la adición, la molécula de ácido nucleico artificial libre o el vector no está complejada y preferentemente no se estará sometida a una reacción de complejación detectable o significativa con la adición del componente adyuvante.
Adyuvantes adecuados se pueden seleccionar adicionalmente de ácidos nucleicos de fórmula (II): GlXmGn, donde: G es guanosina (guanina), uridina (uracilo) o un análogo de guanosina (guanina) o uridina (uracilo); X es guanosina (guanina), uridina (uracilo), adenosina (adenina), timidina (timina), citidina (citosina) o un análogo de los nucleótidos citados (nucleósidos); l es un número entero de 1 a 40, donde cuando l = 1, G es guanosina (guanina) o un análogo de la misma, cuando l > 1 al menos el 50% de los nucleótidos (nucleósidos) son guanosina (guanina) o un análogo de la misma; m es un número entero y es al menos 3; donde, cuando m = 3, X es uridina (uracilo) o un análogo de la misma, cuando m > 3 están presentes al menos 3 uridinas sucesivas (uracilos) o análogos de uridina (uracilo); n es un número entero de 1 a 40, donde, cuando n = 1, G es guanosina (guanina) o un análogo de la misma, cuando n > 1, al menos el 50% de los nucleótidos (nucleósidos) son guanosina (guanina) o un análogo de la misma.
Otros adyuvantes adecuados se pueden seleccionar adicionalmente de ácidos nucleicos de fórmula (III): ClXmCn, donde: C es citidina (citosina), uridina (uracilo) o un análogo de citidina (citosina) o uridina (uracilo); X es guanosina (guanina), uridina (uracilo), adenosina (adenina, timidina (timina), citidina (citosina) o un análogo de los nucleótidos mencionados (nucleósidos); l es un número entero de 1 a 40, donde, cuando l = 1, C es citidina (citosina) o un análogo de la misma, cuando l > 1, al menos 50% de los nucleótidos (nucleósidos) son citidina (citosina) o un análogo de la misma; m es un número entero y es al menos 3; donde, cuando m = 3, X es uridina (uracilo) o un análogo de la misma, cuando m > 3, están presentes al menos 3 uridinas sucesivas (uracilos) o análogos de uridina (uracilo); n es un número entero de 1 a 40, donde, cuando n = 1, C es citidina (citosina) o un análogo de la misma, cuando n > 1, al menos el 50% de los nucleótidos (nucleósidos) son citidina (citosina) o un análogo de la misma.
Preferentemente, la composición farmacéutica de acuerdo con la presente invención comprende una “cantidad segura y efectiva” de los componentes de la composición farmacéutica, en particular de la molécula de ácido nucleico artificial inventiva, el vector y/o las células como se definen aquí. Tal como se utiliza aquí, una “cantidad segura y efectiva” significa una cantidad suficiente para inducir significativamente una modificación positiva de una enfermedad o trastorno como se define aquí. Al mismo tiempo, sin embargo, una “cantidad segura y efectiva” preferentemente evita efectos secundarios serios y permite una relación sensible entre ventaja y riesgo. La determinación de estos límites está típicamente dentro del alcance del juicio médico sensible.
En un aspecto adicional, la presente invención proporciona la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención para su uso como un medicamento, por ejemplo como una vacuna (en la vacunación genética) o en la terapia génica.
La molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención son particularmente adecuados para cualquier aplicación médica que hace uso de la acción terapéutica o del efecto de los péptidos, polipéptidos o proteínas, o donde la suplementación de un péptido o proteína particular es necesaria. Así, la presente invención proporciona la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención para su uso en el tratamiento o prevención de enfermedades o trastornos aptos para el tratamiento por la acción terapéutica o el efecto de los péptidos, polipéptidos o proteínas o apto para el tratamiento por suplementación de un péptido, polipéptido o proteína particular. Por ejemplo, la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención se pueden utilizar para el tratamiento o la prevención de enfermedades genéticas, enfermedades autoinmunes, enfermedades cancerosas o relacionadas con tumores, enfermedades infecciosas, enfermedades crónicas o similares, por ejemplo por vacunación genética o terapia génica.
En particular, estos tratamientos terapéuticos con el beneficio de una presencia incrementada y prolongada de péptidos, polipéptidos o proteínas terapéuticos en un sujeto a tratar son especialmente adecuados como aplicación médica en el contexto de la presente invención, puesto que el elemento 3'-UTR de la molécula de ácido nucleico inventiva proporciona una expresión estable y prolongada del péptido o proteína codificado de la molécula de ácido nucleico artificial inventiva o del vector, opcionalmente en combinación con el elemento 5'-UTR que proporciona una expresión incrementada del péptido o la proteína codificada de la molécula de ácido nucleico artificial inventiva o del vector. Así, una aplicación médica particularmente adecuada para la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención es la vacunación. De esta manera, la presente invención proporciona la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención para la vacunación de un sujeto, preferentemente un sujeto mamífero, en especial un sujeto humano. Tratamientos de vacunación preferentes son la vacunación contra enfermedades infecciosas, tal como infecciones bacterianas, por protozoarios o virales, y la vacunación anti-tumoral. Estos tratamientos de vacunación pueden ser profilácticos o terapéuticos.
El ORF se puede seleccionar dependiendo de la enfermedad a tratar o prevenir. Por ejemplo, el marco de lectura abierto puede codificar para una proteína que es suministrada a un paciente que sufre de falta total o al menos pérdida parcial de función de la proteína, tal como un paciente que padece una enfermedad genética. Adicionalmente, el marco de lectura abierto se puede elegir de un ORF que codifica para un péptido o proteína que proporciona un beneficio para una enfermedad o condición de un sujeto. Adicionalmente, el marco de lectura abierto puede codificar para un péptido o proteína que afecta a la regulación por decremento de una sobreproducción patológica de un péptido o proteína natural o a la eliminación de células que expresan patológicamente una proteína o péptido. Esta falta, pérdida de función o sobreproducción puede, por ejemplo, presentarse en el contexto de tumores y neoplasias, enfermedades autoinmunes, alergias, infecciones, enfermedades crónicas o similares. Adicionalmente, el marco de lectura abierto puede codificar para un antígeno o inmunógeno, por ejemplo para un epítopo de un patógeno o para un antígeno tumoral. Así, en realizaciones preferentes, la molécula de ácido nucleico artificial o el vector de acuerdo con la presente invención comprende un ORF que codifica una secuencia de aminoácidos que comprende o que consiste en un antígeno o inmunógeno, por ejemplo un epítopo de un patógeno o un antígeno asociado a tumor, un elemento 3'-UTR como se define en la reivindicación 1 y, opcionalmente, un elemento 5'-UTR como se describe anteriormente y componentes adicionales opcionales, tales como una secuencia poli(A), etc.
En el contexto de la aplicación médica, en particular en el contexto de la vacunación, es preferente que la molécula de ácido nucleico artificial de acuerdo con la presente invención sea un ARN, preferentemente un ARNm, dado que el ADN conlleva el riesgo de inducir una respuesta inmunitaria anti-ADN y tiende a insertarse en el ADN genómico. Sin embargo, en algunas realizaciones, por ejemplo cuando se utiliza un vehículo de suministro viral, tal como un vehículo de suministro adenoviral, para el suministro de la molécula de ácido nucleico artificial o del vector de acuerdo con la presente invención, por ejemplo en el contexto de tratamientos terapéuticos génicos, puede ser deseable que la molécula de ácido nucleico artificial o el vector sea una molécula de ADN.
La molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención se pueden administrar vía oral, parenteral, por espray de inhalación, tópicamente, rectalmente, nasalmente, bucalmente, vaginalmente, a través de un depósito implantado o a través de inyección a chorro. El término parenteral tal como se utiliza aquí incluye inyección subcutánea, intravenosa, intramuscular, intraarticular, intrasinovial, intraesternal, intratecal, intrahepática, intralesional, intracraneal, transdérmica, intradérmica, intrapulmonar, intraperitoneal, intracardiaca, intraarterial y sublingual o técnicas de infusión. En una realización preferente, la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención se administra por inyección sin aguja (por ejemplo inyección a chorro).
Preferentemente, la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención se administra vía parenteral, por ejemplo por inyección parenteral, de manera más preferente por inyección subcutánea, intravenosa, intramuscular, intraarticular, intrasinovial, intraesternal, intratecal, intrahepática, intralesional, intracraneal, transdérmica, intradérmica, intrapulmonar, intraperitoneal, intracardial, intraarterial, sublingual o por técnicas de infusión. Es particularmente preferente la inyección intradérmica e intramuscular. Las formas inyectables estériles de la composición farmacéutica inventiva pueden ser en suspensión acuosa u oleosa. Estas suspensiones se pueden formular de acuerdo con técnicas conocidas en el campo utilizando agentes de dispersión o humectantes adecuados y agentes de suspensión. Preferentemente, las soluciones o suspensiones se administran por inyección sin aguja (por ejemplo inyección a chorro).
La molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención también se puede administrar vía oral en cualquier forma de dosificación oralmente aceptable, incluyendo, sin limitación, cápsulas, comprimidos, suspensiones acuosas o soluciones.
La molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención también se puede administrar vía tópica, especialmente cuando el objetivo de tratamiento incluye áreas u órganos fácilmente accesibles por la aplicación tópica, por ejemplo incluyendo enfermedades de la piel o de cualquier otro tejido epitelial accesible. Las formaciones tópicas adecuadas se preparan fácilmente para cada una de estas áreas u órganos. Para aplicaciones tópicas, la molécula de ácido nucleico artificial de acuerdo con la presente invención, el vector de acuerdo con la presente invención, la célula de acuerdo con la presente invención o la composición farmacéutica de acuerdo con la presente invención se pueden formular en una pomada adecuada suspendida o disuelta en uno o más vehículos.
En una realización, el uso como un medicamento comprende el paso de transfectar células de mamífero, preferentemente transfección in vitro o ex vivo de células de mamífero, de manera más preferente transfección in vitro de células aisladas de un sujeto a tratar con el medicamento. Si el uso comprende la transfección in vitro de células aisladas, el uso como medicamento puede comprender además la re-administración de las células transfectadas al paciente. El uso de las moléculas de ácido nucleico artificiales inventivas o del vector como medicamento puede comprender además el paso de seleccionar las células aisladas exitosamente transfectadas. Así, puede ser beneficioso que el vector comprenda además un marcador de selección. Igualmente, el uso como medicamento puede comprender la transfección in vitro de células aisladas y la purificación de un producto de expresión, es decir del péptido o proteína codificado de estas células. Este péptido o proteína purificado se puede administrar subsecuentemente a un sujeto que lo necesite.
Además, la presente invención proporciona una molécula de ácido nucleico artificial de acuerdo con la presente invención o un vector de acuerdo con la presente invención para su uso en un método para tratar o prevenir una enfermedad o trastorno que comprende la transfección de una célula los mismos. Dicha transfección se puede llevar a cabo in vitro, ex vivo o in vivo. En una realización preferente, la transfección de una célula se lleva a cabo in vitro y las células transfectadas se administran a un sujeto que lo necesite, preferentemente a un paciente humano. De manera preferente, la célula a transfectar in vitro es una célula aislada del sujeto, preferentemente de un paciente humano. Así, la presente invención proporciona un método de tratamiento que comprende los pasos de aislar una célula de un sujeto, preferentemente un paciente humano, transfectar la célula aislada con el ácido nucleico artificial de acuerdo con la presente invención o el vector de acuerdo con la presente invención y administrar la célula transfectada al sujeto, preferentemente al paciente humano.
El uso en un método para tratar o prevenir un trastorno de acuerdo con la presente invención preferentemente emplea un método de vacunación o un método de terapia génica como se describe anteriormente.
Como ya se ha descrito, el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR de la molécula de ácido nucleico inventiva son capaces de prolongar y/o incrementar la producción de proteínas a partir de un ARNm. Así, en un aspecto adicional, la presente invención se refiere a un método para incrementar y/o prolongar la producción de proteínas a partir de una molécula de ácido nucleico artificial, preferentemente de una molécula de ARNm o un vector, comprendiendo el método el paso de asociar un marco de lectura abierto con un elemento 3'-UTR como se define en la reivindicación 1 y, opcionalmente, un elemento 5'-UTR, donde el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR proporcionan una alta eficiencia de traducción a una molécula de ácido nucleico artificial resultante, para obtener una molécula de ácido nucleico artificial, preferentemente una molécula de ARNm, de acuerdo con la presente invención como se describe anteriormente o un vector de acuerdo con la presente invención como se describe anteriormente.
Preferentemente, en el método para incrementar y/o prolongar la producción de proteínas a partir de una molécula de ácido nucleico artificial, preferentemente de una molécula de ARNm, o un vector de acuerdo con la presente invención, el elemento 3'-UTR comprende o consiste en una secuencia de ácido nucleico como se define en la reivindicación 1 y, opcionalmente, el elemento 5'-UTR y/o o un elemento 3'-UTR adicional comprende o consiste en una secuencia de ácido nucleico que se deriva de la 3'-UTR y/o la 5'-UTR de un transcripto de un gen seleccionado del grupo consistente en ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB3, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (preferentemente todos humanos) y Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1l, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1I, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (preferentyemente trodos de ratón); preferentemente del grupo consistente en ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB3 5'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH1 6A1-5'-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR, (preferentemente todos humanos) y Dpysl2-5'-UTR, Ccnd1-5'- UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'- UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001 J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (preferentemente todos de ratón); y NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'- UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1 S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (preferentemente todos humanos) y Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, lgf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3'-UTR, (preferentemente todos de ratón).
El término “asociar la molécula de ácido nucleico artificial o el vector con un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR” en el contexto de la presente invención preferentemente significa asociar funcionalmente o combinar funcionalmente la molécula de ácido nucleico artificial o el vector con el elemento 3'-UTR y, opcionalmente, con el elemento 5'-UTR. Esto significa que la molécula de ácido nucleico artificial o el vector y el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR, preferentemente el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR como se describen anteriormente, se asocian o se acoplan de manera que se ejerce la función del elemento 3'-UTR y, opcionalmente, del elemento 5'-UTR, por ejemplo la producción de ARN y/o de proteína que prolonga y/o incrementa la función. Típicamente, esto significa que el elemento 3'-UTR y, opcionamente, el elemento 5'-UTR están integrados en la molécula de ácido nucleico artificial o el vector, preferentemente en la molécula de ARNm, 3' y/o 5', respectivamente, a un marco de lectura abierto, preferentemente inmediatamente 3' a un marco de lectura abierto y/o inmediatamente 5' a un marco de lectura abierto, el elemento 3'-UTR preferentemente entre el marco de lectura abierto y una secuencia poli(A) o una señal de poliadenilación. Preferentemente, el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR se integran en la molécula de ácido nucleico artificial o el vector, preferentemente ARNm, como 3'-UTR y, opcionalmente, como 5'-UTR respectivamente, es decir de manera que el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR es el 3'-UTR y, opcionalmente el 5'-UTR, respectivamente, de la molécula de ácido nucleico artificial o del vector, preferentemente del ARNm, es decir, de manera que la 5'-UTR termina inmediatamente antes del extremo 5' del ORF y la 3'-UTR se extiende desde el lado 3' del marco de lectura abierto hasta el lado 5' de una secuencia poli(A) o de una señal de poliadenilación, opcionalmente conectadas mediante un enlazador corto, tal como una secuencia que comprende o consiste en uno o más sitios de restricción. Así, preferentemente, el término “asociar la molécula de ácido nucleico artificial o el vector con un elemento 3'-UTR y, opcionalmente, un elemento 5'-UTR” significa asociar funcionalmente el elemento 3'-UTR y, opcionalmente, el elemento 5'-UTR con un marco de lectura abierto situado dentro de la molécula de ácido nucleico artificial o del vector, preferentemente dentro de la molécula de ARNm. La 3'-UTR y, opcionalmente, la 5'-UTR y el ORF son como se describe anteriormente para la molécula de ácido nucleico artificial de acuerdo con la presente invención, el ORF y la 3' -UTR son heterólogos y, opcionalmente, el ORF y la 5'-UTR son heterólogos, respectivamente, por ejemplo derivados de diferentes genes como se describe anteriormente. La asociación con un elemento 3'-UTR y, opcionalmente, con un elemento 5'-UTR se puede lograr ya sea por asociación de novo de elementos individuales o modificando un ácido nucleico preexistente (plantilla). En el último caso, por ejemplo y con propósito ilustrativo, una molécula de ácido nucleico de acuerdo con la presente invención se puede obtener (i) utilizando un ácido nucleico que corresponde a la secuencia mostrada en la Fig.
1A como plantilla, (ii) modificando dicha plantilla reemplazando (i) el elemento 3'-UTR subrayado (doble subrayado en la Fig. 1A) y, opcionalmente, (ii) el elemento 5'-UTR (subrayado en la Fig. 1A) por un (i) elemento 3'-UTR diferente y, opcionalmente, por (ii) un elemento 5'-UTR diferente, asociando así la molécula de ácido nucleico artificial con dicho elemento 5'-UTR o elemento 3'-UTR.
La presente descripción también proporciona el uso de un elemento 3'-UTR y/o de un elemento 5'-UTR, preferentemente el elemento 3'-UTR como se describe anteriormente y/o el elemento 5'-UTR como se describe anteriormente, para incrementar y/o prolongar la producción de proteína a partir de una molécula de ácido nucleico artificial, preferentemente a partir de una molécula de ARNm o de un vector, donde el elemento 3'-UTR y/o el elemento 5'-UTR comprende o consiste en una secuencia de ácido nucleico que se deriva de la 3'-UTR y/o de la 5'-UTR de un transcripto de un gen seleccionado del grupo consistente en ZNF460, TGM2, IL7R, BGN, TK1, RAB3B, CBX6, FZD2, COL8A1, NDUFS7, PHGDH, PLK2, TSPO, PTGS1, FBXO32, NID2, ATP5D, EXOSC4, NOL9, UBB4B, VPS18, ORMDL2, FSCN1, TMEM33, TUBA4A, EMP3, TMEM201, CRIP2, BRAT1, SERPINH1, CD9, DPYSL2, CDK9, TFRC, PSMB35'-UTR, FASN, PSMB6, PRSS56, KPNA6, SFT2D2, PARD6B, LPP, SPARC, SCAND1, VASN, SLC26A1, LCLAT1, FBXL18, SLC35F6, RAB3D, MAP1B, VMA21, CYBA, SEZ6L2, PCOLCE, VTN, ALDH16A1, RAVER1, KPNA6, SERINC5, JUP, CPN2, CRIP2, EPT1, PNPO, SSSCA1, POLR2L, LIN7C, UQCR10, PYCRL, AMN, MAP1S, NDUFS7, PHGDH, TSPO, ATP5D, EXOSC4, TUBB4B, TUBA4A, EMP3, CRIP2, BRAT1, CD9, CDK9, PSMB3, PSMB6, PRSS56, SCAND1, AMN, CYBA, PCOLCE, MAP1S, VTN, ALDH16A1 (preferentemente todos humanos) y Dpysl2, Ccnd1, Acox2, Cbx6, Ubc, Ldlr, Nudt22, Pcyox1I, Ankrd1, Tmem37, Tspyl4, Slc7a3, Cst6, Aacs, Nosip, Itga7, Ccnd2, Ebp, Sf3b5, Fasn, Hmgcs1, Osr1, Lmnb1, Vma21, Kif20a, Cdca8, Slc7a1, Ubqln2, Prps2, Shmt2, Aurkb, Fignl1, Cad, Anln, Slfn9, Ncaph, Pole, Uhrf1, Gja1, Fam64a, Kif2c, Tspan10, Scand1, Gpr84, Fads3, Cers6, Cxcr4, Gprc5c, Fen1, Cspg4, Mrpl34, Comtd1, Armc6, Emr4, Atp5d, 1110001J03Rik, Csf2ra, Aarsd1, Kif22, Cth, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Acox2, Ubc, Slpi, Pcyox1I, Igf2bp1, Tmem37, Slc7a3, Cst6, Ebp, Sf3b5, Plk1, Cdca8, Kif22, Cad, Cth, Pole, Kif2c, Scand1, Gpr84, Tpgs1, Ccl17, Alkbh7, Ms4a8a, Mrpl34, Comtd1, Armc6, Atp5d, 1110001J03Rik, Nudt22, Aarsd1 (preferentemente todos de ratón); preferentemente del grupo consistente en ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'- UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'-UTR, TFRC-5'-UTR, PSMB35'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CYBA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, RAVER1-5'-UTR, KPNA6-5'-UTR, SERINC5-5'- UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR, (preferentemente todos humanos) y Dpysl2-5'- UTR, Ccnd1-5'-UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'- UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'- UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'- UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (preferentemente todos de ratón); y NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, CD9-3'-UTR, CDK9-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, PRSS56-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR (preferentemente todos humanos) y Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Pcyox1l-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Plk1-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Cth-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR, Aarsd1-3'- UTR, (preferentemente todos de ratón).
Los usos de acuerdo con la presente descripción preferentemente comprenden asociar la molécula de ácido nucleico artificial, el vector o el ARN con el elemento 3'-UTR antes descrito y/o con el elemento 5'-UTR antes descrito.
Los compuestos e ingredientes de la composición farmacéutica inventiva también se pueden fabricar y tratar separadamente entre sí. Así, la invención se refiere además a un kit o kit de partes que comprende una molécula de ácido nucleico artificial de acuerdo con la invención, un vector de acuerdo con la invención, una célula de acuerdo con la invención y/o una composición farmacéutica de acuerdo con la invención. Preferentemente, este kit o kit de partes puede además comprender instrucciones de uso, células para la transfección, un adyuvante, un medio para la administración de la composición farmacéutica, un vehículo farmacéuticamente aceptable y/o una solución farmacéuticamente aceptable para la disolución o dilución de la molécula de ácido nucleico artificial, del vector, de las células o de la composición farmacéutica.
Método para identificar un elemento de región 3' no traducida (elemento 3'-UTR) y/o un elemento de región 5' no traducida (elemento 5'-UTR)
En un aspecto adicional, la presente descripción proporciona un método para identificar un elemento de región 3' no traducida (elemento 3'-UTR) y/o un elemento de región 5' no traducida (elemento 5'-UTR) que comprende los siguientes pasos:
a) Analizar la estabilidad de un ARNm, comprendiendo las siguientes etapas:
i. Determinar la cantidad de dicho ARNm en un primer punto temporal durante un proceso de descomposición de dicho ARNm,
ii. Determinar la cantidad de dicho ARNm en un segundo punto temporal durante un proceso de descomposición del ARNm, y
iii. Calcular la relación entre la cantidad de ARNm determinado en el paso (i) y la cantidad de ARNm determinado en el paso (ii);
b) Seleccionar un ARNm estable con una relación calculada en la etapa (iii) de al menos 0,5 (50%), al menos 0,6 (60%), al menos 0,7 (70%), al menos 0,75 (75%), al menos 0,8 (80%), al menos 0,85 (85%), al menos 0,9 (90%), o al menos 0,95 (95%); y
c) Determinar la secuencia de nucleótidos de un elemento 3'- y/o 5'-UTR de dicho ARNm estable.
Asi, la estabilidad del ARNm preferentemente se evalúa bajo condiciones estándar, por ejemplo condiciones estándar (medio de estándar, incubación, etc.) para una cierta línea celular o tipo de célula utilizada.
Para analizar la estabilidad de un ARNm, se valúa el proceso de descomposición de este ARNm determinando la cantidad o concentración de ARNm en un primer y segundo momento del tiempo en el proceso de descomposición de dicho ARNm (véanse los pasos a) i. y a) ii.).
Para determinar la cantidad o concentración de ARNm durante el proceso de descomposición del ARN in vivo o in vitro como se define anteriormente (es decir, in vitro en referencia en particular a células y/o tejido (“vivo”), incluyendo tejido de un sujeto vivo; células que incluyen en particular líneas celulares, células primarias, células de tejido o sujeto, con preferencia células de mamífero, por ejemplo células humanas y células de ratón y en particular las líneas celulares humanas HeLa, HEPG2 y U-937 y las líneas celulares de ratón NIH3T3, JAWSII y L929; además con particular preferencia células primarias, en realizaciones preferidas particulares fibroblastos dérmicos humanos (HDF)), se pueden utilizar varios métodos que son conocidos por el experto. Ejemplos no limitantes de estos métodos incluyen inhibición general de la transcripción, por ejemplo con un inhibidor de transcripción tal como Actinomicina D, uso de promotores inducibles para promover específicamente la transcripción transitoria, por ejemplo sistema promotor inducible de suero c-fos y sistema promotor regulador Tet-off, y técnicas de etiquetado cinético, por ejemplo etiquetado por pulso.
Por ejemplo, si se utiliza la detención transcripcional mediada por el inhibidor transcripcional en el paso a) para determinar la cantidad o concentración de ARNm durante el proceso de descomposición del ARN in vivo o in vitro como se define anteriormente, se pueden utilizar inhibidores transcripcionales, tales como Actinomicina D (ActD), 5,6-dicloro-1-D-ribofuranosil-benzimidazol (DRB) o a-amanitina (a-Am). Así, para evaluar la descomposición de ARNm, los inhibidores transcripcionales normalmente se añaden a las células y, con ello, se inhibe en general la transcripción y la descomposición del ARN se puede observar sin interferencias de la transcripción en curso.
Alternativamente, se pueden emplear promotores inducibles para promover específicamente la transcripción transitoria en el paso a), debido a que proporcionan un estímulo que activa la transcripción y conduce a un estallido de la síntesis de ARNm, entonces se elimina el estímulo para desactivar la transcripción y monitorear la descomposición del ARNm. De esta manera, el promotor inducible permite un control riguroso, de modo que se consigue la inducción y silenciamiento de la transcripción en una ventana de tiempo reducida. En las células de mamífero, el promotor cfos se sabe que es valioso para este propósito, dado que puede ser inducido en respuesta a la adición de suero de forma rápida y transitoria, proporcionado así una forma confiable y simple para lograr un estallido transitorio de la transcripción. El sistema promotor Tet-off ofrece otra opción que amplia adicionalmente la aplicación de un procedimiento de pulso transcripcional para estudiar el cambio del ARNm en células de mamífero.
Sin embargo, en la presente invención, son preferentes las técnicas de etiquetado cinético en el paso a) para determinar la cantidad de ARNm durante el proceso de descomposición de ARN in vivo o in vitro como se define anteriormente. El ARN de etiquetado cinético normalmente se etiqueta, incluyendo las etiquetas en particular nucleótidos y nucleósidos etiquetados y uridina etiquetada y uracilo etiquetado, que son particularmente preferentes. Ejemplos de etiquetas preferidas incluyen 4-tiouridina (4sU), 2-tiouridina, 6-tioguanosina, 5-etiniluridina (EU), 5-bromouridina (BrU), biotin-16-aminoaliluridina, 5-aminoaliluridina, 5-aminoalilcitidina, etc., siendo especialmente preferentes 4-tiouridina (4sU), 5-etiniluridina (EU) o 5'-bromouridina (BrU). Es particularmente preferente la 4-tiouridina (4sU). La 4-tiouridina (4sU) se utiliza preferentemente en una concentración de 100-500 pM. Por otra parte, también los nucleótidos radiactivamente etiquetados se pueden utilizar, por ejemplo uridina-3H. También se pueden emplear combinaciones de los nucleótidos etiquetados mencionados anteriormente, siendo particularmente preferente una combinación de 4-tiouridina y 6-tioguanosina.
En el etiquetado cinético, usualmente el ARN emergente se etiqueta, por ejemplo por incorporación de uridina o uracilo etiquetados durante la transcripción. Después de un tiempo, la provisión de la etiqueta se detiene y entonces se puede observar la descomposición del ARN evaluando el ARN específicamente etiquetado sin inhibir en general la transcripción.
Para determinar la cantidad de ARNm durante el proceso de descomposición de ARN en el paso a), se prefiere el etiquetado por pulso, en especial una metodología de búsqueda de pulso. Tal como se utiliza aquí, el término “etiquetado por pulso se refiere una técnica en que se utiliza una etiqueta, por ejemplo las etiquetas descritas anteriormente, para medir la velocidad de síntesis y/o de descomposición de los compuestos dentro de las células vivas. Típicamente, las células se exponen a una pequeña cantidad de una etiqueta por un breve período, de ahí el término “pulso”. En la metodología de búsqueda de pulso, después del etiquetado por pulso, normalmente se añade una cantidad mucho más grande de un compuesto no etiquetado que corresponde al “pulso” (por ejemplo uridina no etiquetada, si la uridina etiquetada se utiliza como pulso) después del periodo requerido de exposición a la etiqueta. El efecto de competición entre el compuesto etiquetado y no etiquetado es reducir a un nivel insignificante la captación adicional del compuesto etiquetado, de ahí el término “búsqueda”.
Para determinar la cantidad o concentración de ARNm, usualmente el ARNm tiene que ser aislado. El experto conoce diferentes técnicas para aislar ARN, por ejemplo por extracción con Guanidinio tiocionato-fenol-cloroformo, o por extracción basada en columna de sílice. También se pueden utilizar kits comerciales, por ejemplo, RNeasy Kit, de Qiagen.
Adicionalmente, puede ser necesario un paso de extracción, en particular si se emplea el etiquetado cinético (en contraste con un inhibidor de transcripción, donde el ARN total representa el ARN “en descomposición”, puesto que la transcripción se inhibe generalmente). En el paso de extracción, el ARN etiquetado (es decir, representando el ARN “en descomposición”) se extrae del ARN aislado total. De esta manera, los medios de extracción se pueden seleccionar dependiendo de la etiqueta utilizada. Por ejemplo, se puede utilizar la inmunopurificación con anticuerpos para la etiqueta.
Además, por ejemplo, para la extracción del ARN etiquetado con tio, por ejemplo etiquetado con 4-tiouridina (4sU), se puede incubar HPDP-Biotina (reactivo de biotinilación sufridilo reactivo, activado con piridilditiol, conjugado mediante un enlace disulfuro escindible (reversible)) con el “ARN total” aislado. Este reactivo reacciona específicamente con los tioles reducidos (-SH) del ARN etiquetado con 4-tiouridina (4sU) para formar enlaces disulfuro reversibles. La biotinilación permite el enlace del ARN tio-etiquetado, por ejemplo etiquetado con 4-tiouridina (4sU), con estreptavidina y, por tanto, se puede extraer del ARN total mediante la reducción del enlace disulfuro con ditiotreitol o beta-mercaptoetanol (o cualquier otro activo o cualquier otro agente reductor).
En el caso de los nucleótidos etiquetados con biotina, por ejemplo biotin-16-aminoaliluridina, la estreptavidina se puede utilizar directamente para extraer el ARN etiquetado del ARN total.
Por ejemplo, para la extracción de ARN celular etiquetado con 5-etiniluridina (EU) recién transcripto del ARN total, se puede emplear la biotinilación de EU en una reacción de cicloadición catalizada con cobre (frecuentemente referida como química click), seguida por purificación por afinidad con estreptavidina. Este método está comercialmente disponible como Kit de Captura de ARN Click-iT Nascent (Catalogo no. C10365, Invitrogen). Las instrucciones del fabricante de este kit recomiendan que el tiempo de etiquetado por pulsos sea 30 a 60 minutos para una dosis EU de 0,5 mM o de 1 a 24 horas para una dosis EU de 0,1 o 0,2 mM.
Por ejemplo, las moléculas de ARN etiquetadas con BrU se pueden extraer por inmunopurificación con un anticuerpo anti bromodesoxiuridina (por ejemplo Clon 2B1, Catalogo no. MI-11- 3, MBL), y proteína G Sefarosa.
La cantidad o concentración de ARNm, es decir el nivel de transcripción, se puede medir entonces por varios métodos conocidos por el experto en la técnica. Ejemplos no limitativos de estos métodos incluyen análisis de microarrays, análisis Northern Blot, PCR cuantitativa o secuenciación de próxima generación (secuenciación de alto rendimiento). Se prefieren en particular el análisis de microarrays y la secuenciación de próxima generación. Además, los procedimientos de genoma completo/procedimiento de transcriptoma completo son particularmente preferidos, por ejemplo en el análisis de microarrays, análisis de microarray del genoma complejo, por ejemplo Affymetrix Human Gene 1.0 ST o 2.0 ST o Affymetrix Mouse Gene 1.0 ST o 2.0 ST o análisis de transcriptoma entero por secuenciación de próxima generación.
En las etapas i. e ii. del paso a), la cantidad de ARNm se determina en un primer y un segundo momento del tiempo durante el proceso de descomposición del ARNm. Típicamente, esto significa que el ARNm se aísla en particular en un primer y segundo momento del tiempo durante un proceso de descomposición del ARNm para determinar la cantidad respectiva. Por tanto, “el primer momento del tiempo” y “el segundo momento del tiempo” son los momentos particulares en el tiempo durante el proceso de descomposición del ARN donde se aísla el ARN para determinar la cantidad de ARN. En general, “el segundo momento del tiempo” es posterior en el proceso de descomposición del ARN que el “primer momento del tiempo”.
Preferentemente, el primer momento del tiempo se selecciona de manera que se considera el único ARNm que se somete a un proceso de descomposición, es decir el ARNm emergente - por ejemplo en la transcripción en curso - se evita. Por ejemplo, si se utilizan técnicas de etiquetado cinético, por ejemplo etiquetado por pulso, el primer momento del tiempo preferentemente se selecciona de manera que la incorporación de la etiqueta en el ARNm se ha completado, es decir no existe incorporación en curso de la etiqueta en el ARNm. Así, si se utiliza el etiquetado cinético, el momento del tiempo puede ser al menos 10 minutos, al menos 20 minutos, al menos 30 minutos, al menos 40 minutos, al menos 50 minutos, al menos 60 minutos, al menos 70 minutos, al menos 80 minutos o al menos 90 minutos después del final del procedimiento de etiquetado experimental, por ejemplo después del final de la incubación de las células con la etiqueta.
Por ejemplo, el primer momento del tiempo puede ser preferentemente de 0 a 6 horas después de la detención de la transcripción (por ejemplo con un inhibidor transcripcional), de la detención de la inducción del promotor en el caso de promotores inducibles o después de la detención del pulso o suministro de etiqueta, por ejemplo después del final del etiquetado. De manera más preferente, el primer momento del tiempo puede ser de 30 minutos a 5 horas, de manera aún más preferente de 1 hora a 4 horas y en particular aproximadamente 3 horas después de la detención de la transcripción (por ejemplo con un inhibidor transcripcional), de la detención de la inducción del promotor en el caso de promotores inducibles o después de la detención del suministro del pulso o etiqueta, por ejemplo después del final del etiquetado.
Preferentemente, el segundo momento del se selecciona tan tarde como sea posible durante el proceso de descomposición del ARNm. Sin embargo, si se considera una pluralidad de especies de ARNm, el segundo momento del preferentemente es tal que está presente aún una cantidad considerable de la pluralidad de especies de ARNm, de manera preferente al menos un 10% de las especies de ARNm, en una cantidad detectable, es decir en una cantidad superior a 0. Preferentemente, el segundo momento del tiempo es al menos 5 horas, al menos 6 horas, al menos 7 horas, al menos 8 horas, al menos 9 horas, al menos 10 horas, al menos 11 horas, al menos 12 horas, al menos 13 horas, al menos 14 h o al menos 15 horas después de la detención de la transcripción (por ejemplo con un inhibidor transcripcional), de la detención de la inducción del promotor en el caso de promotores inducibles o después de la detención del suministro de pulso o etiqueta, por ejemplo después del final del etiquetado.
Por ejemplo, el segundo momento del tiempo puede ser preferentemente de 3 a 48 horas después de la detención de la transcripción (por ejemplo con un inhibidor transcripcional), de la detención de la inducción del promotor en el caso de promotores inducibles o después de la detención del suministro del pulso de etiqueta, por ejemplo después del final del etiquetado. De manera más preferente, el segundo momento del tiempo puede ser de 6 minutos a 36 horas, aún de manera más preferente de 10 horas a 24 horas y con particular preferencia aproximadamente 15 horas después de la detención de la transcripción (por ejemplo con un inhibidor transcripcional), de la detención de la inducción del promotor en el caso de promotores inducibles o después de la detención del suministro de pulso o etiqueta, por ejemplo después del final del etiquetado.
Así, el lapso entre el primer momento y el segundo momento del tiempo preferentemente es tan largo como sea posible dentro de los límites descritos anteriormente. Por tanto, el lapso entre el primer momento del tiempo y el segundo momento del tiempo preferentemente es al menos 4 horas, al menos 5 horas, al menos 6 horas, al menos 7 horas, al menos 8 horas, al menos 9 horas, al menos 10 horas, al menos 11 horas o al menos 12 horas, siendo un lapso de aproximadamente 12 horas particularmente preferente. En general, el segundo momento del tiempo y es al menos 10 minutos después del primer momento del tiempo.
En la etapa iii del paso a), se calcula la relación entre la cantidad de ARNm determinado en la etapa (i) y la cantidad de ARNm determinado en la etapa (ii). Para ello, se divide la cantidad de ARNm (nivel de transcripto) determinada como se describe anteriormente en el segundo momento del tiempo entre la cantidad de ARNm (nivel de transcripto) determinada como se describe anteriormente en el primer momento del tiempo. Esta relación impide que los ARNm estables, que ya están presentes en cantidades muy bajas en el primer momento del tiempo, se descarten en relación a los ARNm que están presentes en altas cantidades.
En el paso b), tal ARNm se selecciona con una relación calculada en la etapa (iii) del paso a) de al menos 0,5 (50%), al menos 0,6 (60%), al menos 0,7 (70%), al menos 0,75 (75%), al menos 0,8 (80%), al menos 0,85 (85%), al menos 0,9 (90%) o al menos 0,95 (95%). Este ARNm es considerado en la presente invención como un ARNm estable particular.
En el paso c), se determina la secuencia de nucleótidos de un elemento 3'- y/o 5'-UTR del ARNm, es decir del ARNm seleccionado en el paso b). Para ello, se pueden aplicar diferentes métodos conocidos por las expertos, por ejemplo secuenciación o selección de una base de datos públicamente disponible, tal como NCBI (National Center for Biotechnology Information). Por ejemplo, la secuencia de ARNm del ARNm seleccionado en el paso b) se puede buscar en una base de datos y las 3'- y/o 5'-UTR entonces se pueden extraer de la secuencia de ARNm presente en la base de datos.
En particular, en el método descrito anteriormente para identificar un elemento de región 3' no traducida (elemento 3'-UTR) y/o un elemento de región 5' no traducida (elemento 5'-UTR), el término “ARNm” y/o “ARNm estable”, respectivamente, también puede referirse a una especie de ARNm como se define aquí y/o a una especie de ARNm estable, respectivamente.
Además, es aquí preferente que un “ARNm estable” pueda sufrir una descomposición de ARNm más lenta comparada con la descomposición de un ARNm promedio, preferentemente evaluada in vivo o in vitro como se define anteriormente. De esta manera, se puede evaluar la “descomposición de un ARNm promedio” investigando la descomposición de un ARNm de una pluralidad de especies de ARNm.
Por consiguiente, se describe aquí en un aspecto adicional un método para identificar un elemento de región 3' no traducida (elemento 3'-UTR) y/o un elemento de región 5' no traducida (elemento 5'-UTR) que comprende los siguientes pasos:
a) Analizar la estabilidad de una pluralidad de especies de ARNm, comprendiendo las siguientes etapas:
i. Determinar la cantidad de cada especie de ARNm de la pluralidad de especies de ARNm en un primer momento del tiempo durante un proceso de descomposición de la especie de ARNm,
ii. Determinar la cantidad de cada especie de ARNm de la pluralidad de especies de ARNm en un segundo momento del tiempo durante un proceso de descomposición de la especie de ARNm, y
iii. Calcular para cada especie de ARNm de la pluralidad de especies de ARNm la relación entre la cantidad de la especie de ARNm determinada en la etapa (i) y la cantidad de la especie de ARNm determinada en la etapa (ii);
b) Clasificar las especies de ARNm de la pluralidad de las especies de ARNm de acuerdo con la relación calculada en la etapa (iii) para cada una de las especies de ARNm;
c) Seleccionar una o más especies de ARNm con la relación o las relaciones más altas calculadas en la etapa (iii);
y
d) Determinar la secuencia de nucleótidos de un elemento 3'- y/o elemento 5'-UTR de dicho ARNm.
Una “especie de ARNm” tal como se utiliza aquí corresponde a una unidad de transcripción genómica, es decir normalmente un gen. Así, dentro de una “especie de ARNm” pueden estar presentes transcriptos diferentes, por ejemplo debido al procesamiento del ARNm. Por ejemplo, una especie de ARNm puede estar representada por una mancha en una microarray. Por consiguiente, una microarray proporciona una herramienta ventajosa para determinar la cantidad de una pluralidad de especies de ARNm, por ejemplo en un cierto momento del tiempo durante la descomposición del ARNm. Sin embargo, también pueden emplearse otras técnicas conocidas por el experto, por ejemplo ARN-seq (también llamada Secuenciación de Disparo de Transcriptoma Entero, que es una tecnología que utiliza la capacidad de la secuenciación de siguiente generación para revelar una fotografía de la presencia de ARN y la cantidad de un genoma en un momento dado en el tiempo), PCR cuantitativa, etc.
Preferentemente, “una pluralidad de especies de ARNm” se refiere a al menos 100, al menos 300, al menos 500, al menos 1.000, al menos 2.000, al menos 3.000, al menos 4.000, al menos 5.000, al menos 6.000, al menos 7.000, al menos 8.000, al menos 9.000, al menos 10.000, al menos 11.000, al menos 12.000, al menos 13.000, al menos 14.000, al menos 15.000, al menos 16.000, al menos 17.000, al menos 18.000, al menos 19.000, al menos 20.000, al menos 21.000, al menos 22.000, al menos 23.000, al menos 24.000, al menos 25.000, al menos 26.000, al menos 27.000, al menos 28.000, al menos 29.000 o al menos 30.000 de especies de ARNm. Se prefiere particularmente que se evalúe el transcriptoma completo o tantas especies de ARNm del transcriptoma como sea posible. Esto se puede lograr, por ejemplo, utilizando una microarray que proporciona una cobertura completa de transcriptos.
El paso a) de este método con sus etapas i. a iii. corresponde esencialmente al paso a) con sus etapas i. a iii. del método inventivo previamente descrito, difiriendo solo en que la cantidad de cada una de las especies de ARNm de una pluralidad de las especies de ARNm se determina en un primer y segundo momentos del tiempo y en que la relación se calcula para cada especie de ARNm. Por consiguiente, los métodos detallados y las realizaciones preferentes descritas anteriormente se aplican en este punto también y la relación para una única especie de ARNm (y cada especie de ARNm, respectivamente) se puede determinar como se describe anteriormente para “un ARNm”.
Sin embargo, en contraste con el método anterior, la estabilidad del ARNm no se evalúa por el valor absoluto de la relación, sino por una clasificación de la especie de ARNm de la pluralidad de especies de ARNm de acuerdo con la relación calculada en la etapa (iii) del paso a) para cada especie de ARNm. En la etapa c), se pueden seleccionar así una o más especies de ARNm con la relación más alta o las relaciones más altas calculadas en la etapa (iii) del paso a).
En este contexto, es particularmente preferente seleccionar el 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% de las especies de ARNm más estables en el paso c). Alternativa o adicionalmente, en el paso c) se pueden seleccionar aquellas especies de ARNm que muestran una relación calculada en la etapa iii. del paso a) correspondientes a al menos el 100% de la relación promedio calculada de todas las especies de ARNm analizadas. De manera más preferente, se seleccionan aquellas especies de ARNm que muestran una relación de al menos un 150%, de manera más preferente de al menos un 200% y de manera mucho más preferente de al menos un 300% de la relación promedio calculada de todas las especies de ARNm analizadas.
En el paso d), la secuencia de nucleótidos de un elemento 3'- y/o 5'-UTR del ARNm seleccionado en el paso c) se determina como se describe anteriormente para el paso c) del método previamente descrito.
Preferentemente, en ambos de los métodos descritos anteriormente para identificar un elemento 3'-UTR y/o un elemento 5'-UTR de acuerdo con la presente descripción, el período de tiempo entre el primer momento del tiempo y el segundo momento del tiempo es al menos 5 horas, de manera preferente al menos 6 horas, de manera preferente al menos 7 horas, de manera más preferente al menos 8 horas, de manera más preferente al menos 9 horas, aún de manera más preferente al menos 10 horas, aún de manera más preferente al menos 11 horas y con particular preferencia al menos 12 horas.
Preferentemente, en ambos de los métodos descritos anteriormente para identificar un elemento 3'-UTR y/o un elemento 5'-UTR de acuerdo con la presente descripción, se analiza la estabilidad de un ARNm por etiquetado por pulso, preferentemente utilizando una metodología de búsqueda de pulso.
Método para identificar un elemento de región 3’ no traducida (elemento 3’-UTR) y/o un elemento de región 5’ no traducida (elemento 5’-UTR)
En un aspecto adicional, la presente descripción también proporciona un método para identificar un elemento de región 3’ no traducida (elemento 3’-UTR) y/o un elemento de región 5’ no traducida (elemento 5’-UTR), los cuales proporcionan una alta eficiencia de traducción a una molécula de ácido nucleico artificial, comprendiendo los siguientes pasos:
a) identificar un elemento 3’-UTR y/o un elemento 5’-UTR que se deriva de un ARNm estable por un método para identificar un elemento 3’-UTR y/o un elemento 5’-UTR de acuerdo con cualquiera de los métodos descritos anteriormente;
b) sintetizar una molécula de ácido nucleico artificial que comprende al menos un marco de lectura abierto y al menos un elemento 3’-UTR y/o al menos un elemento 5’-UTR que corresponde a o está comprendido en el elemento 3’-UTR y/o en el elemento 5’-UTR identificado en el paso a);
c) analizar la expresión de la proteína codificada por el al menos un marco de lectura abierto (ORF) de la molécula de ácido nucleico artificial sintetizada en el paso b);
d) analizar la expresión de una proteína codificada por al menos un marco de lectura abierto de una molécula de ácido nucleico artificial de referencia que carece de un elemento 3’-UTR y/o de un elemento 5’-UTR;
e) comparar la expresión de la proteína a partir de la molécula de ácido nucleico artificial analizada en el paso c) con la expresión de la proteína a partir de la molécula de ácido nucleico artificial de referencia analizada en el paso d); y
f) seleccionar el elemento 3'-UTR y/o el elemento 5'-UTR si la expresión de la proteína de la molécula de ácido nucleico artificial analizada en el paso c) se prolonga y/o se incrementa en comparación con la expresión de la proteína de la molécula de ácido nucleico artificial de referencia analizada en el paso d).
En este método, se identifican primero un elemento 3'-UTR y/o un elemento 5'-UTR por un método de acuerdo con la presente descripción como se describe arriba. Esto permite la síntesis del elemento 3'- y/o del elemento 5'-UTR por métodos conocidos por el experto, por ejemplo por amplificación por PCR. Los cebadores utilizados para esta PCR pueden comprender preferentemente sitios de restricción para la clonación. Alternativamente, el elemento 3'- y/o 5'-UTR se puede sintetizar, por ejemplo por síntesis química o recocido oligo. Por consiguiente, en el paso b), se sintetiza una molécula de ácido nucleico artificial que comprende al menos un marco de lectura abierto y al menos un elemento 3'-UTR y/o al menos un elemento 5'-UTR que corresponde a o está comprendido en el elemento 3'-UTR y/o en el elemento 5'-UTR identificado en el paso a). En particular, el al menos un elemento 3'-UTR y/o el al menos un elemento 5'-UTR se combinan usualmente con un marco de lectura abierto, dando como resultado un ácido nucleico artificial que comprende un elemento 3'- y/o un elemento 5'-UTR de acuerdo con la presente descripción, si el elemento 3'- y/o el elemento 5'-UTR cumplen con los requisitos respectivos, es decir, si prolongan y/o incrementan la expresión de la proteína. Para probar esto, el elemento 3'-y/o el elemento 5'-UTR identificados en el paso a), o un fragmento de PCR o secuencia sintetizada del mismo respectivamente se puede clonar en un vector particular, preferentemente en un vector de expresión, a fin de evaluar la expresión proteica del ORF respectivo.
La expresión de la proteína a partir de la molécula de ácido nucleico artificial que comprende el al menos un elemento 3'-UTR y/o el al menos un elemento 5'-UTR después se evalúa en el paso c) como se describe aquí y se compara con la expresión de la proteína evaluada en al paso d) a partir de una molécula de ácido nucleico artificial de referencia respectiva que carece de un elemento 3'-UTR y/o un elemento 5'-UTR como se describe aquí en el paso e).
Después, en el paso f), se selecciona este elemento 3'-UTR y/o 5'-UTR que incrementa la expresión de la molécula de ácido nucleico artificial analizada en el paso c) en comparación con la expresión de la proteína de la molécula de ácido nucleico artificial de referencia analizada en el paso d). La comparación de la expresión de la proteína de la molécula de ácido nucleico inventiva con la molécula de ácido nucleico de referencia se lleva a cabo como se describe aquí, en particular en el contexto de la molécula de ácido nucleico artificial inventiva.
Además, la presente descripción proporciona un método particularmente preferente para identificar un elemento de región 3' no traducida (elemento 3'-UTR) y/o un elemento de región 5' no traducida (elemento 5'-UTR) que proporcionan una alta eficiencia de traducción a una molécula de ácido nucleico artificial, comprendiendo los siguientes pasos:
a) alimentar/incubar células con un nucleótido etiquetado para la incorporación en moléculas de ARN recién transcritas (etiquetado con búsqueda de pulso);
b) aislar el ARN total de las células en un primer momento del tiempo y en al menos un segundo momento del tiempo posterior;
c) extraer las moléculas de ARN etiquetadas del ARN total aislado en el paso b);
d) medir la cantidad/nivel de trascripto de la especie de las diferentes especies de ARNm comprendidas en el ARN etiquetado;
e) calcular la relación entre la cantidad/nivel de transcripto de una especie de ARNm presente en al menos un segundo momento del tiempo posterior y la cantidad/nivel de transcripto de la especie de ARNm presente en el primer momento del tiempo;
f) clasificar las especies de ARNm de acuerdo con la relación determinada en el paso e);
g) seleccionar la especie de ARNm más estable;
h) determinar la secuencia de nucleótidos de los 3'- y/o 5'-UTR de las especies de ARNm más estables seleccionadas en el paso g);
i) sintetizar un elemento 3'- y/o 5'-UTR comprendido en las 3'- y/o 5'-UTR determinadas en el paso h);
j) combinar el elemento 3'- y/o 5'-UTR sintetizado en el paso i) con un marco de lectura abierto para obtener un ácido nucleico de acuerdo con la invención como se describe aquí; y
k) opcionalmente comparar la expresión del marco de lectura abierto presente en el ácido nucleico inventivo comparado con la expresión del marco de lectura abierto presente en un ácido nucleico de referencia sin un elemento 3'- y/o 5'-UTR como se describe aquí.
De esta manera, los detalles y las realizaciones preferentes descritos para los métodos anteriores también se aplican aquí dentro de la limitación respectiva descrita en los pasos a) a k).
En particular, son preferentes los siguientes nucleótidos etiquetados para alimentar las células en el paso a) del método inventivo: 4-tiouridina (4sU), 2-tiouridina, 6-tioguanosina, 5-etiniluridina (EU), 5-bromouridina (BrU), biotin-16 aminoaliluridina, 5-aminoaliluridina, 5-aminoalilcitidina, etc. Se prefiere particularmente la 4-tiouridina (4sU). La 4-tiouridina se utiliza preferentemente en una concentración de 100-500 pM. Alternativamente, se pueden emplear nucleótidos radioactivamente etiquetados, por ejemplo uridina-3H. Pueden emplearse combinaciones de los nucleótidos etiquetados mencionados anteriormente. Particularmente preferente es la combinación de 4-tiouridina y 6-tioguanosina
La incubación de las células con el nucleótido etiquetado en el paso a) se puede variar. Es particularmente preferente una incubación (tiempo de alimentación) de 10 minutos a 24 horas. Se prefieren particularmente de 2 a 6 horas, de manera más preferente 2 a 3 horas.
Células que se pueden utilizar para el método incluyen líneas celulares particulares, células primarias, células de tejido o sujetos. En realizaciones específicas, pueden ser adecuados aquellos tipos de células que permiten el cultivo celular para el método inventivo. Se prefieren en particular células de mamífero, por ejemplo células humanas y células de ratón. En realizaciones particularmente preferentes se utilizan las líneas celulares humanas HeLa, HEPG2 y U-937 y las líneas celulares de ratón NIH3T3, JAWSII y L929. Además, las células primarias son particularmente preferentes; en realizaciones preferidas particulares se pueden utilizar fibroblastos dérmicos, en particular humanos (HDF). Alternativamente, el nucleótido etiquetado también se puede aplicar a un tejido de un sujeto y, después del tiempo de incubación, el ARN de tejido se aísla de acuerdo con el paso c).
Para la determinación de los ARNm más estables de una célula (tipo), se extrae un ARN total en un momento del tiempo como se describe anteriormente, por ejemplo 0 a 6 horas después del etiquetado, de manera preferente 3 horas después del etiquetado, y en un segundo momento del tiempo posterior como se describe anteriormente, por ejemplo 3 a 48 horas después del etiquetado, de manera preferente 10 a 24 horas, de manera mucho más preferente 15 horas después del etiquetado. El segundo momento del tiempo posterior es al menos 10 minutos después del primer momento.
En el paso f), la especie de ARNm se clasifica de acuerdo con la relación calculada en el paso e). En este contexto, se prefiere particularmente seleccionar el 0,1%, 0,2%, 0,3%, 0,4%, 0,5%, 0,6%, 0,7%, 0,8%, 0,9%, 1%, 2%, 3%, 4%, 5%, 10%, 15%, 20% de las especies de ARNm más estables.
En este contexto, es preferente además seleccionar aquellas especies de ARNm que muestran al menos el 50% (0,5 veces), al menos 60% (0,6 veces), al menos 70% (0,7 veces), al menos 90% (0,9 veces) o al menos 95% (0,95 veces) del nivel de transcripto/cantidad de las especies de ARNm en el segundo momento del tiempo posterior comparado con el primer momento. Esta realización es particularmente preferente si el ARN se aísla a las 3 horas (primer momento del tiempo) y a las 15 horas (segundo momento del tiempo) después del etiquetado.
Alternativa o adicionalmente, se seleccionan aquellas especies de ARNm que muestran una relación calculada en el paso e) que corresponde a al menos el 100% de la relación promedio calculada de todas las especies de ARNm analizadas. De manera más preferente, se seleccionan aquellas especies de ARNm que muestran una relación de al menos un 150% y de manera más preferente de al menos un 200% y con mayor preferencia de al menos un 300% de la relación promedio calculada de todas las especies de ARNm analizadas.
En un paso adicional del método, se determina la secuencia de nucleótidos de los 3'- y/o 5'-UTR de las especies de ARNm más estables seleccionadas en el paso g) y en el paso i) se sintetiza el elemento 3'- y/o 5'-UTR, por ejemplo por amplificación por PCR. Los cebadores utilizados para la PCR pueden comprender preferentemente sitios de restricción para la clonación. Alternativamente, el elemento 3'- y/o 5'-UTR se puede sintetizar (por ejemplo por síntesis química o recocido de oligo).
En el paso j) del método, el fragmento PCR resultante o la secuencia sintetizada se combina con un marco de lectura abierto, dando como resultado un ácido nucleico artificial que comprende un elemento 3'- y/o 5'-UTR de acuerdo con la descripción. Preferentemente, el fragmento de PCR o la secuencia se puede clonar en un vector.
En una realización particularmente preferente, la descripción proporciona un método que comprende los pasos a) a k) para identificar elementos de región 3' no traducida (elemento 3'-UTR) y/o elementos de región 5' no traducida (elemento 5'-UTR) donde los elementos 3'-UTR y/o los elementos 5'-UTR prolongan la producción de proteínas a partir de una molécula de ácido nucleico artificial que comprende al menos uno de los elementos 3'-UTR y/o al menos uno de los elementos 5'-UTR.
En un aspecto adicional, la presente descripción también proporciona un método para generar una molécula de ácido nucleico artificial donde se sintetiza una molécula de ácido nucleico artificial que comprende al menos un marco de lectura abierto y al menos un elemento 3'-UTR y/o al menos un elemento 5'-UTR identificados por un método para identificar un elemento 3'-UTR y/o un elemento 5'-UTR de acuerdo con la presente descripción como se describe anteriormente. La síntesis de esta molécula de ácido nucleico artificial se lleva a cabo típicamente por métodos conocidos por el experto, por ejemplo métodos de clonación, por ejemplo como es de conocimiento general o como se describe aquí.
Preferentemente, se utiliza un vector de acuerdo con la presente invención como se describe aquí en tal método para generar una molécula de ácido nucleico artificial.
Preferentemente, la molécula de ácido nucleico artificial generada por tal método para generar una molécula de ácido nucleico artificial es una molécula de ácido nucleico de acuerdo con la presente invención como se describe aquí.
Además, la presente descripción también proporciona una molécula de ácido nucleico artificial obtenible por un método para generar una molécula de ácido nucleico artificial de acuerdo con la presente descripción como se describe aquí. Las figuras, secuencias y ejemplos siguientes se proponen para ilustrar la invención adicionalmente. No se proponen para limitar el contenido de la invención a los mismos.
La figura 1 muestra secuencias codificadoras de ARNm (esto es moléculas de ácido nucleico artificiales) que pueden obtenerse por transcripción in vivo.
Se utilizan las siguientes abreviaturas:
PpLuc (GC): secuencia de ARNm enriquecida en GC que codifica para luciferasa de Photinus pyralis. La PpLuc(GC)ORF se resalta en cursiva.
• A64: secuencia poli(A) con 64 adenilatos
• C30: secuencia poli(C) con 30 citidilatos
• hSL: una secuencia tallo-bucle de histona tomada de (Cakmakci, Lerner, Wagner, Zheng, & William F Marzluff, 2008. Mol. Cell. Biol. 28(3):1182-94)
32L4: una variante artificial de la región 5' no traducida 5'-UTR de la proteína ribosómica humana grande 32 que carece del tracto de oligopirimidina 5'-terminal. La 5'-UTR se deriva del ARNm de la proteína ribosómica humana grande 32 que carece del tracto de oligopirimidina 5' terminal.
albúmina7: una variante artificial de la región 3' no traducida (3'-UTR) de albúmina humana con tres mutaciones puntuales individuales introducidas para eliminar una señal de terminación T7 así como un sitio de restricción HindIII y XbaI.
Figura 1A: Constructo de Referencia, SEQ ID NO: 205, es decir la secuencia de ARNm de 32L4 - PpLuc(GC) - albúmina7 - A64 - C30 - hSL (R3111).
Para los elementos UTR de origen humano que se sometieron a ensayo experimental, ver Tabla 3. Para los elementos UTR de origen de ratón que se sometieron a ensayo experimental, ver Tabla 4.
Figura 1B: Ácido nucleico artificial (SEQ ID NO: 210) (no reivindicada), dicho ácido nucleico artificial comprende una 5'-UTR ensayada que corresponde a la SEQ ID NO: 1 (subrayado simple). Todos los elementos de la secuencia mostrados en esta figura, excepto el elemento subrayado, son idénticos a la SEQ ID NO: 205. La SEQ ID NO: 210 difiere así de la SEQ ID NO: 205 en que un elemento 5'-UTR es diferente.
[5'-UTR que corresponde a la SEQ ID NO: 1 ] - PpLuc(GC) - albúmina7 - A64 - C30 - hSL
Figura 1C: Ácido nucleico artificial (SEQ ID NO: 211) (no reivindicada), dicho ácido nucleico artificial comprende una 3'-UTR ensayada que corresponde a la SEQ ID NO: 152 (doble subrayado). Todos los elementos de la secuencia mostrados en esta figura, excepto el elemento doble subrayado, son idénticos a la SEQ ID NO: 205. La SEQ ID NO: 211 difiere así de la SEQ ID NO: 205 en que un elemento 3'-UTR es diferente.
32L4 - PpLuc(GC) -[3'-UTR que corresponde a la SEQ ID NO: 152] - A64 - C30 - hSL
Las Figuras 2 a 9 muestran la expresión de luciferasa media y la SEM de los ARNm que se analizaron por triplicado; es decir, la expresión PpLuc relativa normalizada a RrLuc (se indican valores medios de tres experimentos independientes y error estándar de la media (SEM)). Se examinó el efecto de los elementos 5'-UTR y 3'-UTR de origen humano (Tabla 3) y de los elementos 5'-UTR y 3'-UTR de origen de ratón (Tabla 4) en la expresión de luciferasa del ARNm en comparación con la expresión de luciferasa del ARNm mostrado en las Figuras 1A-1C (Constructo de Referencia). Para detalles de los constructos que comprenden los elementos 5'-UTR y los elementos 3'-UTR ensayados de las Tablas 3 y 4, ver Ejemplo 3, en particular las secciones 3.3 y 3.4. Para ello, las líneas celulares indicadas en las figuras se transfectaron con ARNm diferentes por lipofección (Figura 2: células HDF transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de origen humano como se muestra en la Tabla 3; Figura 3: células HDF transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de ratón como se muestra en la Tabla 4; Figura 4: células L929 transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de origen humano como se muestra en la Tabla 3; Figura 5: células L929 transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de ratón como se muestra en la Tabla 4; Figura 6: células HEPG2 transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de origen humano como se muestra en la Tabla 3; Figura 7: células HEPG2 transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de ratón como se muestra en la Tabla 4; Figura 8: células HeLa transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de origen humano como se muestra en la Tabla 3; Figura 9: células HeLa transfectadas con los ARNm que tienen los elementos 5'-UTR y los elementos 3'-UTR de ratón como se muestra en la Tabla 4). Para detalles, ver el Ejemplo 3, en particular la sección 3.5. Las Figuras 2 a 9 muestran en cada caso 96 barras que corresponden a los 96 pocillos del ensayo del Ejemplo 3. En las Figuras 2 a 9, las 96 barras se muestran en orden consecutivo, es decir A1, B1, C1, D1, [...], F12, G12, H12.
RLU = unidades de luz relativas (Medida de la actividad de luciferasa)
Ejemplos
Ejemplo 1: Elementos UTR candidatos
Se evaluó la expresión de ARNm en células humanas y de ratón experimentalmente. Esto condujo a la identificación de los ARNm expresados en las células respectivas. La secuencia de nucleótidos de las 5' - y/o 3'-UTR de las especies de ARNm se determinó por búsqueda en la base de datos, verificada por y ajustada de acuerdo con los datos de secuenciación de alto rendimiento de los transcriptomas celulares y se amplificó por PCR o se sintetizó por recocido oligo. Dado que los ARNm identificados se originan de su medio ambiente celular nativo, estos ARNm se entiende que son ARNm de tipo natural:
SEQ ID NO: 1 a 72 representan los elementos 5'-UTR humanos de tipo natural.
SEQ ID NO: 73 a 136 representan los elementos 5'-UTR de ratón de tipo natural.
SEQ ID NO: 152 a 173 representan los elementos 3'-UTR humanos de tipo natural.
SEQ ID NO: 174 a 203 representan los elementos 3'-UTR de ratón de tipo natural.
Aunque varios de estos elementos UTR son conocidos (por ejemplo en su medio ambiente de tipo natural), este procedimiento también condujo a la identificación de elementos 5'-UTR y elementos 3'-UTRs nuevos, es decir, elementos 5'-UTR y elementos 3'-UTR que los presentes inventores encontraron que se expresan en las células humanas y células de ratón, respectivamente, pero que no son conocidos en las bases de datos públicas (NCBI).
En particular, entre el grupo que consiste en los elementos 5'-UTR de SEQ ID NO: 1 a 72, los siguientes elementos 5'-UTR de tipo natural difieren de los elementos 5'-UTR conocidos de las bases públicas (NCBI): SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49.
Entre el grupo consistente en los elementos 5'-UTR de ratón de SEQ ID NO: 73 a 136, los siguientes elementos 5'-UTR de tipo natural difieren de los elementos 5'-UTR conocidos de las bases de datos públicas (NCBI): SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 90, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 98, SEQ ID NO: 106, SEQ ID NO: 109, SEQ ID NO: 115, SEQ ID NO: 118, SEQ ID NO: 125, SEQ ID NO: 127, SEQ ID NO: 131, SEQ ID NO: 135.
Entre el grupo consistente en el elemento 3'-UTR de ratón de SEQ ID NO: 174 a 203, los siguientes elementos 3'-UTR de tipo natural difieren de los elementos 3'-UTR conocidos de las bases de datos públicas (NCBI): SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 197, SEQ 15 ID NO: 200.
Las diferencias de los elementos 5'-UTR recién identificados y los elementos 3'-UTR recién identificados con los elementos 5'-UTR conocidos y los elementos 3'-UTR conocidos, respectivamente, se muestran en las Tablas 1 y 2. En particular, estos elementos recién identificados no se han descrito previamente como elementos 3'-UTR o elementos 5'-UTR, respectivamente.
Tabla 1: Nuevos elementos 5'-UTR de tipo natural
Figure imgf000112_0001
Tabla 2: Nuevos elementos 3'-UTR de tipo natural
Figure imgf000112_0002
Elementos 5’-UTR artificiales y elementos 3’-UTR artificiales
En algunos casos se prepararon los elementos 5'-UTR artificiales y los elementos 3'-UTR. Esto se hizo modificando los elementos 5'-UTR de tipo natural y los elementos 3'-UTR en un procedimiento basado en PCR utilizando cebadores modificados, como sigue: (i) algunos tripletes ATG en unas secuencias 5'-UTR (si están presentes) se convirtieron al triplete TAG. (i) Además, no se deseaba la presencia de un sitio de escisión particular para una enzima de restricción particular (si está presente), se consideró que el sitio de escisión particular interfiere con los experimentos de clonación subsecuentes. Se consideró que un sitio de escisión presente en una secuencia de tipo natural interfiere con los experimentos de clonación subsecuentes y que la enzima de restricción utilizada en los experimentos de clonación subsecuentes (tal como se describe en los Ejemplos 2 y 3) habría reconocido y escindido el elemento 3'-UTR o el elemento 5'-UTR de tipo natural. Puesto que la escisión interna de los elementos 5'-UTR y los elementos 3'-UTR era indeseada, los sitios de escisión para la enzima de restricción específica se eliminaron reemplazando un nucleótido dentro del sitio de escisión para la enzima de restricción específica por el nucleótido complementario, eliminando así los sitios de escisión para la enzima de restricción específica.
SEQ ID NO: 137 (basada en SEQ ID NO: 3), SEQ ID NO: 138 (basada en SEQ ID NO: 9), SEQ ID NO: 139 (basada en SEQ ID NO: 14), SEQ ID NO: 140 (basada en SEQ ID NO: 17), SEQ ID NO: 141 (basada en SEQ ID NO: 18), SEQ ID NO: 142 (basada en SEQ ID NO: 29), SEQ ID NO: 143 (basada en SEQ ID NO: 31), SEQ ID NO: 144 (basada en SEQ ID NO: 42), SEQ ID NO: 145 (basada en SEQ ID NO: 43), SEQ ID NO: 146 (basada en SEQ ID NO: 52), SEQ ID NO: 147 (basada en SEQ ID NO: 109), SEQ ID NO: 148 (basada en SEQ ID NO: 110), SEQ ID NO: 149 (basada en SEQ ID NO: 119), SEQ ID NO: 150 (basada en SEQ ID NO: 120) y SEQ ID NO: 151 (basada en SEQ ID NO: 136) representa los 5' -UTRs 15 artificiales. SEQ ID NO: 204 (basada en SEQ ID NO: 192) representan un elemento 3'-UTR artificial. Las diferencias exactas con las secuencias de tipo natural respectivas se indican anteriormente.
En resumen, las SEQ ID NO: 1 a 136 se pueden considerar como secuencias 5'-UTR de tipo natural y las SEQ ID NO: 137 a 151 se pueden considerar como secuencias 5'-UTR artificiales; las SEQ ID NO: 152 a 203 se pueden considerar como secuencias 3'-UTR de tipo natural y las SEQ ID NO: 204 se pueden considerar como secuencias 3'-UTR artificiales.
En resumen, este ejemplo proporciona varios elementos 5'-UTR y 3'-UTR (de tipo natural y artificial) que, en cada caso, se pueden someter a ensayo por su influencia relativa en la eficiencia de traducción, con referencia a los elementos UTR de referencia (como se describe a continuación en los Ejemplos 2 y 3).
Ejemplo 2: Elementos UTR de Referencia y Constructo de Referencia que los comprende
La Figura 1A muestra la secuencia de ARN de un constructo de referencia utilizado en la presente invención. También se construyó un vector para la transcripción in vitro comprendiendo una secuencia de ADN que corresponde a la secuencia de ARN de la Figura 1A. El vector contiene un promotor T7, una variante artificial de la región 5' no traducida (5'-UTR) de 32L4 (proteína ribosómica Large 32), una secuencia enriquecida en GC (marco de lectura abierto, ORF) que codifica para luciferasa de Photinus pyralis (PpLuc(GC)), una variante artificial de la región 3' no traducida (3'-UTR) de la albúmina humana (ALB), albúmina7. Una secuencia A64 poli(A), seguida por C30 y una secuencia tallo-bucle de histona, estaba presente 3' de la albúmina7. La secuencia tallo-bucle de histona fue seguida por un sitio de restricción utilizado para la linealización del vector antes de la transcripción in vitro.
Los fragmentos PCR que corresponde a las secuencias mostradas en el Ejemplo 1 se clonaron individualmente en un vector que contiene una secuencia de ADN que corresponde a la secuencia de ARN de las Figuras 1A-1C. En los casos donde las secuencias de tipo natural del Ejemplo 1 contenían tripletes ATG en la 5'-UT, y/o sitios de restricción indeseados en la 5'-UTR o la 3'-UTR, se utilizaron las secuencias artificiales respectivas identificadas en el Ejemplo 1 (por ejemplo se utilizó SEQ ID NO: 137 en lugar de SEQ ID NO: 3).
En detalle, con el fin de generar un constructo para ensayar un elemento 5'-UTR candidato, el elemento 5'-UTR subrayado de la Figura 1A se reemplazó por el elemento 5'-UTR candidato (tipo natural o artificial) (Ejemplo 1) para el ensayo (un ejemplo del mismo se muestra en la Figura 1B); y para generar un constructo para probar un elemento 3'-UTR candidato, el elemento 3'-UTR subrayado doble de la Figura 1A se reemplazó por el elemento 3'-UTR candidato (tipo natural o artificial) (Ejemplo 1) a ensayar (un ejemplo del mismo se muestra en la Figura 1C). Los vectores o plásmidos obtenidos (que contienen el ADN que corresponde por ejemplo a una secuencia de ARN, por ejemplo al ARN mostrado en las Figuras 1A a 1C) también se puede denominar plantillas de ADN.
Las plantillas de ADN se linealizaron y se transcribieron in vitro utilizando la T7-ARN-polimerasa (WO2015101416). Las plantillas de ADN después se digirieron por tratamiento con ADNasa. Los transcriptos de ARNm contenían una estructura cap 5' obtenida añadiendo un exceso de N7-metilguanosina-5'-trifosfato-5'-guanosina a la reacción de transcripción. El ARNm así obtenido se purificó y se resuspendió en agua. Los ARNm así obtenidos para ensayar los elementos UTR corresponden al ARNm mostrado en la Figura 1A (Constructo de Referencia), excepto que el elemento 5'-UTR o el elemento 3'-UTR del constructo de referencia se reemplaza por el UTR respectivo que se somete a prueba.
Ejemplo 3: Eficiencia de Traducción de los elementos UTR Candidatos en relación al Constructo de Referencia
Los elementos 5'-UTR de origen humano o de ratón o los elementos 3'-UTR de origen humano o de ratón se sometieron a prueba experimentalmente. Dentro del contexto de este Ejemplo, “origen humano” puede significar ya sea una secuencia de tipo natural humana (por ejemplo SEQ ID NO: 1) o una secuencia artificial basada en una secuencia de tipo natural humana por sustitución de una o más bases (por ejemplo SEQ ID NO: 137) y el término “de ratón” se utiliza de igual forma. Los detalles de cómo las secuencias artificiales de las Tablas 3 y 4 se basan en las secuencias de tipo natural se proporcionan en el Ejemplo 1.
Se ensayó experimentalmente si cualquier (5'- o 3'-) UTR (Tablas 3 y 4, a continuación) tienen un efecto beneficioso en la eficiencia de traducción. Esto se hizo con un método que comprende los pasos:
i. transfectar células de mamífero con una molécula de ácido nucleico artificial y medir las cantidades expresadas de la proteína codificada por el ORF de la molécula de ácido nucleico artificial en uno o dos determinados momentos del tiempo después de la transfección (24 y 48 horas),
ii. transfectar células de mamífero con una molécula de ácido nucleico de referencia (Figura 1A) y medir las cantidades expresadas de la proteína codificada por el ORF de la molécula de ácido nucleico de referencia en los mismos uno o dos momentos del tiempo después de la transfección (24 y 48 horas),
iii. calcular la relación entre la cantidad de proteína expresada a partir de la molécula de ácido nucleico artificial y la cantidad de proteína expresada a partir de la molécula de ácido nucleico de referencia,
donde la relación calculada en (iii) es > 1.
Esta relación se asocia a una alta eficiencia de traducción.
Todas las secuencias UTR ensayadas experimentalmente en este ejemplo también son referidas como “elementos UTR ensayados experimentalmente” o “elementos UTR ensayados” o “UTR experimentalmente ensayados” o “UTR ensayados”.
La molécula de ácido nucleico artificial de (i) comprendía un elemento UTR ensayado. En particular, la molécula de ácido nucleico artificial (ARNm) no difería estructuralmente de la molécula de ácido nucleico de referencia (Figura 1A), excepto que tanto el elemento 5'-UTR como el elemento 3'-UTR de la molécula de ácido nucleico de referencia se reemplazó por un elemento UTR ensayado (para ejemplos ilustrativos, ver FIiguras 1B y 1C).
3.1 Elementos UTR de origen humano
Los detalles de los elementos UTR de origen humano que se ensayaron experimentalmente se proporcionan en la siguiente Tabla 3. La prueba experimental se llevó a cabo con referencia a un constructo de referencia como se describe con detalle anteriormente y en la sección “Detalles del Constructo”.
Tabla 3: Elementos UTR de origen humano ensayados
Figure imgf000114_0001
Figure imgf000115_0001
Figure imgf000116_0001
Figure imgf000117_0001
Figure imgf000118_0001
Figure imgf000119_0001
3.2 Elementos UTR de ratón
Los detalles de los elementos UTR de origen de ratón que se sometieron a ensayo experimental se proporcionan en la siguiente Tabla 4. La prueba experimental se llevó a cabo en relación a un constructo de referencia como se describe con detalle anteriormente y en la sección “Detalles de Constructo”.
Tabla 4: Elementos UTR ensayados de ratón
Figure imgf000119_0002
Figure imgf000120_0001
Figure imgf000121_0001
Figure imgf000122_0001
Figure imgf000123_0001
3.3 Detalles del Constructo
Cuando se ensayaba una 5'-UTR, esto se hizo reemplazando la 5'-UTR del Constructo de Referencia (es decir 32L4 -PpLuc(GC) - albúmina7- A64 - C30 - hSL; Figuras 1A-1C) por la 5'-UTR “ensayada” - es decir cualquiera de las secuencias 5'-UTR de tipo natural (secuencia de ARNm que corresponde a la secuencia de ADN referida en las Tablas 3 o 4, primera columna) o la secuencia 5'-UTR artificial basada en la misma (secuencia de ARNm que corresponde a la secuencia de ADN referida en las Tablas 3 o 4, segunda columna). Los otros elementos de secuencia del Constructo de Referencia permanecieron sin cambio.
A su vez, cuando se ensayó una 3'-UTR, esto se hizo reemplazando la 3'-UTR del Constructo de Referencia (es decir 32L4 - PpLuc(GC) - albúmina7- A64 - C30 - hSL; Figuras 1A-1C) por la 3'-UTR “ensayada” - es decir ya sea la secuencia 3'-UTR de tipo natural (secuencia de ARNm que corresponde a la secuencia de ADN referida en las Tablas 3 o 4, tercera columna) o la secuencia 3'-UTR artificial basada en la misma (secuencia de ARNm que corresponde a la secuencia de ADN referida en las Tablas 3 o 4, cuarta columna). Los otros elementos de secuencia del Constructo de Referencia permanecieron sin cambio.
3.4. Ensayo de Luciferasa para determinar la Eficiencia de Traducción
La eficiencia de traducción se ensayó experimentalmente en un ensayo de transfección celular utilizando diferentes líneas celulares de mamífero (humanas, de ratón), es decir HDF, L929, HepG2 y Hela (ver Figuras 2 a 9).
Se sembraron fibroblastos dérmicos humanos (HDF), células L929, células HEPG2 y células HeLa en placas de 96 pocillos a una densidad de 1x104 células por pocillo. Al siguiente día, las células se lavaron en Opti-MEM y después se transfectaron con 25 ng por porcillo de ARNm de codificación PpLuc complejado con Lipofectamina2000 en Opti-MEM. Las células no transfectadas sirvieron como control. La codificación del ARNm para luciferasa de Renilla reniformis (RrLuc) se transfectó junto con el PpLuc ARNm para controlar la eficiencia de transfección (1 ng de RrLuc ARNm por pocillo). 90 minutos después del inicio de la transfección, el Opti-MEM se intercambió para el medio. 24 y 48 horas después de la transfección, el medio se aspiró y las células se lisaron en 100 pl de solución tampón de Lisis Pasiva (Promega). Los lisados se almacenaron a -80 °C hasta que se midió la actividad de la luciferasa.
La actividad de la luciferasa se midió como unidades de luz relativas (RLU) en un lector de placas Hidex Chameleon. Las actividades de Ppluc y Rrluc se midieron secuencialmente de una muestra individual en un ensayo de luciferasa doble. La actividad de PpLuc se midió primero en un tiempo de medición de 2 segundos utilizando 20 pl de lisado y 50 pl de jugo de escarabajo (pjk GmbH). Después de un retraso de 1.500 ms, se midió la actividad de RrLuc con 50 pl de jugo de Renilla (pjk GmbH).
Esto se hizo en placas de 96 pocillos y cada elemento UTR ensayado (en la estructura del constructo en que estaba contenido, ver 3.3) se asignó a una posición en la placa de 96 pocillos. Se utilizaron dos placas de 96 pocillos, una para probar los elementos UTR de origen humano y otra para probar los elementos UTR de ratón. En cada placa, el Constructo de Referencia (que corresponde a la secuencia de ARNm mostrada en la Figura 1A) estaba en las posiciones G12 y H12. Los elementos UTR ensayados estaban en las posiciones indicadas en la última columna de las Tablas 3 y 4, respectivamente. Para ilustración, un constructo que comprende la 3'-UTR Aarsd1 de ratón (SEQ ID NO: 186) estaba en la posición F12 (ver Tabla 4).
La actividad de luciferasa se midió 24 horas (1d, 24 horas) pos-transfección de las células y nuevamente 48 horas (2d, 48 h) pos-transfección de las células.
Los resultados de este ensayo se describen en 3.5 a continuación.
3.5 Resultados - Determinación de los elementos UTR asociados con una alta eficiencia de traducción
Los resultados de la expresión del ensayo (ver 3.4 anterior), medido después de 24 horas (1d, 24) y nuevamente después de 48 horas (2d, 48 h) después de la transfección en líneas de células de mamífero diferentes (HDF, L929, HepG2 y Hela), se muestran en las Figuras 2 a 9. Cabe destacar que existen dos conjuntos de placas de 96 pocillos, un conjunto relacionado con los elementos UTR de origen humano y otro relacionado con los elementos UTR de ratón.
Aunque las Figuras 2 a 9 se refieren a posiciones específicas en la placa de 96 pocillos (por ejemplo A1), las Tablas 3 y 4 asignan elementos (5'- o 3'-)UTR ensayados específicos a las posiciones específicas en la placa de 96 pocillos. Por ejemplo, se puede tomar de la tabla que, en la posición A1 de la placa de 96 pocillos de los elementos UTR humanos ensayados, el elemento ZNF4605'-UTR (SEQ ID NO: 1) se sometió a prueba y así sucesivamente.
Se determinó un grupo de elementos UTR particularmente preferentes (también llamados “selección final”). Este grupo comprende elementos 5'-UTR y elementos 3'-UTR que se caracterizan por una eficiencia de traducción igual o mejor, preferentemente mejor, que el constructo de referencia (Figura 1A) en al menos una de las líneas celulares ensayadas medida después del día 1 (24 h). Este grupo se divide en cuatro subgrupos: (i) elementos 5'-UTR de origen humano (ver Tabla 5), (ii) elementos 3'-UTR de origen humano (ver Tabla 6), (iii) elementos 5'-UTR de ratón (ver Tabla 7), (ii) elementos 3'-UTR de ratón (ver Tabla 8).
Tabla 5: Elementos 5'-UTR preferentes de origen humano
Figure imgf000124_0001
Figure imgf000125_0001
Así, los 5'-UTR de los genes humanos del grupo consistente en ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'UTR, COL8A1-5'-UTR, NDUFS7-5'-UTR, PLK2-5'-UTR, FBXO32-5'-UTR, ATP5D-5'-UTR, TUBB4B-5'-UTR, ORMDL2-5'-UTR, FSCN1-5' UTR, CD9-5'-UTR, PYSL2-5'-UTR, PSMB3-5'-UTR, PSMB6-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, VMA21-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5'-UTR, KPNA6-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5' 5 UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR se considera que contribuyen a una alta eficiencia de traducción .
También, los 5'-UTR reflejados por las SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 137 (o su equivalente de tipo natural SEQ ID NO: 3), SEQ ID NO: 138 (o su equivalente de tipo natural SEQ ID NO: 9), SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 15, SEQ ID NO: 140 (o su equivalente de tipo natural SEQ ID NO: 17), SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 143 (o su equivalente de tipo natural SEQ ID NO: 31), SEQ ID NO: 32, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 44, SEQ ID NO: 45, SEQ ID NO: 146 (o su equivalente de tipo natural SEQ ID NO: 52), SEQ ID NO: 53, SEQ ID NO: 54, SEQ ID NO: 57, SEQ ID NO: 60, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 72, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 144 (o su equivalente de tipo natural SEQ ID NO: 42), SEQ ID NO: 58, SEQ ID NO: 62 se considera que contribuyen a una alta eficiencia de traducción.
Tabla 6: Elementos 3'-UTR de origen humano preferentes
Figure imgf000126_0001
Así, los 3'-UTR de los genes humanos del grupo consistente en NDUFS7-3'-UTR, PHGDH-3'-UTR, TSPO-3'-UTR, ATP5D-3'-UTR, EXOSC4-3'-UTR, TUBB4B-3'-UTR, TUBA4A-3'-UTR, EMP3-3'-UTR, CRIP2-3'-UTR, BRAT1-3'-UTR, PSMB3-3'-UTR, PSMB6-3'-UTR, SCAND1-3'-UTR, AMN-3'-UTR, CYBA-3'-UTR, PCOLCE-3'-UTR, MAP1S-3'-UTR, VTN-3'-UTR, ALDH16A1-3'-UTR se considera que contribuyen a una alta eficiencia de traducción.
También, los 3'-UTR reflejados por las SEQ ID NO: 152, SEQ ID NO: 153, SEQ ID NO: 154, SEQ ID NO: 155, SEQ ID NO: 156, SEQ ID NO: 157, SEQ ID NO: 158, SEQ ID NO: 159, SEQ ID NO: 160, SEQ ID NO: 161, SEQ ID NO: 164, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 168, SEQ ID NO: 169, SEQ ID NO: 170, SEQ ID NO: 171, SEQ ID NO: 172, SEQ ID NO: 173 se considera que contribuyen a una alta eficiencia de traducción.
Tabla 7: Elementos 5'-UTR de ratón preferentes
Figure imgf000126_0002
Figure imgf000127_0001
Así, los 5'-UTR de los genes de ratón del grupo consistente en Dpysl2-5'-UTR, Acox2-5'-UTR, Ubc-5'20 UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2 5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'-UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5'-UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5' UTR, Emr4-5'-UTR, Atp5d-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR se considera que contribuyen a la una alta eficiencia de traducción.
También, los 5'-UTR reflejados por las SEQ ID NO: 73, SEQ ID NO: 75, SEQ ID NO: 77, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 87, SEQ ID NO: 88, SEQ ID NO: 89, SEQ ID NO: 90, SEQ ID NO: 91, SEQ ID NO: 92, SEQ ID NO: 93, SEQ ID NO: 94, SEQ IID NO: 95, SEQ ID NO: 97, SEQ ID NO: 98, SEQ ID NO: 99, SEQ ID NO: 100, SEQ ID NO: 101, SEQ ID NO: 102, SEQ ID NO: 103, SEQ ID NO: 106, SEQ ID NO: 107, SEQ ID NO: 108, SEQ ID NO: 147 (o su equivalente de tipo natural SEQ ID NO: 109), SEQ ID NO: 148 (o su equivalente de tipo natural SEQ ID NO: 110), SEQ ID NO: 112, SEQ ID NO: 113, SEQ ID NO: 114, SEQ ID NO: 115, SEQ ID NO: 117, SEQ ID NO: 118, SEQ ID NO: 149 (o su equivalente de tipo natural SEQ ID NO: 119), SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 127, SEQ ID NO: 128, SEQ ID NO: 129, SEQ ID NO: 130, SEQ ID NO: 131, SEQ ID NO: 132, SEQ ID NO: 133, SEQ ID NO: 134, SEQ ID NO: 151 (o su equivalente de tipo natural SEQ ID NO: 136), SEQ ID NO: 96, SEQ ID NO: 111, SEQ ID NO: 150 (basada en SEQ ID NO: 120), SEQ ID NO: 121, SEQ ID NO: 124, SEQ ID NO: 125 se considera que contribuyen a la una alta eficiencia de traducción.
Tabla 8: Elementos 3'-UTR de ratón preferentes
Figure imgf000128_0001
Figure imgf000129_0001
Así, los 3'-UTR de los genes de ratón del grupo consistente en Acox2-3'-UTR, Ubc-3'-UTR, Slpi-3'-UTR, Igf2bp1-3'-UTR, Tmem37-3'-UTR, Slc7a3-3'-UTR, Cst6-3'-UTR, Ebp-3'-UTR, Sf3b5-3'-UTR, Cdca8-3'-UTR, Kif22-3'-UTR, Cad-3'-UTR, Pole-3'-UTR, Kif2c-3'-UTR, Scand1-3'-UTR, Gpr84-3'-UTR, Tpgs1-3'-UTR, Ccl17-3'-UTR, Alkbh7-3'-UTR, Ms4a8a-3'-UTR, Mrpl34-3'-UTR, Comtd1-3'-UTR, Armc6-3'-UTR, Atp5d-3'-UTR, 1110001J03Rik-3'-UTR, Nudt22-3'-UTR se considera que contribuyen a una alta eficiencia de traducción.
También, los 3'-UTR reflejados por las SEQ ID NO: 174, SEQ ID NO: 175, SEQ ID NO: 176, SEQ ID NO: 179, SEQ ID NO: 180, SEQ ID NO: 181, SEQ ID NO: 182, SEQ ID NO: 183, SEQ ID NO: 184, SEQ ID NO: 187, SEQ ID NO: 188, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 204 (o su equivalente de tipo natural SEQ ID NO: 192), SEQ ID NO: 193, SEQ ID NO: 194, SEQ ID NO: 195, SEQ ID NO: 196, SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 177 se considera que contribuyen a una alta eficiencia de traducción.

Claims (1)

  1. REIVINDICACIONES
    1. Una molécula de ácido nucleico artificial que comprende
    a. al menos un marco de lectura abierto (ORF); y
    b. al menos un elemento de región 3' no traducida (elemento 3'-UTR) que comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de secuencia de al menos un 90% con la secuencia de ácido nucleico de acuerdo con la SEQ ID NO: 164 o la correspondiente secuencia de ARN
    donde el al menos un marco de lectura abierto es heterólogo con el al menos un elemento 3'-UTR, donde dicha molécula de ácido nucleico artificial se caracteriza por una alta eficiencia de traducción, donde la eficiencia de traducción de la molécula de ácido nucleico artificial se compara con la eficiencia de traducción de una molécula de ácido nucleico de referencia
    donde la molécula de ácido nucleico de referencia es idéntica a la molécula de ácido nucleico artificial con la excepción del elemento 3'-UTR, donde el elemento 3'-UTR de la molécula de ácido nucleico de referencia tiene la secuencia de acuerdo con la SEQ ID NO: 207 o su secuencia de ARN correspondiente,
    donde la eficiencia de la traducción de la molécula de ácido nucleico de artificial y la eficiencia de traducción de la molécula de ácido nucleico de referencia se comparan por un método que comprende los pasos de:
    i. transfectar células de mamífero con la molécula de ácido nucleico artificial y medir las cantidades expresadas de la proteína codificada por el ORF de la molécula de ácido nucleico artificial en un determinado momento del tiempo después de la transfección,
    ii. transfectar células de mamífero con una molécula de ácido nucleico de referencia y medir las cantidades expresadas de la proteína codificada por el ORF de la molécula de ácido nucleico de referencia en el mismo momento del tiempo después de la transfección (24 y 48 horas),
    iii. calcular la relación entre la cantidad de proteína expresada a partir de la molécula de ácido nucleico artificial y la cantidad de proteína expresada a partir de la molécula de ácido nucleico de referencia,
    donde la relación calculada en (iii) es > 1.
    2. La molécula de ácido nucleico artificial según la reivindicación 1, que comprende al menos un elemento 5'-UTR.
    3. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 a 2, donde el al menos un elemento 3'-UTR y/o el al menos un elemento 5'-UTR aumenta la eficiencia de traducción de dicha molécula de ácido nucleico artificial en al menos 1,2 veces, preferentemente en al menos 1,5 veces, con mayor preferencia en al menos 2 veces, incluso con mayor preferencia en al menos 2,5 veces, en comparación con la producción de proteína a partir de una molécula de ácido nucleico de referencia que carece de un 3'-UTR y/o del al menos un 5'-UTR, respectivamente, y/o donde el al menos un elemento 3'-UTR y/o el al menos un elemento 5'-UTR proporciona una alta eficiencia de traducción a dicha molécula de ácido nucleico artificial de al menos 1,5 veces, preferentemente de al menos 2 veces, con mayor preferencia de al menos 2,5 veces, en comparación con la producción de proteína a partir de una molécula de ácido nucleico de referencia que carece de un 3'-UTR y/o del al menos un 5'-UTR, respectivamente.
    4. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 2 a 3, donde el al menos un elemento 5'-UTR comprende una secuencia de ácido nucleico que se deriva de la 5'-UTR de un transcripto de un gen seleccionado del grupo consistente en ZNF460-5'-UTR, TGM2-5'-UTR, IL7R-5'-UTR, BGN-5'-UTR, TK1-5'-UTR, RAB3B-5'-UTR, CBX6-5'-UTR, FZD2-5'-UTR, COL8A1 -5'-UTR, NDUFS7-5'-UTR, PHGDH-5'-UTR, PLK2-5'-UTR, TSPO-5'-UTR, PTGS1-5'-UTR, FBXO32-5'-UTR, NID2-5'-UTR, ATP5D-5'-UTR, EXOSC4-5'-UTR, NOL9-5'-UTR, UBB4B-5'-UTR, VPS18-5'-UTR, ORMDL2-5'-UTR, FSCN1-5'-UTR, TMEM33-5'-UTR, TUBA4A-5'-UTR, EMP3-5'-UTR, TMEM201-5'-UTR, CRIP2-5'-UTR, BRAT1-5'-UTR, SERPINH1-5'-UTR, CD9-5'-UTR, DPYSL2-5'-UTR, CDK9-5'- UTR, TFRC-5'-UTR, PSMB35'-UTR, FASN-5'-UTR, PSMB6-5'-UTR, PRSS56-5'-UTR, KPNA6-5'-UTR, SFT2D2-5'-UTR, PARD6B-5'-UTR, LPP-5'-UTR, SPARC-5'-UTR, SCAND1-5'-UTR, VASN-5'-UTR, SLC26A1-5'- UTR, LCLAT1-5'-UTR, FBXL18-5'-UTR, SLC35F6-5'-UTR, RAB3D-5'-UTR, MAP1B-5'-UTR, VMA21-5'-UTR, CY-BA-5'-UTR, SEZ6L2-5'-UTR, PCOLCE-5'-UTR, VTN-5'-UTR, ALDH16A1-5-UTR, RAVER1-5'-UTR, KPNA6-5'- UTR, SERINC5-5'-UTR, JUP-5'-UTR, CPN2-5'-UTR, CRIP2-5'-UTR, EPT1-5'-UTR, PNPO-5'-UTR, SSSCA1-5'-UTR, POLR2L-5'-UTR, LIN7C-5'-UTR, UQCR10-5'-UTR, PYCRL-5'-UTR, AMN-5'-UTR, MAP1S-5'-UTR (preferentemente todos humanos) y Dpysl2-5'-UTR, Ccnd1-5'-UTR, Acox2-5'-UTR, Cbx6-5'-UTR, Ubc-5'-UTR, Ldlr-5'-UTR, Nudt22-5'-UTR, Pcyox1l-5'-UTR, Ankrd1-5'-UTR, Tmem37-5'-UTR, Tspyl4-5'-UTR, Slc7a3-5'-UTR, Cst6-5'-UTR, Aacs-5'-UTR, Nosip-5'-UTR, Itga7-5'-UTR, Ccnd2-5'-UTR, Ebp-5'-UTR, Sf3b5-5'-UTR, Fasn-5'-UTR, Hmgcs1-5'- UTR, Osr1-5'-UTR, Lmnb1-5'-UTR, Vma21-5'-UTR, Kif20a-5'-UTR, Cdca8-5'-UTR, Slc7a1-5'-UTR, Ubqln2-5'-UTR, Prps2-5'-UTR, Shmt2-5'-UTR, Aurkb-5'-UTR, Fignl1-5'-UTR, Cad-5'-UTR, Anln-5'-UTR, Slfn9-5'-UTR, Ncaph-5' UTR, Pole-5'-UTR, Uhrf1-5'-UTR, Gja1-5'-UTR, Fam64a-5'-UTR, Kif2c-5'-UTR, Tspan10-5'-UTR, Scand1-5'-UTR, Gpr84-5'-UTR, Fads3-5'-UTR, Cers6-5'-UTR, Cxcr4-5'-UTR, Gprc5c-5'-UTR, Fen1-5'-UTR, Cspg4-5'-UTR, Mrpl34-5'-UTR, Comtd1-5'-UTR, Armc6-5'-UTR, Emr4-5'-UTR, Atp5d-5'-UTR, 1110001J03Rik-5'-UTR, Csf2ra-5'-UTR, Aarsd1-5'-UTR, Kif22-5'-UTR, Cth-5'-UTR, Tpgs1-5'-UTR, Ccl17-5'-UTR, Alkbh7-5'-UTR, Ms4a8a-5'-UTR (preferentemente todos de ratón).
    5. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 4, donde el al menos un elemento 3'-UTR comprende o consiste en una secuencia de acuerdo con la SEQ ID NO: 164 o la secuencia de ARN correspondiente.
    6. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 2 - 5, donde el al menos un elemento 5'-UTR comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de al menos un 50%, de manera preferente de al menos un 60%, de manera preferente de al menos un 70%, de manera más preferente de al menos un 80%, más preferentemente de al menos un 90%, de manera aún más preferente de al menos un 95%, incluso más preferentemente de al menos un 99% con una secuencia de ácido nucleico seleccionada del grupo consistente en las SEQ ID NO: 1 a 151 o la secuencia de ARN correspondiente o donde el al menos un elemento 5'-UTR comprende o consiste en un fragmento de una secuencia de ácido nucleico que tiene una identidad de al menos un 40%, de manera preferente de al menos un 50%, de manera preferente de al menos un 60%, de manera preferente de al menos un 70%, de manera más preferente de al menos un 80%, de manera más preferente de al menos un 90%, de manera aún más preferente de al menos un 95%, incluso con mayor preferencia de al menos un 99% con una secuencia de ácido nucleico seleccionada del grupo consistente en las SEQ ID NO: 1 a 151 o la secuencia de ARN correspondiente.
    7. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 6, que además comprende c. una secuencia poli(A) y/o una señal de poliadenilación, donde la secuencia poli(A) o la señal de poliadenilación se localiza preferentemente 3' del elemento 3'-UTR.
    8. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 7, que además comprende una estructura cap 5', una secuencia poli(C), un tallo-bucle de histona y/o un motivo IRES.
    9. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 8, donde el ácido nucleico comprende una 5'-TOP UTR.
    10. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 9, donde la molécula de ácido nucleico artificial, preferentemente el marco de lectura abierto, está modificado al menos parcialmente en G/C, preferentemente donde el contenido en G/C del marco de lectura abierto está incrementado en comparación con el marco de lectura abierto de tipo natural y/o donde el marco de lectura abierto comprende una región optimizada con codón, preferentemente donde el marco de lectura abierto está optimizado con codón.
    11. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 10, que es un ARN, preferentemente una molécula de ARNm.
    12. Un vector que comprende una molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 11.
    13. Una célula que comprende la molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 11 o el vector según la reivindicación 12.
    15. Una composición farmacéutica que comprende la molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 11, el vector según la reivindicación 12 o la célula según la reivindicación 13.
    16. La molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 11, el vector según la reivindicación 12, la célula de según la reivindicación 13 o la composición farmacéutica según la reivindicación 14 para el uso como una vacuna o para el uso en la terapia génica.
    17. Un método para incrementar la eficiencia de traducción de una molécula de ácido nucleico artificial, preferentemente una molécula de ARNm o un vector, comprendiendo el método el paso de asociar un marco de lectura abierto con un elemento 3'-UTR, donde el elemento 3'-UTR comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de secuencia de al menos un 90% con la secuencia de ácido nucleico de acuerdo con la SEQ ID NO: 164 o la correspondiente secuencia de ARN y el elemento 3'-UTR incrementa la eficiencia de traducción a partir de una molécula de ácido nucleico artificial resultante, para obtener una molécula de ácido nucleico artificial, preferentemente una molécula de ARNm, según cualquiera de las reivindicaciones 1 - 11 o un vector según la reivindicación 12.
    18. Uso in vitro de un elemento 3'-UTR para incrementar la eficiencia de traducción de una molécula de ácido nucleico artificial, preferentemente de una molécula de ARNm o un vector, donde el elemento 3'-UTR comprende o consiste en una secuencia de ácido nucleico que tiene una identidad de secuencia de al menos un 90% con la secuencia de ácido nucleico de acuerdo con la SEQ ID NO: 164 o la correspondiente secuencia de ARN.
    19. Un kit o kit de partes que comprende una molécula de ácido nucleico artificial según cualquiera de las reivindicaciones 1 - 11, un vector según la reivindicación 12, una célula según la reivindicación 13 y/o una composición farmacéutica según la reivindicación 14.
ES16759979T 2015-08-28 2016-08-22 Moléculas de ácido nucleico artificiales Active ES2924739T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP2015001755 2015-08-28
PCT/EP2016/001417 WO2017036580A1 (en) 2015-08-28 2016-08-22 Artificial nucleic acid molecules

Publications (1)

Publication Number Publication Date
ES2924739T3 true ES2924739T3 (es) 2022-10-10

Family

ID=54064264

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16759979T Active ES2924739T3 (es) 2015-08-28 2016-08-22 Moléculas de ácido nucleico artificiales

Country Status (13)

Country Link
US (1) US20180237786A1 (es)
EP (2) EP3341482B1 (es)
JP (2) JP7304155B2 (es)
KR (1) KR102645398B1 (es)
CN (2) CN108026537B (es)
AU (1) AU2016316439B2 (es)
BR (1) BR112018001995A2 (es)
CA (1) CA2992801A1 (es)
DK (1) DK3341482T3 (es)
ES (1) ES2924739T3 (es)
MX (1) MX2018001040A (es)
SG (1) SG10201913629VA (es)
WO (1) WO2017036580A1 (es)

Families Citing this family (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012116714A1 (en) 2011-03-02 2012-09-07 Curevac Gmbh Vaccination in elderly patients
WO2013120497A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
CN105073135A (zh) 2013-02-22 2015-11-18 库瑞瓦格有限责任公司 疫苗接种和抑制pd-1途径的组合
MX369469B (es) 2013-08-21 2019-11-08 Curevac Ag Vacuna contra el virus respiratorio sincitial.
IL298516A (en) 2014-06-25 2023-01-01 Acuitas Therapeutics Inc Novel lipids and lipid nanoparticle formulations for delivery of nucleic acids
EP3708668B1 (en) 2014-12-12 2022-07-27 CureVac AG Artificial nucleic acid molecules for improved protein expression
WO2016165825A1 (en) 2015-04-13 2016-10-20 Curevac Ag Method for producing rna compositions
SG11201707663SA (en) 2015-04-17 2017-11-29 Curevac Ag Lyophilization of rna
WO2016174271A1 (en) 2015-04-30 2016-11-03 Curevac Ag Immobilized poly(n)polymerase
EP3294885B1 (en) 2015-05-08 2020-07-01 CureVac Real Estate GmbH Method for producing rna
WO2016184822A1 (en) 2015-05-15 2016-11-24 Curevac Ag Prime-boost regimens involving administration of at least one mrna construct
EP3928800A3 (en) 2015-05-20 2022-03-23 CureVac AG Dry powder composition comprising long-chain rna
EP3298142B1 (en) 2015-05-20 2021-07-14 CureVac AG Dry powder composition comprising long-chain rna
EP3303575B1 (en) 2015-05-29 2022-03-16 CureVac AG Method for adding cap structures to rna using immobilized enzymes
DE202016009003U1 (de) 2015-05-29 2021-05-28 Curevac Real Estate Gmbh Zusammensetzung umfassend in vitro transkribierte RNA erhältlich durch ein Verfahren zur Herstellung und Reinigung von RNA mit mindestens einem Schritt mit einer tangentialen Flussfiltration
IL283545B2 (en) 2015-06-29 2023-09-01 Acuitas Therapeutics Inc Lipids and nanoparticulate lipid formulations for delivery of nucleic acids
US10501768B2 (en) 2015-07-13 2019-12-10 Curevac Ag Method of producing RNA from circular DNA and corresponding template DNA
WO2017064146A1 (en) 2015-10-12 2017-04-20 Curevac Ag Automated method for isolation, selection and/or detection of microorganisms or cells comprised in a solution
CA3003055C (en) 2015-10-28 2023-08-01 Acuitas Therapeutics, Inc. Lipids and lipid nanoparticle formulations for delivery of nucleic acids
US11413346B2 (en) 2015-11-09 2022-08-16 Curevac Ag Rotavirus vaccines
EP3701963A1 (en) 2015-12-22 2020-09-02 CureVac AG Method for producing rna molecule compositions
US11248223B2 (en) 2015-12-23 2022-02-15 Curevac Ag Method of RNA in vitro transcription using a buffer containing a dicarboxylic acid or tricarboxylic acid or a salt thereof
SG10201913630YA (en) 2016-02-17 2020-03-30 Curevac Ag Zika virus vaccine
EP3423595A1 (en) 2016-03-03 2019-01-09 CureVac AG Rna analysis by total hydrolysis
EP3448427A1 (en) 2016-04-29 2019-03-06 CureVac AG Rna encoding an antibody
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
US11141474B2 (en) 2016-05-04 2021-10-12 Curevac Ag Artificial nucleic acid molecules encoding a norovirus antigen and uses thereof
KR20190029576A (ko) 2016-06-09 2019-03-20 큐어백 아게 핵산 카고용 하이브리드 담체
US20190185859A1 (en) 2016-08-19 2019-06-20 Curevac Ag Rna for cancer therapy
US11279923B2 (en) 2016-11-28 2022-03-22 Curevac Ag Method for purifying RNA
US11542490B2 (en) 2016-12-08 2023-01-03 CureVac SE RNAs for wound healing
JP2020501545A (ja) 2016-12-08 2020-01-23 キュアバック アーゲー 肝疾患の処置または予防のためのrna
EP3558354A1 (en) 2016-12-23 2019-10-30 CureVac AG Lassa virus vaccine
EP3558356A2 (en) 2016-12-23 2019-10-30 CureVac AG Mers coronavirus vaccine
US11524066B2 (en) 2016-12-23 2022-12-13 CureVac SE Henipavirus vaccine
EP3595715A1 (en) 2017-03-17 2020-01-22 CureVac AG Rna vaccine and immune checkpoint inhibitors for combined anticancer therapy
EP3601576A1 (en) * 2017-03-24 2020-02-05 CureVac AG Nucleic acids encoding crispr-associated proteins and uses thereof
US11357856B2 (en) 2017-04-13 2022-06-14 Acuitas Therapeutics, Inc. Lipids for delivery of active agents
EP3618859A4 (en) 2017-04-27 2021-05-05 Vanderbilt University HEPATITIS C VIRUS SEQUENCES AND METHODS OF USING THEREFORE
JP7297676B2 (ja) 2017-04-28 2023-06-26 アクイタス セラピューティクス インコーポレイテッド 新規なカルボニル脂質、および核酸を送達するための脂質ナノ粒子製剤
CA3073020A1 (en) 2017-08-16 2019-02-21 Acuitas Therapeutics, Inc. Lipids for use in lipid nanoparticle formulations
US11524932B2 (en) 2017-08-17 2022-12-13 Acuitas Therapeutics, Inc. Lipids for use in lipid nanoparticle formulations
US11542225B2 (en) 2017-08-17 2023-01-03 Acuitas Therapeutics, Inc. Lipids for use in lipid nanoparticle formulations
CA3073018A1 (en) 2017-08-17 2019-02-21 Acuitas Therapeutics, Inc. Lipids for use in lipid nanoparticle formulations
EP3673069A1 (en) 2017-08-22 2020-07-01 CureVac AG Bunyavirales vaccine
AU2018351481A1 (en) * 2017-10-19 2020-03-12 CureVac SE Novel artificial nucleic acid molecules
WO2019092153A1 (en) 2017-11-08 2019-05-16 Curevac Ag Rna sequence adaptation
WO2019115635A1 (en) 2017-12-13 2019-06-20 Curevac Ag Flavivirus vaccine
SG11202005760PA (en) 2017-12-21 2020-07-29 Curevac Ag Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna
EP3773702A2 (en) 2018-04-05 2021-02-17 CureVac AG Novel yellow fever nucleic acid molecules for vaccination
CA3091558A1 (en) * 2018-04-17 2019-10-24 Curevac Ag Novel rsv rna molecules and compositions for vaccination
WO2020002525A1 (en) 2018-06-27 2020-01-02 Curevac Ag Novel lassa virus rna molecules and compositions for vaccination
BR112021009422A2 (pt) 2018-12-21 2021-10-26 Curevac Ag Rna para vacinas contra malária
EP3920950A1 (en) 2019-02-08 2021-12-15 CureVac AG Coding rna administered into the suprachoroidal space in the treatment of ophtalmic diseases
WO2020254535A1 (en) 2019-06-18 2020-12-24 Curevac Ag Rotavirus mrna vaccine
AU2020328855A1 (en) 2019-08-14 2022-03-03 CureVac SE RNA combinations and compositions with decreased immunostimulatory properties
CN110812366B (zh) * 2019-11-18 2023-11-17 珠海丽凡达生物技术有限公司 一种可用于激素补充的mRNA药物及其制备方法
DE202021003575U1 (de) 2020-02-04 2022-01-17 Curevac Ag Coronavirus-Vakzine
US20240277830A1 (en) 2020-02-04 2024-08-22 CureVac SE Coronavirus vaccine
US11241493B2 (en) 2020-02-04 2022-02-08 Curevac Ag Coronavirus vaccine
CN111494631B (zh) * 2020-04-27 2022-10-18 北京大学人民医院 一种原发性免疫性血小板减少症miRNA标记物及其应用
AU2021279312A1 (en) 2020-05-29 2022-12-15 CureVac SE Nucleic acid based combination vaccines
BR112023000327A2 (pt) 2020-07-16 2023-01-31 Acuitas Therapeutics Inc Lipídeos catiônicos para o uso em nanopartículas lipídicas
EP4172194A1 (en) 2020-07-31 2023-05-03 CureVac SE Nucleic acid encoded antibody mixtures
CA3170743A1 (en) 2020-08-31 2022-03-03 Susanne RAUCH Multivalent nucleic acid based coronavirus vaccines
WO2022135993A2 (en) 2020-12-22 2022-06-30 Curevac Ag Pharmaceutical composition comprising lipid-based carriers encapsulating rna for multidose administration
WO2022137133A1 (en) 2020-12-22 2022-06-30 Curevac Ag Rna vaccine against sars-cov-2 variants
CA3205569A1 (en) 2020-12-22 2022-06-30 CureVac SE Rna vaccine against sars-cov-2 variants
CA3170747A1 (en) 2021-01-27 2022-08-04 Moritz THRAN Method of reducing the immunostimulatory properties of in vitro transcribed rna
MX2023011400A (es) 2021-03-26 2023-10-09 Glaxosmithkline Biologicals Sa Composiciones inmunogenicas.
WO2022207862A2 (en) 2021-03-31 2022-10-06 Curevac Ag Syringes containing pharmaceutical compositions comprising rna
WO2022233880A1 (en) 2021-05-03 2022-11-10 Curevac Ag Improved nucleic acid sequence for cell type specific expression
CA3221100A1 (en) 2021-06-04 2022-12-08 Frank Derosa Assay for quantitative assessment of mrna capping efficiency
CA3223855A1 (en) * 2021-06-24 2022-12-29 Seung Su Han Non-natural 5?-untranslated region and 3?-untranslated region and use thereof
JP2024526870A (ja) * 2021-07-27 2024-07-19 エスケー バイオサイエンス カンパニー リミテッド タンパク質発現のためのmRNA、及びそのためのテンプレート
CN117999355A (zh) 2021-08-24 2024-05-07 生物技术欧洲股份公司 体外转录技术
CN115404238A (zh) * 2021-12-22 2022-11-29 江苏拓弘康恒医药有限公司 高翻译稳定性BDNF mRNA的设计和制备方法
WO2023144330A1 (en) 2022-01-28 2023-08-03 CureVac SE Nucleic acid encoded transcription factor inhibitors
CN114540307A (zh) * 2022-02-16 2022-05-27 多莱泌生物科技(武汉)有限公司 一种靶向肝脏的工程化外泌体制备方法
WO2023227608A1 (en) 2022-05-25 2023-11-30 Glaxosmithkline Biologicals Sa Nucleic acid based vaccine encoding an escherichia coli fimh antigenic polypeptide
WO2024068545A1 (en) 2022-09-26 2024-04-04 Glaxosmithkline Biologicals Sa Influenza virus vaccines
WO2024083345A1 (en) 2022-10-21 2024-04-25 BioNTech SE Methods and uses associated with liquid compositions
DE202023106198U1 (de) 2022-10-28 2024-03-21 CureVac SE Impfstoff auf Nukleinsäurebasis
WO2024098361A1 (zh) * 2022-11-11 2024-05-16 斯微(上海)生物科技股份有限公司 人工核酸分子
WO2024098360A1 (zh) * 2022-11-11 2024-05-16 斯微(上海)生物科技股份有限公司 人工核酸分子
WO2024160936A1 (en) 2023-02-03 2024-08-08 Glaxosmithkline Biologicals Sa Rna formulation
GB202302092D0 (en) 2023-02-14 2023-03-29 Glaxosmithkline Biologicals Sa Analytical method
CN117487809B (zh) * 2023-12-29 2024-03-19 艾斯拓康医药科技(北京)有限公司 一种优化的5`utr序列及其应用
CN117535295B (zh) * 2024-01-09 2024-04-26 艾斯拓康医药科技(北京)有限公司 一种优化的3`utr序列及其应用
GB202404607D0 (en) 2024-03-29 2024-05-15 Glaxosmithkline Biologicals Sa RNA formulation

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5132418A (en) 1980-02-29 1992-07-21 University Patents, Inc. Process for preparing polynucleotides
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4500707A (en) 1980-02-29 1985-02-19 University Patents, Inc. Nucleosides useful in the preparation of polynucleotides
US4668777A (en) 1981-03-27 1987-05-26 University Patents, Inc. Phosphoramidite nucleoside compounds
US4973679A (en) 1981-03-27 1990-11-27 University Patents, Inc. Process for oligonucleo tide synthesis using phosphormidite intermediates
US4415732A (en) 1981-03-27 1983-11-15 University Patents, Inc. Phosphoramidite compounds and processes
US4373071A (en) 1981-04-30 1983-02-08 City Of Hope Research Institute Solid-phase synthesis of polynucleotides
US4401796A (en) 1981-04-30 1983-08-30 City Of Hope Research Institute Solid-phase synthesis of polynucleotides
US5153319A (en) 1986-03-31 1992-10-06 University Patents, Inc. Process for preparing polynucleotides
US5262530A (en) 1988-12-21 1993-11-16 Applied Biosystems, Inc. Automated system for polynucleotide synthesis and purification
US5047524A (en) 1988-12-21 1991-09-10 Applied Biosystems, Inc. Automated system for polynucleotide synthesis and purification
US5700642A (en) 1995-05-22 1997-12-23 Sri International Oligonucleotide sizing using immobilized cleavable primers
US6436703B1 (en) * 2000-03-31 2002-08-20 Hyseq, Inc. Nucleic acids and polypeptides
ATE291925T1 (de) * 2001-06-05 2005-04-15 Curevac Gmbh Stabilisierte mrna mit erhöhtem g/c-gehalt und optimierter codon usage für die gentherapie
WO2008112127A2 (en) * 2007-03-08 2008-09-18 Switchgear Genomics Functional arrays for high throughput characterization of regulatory elements in untranslated regions of genes
WO2009030254A1 (en) 2007-09-04 2009-03-12 Curevac Gmbh Complexes of rna and cationic peptides for transfection and for immunostimulation
WO2010037408A1 (en) 2008-09-30 2010-04-08 Curevac Gmbh Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof
US20110053829A1 (en) 2009-09-03 2011-03-03 Curevac Gmbh Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids
KR101761388B1 (ko) 2010-07-30 2017-07-25 큐어백 아게 트랜스펙션 및 면역 자극을 위한 이황화-크로스링크된 양이온 성분 및 핵산의 복합체
WO2012019630A1 (en) * 2010-08-13 2012-02-16 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded protein
SG10201607968WA (en) * 2012-03-27 2016-12-29 Curevac Ag Artificial nucleic acid molecules for improved protein or peptide expression
CN104220599A (zh) * 2012-03-27 2014-12-17 库瑞瓦格有限责任公司 人工核酸分子
MX358706B (es) 2012-03-27 2018-08-31 Curevac Ag Moleculas de acido nucleico artificiales que comprenden un top 5´utr.
US8999380B2 (en) * 2012-04-02 2015-04-07 Moderna Therapeutics, Inc. Modified polynucleotides for the production of biologics and proteins associated with human disease
EP2964234A4 (en) 2013-03-09 2016-12-07 Moderna Therapeutics Inc NON-TRANSLATED HETEROLOGOUS REGIONS FOR MRNA
WO2015024667A1 (en) * 2013-08-21 2015-02-26 Curevac Gmbh Method for increasing expression of rna-encoded proteins
SG10201903381TA (en) 2013-12-30 2019-05-30 Curevac Ag Artificial nucleic acid molecules
WO2015101416A1 (en) 2013-12-30 2015-07-09 Curevac Gmbh Methods for rna analysis
CA2927254C (en) 2013-12-30 2023-10-24 Curevac Ag Artificial nucleic acid molecules
EP3494982A1 (en) * 2014-12-30 2019-06-12 CureVac AG Artificial nucleic acid molecules

Also Published As

Publication number Publication date
CN108026537B (zh) 2022-02-08
RU2018110872A (ru) 2019-10-01
SG10201913629VA (en) 2020-03-30
CN108026537A (zh) 2018-05-11
JP7304155B2 (ja) 2023-07-06
KR102645398B1 (ko) 2024-03-07
CN114381470A (zh) 2022-04-22
AU2016316439A1 (en) 2018-02-08
US20180237786A1 (en) 2018-08-23
JP7245878B2 (ja) 2023-03-24
EP4108774A1 (en) 2022-12-28
EP3341482A1 (en) 2018-07-04
KR20180038564A (ko) 2018-04-16
EP3341482B1 (en) 2022-07-06
AU2016316439B2 (en) 2022-02-24
DK3341482T3 (da) 2022-08-15
MX2018001040A (es) 2018-06-15
JP2021192613A (ja) 2021-12-23
BR112018001995A2 (pt) 2018-09-18
RU2018110872A3 (es) 2020-07-24
WO2017036580A1 (en) 2017-03-09
JP2018529329A (ja) 2018-10-11
CA2992801A1 (en) 2017-03-09

Similar Documents

Publication Publication Date Title
ES2924739T3 (es) Moléculas de ácido nucleico artificiales
US11761009B2 (en) Artificial nucleic acid molecules for improved protein expression
US20230399649A1 (en) Artificial nucleic acid molecules
US20220136001A1 (en) Artificial nucleic acid molecules
AU2014375402A1 (en) Artificial nucleic acid molecules
EP3495486B1 (en) Artificial nucleic acid molecules
RU2772349C2 (ru) Искусственные молекулы нуклеиновой кислоты
EP3090052B1 (en) Artificial nucleic acid molecules