BR122024013538A2 - DNA MOLECULE, VECTOR, HOST CELL, COMPOSITION, RNA MOLECULE, NUCLEIC ACID MOLECULE, PHARMACEUTICAL COMPOSITION, KIT, AND, USE OF A UTR - Google Patents

DNA MOLECULE, VECTOR, HOST CELL, COMPOSITION, RNA MOLECULE, NUCLEIC ACID MOLECULE, PHARMACEUTICAL COMPOSITION, KIT, AND, USE OF A UTR Download PDF

Info

Publication number
BR122024013538A2
BR122024013538A2 BR122024013538-8A BR122024013538A BR122024013538A2 BR 122024013538 A2 BR122024013538 A2 BR 122024013538A2 BR 122024013538 A BR122024013538 A BR 122024013538A BR 122024013538 A2 BR122024013538 A2 BR 122024013538A2
Authority
BR
Brazil
Prior art keywords
rna
sequence
molecule
seq
dna
Prior art date
Application number
BR122024013538-8A
Other languages
Portuguese (pt)
Inventor
Christian Plank
Carsten Rudolph
Manish Kumar Aneja
Ludwig Weiss
Original Assignee
ethris GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ethris GmbH filed Critical ethris GmbH
Publication of BR122024013538A2 publication Critical patent/BR122024013538A2/en

Links

Abstract

MOLÉCULA DE DNA, VETOR, CÉLULA HOSPEDEIRA, COMPOSIÇÃO, MOLÉCULA DE RNA, MOLÉCULA DE ÁCIDO NUCLEICO, COMPOSIÇÃO FARMACÊUTICA, KIT, E, USO DE UMA UTR Trata-se de moléculas de DNA que podem ser transcritas em um mRNA que abriga sequências de UTR inovadoras que combinam as vantagens de serem extremamente curtas e, ao mesmo tempo, permitirem altas eficiências de tradução de moléculas de RNA que contêm as mesmas. Além disso, são descritos vetores que compreendem tal molécula de DNA e células hospedeiras que compreendem tal vetor. Ademais, são descritas moléculas de RNA correspondentes contendo tais UTRs. Além disso, é descrita uma composição farmacêutica que compreende a molécula de RNA descrita e, opcionalmente, um carreador farmaceuticamente aceitável, bem como o uso das UTRs descritas para traduzir uma região de codificação de uma molécula de RNA em um polipeptídeo ou uma proteína codificada pela dita região de codificação.DNA MOLECULE, VECTOR, HOST CELL, COMPOSITION, RNA MOLECULE, NUCLEIC ACID MOLECULE, PHARMACEUTICAL COMPOSITION, KIT, AND, USE OF A UTR These are DNA molecules that can be transcribed into an mRNA that harbors innovative UTR sequences that combine the advantages of being extremely short and, at the same time, allowing high translation efficiencies of RNA molecules containing them. In addition, vectors comprising such a DNA molecule and host cells comprising such a vector are described. In addition, corresponding RNA molecules containing such UTRs are described. In addition, a pharmaceutical composition comprising the described RNA molecule and, optionally, a pharmaceutically acceptable carrier is described, as well as the use of the described UTRs to translate a coding region of an RNA molecule into a polypeptide or a protein encoded by said coding region.

Description

[001] A presente invenção refere-se a moléculas de DNA que podem ser transcritas em um mRNA que abriga sequências de UTR inovadoras que combinam as vantagens de serem extremamente curtas e, ao mesmo tempo, permitem alta eficiências de tradução de moléculas de RNA que as contêm. Além disso, a presente invenção se refere a vetores que compreendem tal molécula de DNA e a células hospedeiras que compreendem tal vetor. Ademais, a presente invenção se refere a moléculas de RNA correspondentes que contêm tais UTRs. Além disso, a presente invenção se refere a uma composição farmacêutica que compreende a molécula de RNA descrita e, opcionalmente, um carreador farmaceuticamente aceitável bem como ao uso das UTRs descritas para traduzir uma região de codificação de uma molécula de RNA em um polipeptídeo ou uma proteína codificada pela dita região de codificação.[001] The present invention relates to DNA molecules that can be transcribed into an mRNA harboring novel UTR sequences that combine the advantages of being extremely short and, at the same time, allowing high translation efficiencies of RNA molecules containing them. Furthermore, the present invention relates to vectors comprising such a DNA molecule and to host cells comprising such a vector. Furthermore, the present invention relates to corresponding RNA molecules containing such UTRs. Furthermore, the present invention relates to a pharmaceutical composition comprising the described RNA molecule and, optionally, a pharmaceutically acceptable carrier as well as to the use of the described UTRs to translate a coding region of an RNA molecule into a polypeptide or a protein encoded by said coding region.

[002] Nos últimos anos, o RNA mensageiro (mRNA) tornou-se cada vez mais relevante como uma nova entidade farmacológica. Ao contrário da terapêutica genética baseada em DNA, o mRNA não precisa ser transportado para o núcleo, mas é diretamente traduzido em proteína no citoplasma (J Control Release, 2011, 150:238 a 247, e Eur J Pharm Biopharm, 2009, 71:484 a 489). Isso torna o mRNA mais seguro para evitar mutagênese insercional em potencial, um risco improvável, porém existente, de medicamentos de gene de DNA. Como consequência, estão surgindo terapêuticas de mRNA como alternativas promissoras para terapias de substituição de genes e de proteínas em uma ampla variedade de indicações médicas (J Control Release, 2011, 150:238 a 247; Eur J Pharm Biopharm, 2009, 71:484 a 489; Nat Biotech, 2011, 29:154 a 157, e Nat Rev Genet, 2011, 12:861 a 874). Entretanto, a forte imunogenicidade, bem como a estabilidade limitada de mRNA convencional, precisam ser superadas para estabelecer ainda mais sua aplicabilidade clínica. Nesse aspecto, a estabilidade do mRNA e, em particular, a taxa de tradução do mRMA é um parâmetro essencial para aplicações médicas previstas devido ao fato de que determina, por exemplo, a dosagem e os intervalos de dosagem de fármacos de mRNA.[002] In recent years, messenger RNA (mRNA) has become increasingly relevant as a new pharmacological entity. Unlike DNA-based gene therapeutics, mRNA does not need to be transported to the nucleus but is directly translated into protein in the cytoplasm (J Control Release, 2011, 150:238–247, and Eur J Pharm Biopharm, 2009, 71:484–489). This makes mRNA safer to avoid potential insertional mutagenesis, an unlikely but existing risk of DNA gene drugs. As a consequence, mRNA therapeutics are emerging as promising alternatives to gene and protein replacement therapies in a wide variety of medical indications (J Control Release, 2011, 150:238–247; Eur J Pharm Biopharm, 2009, 71:484–489; Nat Biotech, 2011, 29:154–157; and Nat Rev Genet, 2011, 12:861–874). However, the strong immunogenicity as well as the limited stability of conventional mRNA need to be overcome to further establish their clinical applicability. In this regard, mRNA stability and in particular the translation rate of mRNA is a key parameter for anticipated medical applications because it determines, for example, the dosage and dosing intervals of mRNA drugs.

[003] Várias estratégias têm se mostrado bem-sucedidas tanto no aumento da estabilidade quanto na redução da resposta imunogênica desencadeada por mRNA administrado a células ou organismos. Entre as mesmas se encontra a inclusão de nucleotídeos quimicamente modificados; Current Opinion in Drug Discovery and Development, 2007, 10:523. Kormann et al. demonstrou que a substituição de apenas 25% de resíduos de uridina e citidina por 2-tiouridina e 5-metilcitidina é suficiente para aumentar a estabilidade de mRNA, bem como para reduzir a ativação da imunidade inata desencadeada por mRNA externamente administrado in vitro (WO2012/0195936 A1; WO2007024708 A2).[003] Several strategies have proven successful in both increasing stability and reducing the immunogenic response triggered by mRNA administered to cells or organisms. Among these is the inclusion of chemically modified nucleotides; Current Opinion in Drug Discovery and Development, 2007, 10:523. Kormann et al. demonstrated that replacing only 25% of uridine and cytidine residues with 2-thiouridine and 5-methylcytidine is sufficient to increase mRNA stability as well as to reduce the activation of innate immunity triggered by externally administered mRNA in vitro (WO2012/0195936 A1; WO2007024708 A2).

[004] Além disso, relatou-se que regiões não traduzidas (UTRs) em mRNAs desempenham um papel fundamental na regulação tanto da estabilidade de mRNA quanto na tradução mRNA. Sabe-se que as UTRs influenciam a iniciação, o alongamento e a terminação da tradução, bem como a estabilização de mRNA e a localização intracelular por meio de sua interação com proteínas de ligação ao RNA (Briefings in Bioinformatics, 2000, 1:236 a 249 e Cold Spring Harbor Monograph Archive, 2007, 48:87 a 128). Dependendo dos motivos específicos na UTR, isso pode ou acentuar ou diminuir a renovação de mRNA (Cell. Mol. Life Sci., 2012, 69:3.613 a 3.634; Nucleic Acids Research, 2005, 33:D141-D146; Science, 2005, 309:1.514 a 1.518 e Current Protein & Peptide Science, 2012, 13:294 a 304). Recentemente, foram publicados os dados sobre as meias-vidas de mRNA e as sequências de UTR correspondentes (Nucleic Acids Research, 2011, 39:556 a 566 e Nucleic acids research, 37, e115).[004] Furthermore, untranslated regions (UTRs) in mRNAs have been reported to play a key role in regulating both mRNA stability and mRNA translation. UTRs are known to influence translation initiation, elongation, and termination, as well as mRNA stabilization and intracellular localization through their interaction with RNA-binding proteins (Briefings in Bioinformatics, 2000, 1:236–249 and Cold Spring Harbor Monograph Archive, 2007, 48:87–128). Depending on the specific motifs in the UTR, this can either enhance or decrease mRNA turnover (Cell. Mol. Life Sci., 2012, 69:3613–3634; Nucleic Acids Research, 2005, 33:D141–D146; Science, 2005, 309:1514–1518 and Current Protein & Peptide Science, 2012, 13:294–304). Recently, data on mRNA half-lives and corresponding UTR sequences have been published (Nucleic Acids Research, 2011, 39:556–566 and Nucleic acids research, 37, e115).

[005] As UTRs são seções de uma molécula de mRNA a montante do códon inicial e a jusante do códon de parada de um mRNA, isto é, sequências que não são traduzidas. Essas regiões são transcritas com a região de codificação e, dessa forma, são exônicas visto que estão presentes no mRNA maduro. A UTR a montante do códon inicial de um mRNA é chamada de 5’ UTR e, uma vez transcrita, abriga, inter alia, sequências que correspondem a partes (3’ residuais) do promotor bem como uma sequência assim chamada Kozak.[005] UTRs are sections of an mRNA molecule upstream of the start codon and downstream of the stop codon of an mRNA, i.e. sequences that are not translated. These regions are transcribed with the coding region and are thus exonic since they are present in the mature mRNA. The UTR upstream of the start codon of an mRNA is called the 5' UTR and, once transcribed, houses, inter alia, sequences corresponding to parts (3' residuals) of the promoter as well as a so-called Kozak sequence.

[006] A sequência consenso Kozak, consenso Kozak ou sequência Kozak, é uma sequência que é conhecida por ocorrer em mRNA eucariótico e tem a consenso (gcc)gccRccAUGG. A sequência consenso Kozak desempenha um papel principal na iniciação do processo de tradução. A sequência recebeu o nome da pessoa que trouxe a mesma à proeminência, Marilyn Kozak. Essa sequência em uma molécula de mRNA é reconhecida pelo ribossoma no sítio de partida translacional, do qual uma proteína é codificada por aquela molécula de mRNA. O ribossoma exige essa sequência, ou uma possível variação da mesma, para iniciar a tradução. A sequência é identificada pela notação (gcc)gccRccAUGG, que sumariza dados analisados por Kozak a partir de uma ampla variedade de fontes (cerca de 699 no total) da seguinte forma: uma letra em caixa baixa denota a base mais comum em uma posição onde a base pode, no entanto, variar; letras em caixa alta indicam bases altamente conservadas, isto é, a sequência “AUGG” é constante ou raramente, se ocorrer, muda, “R” que indica que uma purina (adenina ou guanina) é sempre observada nessa posição (com adenina sendo reivindicada por Kozak como mais frequente); e a sequência entre parênteses ((gcc)) é de significância incerta.[006] The Kozak consensus sequence, Kozak consensus or Kozak sequence, is a sequence that is known to occur in eukaryotic mRNA and has the consensus (gcc)gccRccAUGG. The Kozak consensus sequence plays a key role in the initiation of the translation process. The sequence is named after the person who brought it to prominence, Marilyn Kozak. This sequence on an mRNA molecule is recognized by the ribosome at the translational start site from which a protein is encoded by that mRNA molecule. The ribosome requires this sequence, or a possible variation thereof, to initiate translation. The sequence is identified by the notation (gcc)gccRccAUGG, which summarizes data analyzed by Kozak from a wide variety of sources (about 699 in total) as follows: a lowercase letter denotes the most common base at a position where the base may nevertheless vary; capital letters indicate highly conserved bases, i.e. the sequence “AUGG” is constant or rarely, if ever, changes, “R” indicating that a purine (adenine or guanine) is always observed at that position (with adenine being claimed by Kozak to be more frequent); and the sequence in parentheses ((gcc)) is of uncertain significance.

[007] A sequência consenso Kozak foi originalmente definida como ACCAUGG devido a uma análise de mutações de ponto ao redor do códon de iniciação (AUG, em que A define, neste contexto, a posição +1) na tradução do gene preproinsulina. A mutagênese mais detalhada de 699 mRNAs de vertebrados resultou na sequência consenso GCCGCCACCAUGG, em que o A a montante do códon inicial de AUG na posição -3 também pode ser um G (Nucleic Acids Res., 1987, 15 (20):8.125 a 8.148). Estudos sobre a tradução de preproinsulina e alfa-globina em células eucarióticas revelaram que uma purina (geralmente A) na posição -3 é essencial para a iniciação de tradução eficiente e, se essa purina estiver ausente, um G na posição + 4 é essencial (J. Cell Biol., 1989, 108:229 a 41). A quantidade de proteína sintetizada de uma molécula de mRNA depende fortemente da sequência do elemento de Kozak: o códon inicial de AUG, que codifica a metionina N-terminal da proteína, é o mais importante. Para um forte consenso, os nucleotídeos nas posições +4 (G) e -3 (A ou G) devem coincidir com a consenso. Um consenso adequado tem apenas um desses dois sítios, enquanto uma sequência consenso fraca não cumpre os requisitos nas posições +4 e -3. Os dois resíduos de citidina em -1 e -2 não são muito conservados (Cell, 1986, 44 (2):283 a 92), enquanto que o G na posição -6 é importante para a iniciação de tradução. (Br. J. Haematol., 2004, 124 (2):224 a 31).[007] The Kozak consensus sequence was originally defined as ACCAUGG due to an analysis of point mutations around the initiation codon (AUG, where A defines, in this context, position +1) in the translation of the preproinsulin gene. More detailed mutagenesis of 699 vertebrate mRNAs resulted in the consensus sequence GCCGCCACCAUGG, in which the A upstream of the AUG start codon at position -3 can also be a G (Nucleic Acids Res., 1987, 15 (20):8,125 to 8,148). Studies on the translation of preproinsulin and alpha-globin in eukaryotic cells revealed that a purine (usually A) at position -3 is essential for efficient translation initiation and, if this purine is absent, a G at position +4 is essential (J. Cell Biol., 1989, 108:229 to 41). The amount of protein synthesized from an mRNA molecule depends strongly on the sequence of the Kozak element: the start codon AUG, which encodes the N-terminal methionine of the protein, is the most important. For a strong consensus, the nucleotides at positions +4 (G) and -3 (A or G) must match the consensus. A good consensus has only one of these two sites, while a weak consensus sequence does not meet the requirements at positions +4 and -3. The two cytidine residues at -1 and -2 are not very conserved (Cell, 1986, 44 (2): 283–92), while the G at position -6 is important for translation initiation (Br. J. Haematol., 2004, 124 (2): 224–31).

[008] Embora, na técnica anterior, já existam meios e métodos descritos para aumentar a estabilidade de mRNA, reduzir a resposta imunogênica desencadeada por mRNA administrado a células ou organismos e aumentar a eficiência de expressão (isto é, a eficiência de transcrição e/ou tradução), ainda existe necessidade de melhorias, em particular, no que diz respeito a meios adicionais ou alternativos para aumentar a eficiência da expressão (isto é, a eficiência da transcrição e/ou tradução) uma vez que a eficiência da expressão um parâmetro essencial para aplicações médicas previstas devido ao fato de que determina, por exemplo, a dosagem e os intervalos de dosagem dos fármacos de mRNA e, por fim, determina a biodisponibilidade do produto final, isto é, o peptídeo ou proteína codificada. Ao mesmo tempo, há uma necessidade constante de diminuir ainda mais os custos para a produção de fármacos de mRNA, aumentando o rendimento das moléculas de mRNA produzidas e aumentando o espaço disponível na molécula de mRNA produzida para o transgene real, isto é, para a região de codificação que codifica um polipeptídeo desejado.[008] Although, in the prior art, there are already means and methods described to increase mRNA stability, reduce the immunogenic response triggered by mRNA administered to cells or organisms and increase expression efficiency (i.e. transcription and/or translation efficiency), there is still a need for improvements, in particular, with regard to additional or alternative means to increase expression efficiency (i.e. transcription and/or translation efficiency) since expression efficiency is an essential parameter for anticipated medical applications due to the fact that it determines, for example, the dosage and dosage intervals of mRNA drugs and, ultimately, determines the bioavailability of the final product, i.e. the encoded peptide or protein. At the same time, there is a constant need to further decrease the costs for the production of mRNA drugs, increasing the yield of the mRNA molecules produced and increasing the space available in the mRNA molecule produced for the actual transgene, i.e. for the coding region encoding a desired polypeptide.

[009] O presente pedido aborda essa necessidade por meio do fornecimento das modalidades como definido nas reivindicações.[009] The present application addresses this need by providing the embodiments as defined in the claims.

[0010] Em particular, o presente pedido surpreendentemente constatou que é possível reduzir o tamanho da sequência de UTR para uma sequência de “UTR mínima”, diminuindo assim os custos para a produção de fármacos de mRNA, aumentando o rendimento das moléculas de mRNA produzidas e aumentando o espaço disponível na molécula de mRNA produzida para o transgene real, isto é, para a região de codificação que codifica para um polipeptídeo desejado. Ademais, ao mesmo tempo, essa sequência de UTR mínima surpreendentemente mantém ou mesmo melhora a taxa de expressão em sequências de UTR convencionais enquanto foi constatado que modificações nessa sequência de UTR mínima até mesmo aumenta a taxa de expressão da molécula de mRNA.[0010] In particular, the present application surprisingly found that it is possible to reduce the size of the UTR sequence to a “minimal UTR” sequence, thereby decreasing the costs for the production of mRNA drugs, increasing the yield of the mRNA molecules produced and increasing the space available in the mRNA molecule produced for the actual transgene, i.e. for the coding region encoding a desired polypeptide. Furthermore, at the same time, this minimal UTR sequence surprisingly maintains or even improves the expression rate over conventional UTR sequences while it was found that modifications to this minimal UTR sequence even increase the expression rate of the mRNA molecule.

[0011] Essa constatação leva ao fornecimento das modalidades como caracterizados nas reivindicações, em particular ao fornecimento de moléculas de DNA que permitem a produção de moléculas de RNA que abrigam tal sequência de “UTR mínima” bem como ao fornecimento das moléculas de RNA correspondentes.[0011] This finding leads to the provision of the embodiments as characterized in the claims, in particular to the provision of DNA molecules that allow the production of RNA molecules harboring such a “minimal UTR” sequence as well as to the provision of the corresponding RNA molecules.

[0012] Em um primeiro aspecto, são descritas moléculas correspondentes no nível de DNA enquanto mais abaixo, em um segundo aspecto, são descritas moléculas correspondentes no nível de RNA.[0012] In a first aspect, corresponding molecules at the DNA level are described while further down, in a second aspect, corresponding molecules at the RNA level are described.

[0013] Dessa forma, em um primeiro aspecto, a presente invenção se refere a uma molécula de DNA, que pode ser transcrita em um mRNA, em que a dita molécula de DNA compreende um filamento com os seguintes elementos: (a) uma região de codificação, que inclui um códon inicial em seu terminal 5’, que codifica um polipeptídeo; e (b) diretamente a montante da dita sequência de codificação, uma sequência selecionada do grupo que consiste em: (b1) R1-CGCCACC (SEQ ID NO:1); ou uma sequência em que, na dita sequência, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; e (b2) R1-CNGCCACC (SEQ ID NO:2), em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em T, G, C ou A; ou uma sequência em que, na dita sequência, o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G, em que R1 é um promotor que é reconhecido por uma RNA polimerase dependente de DNA; ou que compreende o filamento complementar.[0013] Thus, in a first aspect, the present invention relates to a DNA molecule, which can be transcribed into an mRNA, wherein said DNA molecule comprises a strand with the following elements: (a) a coding region, which includes a start codon at its 5' terminus, which encodes a polypeptide; and (b) directly upstream of said coding sequence, a sequence selected from the group consisting of: (b1) R1-CGCCACC (SEQ ID NO:1); or a sequence wherein, in said sequence, the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G; and (b2) R1-CNGCCACC (SEQ ID NO:2), wherein the nucleotide N at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of T, G, C or A; or a sequence wherein, in said sequence, the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G, wherein R1 is a promoter that is recognized by a DNA-dependent RNA polymerase; or that comprises the complementary strand.

[0014] Uma sequência de DNA é chamada “senso” se sua sequência for igual àquela de uma cópia de RNA mensageiro que é traduzida em uma proteína. A sequência no filamento complementar oposto é chamada de sequência “antissenso”. A molécula de DNA da presente invenção é definida em (a) e (b), acima, por referência ao filamento senso enquanto o filamento antissenso complementar correspondente pode facilmente ser determinado pelo versado na técnica dadas as regras de pareamento de base.[0014] A DNA sequence is called “sense” if its sequence is the same as that of a messenger RNA copy that is translated into a protein. The sequence on the opposite complementary strand is called the “antisense” sequence. The DNA molecule of the present invention is defined in (a) and (b), above, by reference to the sense strand while the corresponding complementary antisense strand can readily be determined by the skilled artisan given the base pairing rules.

[0015] A molécula de DNA da presente invenção é uma molécula de DNA que pode ser transcrita em uma molécula de mRNA. A transcrição é a primeira etapa da expressão de gene, na qual um segmento particular de uma molécula de DNA é copiada em uma molécula de mRNA pela enzima RNA polimerase. Durante a transcrição, uma sequência de DNA é lida por uma RNA polimerase, que produz um filamento de RNA antiparalelo complementar chamado de transcrito primário.[0015] The DNA molecule of the present invention is a DNA molecule that can be transcribed into an mRNA molecule. Transcription is the first step in gene expression, in which a particular segment of a DNA molecule is copied into an mRNA molecule by the enzyme RNA polymerase. During transcription, a DNA sequence is read by an RNA polymerase, which produces a complementary antiparallel RNA strand called the primary transcript.

[0016] Apenas um dos dois filamentos de DNA serve como um modelo para transcrição. O filamento antissenso de DNA é lido por uma RNA polimerase dependente de DNA do terminal 3’ para o terminal 5’ durante a transcrição (3’ ^ 5’). O RNA complementar é criado na direção oposta, na direção 5’ ^ 3’, correspondendo à sequência do filamento senso com a exceção da troca de uracila por timina. Essa direcionalidade é devido ao fato de que a RNA polimerase pode apenas adicionar nucleotídeos para terminal 3’ da cadeia de mRNA crescente. O filamento senso não-modelo de DNA é chamado de filamento de codificação, devido ao fato de que sua sequência é igual ao transcrito de RNA recentemente criado (exceto pela substituição de uracila por timina). Esse é o filamento que é usado por convenção e no contexto da presente invenção na apresentação de uma sequência de DNA.[0016] Only one of the two DNA strands serves as a template for transcription. The antisense DNA strand is read by a DNA-dependent RNA polymerase from the 3' terminus to the 5' terminus during transcription (3'^5'). Complementary RNA is created in the opposite direction, in the 5'^3' direction, matching the sequence of the sense strand with the exception of the exchange of uracil for thymine. This directionality is due to the fact that RNA polymerase can only add nucleotides to the 3' terminus of the growing mRNA chain. The non-template sense strand of DNA is called the coding strand, due to the fact that its sequence is the same as the newly created RNA transcript (except for the substitution of uracil for thymine). This is the strand that is used by convention and in the context of the present invention in presenting a DNA sequence.

[0017] A molécula de DNA da presente invenção pode ser de filamento duplo ou de filamento simples ou parcialmente de filamento duplo e parcialmente de filamento simples.[0017] The DNA molecule of the present invention may be double-stranded or single-stranded or partially double-stranded and partially single-stranded.

[0018] Uma molécula de DNA da presente invenção compreende dois módulos principais (também chamado de “itens”), isto é, (a) uma região de codificação que codifica um polipeptídeo e que inclui um códon inicial em seu terminal 5’, e (b) diretamente a montante da dita região de codificação uma sequência como definida em (b1) ou (b2) no presente documento. Tal molécula de DNA, quando transcrita, leva a um mRNA com uma sequência de UTR extremamente curta que confere as vantagens acima descritas.[0018] A DNA molecule of the present invention comprises two main modules (also called “items”), that is, (a) a coding region encoding a polypeptide and including a start codon at its 5’ terminus, and (b) directly upstream of said coding region a sequence as defined in (b1) or (b2) herein. Such a DNA molecule, when transcribed, leads to an mRNA with an extremely short UTR sequence that confers the advantages described above.

[0019] Além disso, a molécula de DNA da presente invenção compreende, de preferência, uma sequência que, quando transcrita em mRNA, resulta em uma UTR a jusante da região de codificação. Dessa forma, a molécula de DNA da presente invenção abriga, de preferência, uma região de codificação bem como sequências que, mediante transcrição, resultam em regiões não traduzidas (5’ e 3’) (UTRs) na molécula de mRNA produzida.[0019] Furthermore, the DNA molecule of the present invention preferably comprises a sequence that, when transcribed into mRNA, results in a UTR downstream of the coding region. Thus, the DNA molecule of the present invention preferably houses a coding region as well as sequences that, upon transcription, result in untranslated (5' and 3') regions (UTRs) in the produced mRNA molecule.

[0020] O termo “região de codificação que inclui um códon inicial em seu terminal 5’” como usado de acordo com a presente invenção se refere a uma sequência de DNA que é composta por códons, que são transcritos em uma molécula de mRNA por uma RNA polimerase dependente de DNA em que uma molécula de mRNA correspondente pode ser decodificada e traduzida em proteínas pelo ribossoma de acordo com as informações fornecidas pelo “código genético”. Regiões de codificação comumente começam com um códon inicial em seu terminal 5’ e terminam com um códon de parada. Em geral, o códon inicial é um tripleto de ATG (correspondendo a um tripleto de AUG no nível de RNA) e o códon de parada é TAA, TAG ou TGA (correspondendo a UAA, UAG ou UGA no nível de RNA). Além de serem codificadoras de proteína, porções de regiões de codificação podem servir como sequências regulatórias no pré-mRNA como intensificadores de splicing exônicos ou silenciadores de splicing exônicos. A região de codificação de um gene que codifica um polipeptídeo ou uma proteína como usado de acordo com a presente invenção também é conhecida como a sequência de codificação ou CDS (de sequência de DNA de codificação) e é aquela porção de DNA ou RNA de um gene, composta por éxons, que codifica um polipeptídeo ou proteína. A região de codificação em mRNA é flanqueada pela região não traduzida 5 linha (5’ UTR) e pela região não traduzida 3 linha (3’ UTR) que também faz partes dos éxons. Ademais, moléculas de mRNA podem compreender adicionalmente uma chamada cap 5’ e uma cauda poli-A. A cap 5’, a 5’ UTR, a 3’ UTR e a cauda poli-A são regiões de uma molécula de mRNA que não são traduzidas em proteína.[0020] The term “coding region that includes a start codon at its 5’ terminus” as used in accordance with the present invention refers to a DNA sequence that is composed of codons, which are transcribed into an mRNA molecule by a DNA-dependent RNA polymerase in which a corresponding mRNA molecule can be decoded and translated into proteins by the ribosome according to the information provided by the “genetic code”. Coding regions commonly begin with a start codon at their 5’ terminus and end with a stop codon. In general, the start codon is an ATG triplet (corresponding to an AUG triplet at the RNA level) and the stop codon is TAA, TAG or TGA (corresponding to UAA, UAG or UGA at the RNA level). In addition to being protein-coding, portions of coding regions may serve as regulatory sequences in pre-mRNA such as exonic splicing enhancers or exonic splicing silencers. The coding region of a gene encoding a polypeptide or a protein as used in accordance with the present invention is also known as the coding sequence or CDS (for coding DNA sequence) and is that portion of DNA or RNA of a gene, composed of exons, that encodes a polypeptide or protein. The coding region in mRNA is flanked by the 5' untranslated region (5' UTR) and the 3' untranslated region (3' UTR) which are also parts of the exons. Furthermore, mRNA molecules may additionally comprise a so-called 5' cap and a poly-A tail. The 5' cap, the 5' UTR, the 3' UTR and the poly-A tail are regions of an mRNA molecule that are not translated into protein.

[0021] O termo “região não traduzida” ou “UTR” como usado de acordo com a presente invenção se refere a seções de um mRNA a montante do códon inicial e a jusante do códon de parada que não são traduzidas, e são, portanto, denominadas a região não traduzida cinco linha (5’ UTR) e região não traduzida três linha (3’ UTR), respectivamente. Essas regiões são transcritas com a região de codificação e, dessa forma, são exônicas visto que estão presentes no mRNA maduro.[0021] The term “untranslated region” or “UTR” as used in accordance with the present invention refers to sections of an mRNA upstream of the start codon and downstream of the stop codon that are not translated, and are therefore referred to as the five-strand untranslated region (5’ UTR) and three-strand untranslated region (3’ UTR), respectively. These regions are transcribed with the coding region and are thus exonic since they are present in the mature mRNA.

[0022] Como usado na presente invenção, a região não traduzida 3 linha (3’-UTR) se refere à seção de RNA mensageiro (mRNA) que imediatamente segue o códon de terminação de tradução. A 3’ UTR pode compreender regiões regulatórias na região não traduzida 3 linha que são conhecidas por influenciar a poliadenilação e a estabilidade do mRNA. Muitas 3’-UTRs também contêm elementos ricos em AU (AREs). Além disso, a 3’-UTR pode conter, de preferência, a sequência AAUAAA que direciona a adição de várias centenas de resíduos de adenina chamados de cauda poli(A) ao terminal do transcrito de mRNA.[0022] As used herein, the 3′-untranslated region (3′-UTR) refers to the section of messenger RNA (mRNA) that immediately follows the translation termination codon. The 3′-UTR may comprise regulatory regions in the 3′-untranslated region that are known to influence polyadenylation and mRNA stability. Many 3′-UTRs also contain AU-rich elements (AREs). In addition, the 3′-UTR may preferably contain the sequence AAUAAA that directs the addition of several hundred adenine residues called the poly(A) tail to the terminus of the mRNA transcript.

[0023] A região não traduzida 5 linha (5‘ UTR) (também conhecida como Sequência Líder ou RNA Líder) é a região de um mRNA que está diretamente a montante do códon inicial. A 5‘ UTR começa no sítio de partida de transcrição e termina um nucleotídeo (nt) antes do códon inicial (usualmente AUG no mRNA) da região de codificação. Em eucariotas, o comprimento da 5‘ UTR é geralmente de 100 a várias centenas de nucleotídeos de comprimento, mas, às vezes, também podem ocorrer UTRs mais curtas em eucariotas.[0023] The 5′ untranslated region (5′ UTR) (also known as the Leader Sequence or Leader RNA) is the region of an mRNA that is directly upstream of the start codon. The 5′ UTR begins at the transcription start site and ends one nucleotide (nt) before the start codon (usually AUG in mRNA) of the coding region. In eukaryotes, the length of the 5′ UTR is usually 100 to several hundred nucleotides in length, but shorter UTRs can sometimes occur in eukaryotes as well.

[0024] Na presente invenção, a sequência entre o promotor e a região de codificação (como definido em (b1) ou (b2), acima), é extremamente curta e leva, mediante transcrição, a uma molécula de mRNA com uma sequência de UTR “mínima” muito curta.[0024] In the present invention, the sequence between the promoter and the coding region (as defined in (b1) or (b2), above), is extremely short and leads, upon transcription, to an mRNA molecule with a very short “minimal” UTR sequence.

[0025] Um módulo da molécula de DNA, isto é, “uma região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” (módulo (a)) não é particularmente limitada e pode ser qualquer região de codificação desejada que deve ser expressada em uma dada célula. Dessa forma, esse módulo pode ser uma região de codificação que codifica um polipeptídeo desejado, isto é, o produto final desejado. A presente invenção não é limitada no que diz respeito à “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” visto que a natureza da região de codificação depende do produto desejado que deve ser produzido na célula. Tal região de codificação pode ser também uma sequência de nucleotídeos que difere de uma sequência natural conhecida e contém mutações (isto é, mutações de ponto, mutação por inserção, deleções e combinações das mesmas). Ademais, tal região de codificação pode ser, parcial ou completamente, uma sequência otimizada por códon derivada da sequência natural a ser usada como módulo (a). A otimização por códon é uma técnica para maximizar a expressão de proteína aumentando a eficiência translacional do mRNA derivado de um gene de interesse. Sabe-se que genes naturais não usam os códons disponíveis aleatoriamente, mas mostram uma certa preferência por códons particulares para o mesmo aminoácido. Dessa forma, devido à degenerescência do código genético - um aminoácido pode ser codificado por diversos códons - transformando a sequência de nucleotídeos de um gene de interesse em um conjunto de códons preferidos da mesma espécie ou de uma outra espécie.[0025] A module of the DNA molecule, i.e., “a coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” (module (a)) is not particularly limited and may be any desired coding region that is to be expressed in a given cell. Thus, such a module may be a coding region that encodes a desired polypeptide, i.e., the desired end product. The present invention is not limited with respect to “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” since the nature of the coding region depends on the desired product that is to be produced in the cell. Such a coding region may also be a nucleotide sequence that differs from a known natural sequence and contains mutations (i.e., point mutations, insertion mutations, deletions, and combinations thereof). Furthermore, such a coding region may be, partially or completely, a codon-optimized sequence derived from the natural sequence to be used as module (a). Codon optimization is a technique to maximize protein expression by increasing the translational efficiency of mRNA derived from a gene of interest. It is known that natural genes do not use the available codons randomly, but show a certain preference for particular codons for the same amino acid. Thus, due to the degeneracy of the genetic code - an amino acid can be encoded by several codons - transforming the nucleotide sequence of a gene of interest into a set of preferred codons of the same species or of another species.

[0026] Como mencionado, o módulo (a) não é particularmente limitado e pode ser qualquer região de codificação desejada que deve ser expressada em uma dada célula. Dessa forma, no contexto da presente invenção, deveria ser entendido que “região de codificação” significa qualquer molécula de polidesoxirribonucleotídeo que, se introduzido em uma célula, pode ser transcrito em uma molécula de mRNA que é traduzível para um polipeptídeo/proteína ou fragmento do mesmo. Os termos “polipeptídeo” e “proteína” aqui abrangem qualquer tipo de sequência de aminoácidos, isto é, cadeias de dois ou mais aminoácidos que são, cada um, ligados através de ligações peptídicas e também inclui peptídeos e proteínas de fusão.[0026] As mentioned, module (a) is not particularly limited and may be any desired coding region that is to be expressed in a given cell. Thus, in the context of the present invention, it should be understood that “coding region” means any polydeoxyribonucleotide molecule that, if introduced into a cell, can be transcribed into an mRNA molecule that is translatable to a polypeptide/protein or fragment thereof. The terms “polypeptide” and “protein” herein encompass any type of amino acid sequence, i.e., chains of two or more amino acids that are each linked by peptide bonds, and also include peptides and fusion proteins.

[0027] Em uma modalidade preferida, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” contém uma sequência de desoxirribonucleotídeos que codifica um polipeptídeo/proteína ou fragmento do mesmo cuja função na célula ou nas proximidades da célula é necessária ou benéfica, por exemplo, uma proteína cuja carência ou forma defeituosa da mesma é um desencadeamento para uma doença ou uma enfermidade, cujo fornecimento da mesma pode moderar ou evitar uma doença ou uma enfermidade, ou uma proteína que pode promover um processo que é benéfico para o corpo, em uma célula ou suas proximidades. A região de codificação pode conter a sequência para a proteína completa ou uma variante funcional da mesma. Além disso, a sequência de desoxirribonucleotídeos da região de codificação pode codificar uma proteína que atua como um fator, indutor, regulador, estimulador ou enzima, ou um fragmento funcional do mesmo, em que essa proteína é uma cuja a função é necessária a fim de remedir um transtorno, em particular um transtorno metabólico ou a fim de iniciar processos in vivo como a formação de novos vasos sanguíneos, tecidos, etc. Aqui, entende-se que a variante funcional significa um fragmento que, na célula, pode realizar a função da proteína cuja função na célula é necessária ou a carência ou a forma defeituosa da mesma é patogênica.[0027] In a preferred embodiment, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” contains a deoxyribonucleotide sequence that encodes a polypeptide/protein or fragment thereof whose function in or near the cell is necessary or beneficial, e.g., a protein whose lack or defective form is a trigger for a disease or illness, whose provision may moderate or prevent a disease or illness, or a protein that may promote a process that is beneficial to the body, in or near the cell. The coding region may contain the sequence for the full-length protein or a functional variant thereof. Furthermore, the deoxyribonucleotide sequence of the coding region may encode a protein that acts as a factor, inducer, regulator, stimulator or enzyme, or a functional fragment thereof, wherein such protein is one whose function is necessary in order to remedy a disorder, in particular a metabolic disorder or in order to initiate processes in vivo such as the formation of new blood vessels, tissues, etc. Here, the functional variant is understood to mean a fragment which, in the cell, can perform the function of the protein whose function in the cell is necessary or the lack or defective form of which is pathogenic.

[0028] Em uma modalidade preferida, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” codifica um polipeptídeo terapêutica ou farmaceuticamente ativo ou proteína que tem um efeito terapêutico ou preventivo. Como tal, a molécula de DNA da presente invenção que pode ser transcrita em um mRNA que compreende a dita “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” pode ser usada em terapia de ácido nucleico e aplicações relacionadas. Nesse contexto, de acordo com a invenção, a transcrição e a tradução de uma molécula de DNA da presente invenção em um mRNA e, adicionalmente, em um polipeptídeo ou uma proteína pode ser destinada a compensar ou complementar a expressão de gene endógeno, em particular, em casos em que um gene endógeno é defeituoso ou silencioso, levando a nenhum produto, a um produto insuficiente ou defeituoso ou disfuncional de expressão de gene como é o caso com muitas doenças metabólicas e hereditárias como fibrose cística, hemofilia ou distrofia muscular, para citar algumas. A transcrição e a tradução de uma molécula de DNA da presente invenção em um mRNA e, adicionalmente, em um polipeptídeo ou uma proteína pode ser também prevista a ter o produto da expressão, interagem ou interferem em qualquer processo celular endógeno como a regulação de expressão de gene, transdução de sinal e outros processos celulares. A transcrição e a tradução de uma molécula de DNA da presente invenção em um mRNA e, adicionalmente, em um polipeptídeo ou uma proteína podem ser também previstas a darem origem a uma resposta imunológica no contexto do organismo no qual uma célula transfectada ou transduzida reside ou é feita residir. Exemplos são a modificação genética de células que apresentam antígeno como células dendríticas a fim de que as mesmas apresentem um antígeno para propósitos de vacinação. Um outro exemplo é a transcrição e a tradução de uma molécula de DNA da presente invenção em um mRNA e, adicionalmente, em um polipeptídeo ou uma proteína em que a dita região de codificação codifica citocinas. Isso pode, por exemplo, ser desejável em tumores a fim de elicitar uma resposta imunológica específica de tumor. Além disso, a transcrição e a tradução de uma molécula de DNA da presente invenção em um mRNA e, adicionalmente, em um polipeptídeo ou uma proteína pode ser também destinada a gerar células geneticamente modificadas de maneira transiente in vivo ou ex vivo para terapias celulares como células T modificadas ou células precursoras ou células-tronco ou outras células para medicina regenerativa.[0028] In a preferred embodiment, the “coding region that includes a start codon at its 5’ terminus encoding a polypeptide” encodes a therapeutically or pharmaceutically active polypeptide or protein that has a therapeutic or preventive effect. As such, the DNA molecule of the present invention that can be transcribed into an mRNA comprising said “coding region that includes a start codon at its 5’ terminus encoding a polypeptide” can be used in nucleic acid therapy and related applications. In this context, according to the invention, the transcription and translation of a DNA molecule of the present invention into an mRNA and, additionally, into a polypeptide or a protein can be intended to compensate or complement endogenous gene expression, in particular, in cases where an endogenous gene is defective or silent, leading to no product, to an insufficient or defective product or dysfunctional gene expression as is the case with many metabolic and hereditary diseases such as cystic fibrosis, hemophilia or muscular dystrophy, to name a few. Transcription and translation of a DNA molecule of the present invention into an mRNA and, further, into a polypeptide or a protein may also be anticipated to have the product of expression interact with or interfere with any endogenous cellular process such as regulation of gene expression, signal transduction and other cellular processes. Transcription and translation of a DNA molecule of the present invention into an mRNA and, further, into a polypeptide or a protein may also be anticipated to give rise to an immune response in the context of the organism in which a transfected or transduced cell resides or is made to reside. Examples are the genetic modification of antigen presenting cells such as dendritic cells in order for them to present an antigen for vaccination purposes. Another example is the transcription and translation of a DNA molecule of the present invention into an mRNA and, further, into a polypeptide or a protein in which said coding region encodes cytokines. This may, for example, be desirable in tumors in order to elicit a tumor-specific immune response. Furthermore, the transcription and translation of a DNA molecule of the present invention into an mRNA and, additionally, into a polypeptide or a protein can also be intended to generate genetically modified cells transiently in vivo or ex vivo for cell therapies such as modified T cells or precursor cells or stem cells or other cells for regenerative medicine.

[0029] Em outras modalidades preferidas, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” pode codificar uma proteína que desempenha um papel em processos de crescimento e angiogênese, que são, por exemplo, necessários na regeneração controlada e pode, então, ser formada especificamente por meio da introdução da molécula de RNA de acordo com a invenção. Isso pode, por exemplo, ser útil em processos de crescimento ou para o tratamento de defeitos ósseos, defeitos no tecido e no contexto de implantação e transplantação.[0029] In other preferred embodiments, the “coding region comprising a start codon at its 5’ terminus encoding a polypeptide” may encode a protein that plays a role in growth and angiogenesis processes, which are for example necessary in controlled regeneration, and may then be specifically formed by introducing the RNA molecule according to the invention. This may for example be useful in growth processes or for the treatment of bone defects, tissue defects and in the context of implantation and transplantation.

[0030] Como mencionado, a molécula de DNA e, em particular, a molécula de RNA correspondentemente transcrita da presente invenção que compreende uma “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” podem apropriadamente serem usadas em qualquer caso em que um polipeptídeo ou uma proteína, que naturalmente estaria presente no corpo, mas não está presente ou está presente em forma deficiente ou em quantidade muito pequena devido a defeitos genéticos ou doenças, deve ser fornecida para o corpo. São conhecidas proteínas e genes que codificam as mesmas, em que a deficiência ou defeito das mesmas está ligado a uma doença. A respectiva versão intacta da região de codificação que codifica o polipeptídeo ou proteína intacta pode ser usada de acordo com a presente invenção.[0030] As mentioned, the DNA molecule and, in particular, the correspondingly transcribed RNA molecule of the present invention comprising a “coding region including a start codon at its 5’ terminus encoding a polypeptide” can suitably be used in any case where a polypeptide or a protein, which would naturally be present in the body, but is not present or is present in a deficient form or in a very small amount due to genetic defects or diseases, is to be supplied to the body. Proteins and genes encoding the same are known, wherein the deficiency or defect thereof is linked to a disease. The respective intact version of the coding region encoding the intact polypeptide or protein can be used according to the present invention.

[0031] Inúmeros transtornos genéticos, ocasionados pela mutação de um gene simples são conhecidos e candidatos para abordagens terapêuticas de mRNA. Transtornos ocasionados por mutações de gene simples, como fibrose cística, hemofilia e muitos outros, podem ser dominantes ou recessivos no que diz respeito à probabilidade de que um certo traço aparecerá na prole. Enquanto um alelo dominante manifesta um fenótipo em indivíduos que têm apenas uma cópia do alelo, para um alelo recessivo, o indivíduo deve ter duas cópias, uma de cada pai para se manifestar. Em contrapartida, os transtornos poligênicos são ocasionados por dois genes ou mais e a manifestação da respectiva doença é frequentemente fluente e associada a fatores ambientais. Exemplos de transtornos poligênicos são hipertensão, nível de colesterol elevado, câncer, transtornos neurodegenerativos, doenças mentais e outros. Também nesses casos, o mRNA terapêutico que representa um ou mais desses genes pode ser benéfico para esses pacientes. Além disso, um transtorno genético não deve ter sido transmitido pelos genes dos pais, mas também pode ser ocasionado por novas mutações. Além disso, nesses casos, o mRNA terapêutico que representa o gene correto pode ser benéfico para os pacientes.[0031] Numerous genetic disorders caused by the mutation of a single gene are known and are candidates for mRNA therapeutic approaches. Disorders caused by single gene mutations, such as cystic fibrosis, hemophilia, and many others, can be dominant or recessive with respect to the probability that a certain trait will appear in the offspring. While a dominant allele manifests a phenotype in individuals who have only one copy of the allele, for a recessive allele, the individual must have two copies, one from each parent, to manifest. In contrast, polygenic disorders are caused by two or more genes and the manifestation of the respective disease is often fluent and associated with environmental factors. Examples of polygenic disorders are hypertension, high cholesterol levels, cancer, neurodegenerative disorders, mental illnesses, and others. In these cases too, therapeutic mRNA representing one or more of these genes may be beneficial for these patients. Furthermore, a genetic disorder must not have been transmitted by the genes of the parents, but can also be caused by new mutations. Furthermore, in these cases, therapeutic mRNA that represents the correct gene may be beneficial to patients.

[0032] Um catálogo online com atualmente 22.993 entradas de Genes Humanos e Transtornos Genéticos junto com seus respectivos genes e uma descrição de seus fenótipos estão disponíveis na página da web da ONIM (Online Mendelian Inheritance in Man) (http://onim.org); sequências de cada um dos mesmos estão disponíveis junto à base de dados Uniprot (http://www.uniprot.org). Como exemplos não limitadores, a seguinte Tabela 1 lista algumas doenças congênitas, e o gene correspondente (ou genes). Devido ao alto grau de interação de vias de sinalização celular, a mutação de um certo gene ocasiona múltiplos sintomas patogênicos, dos quais apenas uma característica é listada Tabela 1.[0032] An online catalogue of currently 22,993 entries of Human Genes and Genetic Disorders together with their respective genes and a description of their phenotypes is available on the ONIM (Online Mendelian Inheritance in Man) web page (http://onim.org); sequences of each of these are available from the Uniprot database (http://www.uniprot.org). As non-limiting examples, the following Table 1 lists some congenital diseases, and the corresponding gene (or genes). Due to the high degree of interaction of cellular signaling pathways, the mutation of a certain gene causes multiple pathogenic symptoms, of which only one characteristic is listed in Table 1.

[0033] Em algumas modalidades da presente invenção, a proteína terapêutica é escolhida dentre as proteínas celulares listadas na Tabela 1. Dessa forma, a molécula de DNA da invenção pode codificar uma proteína terapêutica celular, em que a proteína terapêutica codificada é uma listada na Tabela 1 ou um homólogo da mesma.[0033] In some embodiments of the present invention, the therapeutic protein is chosen from among the cellular proteins listed in Table 1. Thus, the DNA molecule of the invention may encode a cellular therapeutic protein, wherein the encoded therapeutic protein is one listed in Table 1 or a homologue thereof.

[0034] Em uma outra modalidade da presente invenção, a proteína terapêutica é escolhida dentre as proteínas secretadas listadas na Tabela 1. Dessa forma, a molécula de DNA da invenção pode codificar uma proteína de fusão terapêutica, em que a proteína terapêutica codificada ou um homólogo da mesma é uma listada na Tabela 1 e a segunda proteína é um peptídeo de sinalização que permite a secreção da proteína terapêutica. Um peptídeo de sinalização é uma sequência de aminoácidos curta, tipicamente com 5 a 30 aminoácidos de comprimento, presente no N-terminal da dita proteína terapêutica e que leva a proteína de fusão na direção da via secretora da célula através de certas organelas (isto é, o retículo endoplásmico, o aparelho de Golgi ou os endossomas). Dessa forma, tal proteína de fusão é secretada da célula ou de uma organela celular, ou inserida em uma membrana celular (por exemplo, proteína de membrana de abrangência múltipla) em um compartimento celular ou na superfície da célula.[0034] In another embodiment of the present invention, the therapeutic protein is chosen from the secreted proteins listed in Table 1. Thus, the DNA molecule of the invention may encode a therapeutic fusion protein, wherein the encoded therapeutic protein or a homologue thereof is one listed in Table 1 and the second protein is a signal peptide that enables secretion of the therapeutic protein. A signal peptide is a short amino acid sequence, typically 5 to 30 amino acids in length, present at the N-terminus of said therapeutic protein and that directs the fusion protein towards the secretory pathway of the cell through certain organelles (i.e., the endoplasmic reticulum, the Golgi apparatus or endosomes). Thus, such a fusion protein is secreted from the cell or a cellular organelle, or inserted into a cellular membrane (e.g., multi-spanning membrane protein) in a cellular compartment or on the cell surface.

[0035] Dessa forma, em modalidades preferidas da presente invenção, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” (módulo (a)) pode codificar, sem limitação, os seguintes genes que ocasionam, predispõem ou protegem contra doenças. Exemplos não limitadores de tais transtornos que podem ser tratados (ou evitados) incluem aqueles em que o dito polipeptídeo, proteína ou peptídeo é selecionado do grupo que consiste naqueles como apresentado na seguinte Tabela 1.[0035] Thus, in preferred embodiments of the present invention, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” (module (a)) may encode, without limitation, the following genes that cause, predispose to, or protect against diseases. Non-limiting examples of such disorders that may be treated (or prevented) include those in which said polypeptide, protein, or peptide is selected from the group consisting of those as set forth in the following Table 1.

[0036] Em algumas modalidades, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” pode ser transcrita e traduzida em uma proteína de comprimento parcial ou total que compreende atividade celular a um nível igual a ou maior que aquele da proteína nativa. Em algumas modalidades, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” codifica um polipeptídeo terapêutica ou farmaceuticamente ativo, proteína ou peptídeo que tem um efeito terapêutico ou preventivo, em que o dito polipeptídeo, proteína ou peptídeo é selecionado do grupo que consiste naqueles como apresentado na seguinte Tabela 1. A “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” pode ser usada para expressar uma proteína de comprimento parcial ou total com atividade celular a um nível igual a ou menor que aquele da proteína nativa. Isso pode permitir o tratamento de doenças para as quais a administração de uma molécula de RNA pode ser indicada. TABELA 1: EXEMPLOS NÃO LIMITADORES DE GENES HUMANOS E TRANSTORNOS GENÉTICOS [0036] In some embodiments, the “coding region that includes a start codon at its 5' terminus that encodes a polypeptide” can be transcribed and translated into a partial or full-length protein that comprises cellular activity at a level equal to or greater than that of the native protein. In some embodiments, the “coding region that includes a start codon at its 5' terminus that encodes a polypeptide” encodes a therapeutically or pharmaceutically active polypeptide, protein or peptide that has a therapeutic or preventative effect, wherein said polypeptide, protein or peptide is selected from the group consisting of those as set forth in the following Table 1. The “coding region that includes a start codon at its 5' terminus that encodes a polypeptide” can be used to express a partial or full-length protein with cellular activity at a level equal to or less than that of the native protein. This may allow for the treatment of diseases for which administration of an RNA molecule may be indicated. TABLE 1: NON-LIMITING EXAMPLES OF HUMAN GENES AND GENETIC DISORDERS

[0037] A Tabela 1 acima mostra exemplos de genes em que um defeito conduz a uma doença que pode ser tratada com a molécula de RNA transcrita a molécula de DNA da presente invenção, em que a molécula de DNA compreende a “região de codificação que inclui um códon inicial em seu terminal 5’ codifica um polipeptídeo” que codifica uma versão intacta da proteína ou um fragmento funcional da mesma do gene defeituoso revelado acima. Em modalidades particularmente preferidas, podem ser mencionadas doenças hereditárias que, por exemplo, afetam os pulmões, como deficiência de SPB (deficiência de tensoativo B), deficiência de ABCA3, fibrose cística e deficiência de α1-antitripsina, ou que afetam proteínas plasmáticas (por exemplo, hemocromatose congênita (deficiência de hepcidina), púrpura trombocitopênica trombótica (TPP, deficiência ADAMTS 13) e ocasionar defeitos de coagulação (por exemplo, hemofilia a e b) e defeitos do complemento (por exemplo, deficiência de proteína C), defeitos imunológicos, como, por exemplo, SCID (ocasionou mutações em diferentes genes, como: RAG1, RAG2, JAK3, IL7R, CD45, CD3δ, CD3ε) ou por deficiências devido à falta de adenosina desaminase, por exemplo, (ADA- SCID), granulomatose séptica (por exemplo, causada por mutações do gene gp-91-phox, do gene p47-phox, do gene p67-phox ou do gene p33-phox ) e doenças de armazenamento, como doença de Gaucher, doença de Fabry, doença de Krabbe, MPS I, MPS II (síndrome de Hunter), MPS VI, doença de armazenamento de glicogênio tipo II ou mucopolissacaridoses.[0037] Table 1 above shows examples of genes in which a defect leads to a disease that can be treated with the RNA molecule transcribed from the DNA molecule of the present invention, wherein the DNA molecule comprises the “coding region that includes a start codon at its 5’ terminus encodes a polypeptide” that encodes an intact version of the protein or a functional fragment thereof of the defective gene disclosed above. In particularly preferred embodiments, hereditary diseases may be mentioned which, for example, affect the lungs, such as SPB deficiency (surfactant B deficiency), ABCA3 deficiency, cystic fibrosis and α1-antitrypsin deficiency, or which affect plasma proteins (e.g. congenital hemochromatosis (hepcidin deficiency), thrombotic thrombocytopenic purpura (TPP, ADAMTS 13 deficiency) and cause coagulation defects (e.g. hemophilia a and b) and complement defects (e.g. protein C deficiency), immunological defects, such as, for example, SCID (caused by mutations in different genes, such as: RAG1, RAG2, JAK3, IL7R, CD45, CD3δ, CD3ε) or by deficiencies due to a lack of adenosine deaminase, for example, (ADA-SCID), septic granulomatosis (e.g. caused by mutations of the gene gp-91-phox, p47-phox gene, p67-phox gene or p33-phox gene) and storage diseases such as Gaucher disease, Fabry disease, Krabbe disease, MPS I, MPS II (Hunter syndrome), MPS VI, glycogen storage disease type II or mucopolysaccharidoses.

[0038] Outros distúrbios para os quais a presente invenção que compreende uma “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um peptídeo” pode ser útil incluem distúrbios como atrofia muscular espinhal (SMA) relacionada a SMN1; esclerose lateral amiotrófica (ELA); galactosemia relacionada a GALT; Fibrose Cística (FC); Transtornos relacionados a SLC3A1, incluindo cistinúria; transtornos relacionados a COL4A5 incluindo síndrome de Alport; deficiências de galactocerebrosidase; adrenoleucodistrofia ligada a X e adrenomieloneuropatia; ataxia de Friedreich; doença de Pelizaeus- Merzbacher; esclerose tuberosa relacionada a TSC1 e TSC2; síndrome de Sanfilippo B (MPS IIIB); cistinose relacionada a CTNS; os transtornos relacionados a FMR1, que incluem síndrome de X frágil, Tremor Associado a X Frágil/Síndrome de Ataxia e Síndrome de Falha do Ovário Prematuro de X Frágil; síndrome de Prader-Willi; telangiectasia hemorrágica hereditária (AT); doença de Niemann-Pick Tipo C1; as doenças relacionadas a lipofuscinoses ceroide neuronal incluindo Lipofuscinose Ceroide Neuronal Juvenil (JNCL), Doença de Batten Juvenil, doença de Santavuori-Haltia, doença de Jansky- Bielschowsky, e deficiências de PTT-1 e TPP1; Ataxia infantil relacionada com EIF2B1, EIF2B2, EIF2B3, EIF2B4 e EIF2B5 com hipomielinização do sistema nervoso central/substância branca em extinção; Ataxia Episódica relacionada a CACNA1A e CACNB4 Tipo 2; os transtornos relacionados a MECP2 incluindo a Síndrome de Classic Rett, Encefalopatia Neonatal Grave Relacionada a MECP2 e Síndrome de PPM-X; Síndrome de Retina Atípica Relacionada a CDKL5; Doença de Kennedy (SBMA); arteropatia autossômica dominante cerebral relacionada a Notch-3 com infartos subcorticais e leucoencefalopatia (CADASIL); transtornos de convulsão relacionados a SCN1A e SCN1B; os transtornos relacionados à Polimerase G que incluem síndrome de Alpers-Huttenlocher, neuropatia atáxica sensorial relacionada a POLG, disartria, e oftalmoparese, e oftalmoplegia externa progressiva autossômica dominante e recessiva com deleções de DNA mitocondrial; hipoplasia adrenal ligada a X; agamaglobulinemia ligada a X; doença de Fabry; e doença de Wilson.[0038] Other disorders for which the present invention comprising a “coding region that includes a start codon at its 5’ terminus encoding a peptide” may be useful include disorders such as SMN1-related spinal muscular atrophy (SMA); amyotrophic lateral sclerosis (ALS); GALT-related galactosemia; Cystic Fibrosis (CF); SLC3A1-related disorders including cystinuria; COL4A5-related disorders including Alport syndrome; galactocerebrosidase deficiencies; X-linked adrenoleukodystrophy and adrenomyeloneuropathy; Friedreich’s ataxia; Pelizaeus-Merzbacher disease; TSC1- and TSC2-related tuberous sclerosis; Sanfilippo B syndrome (MPS IIIB); CTNS-related cystinosis; FMR1-related disorders, which include fragile X syndrome, fragile X-associated tremor/ataxia syndrome, and fragile X premature ovarian failure syndrome; Prader-Willi syndrome; hereditary hemorrhagic telangiectasia (AT); Niemann-Pick disease Type C1; neuronal ceroid lipofuscinoses-related diseases including Juvenile Neuronal Ceroid Lipofuscinosis (JNCL), Juvenile Batten disease, Santavuori-Haltia disease, Jansky-Bielschowsky disease, and PTT-1 and TPP1 deficiencies; EIF2B1-, EIF2B2-, EIF2B3-, EIF2B4-, and EIF2B5-related infantile ataxia with central nervous system hypomyelination/disappearing white matter; CACNA1A- and CACNB4-related Episodic Ataxia Type 2; MECP2-related disorders including Classic Rett Syndrome, MECP2-related Severe Neonatal Encephalopathy, and PPM-X Syndrome; CDKL5-related Atypical Retina Syndrome; Kennedy disease (SBMA); Notch-3-related cerebral autosomal dominant arteropathy with subcortical infarcts and leukoencephalopathy (CADASIL); SCN1A- and SCN1B-related seizure disorders; Polymerase G-related disorders including Alpers-Huttenlocher syndrome, POLG-related sensory ataxic neuropathy, dysarthria, and ophthalmoparesis, and autosomal dominant and recessive progressive external ophthalmoplegia with mitochondrial DNA deletions; X-linked adrenal hypoplasia; X-linked agammaglobulinemia; Fabry disease; and Wilson disease.

[0039] Em todas essas doenças, uma proteína, por exemplo, uma enzima, é defeituosa, que pode ser tratada por tratamento com o transcrito de RNA da molécula de DNA da presente invenção, que torna a proteína codificada pelo gene defeituoso ou um fragmento funcional do mesmo disponível. Terapias de substituição de transcrito/terapias de substituição de enzima não afetam o defeito genético subjacente, mas aumentam a concentração da enzima da qual o paciente é deficiente. Como exemplo, na doença de Pompe, a terapia de substituição de transcrito/terapia de substituição de enzima substitui a enzima lisossômica deficiente ácido alfa- glicosidase (GAA).[0039] In all of these diseases, a protein, e.g., an enzyme, is defective, which can be treated by treatment with the RNA transcript of the DNA molecule of the present invention, which makes the protein encoded by the defective gene or a functional fragment thereof available. Transcript replacement therapies/enzyme replacement therapies do not affect the underlying genetic defect, but increase the concentration of the enzyme of which the patient is deficient. As an example, in Pompe disease, transcript replacement therapy/enzyme replacement therapy replaces the deficient lysosomal enzyme alpha-glucosidase (GAA).

[0040] Assim, exemplos não limitadores de proteínas que podem ser codificadas pela “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” do módulo (a) de acordo com a invenção são eritropoietina (EPO), hormônio do crescimento (somatotropina, hGH), regulador da condutância transmembranar da fibrose cística (CFTR), fatores de crescimento como GM-SCF, G-CSF, MPS, proteína C, hepcidina, ABCA3 e proteína de tensoativo B. Exemplos adicionais de doenças que podem ser tratadas com o RNA de acordo com a invenção são hemofilia A/B, doença de Fabry, CGD, ADAMTS13, doença de Hurler, A-Y-globulinemia mediada por cromossomo X, imunodeficiência relacionada à adenosina desaminase e síndrome de angústia respiratória em recém-nascidos, que está ligada a SP-B. De maneira particularmente preferida, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” da molécula de DNA de acordo com a invenção contém a sequência para proteína de tensoativo B (SP-B) ou para eritropoietina. Exemplos adicionais de proteínas que podem ser codificadas pela “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” da molécula de DNA de acordo com a invenção são fatores de crescimento como hormônio do crescimento humano hGH, BMP-2 ou fatores de angiogênese.[0040] Thus, non-limiting examples of proteins that can be encoded by the “coding region that includes a start codon at its 5’ terminus encoding a polypeptide” of module (a) according to the invention are erythropoietin (EPO), growth hormone (somatotropin, hGH), cystic fibrosis transmembrane conductance regulator (CFTR), growth factors such as GM-SCF, G-CSF, MPS, protein C, hepcidin, ABCA3 and surfactant protein B. Additional examples of diseases that can be treated with the RNA according to the invention are hemophilia A/B, Fabry disease, CGD, ADAMTS13, Hurler disease, X-chromosome-mediated A-Y-globulinemia, adenosine deaminase-related immunodeficiency and respiratory distress syndrome in newborns, which is linked to SP-B. In a particularly preferred manner, the "coding region comprising a start codon at its 5' end encoding a polypeptide" of the DNA molecule according to the invention contains the sequence for surfactant protein B (SP-B) or for erythropoietin. Further examples of proteins which can be encoded by the "coding region comprising a start codon at its 5' end encoding a polypeptide" of the DNA molecule according to the invention are growth factors such as human growth hormone hGH, BMP-2 or angiogenesis factors.

[0041] Alternativamente, os ácidos nucleicos podem codificar anticorpos de comprimento completo ou anticorpos menores (por exemplo, cadeias pesadas e leves) para conferir imunidade a um indivíduo. Em uma outra modalidade, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” pode codificar um anticorpo monoclonal ou policlonal funcional, que pode ser útil para direcionar e/ou inativar um alvo biológico (por exemplo, uma citocina estimulante como fator de necrose tumoral). De modo similar, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” pode codificar, por exemplo, anticorpos de fator antinefrótico funcional útil para o tratamento de glomerulonefrite membranoproliferativa tipo II ou síndrome urêmica hemolítica aguda ou, alternativamente, pode codificar anticorpos anti-fator de crescimento endotelial vascular (VEGF) úteis para o tratamento de doenças mediadas por VEGF, como câncer.[0041] Alternatively, the nucleic acids may encode full-length antibodies or smaller antibodies (e.g., heavy and light chains) to confer immunity to an individual. In another embodiment, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” may encode a functional monoclonal or polyclonal antibody, which may be useful for targeting and/or inactivating a biological target (e.g., a stimulatory cytokine such as tumor necrosis factor). Similarly, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” may encode, for example, functional antinephrotic factor antibodies useful for the treatment of membranoproliferative glomerulonephritis type II or acute hemolytic uremic syndrome, or alternatively, may encode anti-vascular endothelial growth factor (VEGF) antibodies useful for the treatment of VEGF-mediated diseases such as cancer.

[0042] O módulo (a), isto é, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo”, pode ser uma região de codificação que codifica um polipeptídeo ou uma proteína que pode ser usada em tecnologias de edição de genoma. A edição de genoma é um tipo de engenharia genética na qual o DNA é inserido, deletado ou substituído no genoma de um organismo com o uso de nucleases. Essas nucleases criam quebra de filamento duplo sítio-específicas (DSBs) em locais desejados no genoma. As quebras de filamento duplo induzidas são reparadas por junção de extremidades não homólogas ou recombinação homóloga, resultando em mutações direcionadas no genoma, desse modo “editando” o genoma. Inúmeros sistemas de edição de genomas que utilizam diferentes polipeptídeos ou proteínas são conhecidos na técnica, isto é, por exemplo, o sistema CRISPR-Cas, meganucleases, nucleases de dedo de zinco (ZFNs) e nucleases à base de efetor do tipo ativador de transcrição (TALEN). Métodos para manipulação de genoma são revistos em Trends in Biotechnology, 2013, 31 (7), 397 a 405.[0042] Module (a), i.e. the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide”, may be a coding region that encodes a polypeptide or a protein that can be used in genome editing technologies. Genome editing is a type of genetic engineering in which DNA is inserted, deleted or replaced in the genome of an organism using nucleases. These nucleases create site-specific double-strand breaks (DSBs) at desired locations in the genome. The induced double-strand breaks are repaired by non-homologous end joining or homologous recombination, resulting in targeted mutations in the genome, thereby “editing” the genome. Numerous genome editing systems utilizing different polypeptides or proteins are known in the art, i.e., for example, the CRISPR-Cas system, meganucleases, zinc finger nucleases (ZFNs), and transcription activator-like effector-based nucleases (TALENs). Methods for genome manipulation are reviewed in Trends in Biotechnology, 2013, 31 (7), 397–405.

[0043] Dessa forma, em uma modalidade preferida, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” contém uma sequência de desoxirribonucleotídeo que codifica um polipeptídeo ou proteína da família de proteínas Cas (proteína associada a CRISPR), de preferência, Cas9 (proteína associada a CRISPR 9). Proteínas da família de proteínas Cas, de preferência, Cas9, podem ser usadas em métodos à base de CRISPR/Cas9 e/ou em tecnologias de edição de genomas CRISPR/Cas9. Sistemas CRISPR-Cas para edição, regulação e direcionamento de genoma são revistos em Nat. Biotechnol., 2014, 32(4):347 a 355.[0043] Thus, in a preferred embodiment, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” contains a deoxyribonucleotide sequence that encodes a polypeptide or protein of the Cas (CRISPR-associated protein) family of proteins, preferably Cas9 (CRISPR-associated protein 9). Proteins of the Cas family of proteins, preferably Cas9, can be used in CRISPR/Cas9-based methods and/or in CRISPR/Cas9 genome editing technologies. CRISPR-Cas systems for genome editing, regulation, and targeting are reviewed in Nat. Biotechnol., 2014, 32(4):347-355.

[0044] Em uma outra modalidade preferida, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” contém uma sequência de desoxirribonucleotídeos que codifica uma meganuclease. Meganucleases são endodesoxirribonucleases que, ao contrário de endodesoxirribonucleases “convencionais”, reconhecem um grande sítio de reconhecimento (por exemplo, uma sequência de DNA de filamento duplo de 12 a 40 pares de base). Como resultado, o respectivo site ocorre apenas algumas vezes, de preferência apenas uma vez, em qualquer dado genoma. As meganucleases são, portanto, consideradas as enzimas de restrição de ocorrência natural mais específicas e, consequentemente, são ferramentas adequadas nas tecnologias de edição de genoma.[0044] In another preferred embodiment, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” contains a deoxyribonucleotide sequence that encodes a meganuclease. Meganucleases are endodeoxyribonucleases that, unlike “conventional” endodeoxyribonucleases, recognize a large recognition site (e.g., a double-stranded DNA sequence of 12 to 40 base pairs). As a result, the respective site occurs only a few times, preferably only once, in any given genome. Meganucleases are therefore considered the most specific naturally occurring restriction enzymes and are consequently suitable tools in genome editing technologies.

[0045] Em uma outra modalidade preferida, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” contém uma sequência de desoxirribonucleotídeos que codifica uma nuclease de dedo de zinco (ZFN). ZFNs são enzimas de restrição artificiais geradas pela fusão de um domínio de ligação ao DNA de dedo de zinco a um domínio de clivagem de DNA. Os domínios do dedo de zinco podem ser manipulados para atingir sequências de DNA específicas desejadas e isso permite que as nucleases de dedo de zinco tenham como alvo sequências únicas dentro de genomas complexos. Aproveitando a maquinaria de reparo de DNA endógeno, as ZFNs podem ser usadas para alterar com precisão o genoma de organismos superiores e são, portanto, ferramentas adequadas nas tecnologias de edição do genoma.[0045] In another preferred embodiment, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” contains a deoxyribonucleotide sequence that encodes a zinc finger nuclease (ZFN). ZFNs are artificial restriction enzymes generated by fusing a zinc finger DNA-binding domain to a DNA cleavage domain. Zinc finger domains can be engineered to target specific desired DNA sequences and this allows zinc finger nucleases to target unique sequences within complex genomes. By harnessing the endogenous DNA repair machinery, ZFNs can be used to precisely alter the genome of higher organisms and are therefore suitable tools in genome editing technologies.

[0046] Em uma outra modalidade preferida, a “região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” contém uma sequência de desoxirribonucleotídeos que codifica uma nuclease efetora do tipo ativador transcricional (TALEN). TALENs são enzimas de restrição que podem ser manipuladas para cortar sequências específicas de DNA. TALENs são proteínas de fusão em que um domínio de ligação a DNA de efetor de TAL é fundido a um domínio de clivagem de DNA de uma nuclease. Efetores do tipo ativador de transcrição (TALEs) podem ser manipulados para ligar praticamente qualquer sequência de DNA desejada. Dessa forma, quando combinado com uma nuclease, o DNA pode ser cortado em locais desejados específicos.[0046] In another preferred embodiment, the “coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” contains a deoxyribonucleotide sequence that encodes a transcriptional activator-like effector nuclease (TALEN). TALENs are restriction enzymes that can be engineered to cut specific DNA sequences. TALENs are fusion proteins in which a TAL effector DNA-binding domain is fused to a DNA cleavage domain of a nuclease. Transcriptional activator-like effectors (TALEs) can be engineered to bind virtually any desired DNA sequence. Thus, when combined with a nuclease, DNA can be cut at specific desired locations.

[0047] A molécula de DNA da presente invenção compreende, como um segundo módulo (b), uma sequência que está situada diretamente a montante da sequência de codificação.[0047] The DNA molecule of the present invention comprises, as a second module (b), a sequence that is located directly upstream of the coding sequence.

[0048] Mais especificamente, a molécula de DNA da presente invenção compreende um módulo (b) diretamente a montante da dita sequência de codificação, em que o dito módulo (b) é uma sequência selecionada do grupo que consiste em: (b1) R1-CGCCACC (SEQ ID NO:1); ou uma sequência em que, na dita sequência, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; e (b2) R1-CNGCCACC (SEQ ID NO:2), em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em T, G, C ou A; ou uma sequência em que, na dita sequência, o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G, em que R1 é um promotor que é reconhecido por uma RNA polimerase dependente de DNA.[0048] More specifically, the DNA molecule of the present invention comprises a module (b) directly upstream of said coding sequence, wherein said module (b) is a sequence selected from the group consisting of: (b1) R1-CGCCACC (SEQ ID NO:1); or a sequence wherein, in said sequence, the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G; and (b2) R1-CNGCCACC (SEQ ID NO:2), wherein the nucleotide N at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of T, G, C or A; or a sequence in which, in said sequence, the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G, wherein R1 is a promoter that is recognized by a DNA-dependent RNA polymerase.

[0049] As sequências como definido no item (b) no presente documento não são particularmente limitadas às sequências específicas acima, mas podem também estar relacionadas a (a) sequência(s) que mostra(m) (a) adição(ões) de nucleotídeo(s) em comparação com tais sequências, em que o(s) nucleotídeo(s) adicional(is) pode(m) ser adicionado(s) no terminal 5’ de R1 na(s) sequência(s) descrita(s) acima. O(s) nucleotídeo(s) adicional(is) compreende(m) cadeias de polinucleotídeo de até 0 (sem mudanças), 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 nucleotídeos, de preferência, de até 20 nucleotídeos. Com mais preferência, são adicionados 11, 12, 13, 14, 15, 16, 18 ou 19 nucleotídeos no terminal 5’. Com mais preferência ainda, são adicionados até 30 nucleotídeos no terminal 5’.[0049] The sequences as defined in item (b) herein are not particularly limited to the specific sequences above, but may also relate to (a) sequence(s) showing (a) addition(s) of nucleotide(s) compared to such sequences, wherein the additional nucleotide(s) may be added at the 5' terminus of R1 in the sequence(s) described above. The additional nucleotide(s) comprise polynucleotide chains of up to 0 (no changes), 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 nucleotides, preferably of up to 20 nucleotides. More preferably, 11, 12, 13, 14, 15, 16, 18 or 19 nucleotides are added at the 5' terminus. Most preferably, up to 30 nucleotides are added at the 5' terminus.

[0050] Visto que a adição de nucleotídeos a montante do promotor R1 não mudará as propriedades funcionais acima da(s) UTR(s) da invenção, a adição dos nucleotídeos pode também ter um comprimento de até 40, 50, 60, 70, 80, 90 ou mesmo 100 nucleotídeos ou ainda mais, até 200, 300, 400 ou 500 nucleotídeos.[0050] Since the addition of nucleotides upstream of the R1 promoter will not change the above functional properties of the UTR(s) of the invention, the addition of the nucleotides may also have a length of up to 40, 50, 60, 70, 80, 90 or even 100 nucleotides or even longer, up to 200, 300, 400 or 500 nucleotides.

[0051] Como mencionado acima, uma molécula de DNA de filamento duplo compreende dois filamentos antiparalelos, em que um filamento é chamado do filamento “senso” se sua sequência for igual àquela de uma cópia de RNA mensageiro que é traduzida em uma proteína. A sequência no filamento complementar oposto é chamada de sequência “antissenso”. Dessa forma, a molécula de DNA da presente invenção não apenas se refere à molécula de DNA acima que corresponde a um mRNA que compreende um filamento com os elementos (a) e (b) acima, mas também a uma molécula de DNA que compreende o filamento complementar, isto é, filamento antissenso que pode ser transcrito em mRNA. Esse filamento complementar da molécula de DNA da presente invenção é definido por referência ao filamento antissenso que pode facilmente ser determinado dadas as regras de pareamento de base.[0051] As mentioned above, a double-stranded DNA molecule comprises two antiparallel strands, wherein one strand is called the “sense” strand if its sequence is the same as that of a messenger RNA copy that is translated into a protein. The sequence on the opposite complementary strand is called the “antisense” sequence. Thus, the DNA molecule of the present invention not only refers to the above DNA molecule that corresponds to an mRNA comprising a strand with elements (a) and (b) above, but also to a DNA molecule comprising the complementary strand, i.e., antisense strand that can be transcribed into mRNA. This complementary strand of the DNA molecule of the present invention is defined by reference to the antisense strand that can easily be determined given the base pairing rules.

[0052] A molécula de DNA da presente invenção também compreende no, módulo (b), um promotor R1 que é reconhecido por uma RNA polimerase dependente de DNA. De preferência, o dito promotor R1 é diretamente ligado à sequência restante definida no item (b1) ou (b2), isto é, sem a ocorrência de nenhum nucleotídeo interveniente.[0052] The DNA molecule of the present invention also comprises, in module (b), an R1 promoter that is recognized by a DNA-dependent RNA polymerase. Preferably, said R1 promoter is directly linked to the remaining sequence defined in item (b1) or (b2), that is, without the occurrence of any intervening nucleotide.

[0053] A natureza do promotor R1 que é reconhecido por uma RNA polimerase dependente de DNA não é particularmente limitada. Qualquer promotor (e variantes do mesmo) pode ser usado desde que uma RNA polimerase dependente de DNA correspondente possa reconhecer a respectiva sequência. Inúmeras polimerases de RNA (também conhecidas como polimerases de RNA dependentes de DNA e frequentemente abreviadas como RNAP ou RNApol) são conhecidas na técnica. Essas enzimas têm a capacidade de produzir o RNA de transcrito primário. Como apresentado acima, polimerases de RNA dependentes de DNA têm a capacidade de sintetizar cadeias de RNA com o uso de DNA como modelo em um processo denominado transcrição. Uma RNA polimerase dependente de DNA inicia transcrição em sequências de DNA específicas conhecidas como promotores. Isso, então, produz uma cadeia de RNA que é complementar ao filamento de DNA modelo. O processo de adição de nucleotídeos ao filamento de RNA é conhecido como alongamento. Por conseguinte, no contexto da presente invenção, o termo “reconhecer” preferencialmente significa não apenas que a RNA polimerase dependente de DNA tem a capacidade de especificamente detectar/ligar sua sequência promotora R1 correspondente. Esse termo também se refere à capacidade de a RNA polimerase dependente de DNA iniciar transcrição e, então produzir uma molécula de RNA durante o alongamento.[0053] The nature of the R1 promoter that is recognized by a DNA-dependent RNA polymerase is not particularly limited. Any promoter (and variants thereof) may be used as long as a corresponding DNA-dependent RNA polymerase can recognize the respective sequence. Numerous RNA polymerases (also known as DNA-dependent RNA polymerases and often abbreviated as RNAP or RNApol) are known in the art. These enzymes have the ability to produce the primary transcript RNA. As shown above, DNA-dependent RNA polymerases have the ability to synthesize RNA strands using DNA as a template in a process called transcription. A DNA-dependent RNA polymerase initiates transcription at specific DNA sequences known as promoters. This then produces an RNA strand that is complementary to the template DNA strand. The process of adding nucleotides to the RNA strand is known as elongation. Accordingly, in the context of the present invention, the term "recognize" preferably means not only that the DNA-dependent RNA polymerase has the ability to specifically detect/bind its corresponding R1 promoter sequence. This term also refers to the ability of the DNA-dependent RNA polymerase to initiate transcription and then produce an RNA molecule during elongation.

[0054] O versado na técnica pode determinar através de métodos conhecidos na técnica se uma dada RNA polimerase dependente de DNA tem a capacidade de reconhecer um respectivo promotor. Ademais, por meio do uso de métodos bem conhecidos para a avaliação de interações de proteína/DNA, uma sequência promotora R1 correspondente (desconhecida) de uma dada RNA polimerase dependente de DNA pode ser identificada e vice-versa.[0054] One skilled in the art can determine by methods known in the art whether a given DNA-dependent RNA polymerase has the ability to recognize a respective promoter. Furthermore, by using well-known methods for evaluating protein/DNA interactions, a corresponding (unknown) R1 promoter sequence of a given DNA-dependent RNA polymerase can be identified and vice versa.

[0055] Dessa forma, a capacidade de uma RNA polimerase dependente de DNA reconhecer/ligar seu promotor R1 e, de preferência, a capacidade de iniciar a transcrição pode ser determinada por métodos conhecidos na técnica como, por exemplo, descrito em Journal of Biological Chemistry, 1993, 268(26):19.299 a 19.304, enquanto a constatação de inúmeras polimerases de RNA dependentes de DNA é revista em Journal of Biological Chemistry, 2005, 280(52):42.477 a 42.485).[0055] Thus, the ability of a DNA-dependent RNA polymerase to recognize/bind its R1 promoter and, preferably, the ability to initiate transcription can be determined by methods known in the art as, for example, described in Journal of Biological Chemistry, 1993, 268(26):19,299 to 19,304, while the finding of numerous DNA-dependent RNA polymerases is reviewed in Journal of Biological Chemistry, 2005, 280(52):42,477 to 42,485).

[0056] Em uma modalidade preferida, o promotor R1 que é reconhecido por uma RNA polimerase dependente de DNA é um promotor de bacteriófago.[0056] In a preferred embodiment, the R1 promoter that is recognized by a DNA-dependent RNA polymerase is a bacteriophage promoter.

[0057] Como exemplos apenas, sabe-se, na técnica, que um RNA polimerase dependente de DNA de T7 reconhece a sequência TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3), a RNA polimerase dependente de DNA de T3 reconhece a sequência AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4), a RNA polimerase dependente de DNA de SP6 reconhece a sequência ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) e a RNA polimerase dependente de DNA de K11 reconhece a sequência AATTAGGGCACACTATAGGGA (SEQ ID NO: 6). Entretanto, esses exemplos são apenas dados para propósitos de ilustração visto que a presente invenção não se limita a esses promotores e polimerases de RNA dependentes de DNA correspondentes. De fato, qualquer promotor (e variantes do mesmo) pode ser usado desde que uma RNA polimerase dependente de DNA correspondente, de preferência RNA polimerase dependente de DNA de bacteriófago, pode reconhecer a respectiva sequência.[0057] As examples only, it is known in the art that a T7 DNA-dependent RNA polymerase recognizes the sequence TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3), a T3 DNA-dependent RNA polymerase recognizes the sequence AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4), a SP6 DNA-dependent RNA polymerase recognizes the sequence ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) and a K11 DNA-dependent RNA polymerase recognizes the sequence AATTAGGGCACACTATAGGGA (SEQ ID NO: 6). However, these examples are given for illustration purposes only since the present invention is not limited to these promoters and corresponding DNA-dependent RNA polymerases. Indeed, any promoter (and variants thereof) can be used as long as a corresponding DNA-dependent RNA polymerase, preferably bacteriophage DNA-dependent RNA polymerase, can recognize the respective sequence.

[0058] Em uma modalidade preferida, R1 é selecionado do grupo que consiste em: (i) TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:3 e que é reconhecida por uma RNA polimerase dependente de DNA de T7; (ii) AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:4 e que é reconhecida por uma RNA polimerase dependente de DNA de T3; (iii) ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:5 e que é reconhecida por uma RNA polimerase dependente de DNA de SP6; e (iv) AATTAGGGCACACTATAGGGA (SEQ ID NO: 6) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:6 e que é reconhecida por uma RNA polimerase dependente de DNA de K11.[0058] In a preferred embodiment, R1 is selected from the group consisting of: (i) TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3) or a sequence showing 1 to 6 substitutions compared to SEQ ID NO:3 and which is recognized by a T7 DNA-dependent RNA polymerase; (ii) AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4) or a sequence showing 1 to 6 substitutions compared to SEQ ID NO:4 and which is recognized by a T3 DNA-dependent RNA polymerase; (iii) ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) or a sequence showing 1 to 6 substitutions compared to SEQ ID NO:5 and which is recognized by a SP6 DNA-dependent RNA polymerase; and (iv) AATTAGGGCACACTATAGGGA (SEQ ID NO: 6) or a sequence that shows 1 to 6 substitutions compared to SEQ ID NO:6 and that is recognized by a K11 DNA-dependent RNA polymerase.

[0059] Em uma outra modalidade preferida, a sequência pode ser uma sequência que mostra 1 a 3, 4 ou 5 substituições desde que a sequência correspondente ainda possa ser reconhecida pela RNA polimerase dependente de DNA de T7, T3, SP6 e K11, respectivamente. Em uma modalidade mais preferida, a sequência pode ser uma sequência que mostra 1 a 2 substituições desde que a sequência correspondente ainda possa ser reconhecida pela RNA polimerase dependente de DNA de T7, T3, SP6 e K11, respectivamente. Com a máxima preferência, a sequência pode ser a sequência que mostra 1 substituição desde que a sequência correspondente ainda possa ser reconhecida pela RNA polimerase dependente de DNA de T7, T3, SP6 e K11, respectivamente.[0059] In another preferred embodiment, the sequence may be a sequence showing 1 to 3, 4 or 5 substitutions provided that the corresponding sequence can still be recognized by T7, T3, SP6 and K11 DNA-dependent RNA polymerase, respectively. In a more preferred embodiment, the sequence may be a sequence showing 1 to 2 substitutions provided that the corresponding sequence can still be recognized by T7, T3, SP6 and K11 DNA-dependent RNA polymerase, respectively. Most preferably, the sequence may be the sequence showing 1 substitution provided that the corresponding sequence can still be recognized by T7, T3, SP6 and K11 DNA-dependent RNA polymerase, respectively.

[0060] Em outras modalidades, as sequências promotoras R1 que são reconhecidas por uma RNA polimerase dependente de DNA não são particularmente limitada a nenhuma das sequências de SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 ou SEQ ID NO: 6 ou sequências que mostram 1 a 6 substituições em comparação com isso, mas podem ser também sequências mostrando 1 a 7, 8, 9, 10, 11 ou 12 substituições desde que a sequência correspondente ainda possa ser reconhecida pela RNA polimerase dependente de DNA de T7, T3, SP6 e K11, respectivamente.[0060] In other embodiments, the R1 promoter sequences that are recognized by a DNA-dependent RNA polymerase are not particularly limited to any of the sequences of SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, or SEQ ID NO: 6 or sequences showing 1 to 6 substitutions compared thereto, but may also be sequences showing 1 to 7, 8, 9, 10, 11, or 12 substitutions as long as the corresponding sequence can still be recognized by the DNA-dependent RNA polymerase of T7, T3, SP6, and K11, respectively.

[0061] Em uma modalidade preferida, da(s) substituição(ões) acima nas sequências de TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3), AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4), ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) ou AATTAGGGCACACTATAGGGA (SEQ ID NO: 6), substituições nos 5 nucleotídeos “CACTA” nas posições 11 a 12 nas sequências acima de SEQ ID NOs: 3 a 6 são excluídos visto que esses 5 nucleotídeos são conservados entre as quatro sequências.[0061] In a preferred embodiment, of the above substitution(s) in the sequences of TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3), AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4), ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) or AATTAGGGCACACTATAGGGA (SEQ ID NO: 6), substitutions in the 5 “CACTA” nucleotides at positions 11 to 12 in the above sequences of SEQ ID NOs: 3 to 6 are excluded since these 5 nucleotides are conserved among the four sequences.

[0062] Em uma outra modalidade preferida, da(s) substituição(ões) acima nas sequências de SEQ ID NOs: 3 a 6, uma substituição no nucleotídeo “T” na posição 4 nas sequências acima de SEQ ID NOs: 3 a 6 é excluída visto que esse nucleotídeo é conservado entre as quatro sequências.[0062] In another preferred embodiment, from the above substitution(s) in the sequences of SEQ ID NOs: 3 to 6, a substitution at the nucleotide “T” at position 4 in the above sequences of SEQ ID NOs: 3 to 6 is excluded since that nucleotide is conserved among the four sequences.

[0063] Em uma outra modalidade preferida, da(s) substituição(ões) acima nas sequências de SEQ ID NOs: 3 a 6, uma substituição no nucleotídeo “A” na posição 5 nas sequências acima de SEQ ID NOs: 3 a 6 é excluída visto que esse nucleotídeo é conservado entre as quatro sequências.[0063] In another preferred embodiment, from the above substitution(s) in the sequences of SEQ ID NOs: 3 to 6, a substitution at nucleotide “A” at position 5 in the above sequences of SEQ ID NOs: 3 to 6 is excluded since that nucleotide is conserved among the four sequences.

[0064] Em uma outra modalidade preferida, da(s) substituição(ões) acima nas sequências de SEQ ID NOs: 3 a 6, uma substituição no nucleotídeo “G” na posição 18 nas sequências acima de SEQ ID NOs: 3 a 6 é excluída visto que esse nucleotídeo é conservado entre as quatro sequências.[0064] In another preferred embodiment, from the above substitution(s) in the sequences of SEQ ID NOs: 3 to 6, a substitution at the nucleotide “G” at position 18 in the above sequences of SEQ ID NOs: 3 to 6 is excluded since that nucleotide is conserved among the four sequences.

[0065] A capacidade de uma RNA polimerase dependente de DNA de T7, T3, SP6 e K11 reconhecer/ligar seu promotor R1 pode ser determinada por métodos conhecidos na técnica como apresentado acima.[0065] The ability of a T7, T3, SP6 and K11 DNA-dependent RNA polymerase to recognize/bind its R1 promoter can be determined by methods known in the art as set forth above.

[0066] Em uma modalidade mais preferida, a molécula de DNA da presente invenção é uma molécula de DNA que compreende um módulo (b1) diretamente a montante da dita sequência de codificação, em que, no dito módulo (b1), o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em T, G ou C, e em que o nucleotídeo N não é um A.[0066] In a more preferred embodiment, the DNA molecule of the present invention is a DNA molecule comprising a module (b1) directly upstream of said coding sequence, wherein, in said module (b1), the nucleotide N at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of T, G or C, and wherein the nucleotide N is not an A.

[0067] Em uma modalidade ainda mais preferida, o dito nucleotídeo N na posição 2 de SEQ ID NO:2 é T.[0067] In an even more preferred embodiment, said N nucleotide at position 2 of SEQ ID NO:2 is T.

[0068] Em uma modalidade preferida, a molécula de DNA da presente invenção é uma molécula de DNA em que o nucleotídeo seguinte diretamente a jusante do códon inicial não é o nucleotídeo G. Em uma outra modalidade preferida, a molécula de DNA da presente invenção é uma molécula de DNA em que o nucleotídeo seguinte diretamente a jusante do códon inicial é um nucleotídeo selecionado do grupo que consiste em A, T e C.[0068] In a preferred embodiment, the DNA molecule of the present invention is a DNA molecule in which the next nucleotide directly downstream of the start codon is not the nucleotide G. In another preferred embodiment, the DNA molecule of the present invention is a DNA molecule in which the next nucleotide directly downstream of the start codon is a nucleotide selected from the group consisting of A, T, and C.

[0069] Em uma modalidade ainda mais preferida, a molécula de DNA da presente invenção é uma molécula de DNA que compreende um módulo (b1) como definido acima, em que o dito módulo (b1) é uma sequência em que o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G e em que o nucleotídeo seguinte diretamente a jusante do códon inicial é um nucleotídeo selecionado do grupo que consiste em A, T e C.[0069] In an even more preferred embodiment, the DNA molecule of the present invention is a DNA molecule comprising a module (b1) as defined above, wherein said module (b1) is a sequence wherein the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G and wherein the next nucleotide directly downstream of the start codon is a nucleotide selected from the group consisting of A, T and C.

[0070] Em uma outra modalidade ainda mais preferida, a molécula de DNA da presente invenção é uma molécula de DNA que compreende um módulo (b2) como definido acima, em que o dito módulo (b2) é uma sequência em que o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G e em que o nucleotídeo seguinte diretamente a jusante do códon inicial é um nucleotídeo selecionado do grupo que consiste em A, T e C.[0070] In another even more preferred embodiment, the DNA molecule of the present invention is a DNA molecule comprising a module (b2) as defined above, wherein said module (b2) is a sequence wherein the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G and wherein the next nucleotide directly downstream of the start codon is a nucleotide selected from the group consisting of A, T and C.

[0071] Na biologia molecular e genética, a montante e a jusante se referem, ambos, a uma posição relativa em uma molécula de DNA. No contexto da presente invenção, a montante é na direção do terminal 5’ do filamento senso da molécula de DNA e a jusante é na direção do terminal 3’ da molécula.[0071] In molecular biology and genetics, upstream and downstream both refer to a relative position in a DNA molecule. In the context of the present invention, upstream is toward the 5' terminus of the sense strand of the DNA molecule and downstream is toward the 3' terminus of the molecule.

[0072] Consequentemente, na presente invenção, a sequência definida no item (b), acima, está situada diretamente a montante da região de codificação do item (a), mais especificamente, diretamente a montante do códon inicial da região de codificação. Dessa forma, “diretamente a montante” nesse contexto significa que não há nucleotídeos adicionais entre a sequência como definida no item (b) e a sequência de codificação que inicia com um códon inicial. Dessa forma, a região de codificação que inicia com um códon inicial é imediatamente adjacente à sequência como definida no item (b) no presente documento.[0072] Accordingly, in the present invention, the sequence defined in item (b) above is located directly upstream of the coding region of item (a), more specifically, directly upstream of the start codon of the coding region. Thus, “directly upstream” in this context means that there are no additional nucleotides between the sequence as defined in item (b) and the coding sequence that begins with a start codon. Thus, the coding region that begins with a start codon is immediately adjacent to the sequence as defined in item (b) herein.

[0073] As moléculas de DNA da presente invenção podem ser geradas/sintetizadas recombinantemente (por exemplo, em um sistema in vivo ou um in vitro) ou sinteticamente (por exemplo, por uma reação de PCR ou em uma reação química) por métodos conhecidos pelo versado na técnica.[0073] The DNA molecules of the present invention can be generated/synthesized recombinantly (e.g., in an in vivo or an in vitro system) or synthetically (e.g., by a PCR reaction or in a chemical reaction) by methods known to the person skilled in the art.

[0074] A molécula de DNA da presente invenção é, de preferência, uma molécula de ácido nucleico recombinante, isto é, é composta por elementos que não ocorrem na natureza nessa combinação. A molécula de ácido nucleico da invenção pode ser sintética ou semissintética.[0074] The DNA molecule of the present invention is preferably a recombinant nucleic acid molecule, that is, it is composed of elements that do not occur in nature in this combination. The nucleic acid molecule of the invention may be synthetic or semi-synthetic.

[0075] A molécula de DNA pode estar presente sob a forma de sequências de DNA fundidas de módulos (a) e (b) (definido nos itens (a) e (b), respectivamente, acima) isto é, uma molécula de DNA (fusão) que é formada pela combinação de pelo menos duas sequências de nucleotídeos contendo os ditos módulos. Tipicamente, como será explicado com mais detalhes abaixo, isso pode ser realizado por meio da clonagem de um cDNA em um vetor de expressão que permite a transcrição na molécula de RNA. Consequentemente, a molécula de DNA da presente invenção pode ser uma sequência de DNA fundida, isto é, uma molécula quimérica que é formada unindo dois ou mais polinucleotídeos através do grupo fosfato de um nucleotídeo ligado ao carbono 3’ em um outro nucleotídeo, formando uma ligação fosfodiéster entre as respectivas extremidades de um módulo e a extremidade de uma outra molécula. Dessa forma, as moléculas de DNA contendo os ditos pelo menos dois módulos são unidas sob a forma de uma molécula de DNA. Uma vez clonada em quadro, tal molécula de DNA recombinante pode, então, ser transcrita em sua sequência de ácidos nucleicos de RNA correspondente que codifica a dita proteína, polipeptídeo ou molécula enzimática.[0075] The DNA molecule may be present in the form of fused DNA sequences of modules (a) and (b) (defined in items (a) and (b), respectively, above), that is, a DNA molecule (fusion) that is formed by the combination of at least two nucleotide sequences containing said modules. Typically, as will be explained in more detail below, this can be accomplished by cloning a cDNA into an expression vector that allows transcription into the RNA molecule. Consequently, the DNA molecule of the present invention may be a fused DNA sequence, that is, a chimeric molecule that is formed by joining two or more polynucleotides through the phosphate group of a nucleotide linked to the 3' carbon in another nucleotide, forming a phosphodiester bond between the respective ends of a module and the end of another molecule. In this way, the DNA molecules containing said at least two modules are joined in the form of a DNA molecule. Once cloned in frame, such a recombinant DNA molecule can then be transcribed into its corresponding RNA nucleic acid sequence that encodes said protein, polypeptide or enzyme molecule.

[0076] Uma molécula de DNA de acordo com a presente invenção pode ser introduzida em um vetor, de preferência, um vetor de expressão, por técnicas padrão de biologia molecular (consulte, por exemplo, Sambrook et al., Molecular Cloning, A laboratory manual, 2a Ed, 1989). O termo “vetor” como “vetor de expressão” ou “vetor de clonagem” no sentido da presente invenção é entendido como uma unidade de filamento duplo circular de DNA que replica em uma célula independentemente do DNA cromossômico e que é usado como um veículo para portar material genético para uma célula, onde isso pode ser replicado e/ou expressado (isto é, transcrito em RNA e traduzido em uma sequência de aminoácidos). Um vetor contendo DNA estranho é denominado DNA recombinante. O próprio vetor é geralmente uma sequência de DNA que tipicamente consiste em um inserto (por exemplo, uma molécula de ácido nucleico/molécula de DNA da presente invenção) e uma sequência maior que serve como a “estrutura principal” do vetor. Plasmídeos no sentido da presente invenção são encontrados com mais frequência em bactérias e são usados na pesquisa de DNA recombinante para transferir genes entre células e são, como tal, uma subpopulação de “vetores” como usado no sentido da presente invenção.[0076] A DNA molecule according to the present invention may be introduced into a vector, preferably an expression vector, by standard molecular biology techniques (see, for example, Sambrook et al., Molecular Cloning, A laboratory manual, 2nd Ed, 1989). The term “vector” as “expression vector” or “cloning vector” in the sense of the present invention is understood as a circular double-stranded unit of DNA that replicates in a cell independently of chromosomal DNA and that is used as a vehicle for carrying genetic material into a cell, where it can be replicated and/or expressed (i.e. transcribed into RNA and translated into an amino acid sequence). A vector containing foreign DNA is called recombinant DNA. The vector itself is generally a DNA sequence that typically consists of an insert (e.g. a nucleic acid molecule/DNA molecule of the present invention) and a larger sequence that serves as the “backbone” of the vector. Plasmids within the meaning of the present invention are most frequently found in bacteria and are used in recombinant DNA research to transfer genes between cells and are, as such, a subpopulation of “vectors” as used within the meaning of the present invention.

[0077] Fica evidente para o versado na técnica que sequências regulatórias adicionais podem ser adicionadas à molécula de DNA da invenção. Por exemplo, podem ser empregados intensificadores transcricionais e/ou sequências que permitem expressão induzida. Um sistema induzível adequado é, por exemplo, a expressão de gene regulada por tetraciclina como descrito, por exemplo, por Gossen e Bujard, Proc. Natl. Acad. Sci. USA 89 (1992), 5.547 a 5.551) e Gossen, Trends Biotech. 12 (1994), 58 a 62, ou um sistema de expressão de gene induzível por dexametasona como descrito, por exemplo, por Crook, EMBO J. 8 (1989), 513 a 519.[0077] It will be apparent to one skilled in the art that additional regulatory sequences may be added to the DNA molecule of the invention. For example, transcriptional enhancers and/or sequences that allow for induced expression may be employed. A suitable inducible system is, for example, tetracycline-regulated gene expression as described, for example, by Gossen and Bujard, Proc. Natl. Acad. Sci. USA 89 (1992), 5547-5551) and Gossen, Trends Biotech. 12 (1994), 58-62, or a dexamethasone-inducible gene expression system as described, for example, by Crook, EMBO J. 8 (1989), 513-519.

[0078] A presente invenção também se refere a um vetor, de preferência, um vetor de expressão, que compreende a molécula de DNA da presente invenção.[0078] The present invention also relates to a vector, preferably an expression vector, comprising the DNA molecule of the present invention.

[0079] O vetor da presente invenção pode ser, por exemplo, um plasmídeo, cosmídeo, vírus, bacteriófago ou um outro vetor usado, por exemplo, convencionalmente em engenharia genética, e pode compreender genes adicionais como genes marcadores que permitem a seleção do dito vetor em uma célula hospedeira adequada e sob condições adequadas.[0079] The vector of the present invention may be, for example, a plasmid, cosmid, virus, bacteriophage or another vector used, for example, conventionally in genetic engineering, and may comprise additional genes such as marker genes that allow the selection of said vector in a suitable host cell and under suitable conditions.

[0080] A molécula de DNA da presente invenção preferencialmente também contém sinal de poli-A que garante a terminação da transcrição e estabilização do transcrito por meio de adição de uma cauda poli-A.[0080] The DNA molecule of the present invention preferably also contains a poly-A signal that ensures transcription termination and transcript stabilization by adding a poly-A tail.

[0081] As moléculas de DNA e vetores da invenção podem ser projetadas para introdução direta ou para introdução através de lipossomas, vetores virais (por exemplo, adenovirais, retrovirais), eletroporação, sistemas balísticos de entrega (por exemplo, pistola de gene) ou outros sistemas de entrega para a célula. Adicionalmente, um sistema baculoviral pode ser usado como sistema de expressão eucariótico para as moléculas de ácido nucleico da invenção.[0081] The DNA molecules and vectors of the invention may be designed for direct introduction or for introduction via liposomes, viral vectors (e.g., adenoviral, retroviral), electroporation, ballistic delivery systems (e.g., gene gun), or other delivery systems into the cell. Additionally, a baculoviral system may be used as a eukaryotic expression system for the nucleic acid molecules of the invention.

[0082] A presente invenção também se refere a uma célula hospedeira que compreende o vetor da presente invenção. Dessa forma, a presente invenção se refere a um hospedeiro transfectado ou transformado com o vetor da invenção ou um hospedeiro não humano que porta o vetor da presente invenção, isto é, para uma célula hospedeira ou hospedeiro que é geneticamente modificado com uma molécula de DNA de acordo com a invenção ou com um vetor que compreende tal molécula de DNA. O termo “geneticamente modificado” significa que a célula hospedeira ou hospedeiro compreende, além de seu genoma natural, uma molécula de DNA ou vetor de acordo com a invenção que foi introduzida na célula ou hospedeiro ou em um de seus antecessores/pais. A molécula de DNA ou vetor pode estar presente na célula hospedeira ou hospedeiro geneticamente modificado ou como uma molécula independente fora do genoma, de preferência, como uma molécula que tem a capacidade de replicação, ou pode ser estavelmente integrada ao genoma da célula hospedeira ou hospedeiro. A transformação da célula hospedeira com um vetor de acordo com a invenção pode ser executada por métodos padrão, como, por exemplo, descrito em Sambrook e Russell (2001), Molecular Cloning: A Laboratory Manual, CSH Press, Cold Spring Harbor, NY, USA; Methods in Yeast Genetics, A Laboratory Course Manual, Cold Spring Harbor Laboratory Press, 1990. A célula hospedeira é cultivada em meio nutriente atendendo às exigências da célula hospedeira particular usada, em particular, no que diz respeito ao valor de pH, temperatura, concentração de sal, aeração, antibióticos, vitaminas, elementos-traço, etc.[0082] The present invention also relates to a host cell comprising the vector of the present invention. Thus, the present invention relates to a host transfected or transformed with the vector of the invention or a non-human host carrying the vector of the present invention, that is, to a host cell or host that is genetically modified with a DNA molecule according to the invention or with a vector comprising such a DNA molecule. The term “genetically modified” means that the host cell or host comprises, in addition to its natural genome, a DNA molecule or vector according to the invention that has been introduced into the cell or host or into one of its ancestors/parents. The DNA molecule or vector may be present in the genetically modified host cell or host or as an independent molecule outside the genome, preferably as a molecule that has the capacity for replication, or may be stably integrated into the genome of the host cell or host. The transformation of the host cell with a vector according to the invention can be carried out by standard methods, as, for example, described in Sambrook and Russell (2001), Molecular Cloning: A Laboratory Manual, CSH Press, Cold Spring Harbor, NY, USA; Methods in Yeast Genetics, A Laboratory Course Manual, Cold Spring Harbor Laboratory Press, 1990. The host cell is cultivated in a nutrient medium meeting the requirements of the particular host cell used, in particular with regard to pH value, temperature, salt concentration, aeration, antibiotics, vitamins, trace elements, etc.

[0083] A célula hospedeira da presente invenção pode ser qualquer célula procariótica ou eucariótica. Células procarióticas adequadas são aquelas geralmente usadas para clonagem como E. coli ou Bacillus subtilis. Além disso, células eucarióticas compreendem, por exemplo, células fúngicas ou animais. Exemplos para células fúngicas adequadas são células de levedura, de preferência, aquelas do gênero Saccharomyces e, com a máxima preferência, aquelas da espécie Saccharomyces cerevisiae. Células animais adequadas são, por exemplo, células de inseto, células de vertebrado, de, células de mamífero, como, por exemplo, HEK293, NSO, CHO,COS-7, MDCK, U2-OSHela, NIH3T3, MOLT-4, Jurkat, PC-12, PC-3, IMR, NT2N, Sk-n-sh, CaSki, C33A. Linhagem de células adequadas adicionais conhecidas na técnica são obteníveis de depositórios de linhagem de células, como, por exemplo, o Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ) ou o American Type Culture Collection (ATCC). De acordo com a presente invenção, é adicionalmente previsto que culturas celulares/células primárias podem funcionar como células hospedeiras. As ditas células são, em particular, derivadas de insetos (como insetos da espécie Drosophila ou Blatta) ou mamíferos (como ser humano, suíno, camundongo ou rato). As ditas células hospedeiras podem também compreender células de e/ou derivadas de linhagens de células como linhagens de células de neuroblastoma. As células primárias mencionadas acima são bem conhecidas na técnica e compreendem, inter alia, astrócitos primários, culturas espinhais (misturadas) ou culturas de hipocampo.[0083] The host cell of the present invention may be any prokaryotic or eukaryotic cell. Suitable prokaryotic cells are those generally used for cloning such as E. coli or Bacillus subtilis. Furthermore, eukaryotic cells comprise, for example, fungal or animal cells. Examples of suitable fungal cells are yeast cells, preferably those of the genus Saccharomyces and, most preferably, those of the species Saccharomyces cerevisiae. Suitable animal cells are, for example, insect cells, vertebrate cells, mammalian cells such as, for example, HEK293, NSO, CHO, COS-7, MDCK, U2-OS, Hela, NIH3T3, MOLT-4, Jurkat, PC-12, PC-3, IMR, NT2N, Sk-n-sh, CaSki, C33A. Additional suitable cell lines known in the art are obtainable from cell line repositories, such as, for example, the Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSMZ) or the American Type Culture Collection (ATCC). According to the present invention, it is further envisaged that cell cultures/primary cells can function as host cells. Said cells are in particular derived from insects (such as insects of the species Drosophila or Blatta) or mammals (such as human, swine, mouse or rat). Said host cells can also comprise cells of and/or derived from cell lines such as neuroblastoma cell lines. The above-mentioned primary cells are well known in the art and comprise, inter alia, primary astrocytes, (mixed) spinal cultures or hippocampal cultures.

[0084] A presente invenção também se refere a uma composição que compreende a molécula de DNA da presente invenção, o vetor da presente invenção ou a célula hospedeira da presente invenção.[0084] The present invention also relates to a composition comprising the DNA molecule of the present invention, the vector of the present invention or the host cell of the present invention.

[0085] Em um segundo aspecto, a presente invenção se refere a uma molécula de RNA que compreende (a) uma região de codificação, que inclui um códon inicial em seu terminal 5’, que codifica um polipeptídeo; e (b) diretamente a montante da dita sequência de codificação, uma UTR selecionada do grupo que consiste em: (b1) uma UTR da sequência R2-CGCCACC (SEQ ID NO:1), ou uma sequência em que, na dita sequência de UTR, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; e (b2) uma UTR da sequência R2-CNGCCACC (SEQ ID NO:2), em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência em que, na dita sequência de UTR, o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G, em que R2 é uma sequência de RNA que corresponde à parte de uma região promotora que começa com o nucleotídeo em que uma RNA polimerase dependente de DNA inicia a síntese de RNA.[0085] In a second aspect, the present invention relates to an RNA molecule comprising (a) a coding region, which includes a start codon at its 5' terminus, which encodes a polypeptide; and (b) directly upstream of said coding sequence, a UTR selected from the group consisting of: (b1) a UTR of the sequence R2-CGCCACC (SEQ ID NO:1), or a sequence in which, in said UTR sequence, the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G; and (b2) a UTR of the sequence R2-CNGCCACC (SEQ ID NO:2), wherein the nucleotide N at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence wherein, in said UTR sequence, the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G, wherein R2 is an RNA sequence that corresponds to the portion of a promoter region that begins with the nucleotide at which a DNA-dependent RNA polymerase initiates RNA synthesis.

[0086] Uma molécula de ácido ribonucleico (RNA) como usado de acordo com a presente invenção se refere a uma molécula polimérica que é montada como uma cadeia dos nucleotídeos denominados G, A, U e C. Cada nucleotídeo no RNA contém um açúcar de ribose, com carbonos numerados de 1’ até 5’. Uma base nitrogenosa é fixada à 1’ posição, em geral, adenina (A), citosina (C), guanina (G) ou uracila (U). Em uma molécula polimérica de RNA, um grupo fosfato é fixado à posição 3’ de uma ribose e à posição 5’ da próxima. Dessa forma, os nucleotídeos em uma molécula polimérica de RNA são covalentemente ligados entre si, em que o grupo fosfato de um nucleotídeo se liga ao 3’ carbono no nucleotídeo subsequente, formando, assim, uma ligação fosfodiéster. Consequentemente, um filamento de RNA tem um terminal 5’ e um terminal 3’, assim chamado para os carbonos no anel de ribose. Por conversão, a montante e a jusante se referem à direção 5’ para 3’ na qual ocorre a transcrição de RNA. De preferência, a molécula de RNA é uma molécula de RNA mensageiro (mRNA). O mRNA é uma grande família de moléculas de RNA que conduzem informações genéticas do DNA para o ribossoma, onde as mesmas especificam a sequência de aminoácidos dos produtos de proteína da expressão de gene. Após a transcrição do mRNA de transcrito primário (conhecido como pré-mRNA) por RNA polimerase, o mRNA maduro processado é traduzido em um polímero de aminoácidos: uma proteína, como sumarizado no dogma central de biologia molecular. Como no DNA, as informações genéticas de mRNA se encontram na sequência de nucleotídeos, que são dispostos em códons que consistem em três bases cada. Cada códon codifica um aminoácido específico, exceto os códons de parada, que terminam a síntese de proteína.[0086] A ribonucleic acid (RNA) molecule as used in accordance with the present invention refers to a polymeric molecule that is assembled as a chain of nucleotides designated G, A, U, and C. Each nucleotide in RNA contains a ribose sugar, with carbons numbered 1' through 5'. A nitrogenous base is attached to the 1' position, typically adenine (A), cytosine (C), guanine (G), or uracil (U). In a polymeric RNA molecule, a phosphate group is attached to the 3' position of one ribose and the 5' position of the next. In this manner, the nucleotides in a polymeric RNA molecule are covalently linked together, wherein the phosphate group of one nucleotide attaches to the 3' carbon in the subsequent nucleotide, thus forming a phosphodiester bond. Accordingly, an RNA strand has a 5′ terminus and a 3′ terminus, named for the carbons in the ribose ring. By conversion, upstream and downstream refer to the 5′ to 3′ direction in which RNA transcription occurs. Preferably, the RNA molecule is a messenger RNA (mRNA) molecule. mRNA is a large family of RNA molecules that conduct genetic information from DNA to the ribosome, where it specifies the amino acid sequence of the protein products of gene expression. After transcription of the primary transcript mRNA (known as pre-mRNA) by RNA polymerase, the processed mature mRNA is translated into a polymer of amino acids: a protein, as summarized in the central dogma of molecular biology. As in DNA, the genetic information of mRNA is contained in the sequence of nucleotides, which are arranged in codons consisting of three bases each. Each codon codes for a specific amino acid, except for stop codons, which terminate protein synthesis.

[0087] A molécula de RNA da presente invenção compreende dois módulos principais como definido nos itens (a) e (b), acima. Além disso, a molécula de RNA da presente invenção compreende, de preferência, uma UTR em seu terminal 3’. Dessa forma, a molécula de RNA da presente invenção se assemelha, no que diz respeito a sua estrutura, a uma molécula de mRNA “normal” que ocorre na natureza, abrigando uma região de codificação bem como regiões não traduzidas (UTRs) (5’ e 3’) e, opcionalmente, uma cauda poli-A.[0087] The RNA molecule of the present invention comprises two main modules as defined in items (a) and (b) above. In addition, the RNA molecule of the present invention preferably comprises a UTR at its 3' terminus. Thus, the RNA molecule of the present invention resembles, with respect to its structure, a “normal” mRNA molecule that occurs in nature, harboring a coding region as well as untranslated regions (UTRs) (5' and 3') and, optionally, a poly-A tail.

[0088] O termo “região de codificação que inclui um códon inicial em seu terminal 5’” como usado de acordo com a presente invenção se refere a uma sequência que é composta por códons, que são decodificados e traduzidos em proteína pelo ribossoma de acordo com as informações fornecidas pelo código genético. Regiões de codificação comumente começam com um códon inicial em seu terminal 5’ e terminam com um códon de parada. Em geral, o códon inicial é um tripleto de AUG e o códon de parada é UAA, UAG ou UGA. Além de serem codificadoras de proteína, porções de regiões de codificação podem servir como sequências regulatórias no pré-mRNA como intensificadores de splicing exônicos ou silenciadores de splicing exônicos. A região de codificação de um gene que codifica um polipeptídeo ou uma proteína como usado de acordo com a presente invenção também é conhecida como a sequência de codificação ou CDS (de sequência de DNA de codificação) e é aquela porção de DNA ou RNA de um gene, composta por éxons, que codifica um polipeptídeo ou proteína. A região de codificação em mRNA é flanqueada pela região não traduzida 5 linha (5’ UTR) e pela região não traduzida 3 linha (3’ UTR) que também faz partes dos éxons. Ademais, moléculas de mRNA podem compreender adicionalmente uma chamada cap 5’ e uma cauda poli-A. A cap 5’, a 5’ UTR, a 3’ UTR e a cauda poli-A são regiões de uma molécula de mRNA que não são traduzidas em proteína.[0088] The term “coding region that includes a start codon at its 5’ terminus” as used in accordance with the present invention refers to a sequence that is composed of codons, which are decoded and translated into protein by the ribosome according to the information provided by the genetic code. Coding regions commonly begin with a start codon at their 5’ terminus and end with a stop codon. In general, the start codon is an AUG triplet and the stop codon is UAA, UAG or UGA. In addition to being protein coding, portions of coding regions can serve as regulatory sequences in pre-mRNA such as exonic splicing enhancers or exonic splicing silencers. The coding region of a gene encoding a polypeptide or protein as used in accordance with the present invention is also known as the coding sequence or CDS (for coding DNA sequence) and is that portion of DNA or RNA of a gene, composed of exons, that encodes a polypeptide or protein. The coding region in mRNA is flanked by the 5' untranslated region (5' UTR) and the 3' untranslated region (3' UTR) which are also parts of the exons. Furthermore, mRNA molecules may additionally comprise a so-called 5' cap and a poly-A tail. The 5' cap, the 5' UTR, the 3' UTR and the poly-A tail are regions of an mRNA molecule that are not translated into protein.

[0089] O termo “região não traduzida” ou “UTR” como usado de acordo com a presente invenção se refere a seções do mRNA a montante do códon inicial e a jusante do códon de parada que não são traduzidas, e são, portanto, chamadas de região não traduzida 5 linha (5’ UTR) e região não traduzida 3 linha (3’ UTR), respectivamente. Essas regiões são transcritas com a região de codificação e, dessa forma, são exônicas, visto que estão presentes no mRNA maduro.[0089] The term “untranslated region” or “UTR” as used in accordance with the present invention refers to sections of the mRNA upstream of the start codon and downstream of the stop codon that are not translated, and are therefore referred to as the 5’ untranslated region (5’ UTR) and the 3’ untranslated region (3’ UTR), respectively. These regions are transcribed with the coding region and are thus exonic, since they are present in the mature mRNA.

[0090] Como usado na presente invenção, a região não traduzida 3 linha (3’-UTR) se refere à seção de RNA mensageiro (mRNA) que imediatamente segue o códon de terminação de tradução. A 3’ UTR pode compreender regiões regulatórias na região não traduzida 3 linha que são conhecidas por influenciar a poliadenilação e a estabilidade do mRNA. Muitas 3’-UTRs também contêm elementos ricos em AU (AREs). Além disso, a 3’-UTR pode conter, de preferência, a sequência AAUAAA que direciona a adição de várias centenas de resíduos de adenina chamados de cauda poli(A) ao terminal do transcrito de mRNA.[0090] As used herein, the 3′-untranslated region (3′-UTR) refers to the section of messenger RNA (mRNA) that immediately follows the translation termination codon. The 3′-UTR may comprise regulatory regions in the 3′-untranslated region that are known to influence polyadenylation and mRNA stability. Many 3′-UTRs also contain AU-rich elements (AREs). In addition, the 3′-UTR may preferably contain the sequence AAUAAA that directs the addition of several hundred adenine residues called the poly(A) tail to the terminus of the mRNA transcript.

[0091] Como usado na presente invenção, a região não traduzida 5 linha (5‘ UTR) (também conhecida como uma Sequência Líder ou RNA Líder) é a região de um mRNA que está diretamente a montante do códon inicial. A 5‘ UTR começa no sítio de partida de transcrição e termina um nucleotídeo (nt) antes do códon inicial (usualmente AUG) da região de codificação. Em eucariotas, o comprimento da 5‘ UTR é geralmente de 100 a várias centenas de nucleotídeos de comprimento, mas, às vezes, também podem ocorrer UTRs mais curtas em eucariotas.[0091] As used herein, the 5′ untranslated region (5′ UTR) (also known as a Leader Sequence or Leader RNA) is the region of an mRNA that is directly upstream of the start codon. The 5′ UTR begins at the transcription start site and ends one nucleotide (nt) before the start codon (usually AUG) of the coding region. In eukaryotes, the length of the 5′ UTR is typically 100 to several hundred nucleotides in length, but shorter UTRs can sometimes occur in eukaryotes as well.

[0092] Na presente invenção, a 5’ UTR é extremamente curta visto que é um objeto da presente invenção fornecer uma sequência de UTR mínima.[0092] In the present invention, the 5' UTR is extremely short as it is an object of the present invention to provide a minimal UTR sequence.

[0093] Uma molécula de RNA da presente invenção pode também conter uma cauda poli-A. Uma cauda poli-A é uma sequência longa de nucleotídeos de adenina (frequentemente diversas centenas) adicionada ao terminal 3’ do pré-mRNA por um processo denominado poliadenilação. Essa cauda promove exportação do núcleo e tradução, e protege o mRNA contra degradação. A poliadenilação é a adição de uma cauda poli(A) a um RNA mensageiro. A cauda poli(A) consiste em múltiplos monofosfatos de adenosina; em outras palavras, é uma extensão de RNA que tem apenas bases de adenina. Em eucariotas, a poliadenilação é parte do processo que produz RNA mensageiro (mRNA) maduro para tradução.[0093] An RNA molecule of the present invention may also contain a poly-A tail. A poly-A tail is a long sequence of adenine nucleotides (often several hundred) added to the 3' terminus of pre-mRNA by a process called polyadenylation. This tail promotes nuclear export and translation, and protects the mRNA from degradation. Polyadenylation is the addition of a poly(A) tail to a messenger RNA. The poly(A) tail consists of multiple adenosine monophosphates; in other words, it is a stretch of RNA that has only adenine bases. In eukaryotes, polyadenylation is part of the process that produces mature messenger RNA (mRNA) for translation.

[0094] Um módulo da molécula de RNA, isto é, “uma região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” (módulo (a)) não é particularmente limitado e pode ser qualquer região de codificação desejada que deve ser expressada em uma dada célula. Em relação às modalidades preferidas do termo “uma região de codificação que inclui um códon inicial em seu terminal 5’ que codifica um polipeptídeo” (módulo (a)) o mesmo se aplica, com as devidas modificações, à molécula de RNA da presente invenção como foi apresentado acima no contexto da molécula de DNA da presente invenção.[0094] A module of the RNA molecule, that is, “a coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” (module (a)) is not particularly limited and can be any desired coding region that is to be expressed in a given cell. With respect to the preferred embodiments of the term “a coding region that includes a start codon at its 5’ terminus that encodes a polypeptide” (module (a)) the same applies, with due modifications, to the RNA molecule of the present invention as was presented above in the context of the DNA molecule of the present invention.

[0095] A molécula de RNA da presente invenção compreende um módulo (b) diretamente a montante da dita sequência de codificação, em que o dito módulo (b) é uma UTR selecionada do grupo que consiste em: (b1) uma UTR da sequência R2-CGCCACC (SEQ ID NO:1), ou uma sequência em que, na dita sequência de UTR, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; e (b2) uma UTR da sequência R2-CNGCCACC (SEQ ID NO:2), em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência em que, na dita sequência de UTR, o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G, em que R2 é uma sequência de RNA que corresponde à parte de uma região promotora que começa com o nucleotídeo em que uma RNA polimerase dependente de DNA inicia a síntese de RNA.[0095] The RNA molecule of the present invention comprises a module (b) directly upstream of said coding sequence, wherein said module (b) is a UTR selected from the group consisting of: (b1) a UTR of the sequence R2-CGCCACC (SEQ ID NO:1), or a sequence wherein, in said UTR sequence, the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G; and (b2) a UTR of the sequence R2-CNGCCACC (SEQ ID NO:2), wherein the nucleotide N at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence wherein, in said UTR sequence, the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G, wherein R2 is an RNA sequence that corresponds to the portion of a promoter region that begins with the nucleotide at which a DNA-dependent RNA polymerase initiates RNA synthesis.

[0096] A natureza de R2 não é particularmente limitada. Pode ser usada qualquer sequência de RNA que corresponde à parte de uma região promotora que começa com o nucleotídeo em que uma RNA polimerase dependente de DNA inicia a síntese de RNA. O versado na técnica se encontra facilmente em uma posição para determinar aquelas partes de uma região promotora que começa com o nucleotídeo do qual uma RNA polimerase dependente de DNA inicia a síntese de RNA. Essa sequência de RNA R2 é a sequência de um promotor que corresponde à parte de um promotor que é transcrito, isto é, que está realmente presente no transcrito uma vez transcrito.[0096] The nature of R2 is not particularly limited. Any RNA sequence that corresponds to the part of a promoter region that begins with the nucleotide at which a DNA-dependent RNA polymerase initiates RNA synthesis may be used. The skilled artisan is readily in a position to determine those parts of a promoter region that begin with the nucleotide from which a DNA-dependent RNA polymerase initiates RNA synthesis. Such an RNA sequence R2 is the sequence of a promoter that corresponds to the part of a promoter that is transcribed, i.e., that is actually present in the transcript once transcribed.

[0097] Em uma modalidade preferida, o promotor R2 é uma sequência de RNA que corresponde à parte de uma região promotora que começa com o nucleotídeo onde uma RNA polimerase dependente de DNA derivada de bacteriófago inicia a síntese de RNA.[0097] In a preferred embodiment, the R2 promoter is an RNA sequence that corresponds to the portion of a promoter region that begins with the nucleotide where a bacteriophage-derived DNA-dependent RNA polymerase initiates RNA synthesis.

[0098] Em uma modalidade preferida, o promotor R2 é uma sequência de RNA que corresponde à parte de uma região promotora que começa com o nucleotídeo em que uma RNA polimerase dependente de DNA de T7, RNA polimerase dependente de DNA de T3, RNA polimerase dependente de DNA de SP6 ou uma RNA polimerase dependente de DNA de K11 inicia a síntese de RNA.[0098] In a preferred embodiment, the R2 promoter is an RNA sequence that corresponds to the portion of a promoter region that begins with the nucleotide at which a T7 DNA-dependent RNA polymerase, T3 DNA-dependent RNA polymerase, SP6 DNA-dependent RNA polymerase, or a K11 DNA-dependent RNA polymerase initiates RNA synthesis.

[0099] A fim de ilustrar isso, como exemplos não limitadores, R2 é a sequência sublinhada nas seguintes sequências promotoras de TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3; isto é, o promotor reconhecido pela RNA polimerase dependente de DNA de T7), AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4; isto é, o promotor reconhecido pela RNA polimerase dependente de DNA de T3), ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5; isto é, o promotor reconhecido pela RNA polimerase dependente de DNA de SP6) e AATTAGGGCACACTATAGGGA (SEQ ID NO: 6; isto é, o promotor reconhecido pela RNA polimerase dependente de DNA de K11). As sequências sublinhadas correspondem à parte do respectivo promotor em que uma RNA polimerase dependente de DNA inicia a síntese de RNA e, consequentemente, que está realmente presente na molécula de RNA (isto é, no transcrito) uma vez transcrito.[0099] In order to illustrate this, as non-limiting examples, R2 is the underlined sequence in the following promoter sequences of TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3; i.e., the promoter recognized by T7 DNA-dependent RNA polymerase), AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4; i.e., the promoter recognized by T3 DNA-dependent RNA polymerase), ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5; i.e., the promoter recognized by SP6 DNA-dependent RNA polymerase), and AATTAGGGCACACTATAGGGA (SEQ ID NO: 6; i.e., the promoter recognized by K11 DNA-dependent RNA polymerase). The underlined sequences correspond to the part of the respective promoter where a DNA-dependent RNA polymerase initiates RNA synthesis and, consequently, which is actually present in the RNA molecule (i.e. in the transcript) once transcribed.

[00100] A sequência de UTR(s) que tem qualquer uma das substituições acima em comparação com uma UTR da sequência R2- CGCCACC (SEQ ID NO:1) ou em comparação com uma UTR da sequência R2-CNGCCACC (SEQ ID NO:2) pode resultar em uma molécula de RNA que mostra uma eficiência de tradução igual ou similar, de preferência uma eficiência superior de tradução como uma molécula de RNA que compreende uma UTR da sequência R2-CGCCACC (SEQ ID NO:1) e uma molécula de RNA que compreende uma UTR da sequência R2-CNGCCACC (SEQ ID NO:2), respectivamente. A eficiência de tradução de uma dada molécula de RNA que compreende uma UTR como descrito no presente documento pode ser determinada pelo versado na técnica por métodos conhecidos na técnica e como descrito a seguir.[00100] The sequence of UTR(s) having any of the above substitutions compared to a UTR of the sequence R2-CGCCACC (SEQ ID NO:1) or compared to a UTR of the sequence R2-CNGCCACC (SEQ ID NO:2) can result in an RNA molecule that shows an equal or similar translation efficiency, preferably a higher translation efficiency as an RNA molecule comprising a UTR of the sequence R2-CGCCACC (SEQ ID NO:1) and an RNA molecule comprising a UTR of the sequence R2-CNGCCACC (SEQ ID NO:2), respectively. The translation efficiency of a given RNA molecule comprising a UTR as described herein can be determined by one of skill in the art by methods known in the art and as described below.

[00101] A eficiência de tradução é a taxa de tradução de mRNA em polipeptídeos ou proteínas em células. A eficiência de tradução de um dado mRNA é medida como o número de proteínas ou polipeptídeos que são traduzidos por mRNA por unidade de tempo. A tradução é o processo no qual ribossomas celulares criam proteínas e é bem conhecida pelo versado na técnica. Brevemente, na tradução, o RNA mensageiro (mRNA) que é produzido por transcrição de DNA é decodificado por um ribossoma para produzi uma cadeia de aminoácido específica ou um polipeptídeo ou uma proteína.[00101] Translation efficiency is the rate of translation of mRNA into polypeptides or proteins in cells. The translation efficiency of a given mRNA is measured as the number of proteins or polypeptides that are translated per mRNA per unit time. Translation is the process in which cellular ribosomes create proteins and is well known to those skilled in the art. Briefly, in translation, messenger RNA (mRNA) that is produced by DNA transcription is decoded by a ribosome to produce a specific amino acid chain or a polypeptide or a protein.

[00102] Dessa forma, a eficiência de tradução de uma dada molécula de RNA que abriga uma sequência de UTR modificada com qualquer uma das substituições acima é, de preferência, igual ou superior em comparação com a eficiência de tradução do mesmo dado RNA, mas que abriga uma UTR de R2- CGCCACC (SEQ ID NO:1) ou R2-CNGCCACC (SEQ ID NO:2) como definido no presente documento acima, respectivamente. Consequentemente, o número de proteínas ou polipeptídeos codificados pela região de codificação da molécula de RNA que abriga uma sequência de UTR modificada com qualquer uma das substituições acima que são traduzidas por RNA por unidade de tempo é pelo menos igual ou é, de preferência, superior ao número de proteínas ou polipeptídeos codificados pela região de codificação da molécula de RNA que abriga uma UTR de R2-CGCCACC (SEQ ID NO:1) ou R2-CNGCCACC (SEQ ID NO:2) como definido no presente documento acima, respectivamente, que são traduzidos por RNA por unidade de tempo.[00102] Thus, the translation efficiency of a given RNA molecule harboring a modified UTR sequence with any of the above substitutions is preferably equal to or higher compared to the translation efficiency of the same given RNA but harboring a UTR of R2-CGCCACC (SEQ ID NO:1) or R2-CNGCCACC (SEQ ID NO:2) as defined herein above, respectively. Accordingly, the number of proteins or polypeptides encoded by the coding region of the RNA molecule harboring a modified UTR sequence with any of the above substitutions that are translated by RNA per unit time is at least equal to or is preferably higher than the number of proteins or polypeptides encoded by the coding region of the RNA molecule harboring a UTR of R2-CGCCACC (SEQ ID NO:1) or R2-CNGCCACC (SEQ ID NO:2) as defined herein above, respectively, that are translated by RNA per unit time.

[00103] A eficiência de tradução, no contexto da presente invenção é, de preferência, a taxa de mRNA traduzido em proteína em uma célula em um determinado ponto no tempo em relação à quantidade de mRNA que codifica a respectiva proteína na dita célula no mesmo ponto no tempo. Dessa forma, a eficiência de tradução é o quociente do mRNA traduzido em proteína em uma célula em um determinado ponto no tempo e a quantidade de mRNA que codifica a respectiva proteína. Ambos os parâmetros, isto é, o mRNA traduzido em uma proteína bem como a quantidade de mRNA que codifica a respectiva proteína, podem ser determinados por métodos conhecidos na técnica. Como exemplos não limitadores, a quantidade de mRNA traduzido em proteína em uma célula pode, por exemplo, ser determinada conforme determinado pela citometria de fluxo (FC) enquanto a quantidade de mRNA que codifica a respectiva proteína pode, por exemplo, ser medida por qPCR.[00103] Translation efficiency, in the context of the present invention, is preferably the ratio of mRNA translated into protein in a cell at a given point in time to the amount of mRNA encoding the respective protein in said cell at the same point in time. Thus, translation efficiency is the quotient of the mRNA translated into protein in a cell at a given point in time and the amount of mRNA encoding the respective protein. Both parameters, i.e. the mRNA translated into a protein as well as the amount of mRNA encoding the respective protein, can be determined by methods known in the art. As non-limiting examples, the amount of mRNA translated into protein in a cell can, for example, be determined as determined by flow cytometry (FC) while the amount of mRNA encoding the respective protein can, for example, be measured by qPCR.

[00104] A UTR(s) como definido no item (b) no presente documento não é particularmente limitada às sequências específicas acima, mas pode também se referir a (a) sequência de UTR (ou sequências) que compreende uma sequência que mostra (a) adição(ões) d nucleotídeo(s) em comparação com tais sequências, em que o(s) nucleotídeo(s) adicional(is) pode(m) ser adicionado(s) no terminal 5’ da UTR descrita acima (ou UTRs). O(s) nucleotídeo(s) adicional(is) compreende(m) cadeias de polinucleotídeo de até 0 (sem mudanças), 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 nucleotídeos, de preferência, de até 20 nucleotídeos. Com mais preferência, são adicionados 11, 12, 13, 14, 15, 16, 18 ou 19 nucleotídeos no terminal 5’. Com mais preferência ainda, são adicionados até 30 nucleotídeos no terminal 5’.[00104] The UTR(s) as defined in item (b) herein is not particularly limited to the specific sequences above, but may also refer to (a) a UTR sequence (or sequences) comprising a sequence showing (a) addition(s) of nucleotide(s) compared to such sequences, wherein the additional nucleotide(s) may be added at the 5' terminus of the above-described UTR (or UTRs). The additional nucleotide(s) comprise polynucleotide chains of up to 0 (no changes), 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 nucleotides, preferably of up to 20 nucleotides. More preferably, 11, 12, 13, 14, 15, 16, 18 or 19 nucleotides are added at the 5' terminus. Most preferably, up to 30 nucleotides are added at the 5' terminus.

[00105] À luz da lógica de que a adição de nucleotídeos provavelmente não mudará as propriedades funcionais acima da respectiva UTR (ou UTRs), a adição dos nucleotídeos pode também ter um comprimento de até 40, 50, 60, 70, 80, 90 ou mesmo 100 nucleotídeos ou, ainda mais, até 200, 300, 400 ou 500 nucleotídeos desde que essas sequências tenham uma capacidade similar (em termos da eficiência de tradução descrita acima) como as UTRs definidas no item (b) no presente documento.[00105] In light of the logic that the addition of nucleotides is unlikely to change the above functional properties of the respective UTR (or UTRs), the addition of the nucleotides may also have a length of up to 40, 50, 60, 70, 80, 90 or even 100 nucleotides or, even longer, up to 200, 300, 400 or 500 nucleotides as long as these sequences have a similar capacity (in terms of the translation efficiency described above) as the UTRs defined in item (b) herein.

[00106] Em uma modalidade preferida, a UTR como definido no item (b1) no presente documento tem um comprimento máximo de 11, 12 ou 13 nucleotídeos. De preferência, a UTR como definido no item (b1) no presente documento tem um comprimento máximo de 13 nucleotídeos se R2 é GGGAGA (SEQ ID NO: 7) ou GGGAGA (SEQ ID NO: 8).[00106] In a preferred embodiment, the UTR as defined in item (b1) herein has a maximum length of 11, 12 or 13 nucleotides. Preferably, the UTR as defined in item (b1) herein has a maximum length of 13 nucleotides if R2 is GGGAGA (SEQ ID NO: 7) or GGGAGA (SEQ ID NO: 8).

[00107] De preferência, a UTR como definido no item (b1) no presente documento tem um comprimento máximo de 11 nucleotídeos se R2 é GAAG (SEQ ID NO: 9) ou GGGA (SEQ ID NO: 10).[00107] Preferably, the UTR as defined in item (b1) herein has a maximum length of 11 nucleotides if R2 is GAAG (SEQ ID NO: 9) or GGGA (SEQ ID NO: 10).

[00108] Em uma outra modalidade preferida, a UTR como definido no item (b2) no presente documento tem um comprimento máximo de 12, 13 ou 14 nucleotídeos. De preferência, a UTR como definido no item (b2) no presente documento tem um comprimento máximo de 14 nucleotídeos se R2 é GGGAGA (SEQ ID NO: 7) ou GGGAGA (SEQ ID NO: 8).[00108] In another preferred embodiment, the UTR as defined in item (b2) herein has a maximum length of 12, 13 or 14 nucleotides. Preferably, the UTR as defined in item (b2) herein has a maximum length of 14 nucleotides if R2 is GGGAGA (SEQ ID NO: 7) or GGGAGA (SEQ ID NO: 8).

[00109] De preferência, a UTR como definido no item (b2) no presente documento tem um comprimento máximo de 12 nucleotídeos se R2 é GAAG (SEQ ID NO: 9) ou GGGA (SEQ ID NO: 10).[00109] Preferably, the UTR as defined in item (b2) herein has a maximum length of 12 nucleotides if R2 is GAAG (SEQ ID NO: 9) or GGGA (SEQ ID NO: 10).

[00110] As moléculas de RNA da presente invenção contendo a(s) UTR(s) descrita(s) acima pode(m) ser gerada(s)/sintetizada(s) recombinantemente (por exemplo, em um sistema in vivo ou um in vitro) ou sinteticamente por métodos conhecidos pelo versado na técnica.[00110] The RNA molecules of the present invention containing the UTR(s) described above can be generated/synthesized recombinantly (e.g., in an in vivo or an in vitro system) or synthetically by methods known to the skilled artisan.

[00111] A transcrição in vitro de RNA normalmente exige um modelo de DNA linear contendo uma região promotora de filamento duplo onde a RNA polimerase dependente de DNA se liga e inicia a síntese de RNA enquanto a região de codificação pode ser de filamento duplo ou de filamento simples. No caso de o modelo de DNA linear conter uma região de codificação de filamento simples, o filamento antissenso (isto é, o filamento que é lido pela polimerase dependente de DNA) da região de codificação é parte do modelo. As polimerases de RNA dependentes de DNA comuns são a polimerase de T7, a polimerase de T3, a polimerase de SP6 e a polimerase de K11. A sequência completa de seus respectivos promotores é mostrada nas SEQ ID NOs: 3 a 6.[00111] In vitro transcription of RNA typically requires a linear DNA template containing a double-stranded promoter region where DNA-dependent RNA polymerase binds and initiates RNA synthesis while the coding region can be either double-stranded or single-stranded. In the case where the linear DNA template contains a single-stranded coding region, the antisense strand (i.e., the strand that is read by DNA-dependent RNA polymerase) of the coding region is part of the template. Common DNA-dependent RNA polymerases are T7 polymerase, T3 polymerase, SP6 polymerase, and K11 polymerase. The complete sequence of their respective promoters is shown in SEQ ID NOs: 3 to 6.

[00112] Os modelos de transcrição para uma transcrição in vitro incluem, por exemplo, modelos de cDNA sintetizados de um precursor de RNA, modelos gerados por PCR, oligonucleotídeos quimicamente sintetizados e construtos de plasmídeo. Muitos vetores de clonagem de plasmídeo amplamente usados abrigam promotores de polimerase de fago situados em cada lado de múltiplos sítios de clonagem para permitir a transcrição de qualquer filamento de uma sequência de nucleotídeos inserida nos múltiplos sítios de clonagem. Vetores de clonagem comumente usados incluem, por exemplo, vetores pCRII da Invitrogen, pGEM da Promega e pBluescript da Stratagene. A família pTRIPLEscript da Ambion de vetores contém todos os três promotores de polimerase de fago em conjunto (no mesmo lado dos múltiplos sítios de clonagem), permitindo que qualquer uma das três polimerases, SP6, T7 ou T3 seja usada.[00112] Transcription templates for in vitro transcription include, for example, cDNA templates synthesized from an RNA precursor, PCR-generated templates, chemically synthesized oligonucleotides, and plasmid constructs. Many widely used plasmid cloning vectors harbor phage polymerase promoters located on either side of multiple cloning sites to allow transcription of any strand of a nucleotide sequence inserted into the multiple cloning sites. Commonly used cloning vectors include, for example, Invitrogen's pCRII, Promega's pGEM, and Stratagene's pBluescript vectors. Ambion's pTRIPLEscript family of vectors contains all three phage polymerase promoters in tandem (on the same side of the multiple cloning sites), allowing any of the three polymerases, SP6, T7, or T3, to be used.

[00113] As moléculas de RNA da presente invenção podem ser produzidas recombinantemente em sistemas in vivo por métodos conhecidos pelo versado na técnica.[00113] The RNA molecules of the present invention can be produced recombinantly in in vivo systems by methods known to those skilled in the art.

[00114] Alternativamente, as moléculas de RNA da presente invenção podem ser produzidas em um sistema in vitro com o uso, por exemplo, de um sistema de transcrição in vitro. Sistemas de transcrição in vitro são comumente conhecidos e normalmente exigem um modelo de DNA linear purificado contendo uma sequência de DNA “que codifica” a molécula de RNA, em que a dita sequência de DNA está sob o controle de um promotor apropriado. Ademais, um sistema de transcrição in vitro também comumente exige trifosfatos de ribonucleosídeo, um sistema de tampão que inclui DTT e íons de magnésio, e uma RNA polimerase apropriada que fornece a atividade enzimática para a transcrição in vitro da sequência de DNA em uma molécula de RNA correspondente da presente invenção.[00114] Alternatively, the RNA molecules of the present invention may be produced in an in vitro system using, for example, an in vitro transcription system. In vitro transcription systems are commonly known and typically require a purified linear DNA template containing a DNA sequence “coding” for the RNA molecule, wherein said DNA sequence is under the control of an appropriate promoter. Furthermore, an in vitro transcription system also commonly requires ribonucleoside triphosphates, a buffer system that includes DTT and magnesium ions, and an appropriate RNA polymerase that provides the enzymatic activity for in vitro transcription of the DNA sequence into a corresponding RNA molecule of the present invention.

[00115] Além disso, as moléculas de RNA podem ser quimicamente sintetizadas, por exemplo, por síntese química convencional em um sintetizador de sequência de nucleotídeos automatizado com o uso de um suporte de fase sólida e técnicas padrão ou por síntese química das respectivas sequências de DNA e subsequente transcrição in vitro ou in vivo das mesmas.[00115] Furthermore, RNA molecules can be chemically synthesized, for example, by conventional chemical synthesis on an automated nucleotide sequence synthesizer using a solid phase support and standard techniques or by chemical synthesis of the respective DNA sequences and subsequent in vitro or in vivo transcription thereof.

[00116] De acordo com o disposto acima, a presente invenção fornece moléculas de RNA/moléculas de ácido polirribonucleico, de preferência, moléculas de ácido polirribonucleico modificadas, em que um módulo da dita molécula de RNA, isto é, “uma região de codificação que inclui um códon inicial em seu terminal 5’” (módulo (a)), codifica um polipeptídeo. Os termos ácido nucleico e polinucleotídeo são usados de forma intercambiável e incluem qualquer composto e/ou substância que compreende um polímero de nucleotídeos. O termo nucleotídeo inclui desoxinucleotídeos e ribonucleotídeos. Os termos ácido ribonucleico e polirribonucleotídeo são usados de forma intercambiável e, em certas modalidades, incluem qualquer composto e/ou substância que compreende um polímero de nucleotídeos em que mais que 50% dos nucleotídeos são ribonucleotídeos. Em certas modalidades, polirribonucleotídeos compreendem um polímero de nucleotídeos, em que mais que 60%, 70%, 75%, 80%, 90%, mais que 95%, mais que 99% ou 100% dos nucleotídeos são ribonucleotídeos. Polirribonucleotídeos em que um ou mais nucleotídeos são nucleotídeos modificados podem ser referidos como polirribonucleotídeos modificados. Entretanto, o termo “polirribonucleotídeos” pode incluir polirribonucleotídeos modificados.[00116] In accordance with the above, the present invention provides RNA molecules/polyribonucleic acid molecules, preferably modified polyribonucleic acid molecules, wherein a module of said RNA molecule, i.e., “a coding region that includes a start codon at its 5’ terminus” (module (a)), encodes a polypeptide. The terms nucleic acid and polynucleotide are used interchangeably and include any compound and/or substance that comprises a polymer of nucleotides. The term nucleotide includes deoxynucleotides and ribonucleotides. The terms ribonucleic acid and polyribonucleotide are used interchangeably and, in certain embodiments, include any compound and/or substance that comprises a polymer of nucleotides in which more than 50% of the nucleotides are ribonucleotides. In certain embodiments, polyribonucleotides comprise a polymer of nucleotides, wherein greater than 60%, 70%, 75%, 80%, 90%, greater than 95%, greater than 99%, or 100% of the nucleotides are ribonucleotides. Polyribonucleotides in which one or more nucleotides are modified nucleotides may be referred to as modified polyribonucleotides. However, the term “polyribonucleotides” may include modified polyribonucleotides.

[00117] A sequência das moléculas de RNA/polirribonucleotídeos pode ser derivada de, por exemplo, qualquer ácido nucleico adequado que compreende as informações genéticas de um gene de interesse. Exemplos de ácidos nucleicos incluem DNA genômico, RNA ou cDNA de qualquer célula bacteriana ou de arquea que compreende o gene (ou genes) de interesse. Os polinucleotídeos podem ser derivados de ácidos nucleicos que portam genes mutados e polimorfismos. Uma molécula de RNA/polirribonucleotídeo da presente invenção compreende uma sequência que não é particularmente limitada e pode compreender, como módulo A, qualquer região de codificação desejada que é expressa em uma dada célula. Em uma modalidade preferida, a dita sequência pode ser uma região de codificação que codifica um polipeptídeo/proteína desejada como apresentado acima. De preferência, alinhado com o disposto acima, a molécula de RNA/polirribonucleotídeo compreende adicionalmente uma sequência não traduzida posicionada a montante (5’) do códon inicial do módulo A, uma sequência não traduzida posicionada a jusante (3’) do códon de parada do módulo A, ou tanto a sequência não traduzida posicionada a montante (5’) do códon inicial do módulo A como uma sequência não traduzida posicionada a jusante (3’) do códon de parada do módulo A. Em uma modalidade preferida, uma molécula de RNA/polirribonucleotídeo da presente invenção pode ser uma molécula de RNA/polirribonucleotídeo modificado.[00117] The sequence of the RNA/polyribonucleotide molecules may be derived from, for example, any suitable nucleic acid comprising the genetic information of a gene of interest. Examples of nucleic acids include genomic DNA, RNA or cDNA from any bacterial or archaeal cell comprising the gene(s) of interest. Polynucleotides may be derived from nucleic acids carrying mutated genes and polymorphisms. An RNA/polyribonucleotide molecule of the present invention comprises a sequence that is not particularly limited and may comprise, as module A, any desired coding region that is expressed in a given cell. In a preferred embodiment, said sequence may be a coding region encoding a desired polypeptide/protein as set forth above. Preferably, in line with the above, the RNA/polyribonucleotide molecule further comprises an untranslated sequence positioned upstream (5') of the start codon of module A, an untranslated sequence positioned downstream (3') of the stop codon of module A, or both the untranslated sequence positioned upstream (5') of the start codon of module A and an untranslated sequence positioned downstream (3') of the stop codon of module A. In a preferred embodiment, an RNA/polyribonucleotide molecule of the present invention may be a modified RNA/polyribonucleotide molecule.

[00118] Além dos quatro ribonucleotídeos clássicos, a saber, adenosina, guanosina, citidina e uridina, existem inúmeros análogos de cada uma dessas nucleobases. Às vezes ao longo e na literatura, esses análogos, ou moléculas de RNA/polirribonucleotídeos que incluem um ou mais desses análogos, são chamados de modificados (por exemplo, nucleotídeos modificados ou ribonucleotídeos modificados). Alguns análogos diferem das nucleobases canônicas acima, mas ainda podem existir na natureza. Outros análogos são de ocorrência não natural. Qualquer tipo de análogo é contemplado.[00118] In addition to the four classical ribonucleotides, namely adenosine, guanosine, cytidine, and uridine, there are numerous analogues of each of these nucleobases. Sometimes throughout and in the literature, these analogues, or RNA/polyribonucleotide molecules that include one or more of these analogues, are referred to as modified (e.g., modified nucleotides or modified ribonucleotides). Some analogues differ from the above canonical nucleobases, but may still exist in nature. Other analogues are non-naturally occurring. Any type of analogue is contemplated.

[00119] Em certas modalidades, as moléculas de RNA/polirribonucleotídeos da presente invenção compreendem análogos de nucleotídeo (por exemplo, o polirribonucleotídeo compreende um polirribonucleotídeo modificado). São fornecidos abaixo análogos de nucleotídeo (por exemplo, análogos de U; análogos de C; análogos de A; análogos de G). Além disso, em certas modalidades, uma molécula de RNA/polirribonucleotídeo ou outro ácido nucleico da revelação pode também compreender (adicional ou alternativamente) modificações na cadeia principal de fosfodiéster ou na ligação entre nucleobases. Ácidos nucleicos exemplares que podem formar parte ou a totalidade de uma molécula de RNA/polirribonucleotídeo da revelação incluem, sem limitação, ácidos ribonucleicos (RNAs), ácidos desoxirribonucleicos (DNAs), ácidos nucleicos de treose (TNAs), ácidos nucleicos de glicol (GNAs), ácidos nucleicos de peptídeo (PNAs), ácidos nucleicos travados (LNAs, incluindo LNA que tem uma configuração beta-d-ribo, alfa-LNA que tem uma configuração alfa-l- ribo (um diastereômero de LNA), 2'-amino-LNA que tem uma funcionalização de 2'-;imino e 2'-amino-alfa-LNA que tem uma funcionalização de 2'-;imino) ou híbridos dos mesmos.[00119] In certain embodiments, the RNA/polyribonucleotide molecules of the present invention comprise nucleotide analogs (e.g., the polyribonucleotide comprises a modified polyribonucleotide). Nucleotide analogs (e.g., U analogs; C analogs; A analogs; G analogs) are provided below. Furthermore, in certain embodiments, an RNA/polyribonucleotide molecule or other nucleic acid of the disclosure can also comprise (additionally or alternatively) modifications to the phosphodiester backbone or the linkage between nucleobases. Exemplary nucleic acids that may form part or all of an RNA/polyribonucleotide molecule of the disclosure include, without limitation, ribonucleic acids (RNAs), deoxyribonucleic acids (DNAs), threose nucleic acids (TNAs), glycol nucleic acids (GNAs), peptide nucleic acids (PNAs), locked nucleic acids (LNAs, including LNA having a beta-d-ribo configuration, alpha-LNA having an alpha-l-ribo configuration (a diastereomer of LNA), 2'-amino-LNA having a 2'-imino functionalization, and 2'-amino-alpha-LNA having a 2'-imino functionalization), or hybrids thereof.

[00120] Em certas modalidades, uma modificação pode ser em um ou mais nucleosídeos ou na cadeia principal da molécula de ácido nucleico/polinucleotídeo. Em certas modalidades, uma modificação pode ser tanto em um nucleosídeo como em uma ligação de cadeia principal. Em certas modalidades, uma modificação pode ser manipulada em um polinucleotídeo in vitro. Em certas modalidades, um ribonucleotídeo/nucleotídeo modificado pode ser também sintetizado pós-transcricionalmente por modificação covalente dos ribonucleotídeos/nucleotídeos clássicos/naturais.[00120] In certain embodiments, a modification can be to one or more nucleosides or to the backbone of the nucleic acid/polynucleotide molecule. In certain embodiments, a modification can be to both a nucleoside and a backbone linkage. In certain embodiments, a modification can be engineered into a polynucleotide in vitro. In certain embodiments, a modified ribonucleotide/nucleotide can also be synthesized post-transcriptionally by covalent modification of classical/natural ribonucleotides/nucleotides.

[00121] Uma molécula de RNA/polirribonucleotídeo da presente invenção pode ser uma molécula de RNA/polirribonucleotídeo modificado e, em certas modalidades, pode compreender análogos de purinas e/ou análogos de pirimidinas. Em certas modalidades, uma molécula de RNA/polirribonucleotídeo modificado da presente invenção compreende um análogo de pirimidina, como um análogo de uridina e/ou um análogo de citidina. Em certas modalidades, uma molécula de RNA/polirribonucleotídeo modificado da presente invenção compreende um análogo de uridina e um análogo de citidina. Em certas modalidades, a molécula de RNA/polirribonucleotídeo modificado não compreende análogos de adenosina e/ou análogos de guanosina. Em certas modalidades, a molécula de RNA/polirribonucleotídeo compreende um tipo único de análogo de uridina e um tipo único de análogo de citidina (por exemplo, um tipo de análogo, não uma molécula única de análogo - o análogo único pode estar presente em vários percentuais descritos no presente documento). Em outras modalidades, a molécula de RNA/polirribonucleotídeo compreende mais de um tipo de análogo de uridina e/ou citidina e, opcionalmente e se estiver presente, um ou mais análogos de adenosina e/ou guanosina (ou nenhum dos dois ou ambos).[00121] An RNA/polyribonucleotide molecule of the present invention can be a modified RNA/polyribonucleotide molecule, and in certain embodiments, can comprise purine analogs and/or pyrimidine analogs. In certain embodiments, a modified RNA/polyribonucleotide molecule of the present invention comprises a pyrimidine analog, such as a uridine analog and/or a cytidine analog. In certain embodiments, a modified RNA/polyribonucleotide molecule of the present invention comprises a uridine analog and a cytidine analog. In certain embodiments, the modified RNA/polyribonucleotide molecule does not comprise adenosine analogs and/or guanosine analogs. In certain embodiments, the RNA/polyribonucleotide molecule comprises a single type of uridine analog and a single type of cytidine analog (e.g., one type of analog, not a single molecule of analog - the single analog may be present in various percentages described herein). In other embodiments, the RNA/polyribonucleotide molecule comprises more than one type of uridine and/or cytidine analog and, optionally and if present, one or more adenosine and/or guanosine analogs (or neither or both).

[00122] Em alguns casos, uma uridina modificada (por exemplo, análogo de uridina) é selecionada de 2-tiouridina, 5'-metiluridina, pseudouridina, 5-iodouridina (I5U), 4-tiouridina (S4U), 5-bromouridina (Br5U), 2'-metil-2'-desoxiuridina (U2'm), 2'-amino-2'-desoxiuridina (U2'N1I2), 2'-azido-2'-desoxiuridina (U2"Na) e 2'-fluor-2'-desoxiuridina (U2T). Em alguns casos, uma citidina modificada (por exemplo, análogo de citidina) é selecionada de 5-metilcitidina, 3-metilcitidina, 2-tio-citidina, 2'- metil-2'-desoxicitidina (C2'm), 2'-amino-2'-desoxicitidina (C2'NH2), 2'- fluor-2"-desoxicitidina (C2"F), 5-iodocitidina (I5C), 5-bromocitidina (Br5C) e 2'-azido-2'-desoxicitidina (C2'N3). Observar que, com referência a análogos, o disposto acima também se refere a análogos em sua forma de 5’ trifosfato. Em certas modalidades, o análogo de citidina é 5-iodocitidina e o análogo de uridina é 5-iodouridina.[00122] In some cases, a modified uridine (e.g., uridine analog) is selected from 2-thiouridine, 5'-methyluridine, pseudouridine, 5-iodouridine (I5U), 4-thiouridine (S4U), 5-bromouridine (Br5U), 2'-methyl-2'-deoxyuridine (U2'm), 2'-amino-2'-deoxyuridine (U2'N1I2), 2'-azido-2'-deoxyuridine (U2"Na), and 2'-fluoro-2'-deoxyuridine (U2T). In some cases, a modified cytidine (e.g., cytidine analog) is selected from 5-methylcytidine, 3-methylcytidine, 2-thio-cytidine, 2'-methyl-2'-deoxycytidine (C2'm), 2'-amino-2'-deoxycytidine (C2'NH2), 2'-fluoro-2"-deoxycytidine (C2"F), 5-iodocytidine (I5C), 5-bromocytidine (Br5C), and 2'-azido-2'-deoxycytidine (C2'N3). Note that with reference to analogs, the above also refers to analogs in their 5' triphosphate form. In certain embodiments, the cytidine analog is 5-iodocytidine and the uridine analog is 5-iodouridine.

[00123] Em algumas modalidades, a molécula de RNA/polirribonucleotídeo é uma molécula de RNA/polirribonucleotídeo modificado. Em alguns casos, a molécula de RNA/polirribonucleotídeo modificado é pelo menos 25% mais estável em comparação com uma molécula de RNA/polirribonucleotídeo não modificada (sem modificação). Em alguns casos, a molécula de RNA/polirribonucleotídeo modificado pode ser pelo menos 30% mais estável, pelo menos 35% mais estável, pelo menos 40% mais estável, pelo menos 45% mais estável, pelo menos 50% mais estável, pelo menos 55% mais estável, pelo menos 60% mais estável, pelo menos 65% mais estável, pelo menos 70% mais estável, pelo menos 75% mais estável, pelo menos 80% mais estável, pelo menos 85% mais estável, pelo menos 90% mais estável, ou pelo menos 95% mais estável em comparação com uma molécula de RNA/polirribonucleotídeo não modificado. Em certas modalidades, a estabilidade é medida in vivo. Em certas modalidades, a estabilidade é medida in vitro. Em certas modalidades, a estabilidade é quantificada mediante a medição da meia-vida do polirribonucleotídeo.[00123] In some embodiments, the RNA/polyribonucleotide molecule is a modified RNA/polyribonucleotide molecule. In some cases, the modified RNA/polyribonucleotide molecule is at least 25% more stable compared to an unmodified (unmodified) RNA/polyribonucleotide molecule. In some cases, the modified RNA/polyribonucleotide molecule can be at least 30% more stable, at least 35% more stable, at least 40% more stable, at least 45% more stable, at least 50% more stable, at least 55% more stable, at least 60% more stable, at least 65% more stable, at least 70% more stable, at least 75% more stable, at least 80% more stable, at least 85% more stable, at least 90% more stable, or at least 95% more stable compared to an unmodified RNA/polyribonucleotide molecule. In certain embodiments, stability is measured in vivo. In certain embodiments, stability is measured in vitro. In certain embodiments, stability is quantified by measuring the half-life of the polyribonucleotide.

[00124] Uma molécula de RNA/polirribonucleotídeo da presente invenção pode ter nucleotídeos que foram modificados da mesma forma ou então uma mistura de diferentes nucleotídeos modificados. Os nucleotídeos modificados podem ter modificações que são de ocorrência natural ou de ocorrência não natural em RNA mensageiro. Uma mistura de vários nucleotídeos modificados pode ser usada. Por exemplo, um ou mais nucleotídeos modificados em uma molécula de RNA/polirribonucleotídeo pode ter modificações naturais, enquanto uma outra parte tem modificações que não são naturalmente encontradas em mRNA. Adicionalmente, alguns nucleotídeos modificados podem ter uma modificação de base, enquanto outros nucleotídeos modificados têm uma modificação de açúcar. Da mesma forma, é possível que todas as modificações sejam modificações de base ou que todas as modificações sejam modificações de açúcar ou qualquer mistura adequada das mesmas. Em alguns casos, a estabilidade da molécula de RNA/polirribonucleotídeo modificado pode ser seletivamente otimizada mediante a mudança da natureza de bases modificadas no polirribonucleotídeo modificado. TABELA 2: EXEMPLOS NÃO LIMITADORES DE ANÁLOGOS DE U TABELA 3: EXEMPLOS NÃO LIMITADORES DE ANÁLOGOS DE C TABELA 4: EXEMPLOS NÃO LIMITADORES DE ANÁLOGOS DE A TABELA 5: EXEMPLOS NÃO LIMITADORES DE ANÁLOGOS DE G [00124] An RNA/polyribonucleotide molecule of the present invention may have nucleotides that have been modified in the same way or a mixture of different modified nucleotides. The modified nucleotides may have modifications that are naturally occurring or non-naturally occurring in messenger RNA. A mixture of various modified nucleotides may be used. For example, one or more modified nucleotides in an RNA/polyribonucleotide molecule may have naturally occurring modifications, while another portion has modifications that are not naturally found in mRNA. Additionally, some modified nucleotides may have a base modification, while other modified nucleotides have a sugar modification. Likewise, it is possible for all of the modifications to be base modifications, or for all of the modifications to be sugar modifications, or any suitable mixture thereof. In some cases, the stability of the modified RNA/polyribonucleotide molecule may be selectively optimized by changing the nature of modified bases in the modified polyribonucleotide. TABLE 2: NON-LIMITING EXAMPLES OF ANALOGS OF U TABLE 3: NON-LIMITING EXAMPLES OF C ANALOGUES TABLE 4: NON-LIMITING EXAMPLES OF ANALOGUES OF A TABLE 5: NON-LIMITING EXAMPLES OF ANALOGS OF G

[00125] Em certas modalidades, um análogo (por exemplo, um nucleotídeo modificado) pode ser selecionado do grupo que compreende piridin-4-ona ribonucleosídeo, 5-iodouridina, 5-iodocitidina, 5-aza-uridina, 2’-amino-2’-desoxicitidina, 2’-fluor-2’-desoxicitidina, 2-tio-5-aza-uridina, 2- tiouridina, 4-tio-pseudouridina, 2-tio-pseudouridina, 5-hidroxiuridina, 3- metiluridina, 5-carboximetil- uridina, 1-carboximetil-pseudouridina, 5- propinil-uridina, 1-propinil-pseudouridina, 5-taurinometiluridina, 1- taurinometil-pseudouridina, 5-taurinometil-2-tio-uridina, 1-taurinometil-4-tio- uridina, 5-metil-uridina, 1-metil-pseudouridina, 4-tio-l-metil-pseudouridina, 2-tio-l-metil-pseudouridina, 1-metil-l-deaza-pseudouridina, 2-tio-1-metil-l- deaza-pseudouridina, di-hidrouridina, di-hidropseudouridina, 2-tio-di- hidrouridina, 2-tio-di-hidropseudouridina, 2-metoxiuridina, 2-metoxi-4-tio- uridina, 4-metoxi-pseudouridina, 4-metoxi-2-tio-pseudouridina, 5-aza- citidina, pseudoisocitidina, 3-metil-citidina, N4-acetilcitidina, 5- formilcitidina, 5-metilcitidina, N4-metilcitidina, 5-hidroximetilcitidina, 1- metil-pseudoisocitidina, pirrolo-citidina, pirrolo-pseudoisocitidina, 2-tio- citidina, 2-tio-5-metil-citidina, 4-tio-pseudoisocitidina, 4-tio-l-metil- pseudoisocitidina, 4-tio-l-metil-1-deaza-pseudoisocitidina, 1-metil-l-deaza- pseudoisocitidina, zebularina, 5-aza-zebularina, 5-metil-zebularina, 5-aza-2- tio-zebularina, 2-tio-zebularina, 2-metoxi-citidina, 2-metoxi-5-metil-citidina, 4-metoxi-pseudoisocitidina, 4-metoxi-l-metil-pseudoisocitidina, 2- aminopurina, 2, 6-diaminopurina, 7-deaza-adenina, 7-deaza-8-aza-adenina, 7- deaza-2-aminopurina, 7-deaza-8-aza-2-aminopurina, 7-deaza-2,6- diaminopurina, 7-deaza-8-aza-2,6- diaminopurina, 1-metiladenosina, N6- metiladenosina, N6-isopenteniladenosina, N6-(cis-hidroxi- isopentenil)adenosina, 2-metiltio-N6-(cis-hidroxi-isopentenil) adenosina, N6- glicinilcarbamoiladenosina, N6-treonilcarbamoiladenosina, 2-metiltio-N6- treonil carbamoiladenosina, N6,N6-dimetiladenosina, 7-metiladenina, 2- metiltio-adenina, 2-metoxi-adenina, inosina, 1-metil-inosina, wiosina, wibutosina, 7-deaza-guanosina, 7-deaza-8-aza-guanosina, 6-tio-guanosina, 6- tio-7-deaza-guanosina, 6-tio-7-deaza-8-aza-guanosina, 7-metil-guanosina, 6- tio-7-metil-guanosina, 7-metilinosina, 6-metoxi-guanosina, 1-metilguanosina, N2-metilguanosina, N2,N2-dimetilguanosina, 8-oxo-guanosina, 7-metil-8- oxo-guanosina, 1-metil-6-tio-guanosina, N2-metil-6-tio-guanosina e N2,N2- dimetil-6-tio-guanosina.[00125] In certain embodiments, an analog (e.g., a modified nucleotide) can be selected from the group comprising pyridin-4-one ribonucleoside, 5-iodouridine, 5-iodocytidine, 5-aza-uridine, 2’-amino-2’-deoxycytidine, 2’-fluoro-2’-deoxycytidine, 2-thio-5-aza-uridine, 2-thiouridine, 4-thio-pseudouridine, 2-thio-pseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyl-uridine, 1-carboxymethyl-pseudouridine, 5-propynyl-uridine, 1-propynyl-pseudouridine, 5-taurinemethyluridine, 1-taurinemethyl-pseudouridine, 5-taurinemethyl-2-thio-uridine, 1-taurinometil-4-tio- uridina, 5-metil-uridina, 1-metil-pseudouridina, 4-tio-l-metil-pseudouridina, 2-tio-l-metil-pseudouridina, 1-metil-l-deaza-pseudouridina, 2-tio-1-metil-l- deaza-pseudouridina, di-hidrouridina, di-hidropseudouridina, 2-tio-di- hidrouridina, 2-tio-di-hidropseudouridina, 2-metoxiuridina, 2-metoxi-4-tio- uridina, 4-metoxi-pseudouridina, 4-metoxi-2-tio-pseudouridina, 5-aza- citidina, pseudoisocitidina, 3-metil-citidina, N4-acetilcitidina, 5- formilcitidina, 5-metilcitidina, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methyl-pseudoisocitidine, pyrrolo-cytidine, pyrrolo-pseudoisocitidine, 2-thio-cytidine, 2-thio-5-methyl-cytidine, 4-thio-pseudoisocitidine, 4-thio-l-methyl-pseudoisocitidine, 4-thio-l-methyl-1-deaza-pseudoisocitidine, , 1-methyl-l-deaza-pseudoisocytidine, zebularine, 5-aza-zebularine, 5-methyl-zebularine, 5-aza-2-thio-zebularine, 2-thio-zebularine, 2-methoxy-cytidine, 2-methoxy-5-methyl-cytidine, 4-methoxy-pseudoisocitidine, 4-methoxy-l-methyl-pseudoisocitidine, 2- aminopurine, 2, 6-diaminopurine, 7-deaza-adenine, 7-deaza-8-aza-adenine, 7-deaza-2-aminopurine, 7-deaza-8-aza-2-aminopurine, 7-deaza-2,6- diaminopurine, 7-deaza-8-aza-2,6- diaminopurine, 1-methyladenosine, - methyladenosine, N6-isopentenyladenosine, N6-(cis-hydroxy-isopentenyl)adenosine, 2-methylthio-N6-(cis-hydroxy-isopentenyl)adenosine, N6-glycinylcarbamoyladenosine, N6-threonylcarbamoyladenosine, 2-methylthio-N6-threonyl carbamoyladenosine, N6,N6-dimethyladenosine, 7-methyladenine, 2-methylthio-adenine, 2-methoxy-adenine, inosine, 1-methyl-inosine, wiosine, wibutosine, 7-deaza-guanosine, 7-deaza-8-aza-guanosine, 6-thio-guanosine, 6-thio-7-deaza-guanosine, 6-thio-7-deaza-8-aza-guanosine, 7 -methyl-guanosine, 6-thio-7-methyl-guanosine, 7-methylinosine, 6-methoxy-guanosine, 1-methylguanosine, N2-methylguanosine, N2,N2-dimethylguanosine, 8-oxo-guanosine, 7-methyl-8-oxo-guanosine, 1-methyl-6-thio-guanosine, N2-methyl-6-thio-guanosine and N2,N2- dimethyl-6-thio-guanosine.

[00126] Em certas modalidades, uma molécula de RNA/polirribonucleotídeo modificado da presente invenção não inclui pseudouridina. Em certas modalidades, uma molécula de RNA/polirribonucleotídeo modificado da presente invenção não inclui 5-metil citidina. Em certas modalidades, uma molécula de RNA/polirribonucleotídeo modificado da presente invenção não inclui 5-metil uridina. Em certas modalidades, uma molécula de RNA/polirribonucleotídeo modificado da presente invenção compreende análogos de U e análogos de C, em que tais análogos de U podem, todos, ser o mesmo análogo ou podem ser análogos diferentes (por exemplo, mais de um tipo de análogo), e em que tais análogos de C podem, todos, ser o mesmo análogo ou podem ser análogos diferentes (por exemplo, mais de um tipo de análogo). Em certas modalidades, uma molécula de RNA/polirribonucleotídeo modificado da presente invenção não inclui análogos de adenosina e análogos de guanosina.[00126] In certain embodiments, a modified RNA/polyribonucleotide molecule of the present invention does not include pseudouridine. In certain embodiments, a modified RNA/polyribonucleotide molecule of the present invention does not include 5-methyl cytidine. In certain embodiments, a modified RNA/polyribonucleotide molecule of the present invention does not include 5-methyl uridine. In certain embodiments, a modified RNA/polyribonucleotide molecule of the present invention comprises U analogs and C analogs, wherein such U analogs may all be the same analog or may be different analogs (e.g., more than one type of analog), and wherein such C analogs may all be the same analog or may be different analogs (e.g., more than one type of analog). In certain embodiments, a modified RNA/polyribonucleotide molecule of the present invention does not include adenosine analogs and guanosine analogs.

[00127] Conforme descrito em detalhes no presente documento, quando uma molécula de RNA/polirribonucleotídeo compreende um polirribonucleotídeo modificado, análogos podem estar presentes como uma certa proporção dos nucleotídeos no composto (por exemplo, um dado percentual de uma dada nucleobase pode ser análogo, como descrito no presente documento).[00127] As described in detail herein, when an RNA/polyribonucleotide molecule comprises a modified polyribonucleotide, analogs may be present as a certain proportion of the nucleotides in the compound (e.g., a given percentage of a given nucleobase may be analogous, as described herein).

[00128] Uma molécula de RNA/polirribonucleotídeo que compreende pelo menos um nucleotídeo modificado é uma molécula de RNA/polirribonucleotídeo modificado. Em certas modalidades, pelo menos cerca de 5% da molécula de RNA/polirribonucleotídeo modificado inclui adenosina, citidina, guanosina ou uridina modificada ou de ocorrência não natural (por exemplo, análogos de ou modificada), como os nucleotídeos análogos descritos no presente documento. Em alguns casos, pelo menos cerca de 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50% da molécula de RNA/polirribonucleotídeo modificado inclui adenosina, citidina, guanosina ou uridina modificada ou de ocorrência não natural (por exemplo, análogos de ou modificada). Em alguns casos, no máximo cerca de 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5% da molécula de RNA/polirribonucleotídeo modificado inclui adenosina, citidina, guanosina ou uridina modificada ou de ocorrência não natural.[00128] An RNA/polyribonucleotide molecule comprising at least one modified nucleotide is a modified RNA/polyribonucleotide molecule. In certain embodiments, at least about 5% of the modified RNA/polyribonucleotide molecule includes modified or non-naturally occurring adenosine, cytidine, guanosine, or uridine (e.g., analogs of or modified), such as the analogous nucleotides described herein. In some cases, at least about 5%, 10%, 15%, 20%, 25%, 30%, 40%, 45%, 50% of the modified RNA/polyribonucleotide molecule includes modified or non-naturally occurring adenosine, cytidine, guanosine, or uridine (e.g., analogs of or modified). In some cases, up to about 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5% of the modified RNA/polyribonucleotide molecule includes modified or non-naturally occurring adenosine, cytidine, guanosine, or uridine.

[00129] Em uma modalidade preferida, a molécula de RNA da presente invenção contém uma combinação de nucleotídeos modificados e não modificados. De preferência, a molécula de RNA da presente invenção contém uma combinação de nucleotídeos modificados e não modificados como descrito no documento WO 2011/012316. Tais moléculas de RNA também são conhecidas e comercializadas como “SNIM®-RNA”. Relata-se que a molécula de RNA descrita no documento WO 2011/012316 mostra uma estabilidade aumentada e imunogenicidade diminuída. Em uma modalidade preferida, em tal molécula de RNA modificada, 5 a 50% dos nucleotídeos de citidina e 5 a 50% dos nucleotídeos de uridina são modificados. Os nucleotídeos contendo adenosina e guanosina podem ser não modificados. Os nucleotídeos de adenosina e guanosina podem ser não modificados ou parcialmente modificados, e os mesmos estão, de preferência, presentes em forma não modificada. De preferência, 10 a 35% dos nucleotídeos de citidina e uridina são modificados e, particularmente, de preferência, o teor de nucleotídeos de citidina modificados se encontra na faixa de 7,5 a 25% e o teor dos nucleotídeos de uridina modificados, em uma faixa de 7,5 a 25%. Constatou-se que, de fato, um teor relativamente baixo, por exemplo apenas 10% cada, de nucleotídeos de citidina e uridina modificados pode alcançar as propriedades desejadas. É particularmente preferido que os nucleotídeos de citidina modificados sejam resíduos de 5-metilcitidina e os nucleotídeos de uridina modificados sejam resíduos de 2-tiouridina. Com a máxima preferência, o teor de nucleotídeos de citidina modificados e o teor dos nucleotídeos de uridina modificados é 25%, respectivamente.[00129] In a preferred embodiment, the RNA molecule of the present invention contains a combination of modified and unmodified nucleotides. Preferably, the RNA molecule of the present invention contains a combination of modified and unmodified nucleotides as described in WO 2011/012316. Such RNA molecules are also known and commercially available as “SNIM®-RNA”. The RNA molecule described in WO 2011/012316 is reported to show increased stability and decreased immunogenicity. In a preferred embodiment, in such a modified RNA molecule, 5 to 50% of the cytidine nucleotides and 5 to 50% of the uridine nucleotides are modified. The adenosine and guanosine containing nucleotides may be unmodified. The adenosine and guanosine nucleotides may be unmodified or partially modified, and they are preferably present in unmodified form. Preferably, 10 to 35% of the cytidine and uridine nucleotides are modified, and particularly preferably, the content of modified cytidine nucleotides is in the range of 7.5 to 25% and the content of modified uridine nucleotides is in the range of 7.5 to 25%. It has been found that, in fact, a relatively low content, for example only 10% each, of modified cytidine and uridine nucleotides can achieve the desired properties. It is particularly preferred that the modified cytidine nucleotides are 5-methylcytidine residues and the modified uridine nucleotides are 2-thiouridine residues. Most preferably, the content of modified cytidine nucleotides and the content of modified uridine nucleotides is 25%, respectively.

[00130] Em certas outras modalidades, em tal molécula de RNA/molécula de polirribonucleotídeo modificado, 5 a 50% das citidinas são análogos de C e 5 a 50% das uridinas são análogos de U. Em certas modalidades, em tal molécula de polirribonucleotídeo modificado, 5 a 40% das citidinas são análogos de C e 5 a 40% das uridinas são análogos de U. Em certas modalidades, em tal molécula de RNA/molécula de polirribonucleotídeo modificado, 5 a 30% das citidinas são análogos de C e 5 a 30% das uridinas são análogos de U. Em certas modalidades, em tal molécula de RNA/molécula de polirribonucleotídeo modificado, 10 a 30% das citidinas são análogos de C e 10 a 30% das uridinas são análogos de U. Em certas modalidades, em tal molécula de polirribonucleotídeo modificado, 5 a 20% das citidinas são análogos de C e 5 a 20% das uridinas são análogos de U. Em certas modalidades, em tal molécula de RNA/molécula de polirribonucleotídeo modificado, 5 a 10% dos nucleotídeos de citidina e 5 a 10% dos nucleotídeos de uridina são modificados. Em certas modalidades, em tal molécula de RNA/molécula de polirribonucleotídeo modificado, 25% dos nucleotídeos de citidina e 25% dos nucleotídeos de uridina são modificados. Em certas modalidades, os nucleotídeos contendo adenosina e guanosina podem ser não modificados. Em certas modalidades, os nucleotídeos de adenosina e guanosina podem ser não modificados ou parcialmente modificados, e os mesmos estão, de preferência, presentes em forma não modificada.[00130] In certain other embodiments, in such a modified RNA molecule/polyribonucleotide molecule, 5-50% of the cytidines are C analogs and 5-50% of the uridines are U analogs. In certain embodiments, in such a modified polyribonucleotide molecule, 5-40% of the cytidines are C analogs and 5-40% of the uridines are U analogs. In certain embodiments, in such a modified RNA molecule/polyribonucleotide molecule, 5-30% of the cytidines are C analogs and 5-30% of the uridines are U analogs. In certain embodiments, in such a modified RNA molecule/polyribonucleotide molecule, 10-30% of the cytidines are C analogs and 10-30% of the uridines are U analogs. In certain embodiments, in such a modified RNA molecule/polyribonucleotide molecule, 10-30% of the cytidines are C analogs and 10-30% of the uridines are U analogs. modified polyribonucleotide, 5 to 20% of the cytidines are C analogs and 5 to 20% of the uridines are U analogs. In certain embodiments, in such a modified RNA molecule/polyribonucleotide molecule, 5 to 10% of the cytidine nucleotides and 5 to 10% of the uridine nucleotides are modified. In certain embodiments, in such a modified RNA molecule/polyribonucleotide molecule, 25% of the cytidine nucleotides and 25% of the uridine nucleotides are modified. In certain embodiments, the adenosine and guanosine-containing nucleotides can be unmodified. In certain embodiments, the adenosine and guanosine nucleotides can be unmodified or partially modified, and they are preferably present in unmodified form.

[00131] Conforme apontado acima, em certas modalidades, análogos de U se referem a um tipo único de análogo de U. Em certas modalidades, análogos de U se referem a dois ou mais tipos de análogos de U. Em certas modalidades, análogos de C se refere a um tipo único de análogo de C. Em certas modalidades, análogos de C se refere a dois ou mais tipos de análogos de C.[00131] As noted above, in certain embodiments, U analogs refer to a single type of U analog. In certain embodiments, U analogs refer to two or more types of U analogs. In certain embodiments, C analogs refer to a single type of C analog. In certain embodiments, C analogs refer to two or more types of C analogs.

[00132] Em certas modalidades, o percentual de citidinas em uma molécula de RNA/polirribonucleotídeo que são análogos de citidina não é igual ao percentual de uridinas na molécula de RNA/polirribonucleotídeo que são análogos de uridina. Em certas modalidades, o percentual de análogos de citidina é inferior ao percentual de análogos de uridina. Conforme apontado acima, isso pode ser na presença ou na ausência de análogos de adenosina e guanosina mas, em certas modalidades, é na ausência de análogos de adenosina e análogos de guanosina. Em certas modalidades, polirribonucleotídeos da revelação compreendem menos que 15%, menos que 10%, menos que 5% ou menos que 2% de análogos de adenosina, análogos de guanosina ou ambos.[00132] In certain embodiments, the percentage of cytidines in an RNA/polyribonucleotide molecule that are cytidine analogs is not equal to the percentage of uridines in the RNA/polyribonucleotide molecule that are uridine analogs. In certain embodiments, the percentage of cytidine analogs is less than the percentage of uridine analogs. As noted above, this may be in the presence or absence of adenosine and guanosine analogs, but in certain embodiments, it is in the absence of adenosine analogs and guanosine analogs. In certain embodiments, polyribonucleotides of the disclosure comprise less than 15%, less than 10%, less than 5%, or less than 2% adenosine analogs, guanosine analogs, or both.

[00133] Em certas modalidades, uma molécula de RNA/polirribonucleotídeo da presente invenção compreende análogos de citidina e análogos de uridina, e 5 a 20% das citidinas são análogos de citidina e 25 a 45% das uridinas são análogos de uridina. Em outras palavras, a molécula de RNA/polirribonucleotídeo compreende citidinas modificadas e não modificadas e uridinas modificadas e não modificadas, e 5 a 20% das citidinas compreendem análogos de citidina enquanto 25 a 45% das uridinas compreendem análogos de uridina. Em outras modalidades, a molécula de RNA/polirribonucleotídeo compreende 5 a 10% de análogos de citidina e 30 a 40% de análogos de uridina, como 7 a 9% de análogos de citidina, como cerca de 7, 7,5 ou 8% e, como 32 a 38% de análogos de uridina, como cerca de 33, 34, 35, 36%.[00133] In certain embodiments, an RNA/polyribonucleotide molecule of the present invention comprises cytidine analogs and uridine analogs, and 5 to 20% of the cytidines are cytidine analogs and 25 to 45% of the uridines are uridine analogs. In other words, the RNA/polyribonucleotide molecule comprises modified and unmodified cytidines and modified and unmodified uridines, and 5 to 20% of the cytidines comprise cytidine analogs while 25 to 45% of the uridines comprise uridine analogs. In other embodiments, the RNA/polyribonucleotide molecule comprises 5 to 10% cytidine analogs and 30 to 40% uridine analogs, such as 7 to 9% cytidine analogs, such as about 7, 7.5, or 8%, and such as 32 to 38% uridine analogs, such as about 33, 34, 35, 36%.

[00134] Em certas modalidades, qualquer um dos análogos de uridina e análogos de citidina descritos no presente documento pode ser usado, opcionalmente excluindo pseudouridina. Em certas modalidades, o análogo de citidina compreende ou consiste em (por exemplo, no caso de consistir em, é o tipo de análogo único usado) 5-iodocitidina e o análogo de uridina compreende ou consiste em (por exemplo, no caso de consistir em, é o tipo de análogo único usado) 5-iodouridina.[00134] In certain embodiments, any of the uridine analogs and cytidine analogs described herein can be used, optionally excluding pseudouridine. In certain embodiments, the cytidine analog comprises or consists of (e.g., if consisting of, is the sole type of analog used) 5-iodocytidine and the uridine analog comprises or consists of (e.g., if consisting of, is the sole type of analog used) 5-iodouridine.

[00135] Em certas modalidades de qualquer um dos supracitados, o percentual de análogos de um dado nucleotídeo se refere um percentual de entrada (por exemplo, o percentual de análogos em uma reação de partida, como uma reação de transcrição in vitro de partida). Em certas modalidades de qualquer um dos supracitados, o percentual de análogos de um dado nucleotídeo se refere um percentual de saída (por exemplo, o percentual em um composto sintetizado ou transcrito).[00135] In certain embodiments of any of the foregoing, the percent analogs of a given nucleotide refers to a percent input (e.g., the percent analogs in a starting reaction, such as a starting in vitro transcription reaction). In certain embodiments of any of the foregoing, the percent analogs of a given nucleotide refers to a percent output (e.g., the percent in a synthesized or transcribed compound).

[00136] As moléculas de RNA/moléculas de polirribonucleotídeo da presente invenção podem ser produzidas recombinantemente em sistemas in vivo por métodos conhecidos por um versado na técnica que são descritos em mais detalhes abaixo.[00136] The RNA molecules/polyribonucleotide molecules of the present invention can be produced recombinantly in in vivo systems by methods known to one of skill in the art that are described in more detail below.

[00137] Alternativamente, as moléculas de polirribonucleotídeo modificado da presente invenção podem ser produzidas em um sistema in vitro com o uso de, por exemplo, um sistema de transcrição in vitro que é descrito em mais detalhes abaixo. Um sistema de transcrição in vitro que tem a capacidade de produzir moléculas de RNA/polirribonucleotídeos exige uma mistura de entrada de trifosfatos de nucleosídeo modificados e não modificados para produzir moléculas de RNA/polirribonucleotídeos modificados com as propriedades desejadas da presente invenção. Em certas modalidades, 5 a 50% das citidinas são análogos de citidina em tal mistura de entrada e 5 a 50% das uridinas são análogos de uridina em tal mistura de entrada. Em certas modalidades, 5 a 40% das citidinas são análogos de citidina em tal mistura de entrada e 5 a 40% das uridinas são análogos de uridina em tal mistura de entrada. Em certas modalidades, 5 a 30% das citidinas são análogos de citidina em tal mistura e 5 a 30% das uridinas são análogos de uridina em tal mistura de entrada. Em certas modalidades, 5 a 30% das citidinas são análogos de citidina em tal mistura e 10 a 30% das uridinas são análogos de uridina em tal mistura. Em certas modalidades, 5 a 20% das citidinas são análogos de citidina em tal mistura de entrada e 5 a 20% das uridinas são análogos de uridina em tal mistura de entrada. Em certas modalidades, 5 a 10% das citidinas são análogos de citidina em tal mistura de entrada e 5 a 10% das uridinas são análogos de uridina em tal mistura de entrada. Em certas modalidades, 25% das citidinas são análogos de citidina em tal mistura de entrada e 25% das uridinas são análogos de uridina em tal mistura de entrada. Em certas modalidades, a mistura de entrada não compreende análogos de adenosina e/ou guanosina. Em outras modalidades, opcionalmente, a mistura de entrada compreende um ou mais análogos de adenosina e/ou guanosina (ou nenhuma das duas ou ambas).[00137] Alternatively, the modified polyribonucleotide molecules of the present invention can be produced in an in vitro system using, for example, an in vitro transcription system that is described in more detail below. An in vitro transcription system that has the capability of producing RNA/polyribonucleotide molecules requires an input mixture of modified and unmodified nucleoside triphosphates to produce modified RNA/polyribonucleotide molecules with the desired properties of the present invention. In certain embodiments, 5 to 50% of the cytidines are cytidine analogs in such input mixture and 5 to 50% of the uridines are uridine analogs in such input mixture. In certain embodiments, 5 to 40% of the cytidines are cytidine analogs in such input mixture and 5 to 40% of the uridines are uridine analogs in such input mixture. In certain embodiments, 5-30% of the cytidines are cytidine analogs in such a mixture and 5-30% of the uridines are uridine analogs in such an input mixture. In certain embodiments, 5-30% of the cytidines are cytidine analogs in such a mixture and 10-30% of the uridines are uridine analogs in such a mixture. In certain embodiments, 5-20% of the cytidines are cytidine analogs in such an input mixture and 5-20% of the uridines are uridine analogs in such an input mixture. In certain embodiments, 5-10% of the cytidines are cytidine analogs in such an input mixture and 5-10% of the uridines are uridine analogs in such an input mixture. In certain embodiments, 25% of the cytidines are cytidine analogs in such an input mixture and 25% of the uridines are uridine analogs in such an input mixture. In certain embodiments, the input mixture does not comprise adenosine and/or guanosine analogs. In other embodiments, optionally, the input mixture comprises one or more adenosine and/or guanosine analogs (or neither or both).

[00138] Em certas modalidades, o percentual de citidinas em uma mistura de entrada que são análogos de citidina não é igual ao percentual de uridinas em uma mistura de entrada que são análogos de uridina. Em certas modalidades, o percentual de análogos de citidina em uma mistura de entrada é menor que o percentual de análogos de uridina em uma mistura de entrada. Conforme apontado acima, isso pode ser na presença ou na ausência de análogos de adenosina e guanosina na mistura de entrada, mas, em certas modalidades, é na ausência de análogos de adenosina e análogos de guanosina na mistura de entrada.[00138] In certain embodiments, the percentage of cytidines in an input mixture that are cytidine analogs is not equal to the percentage of uridines in an input mixture that are uridine analogs. In certain embodiments, the percentage of cytidine analogs in an input mixture is less than the percentage of uridine analogs in an input mixture. As noted above, this may be in the presence or absence of adenosine and guanosine analogs in the input mixture, but in certain embodiments, it is in the absence of adenosine analogs and guanosine analogs in the input mixture.

[00139] Em certas modalidades, uma mistura de entrada de nucleotídeos para um sistema de transcrição in vitro que produz uma molécula de RNA/polirribonucleotídeo da presente invenção compreende análogos de citidina e análogos de uridina, e 5 a 20% das citidinas da mistura de entrada são análogos de citidina e 25 a 45% das uridinas da mistura de entrada são análogos de uridina. Em outras palavras, a mistura de entrada compreende citidinas modificadas e não modificadas e uridinas modificadas e não modificadas, e 5 a 20% das citidinas da mistura de entrada compreendem análogos de citidina enquanto 25 a 45% das uridinas da mistura de entrada compreendem análogos de uridina. Em outras modalidades, a mistura de entrada compreende 5 a 10% de análogos de citidina e 30 a 40% de análogos de uridina, como a 7 a 9% de análogos de citidina, como 7, 7,5 ou 8% e, como 32 a 38% de análogos de uridina, como 33, 34, 35, 36%.[00139] In certain embodiments, an input mixture of nucleotides for an in vitro transcription system that produces an RNA/polyribonucleotide molecule of the present invention comprises cytidine analogs and uridine analogs, and 5 to 20% of the cytidines of the input mixture are cytidine analogs and 25 to 45% of the uridines of the input mixture are uridine analogs. In other words, the input mixture comprises modified and unmodified cytidines and modified and unmodified uridines, and 5 to 20% of the cytidines of the input mixture comprise cytidine analogs while 25 to 45% of the uridines of the input mixture comprise uridine analogs. In other embodiments, the input mixture comprises 5 to 10% cytidine analogs and 30 to 40% uridine analogs, such as 7 to 9% cytidine analogs, such as 7, 7.5, or 8%, and such as 32 to 38% uridine analogs, such as 33, 34, 35, 36%.

[00140] Em certas modalidades, qualquer um dos análogos de uridina e análogos de citidina descritos no presente documento pode ser usado, opcionalmente excluindo pseudouridina. Em certas modalidades, o análogo de citidina compreende ou consiste em (por exemplo, é o tipo de análogo C único usado) 5-iodocitidina e o análogo de uridina compreende ou consiste em (por exemplo, é o tipo de análogo U único usado) 5-iodouridina.[00140] In certain embodiments, any of the uridine analogs and cytidine analogs described herein can be used, optionally excluding pseudouridine. In certain embodiments, the cytidine analog comprises or consists of (e.g., is the only type of analog C used) 5-iodocytidine and the uridine analog comprises or consists of (e.g., is the only type of analog U used) 5-iodouridine.

[00141] São descritos análogos exemplares nas Tabelas acima. Deve-se compreender que, para polirribonucleotídeos modificados que codificam o polipeptídeo desejado (módulo (a)), os análogos e nível de modificação é, exceto onde indicado em contrário, considerado em todo o polirribonucleotídeo que codifica o polipeptídeo desejado (módulo (a)), incluindo 5’ e 3’ regiões não traduzidas (por exemplo, o nível de modificação se baseia em razões de entrada de análogos em uma reação de transcrição in vitro de modo que os análogos possam ser incorporados às posições que são transcritos).[00141] Exemplary analogs are described in the Tables above. It should be understood that for modified polyribonucleotides encoding the desired polypeptide (module (a)), the analogs and level of modification is, unless otherwise indicated, considered across the entire polyribonucleotide encoding the desired polypeptide (module (a)), including 5' and 3' untranslated regions (e.g., the level of modification is based on input ratios of analogs into an in vitro transcription reaction so that the analogs can be incorporated into the positions that are transcribed).

[00142] Além disso, as moléculas de RNA/moléculas de polirribonucleotídeo modificadas podem ser quimicamente sintetizadas, por exemplo, por síntese química convencional em um sintetizador de sequência de nucleotídeos automatizado com o uso de um suporte de fase sólida e técnicas padrão ou por síntese química das respectivas sequências de DNA e subsequente transcrição in vitro ou in vivo das mesmas.[00142] Furthermore, the modified RNA molecules/polyribonucleotide molecules can be chemically synthesized, for example, by conventional chemical synthesis on an automated nucleotide sequence synthesizer using a solid phase support and standard techniques or by chemical synthesis of the respective DNA sequences and subsequent in vitro or in vivo transcription thereof.

[00143] Em biologia molecular e genética, a montante e a jusante se referem, ambos, a uma posição relativa em uma molécula de RNA. No contexto da presente invenção, a montante é na direção do terminal 5’ da molécula de RNA e a jusante é na direção do terminal 3’ da molécula.[00143] In molecular biology and genetics, upstream and downstream both refer to a relative position in an RNA molecule. In the context of the present invention, upstream is toward the 5' terminus of the RNA molecule and downstream is toward the 3' terminus of the molecule.

[00144] Consequentemente, na presente invenção, a UTR definida no item (b), acima, está localizada diretamente a montante da região de codificação do item (a), mais especificamente, diretamente a montante do códon inicial da região de codificação. Dessa forma, “diretamente a montante” neste contexto significa que não há nucleotídeos adicionais entre a UTR definida no item (b) e a sequência de codificação que inicia com um códon inicial. Dessa forma, a região de codificação que inicia com um códon inicial está imediatamente adjacente à dita sequência de UTR.[00144] Accordingly, in the present invention, the UTR defined in item (b) above is located directly upstream of the coding region of item (a), more specifically, directly upstream of the start codon of the coding region. Thus, “directly upstream” in this context means that there are no additional nucleotides between the UTR defined in item (b) and the coding sequence that begins with a start codon. Thus, the coding region that begins with a start codon is immediately adjacent to said UTR sequence.

[00145] A molécula de RNA pode estar presente sob a forma de sequências de RNA fundidas de módulos (a) e (b) (definido nos itens (a) e (b), respectivamente, acima) isto é, uma molécula de RNA (fusão) que é formada pela expressão de um gene híbrido produzido pela combinação de pelo menos duas sequências de nucleotídeos que codificam os ditos módulos. Tipicamente, como será explicado com mais detalhes abaixo, isso pode ser realizado por meio da clonagem de um cDNA em um vetor de expressão que permite a transcrição na molécula de RNA. Consequentemente, a molécula de DNA que codifica a molécula de RNA da presente invenção pode ser uma sequência de DNA fundida, isto é, uma molécula quimérica que é formada pela união de dois ou mais polinucleotídeos através do grupo fosfato de um nucleotídeo ligado ao carbono 3’ em um outro nucleotídeo, formando uma ligação fosfodiéster entre as respectivas extremidades de um módulo e a extremidade de uma outra molécula. Dessa forma, as moléculas de DNA acima que codificam os ditos pelo menos dois módulos são unidas sob a forma de uma molécula de DNA. Tal molécula de DNA recombinante é, então, transcrita em sua sequência de ácidos nucleicos de RNA correspondente.[00145] The RNA molecule may be present in the form of fused RNA sequences of modules (a) and (b) (defined in items (a) and (b), respectively, above), that is, an RNA molecule (fusion) that is formed by the expression of a hybrid gene produced by the combination of at least two nucleotide sequences that encode said modules. Typically, as will be explained in more detail below, this can be accomplished by cloning a cDNA into an expression vector that allows transcription into the RNA molecule. Consequently, the DNA molecule that encodes the RNA molecule of the present invention may be a fused DNA sequence, that is, a chimeric molecule that is formed by the union of two or more polynucleotides through the phosphate group of a nucleotide linked to the 3' carbon in another nucleotide, forming a phosphodiester bond between the respective ends of a module and the end of another molecule. In this way, the above DNA molecules encoding the said at least two modules are joined together in the form of a DNA molecule. Such a recombinant DNA molecule is then transcribed into its corresponding RNA nucleic acid sequence.

[00146] Em uma modalidade preferida, R2 é selecionado do grupo que consiste em: (i) GGGAGA (SEQ ID NO: 7); (ii) GGGAGA (SEQ ID NO: 8); (iii) GAAG (SEQ ID NO: 9); e (iv) GGGA (SEQ ID NO: 10).[00146] In a preferred embodiment, R2 is selected from the group consisting of: (i) GGGAGA (SEQ ID NO: 7); (ii) GGGAGA (SEQ ID NO: 8); (iii) GAAG (SEQ ID NO: 9); and (iv) GGGA (SEQ ID NO: 10).

[00147] Em uma modalidade preferida, a molécula de RNA que compreende a sequência R2-CNGCCACC (SEQ ID NO:2) é uma molécula de RNA, em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em U, G ou C, e em que nucleotídeo N não é um A.[00147] In a preferred embodiment, the RNA molecule comprising the sequence R2-CNGCCACC (SEQ ID NO:2) is an RNA molecule, wherein the N nucleotide at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of U, G, or C, and wherein the N nucleotide is not an A.

[00148] Em uma outra modalidade preferida, o dito nucleotídeo N na posição 2 de SEQ ID NO:2 é U.[00148] In another preferred embodiment, said N nucleotide at position 2 of SEQ ID NO:2 is U.

[00149] Em uma modalidade preferida, a molécula de RNA da presente invenção é uma molécula de RNA em que o nucleotídeo seguinte diretamente a jusante do códon inicial não é o nucleotídeo G. Em uma outra modalidade preferida, a molécula de RNA da presente invenção é uma molécula de RNA em que o nucleotídeo seguinte diretamente a jusante do códon inicial é um nucleotídeo selecionado do grupo que consiste em A, U e C.[00149] In a preferred embodiment, the RNA molecule of the present invention is an RNA molecule in which the next nucleotide directly downstream of the start codon is not the nucleotide G. In another preferred embodiment, the RNA molecule of the present invention is an RNA molecule in which the next nucleotide directly downstream of the start codon is a nucleotide selected from the group consisting of A, U, and C.

[00150] Em uma modalidade ainda mais preferida, a molécula de RNA da presente invenção é uma molécula de RNA que compreende um módulo (b1) como definido acima, em que o dito módulo (b1) é uma sequência em que o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G e em que o nucleotídeo seguinte diretamente a jusante do códon inicial é um nucleotídeo selecionado do grupo que consiste em A, U e C.[00150] In an even more preferred embodiment, the RNA molecule of the present invention is an RNA molecule comprising a module (b1) as defined above, wherein said module (b1) is a sequence wherein the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G and wherein the next nucleotide directly downstream of the start codon is a nucleotide selected from the group consisting of A, U and C.

[00151] Em uma outra modalidade ainda mais preferida, a molécula de RNA da presente invenção é uma molécula de RNA que compreende um módulo (b2) como definido acima, em que o dito módulo (b2) é uma sequência em que o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G e em que o nucleotídeo seguinte diretamente a jusante do códon inicial é um nucleotídeo selecionado do grupo que consiste em A, U e C.[00151] In another even more preferred embodiment, the RNA molecule of the present invention is an RNA molecule comprising a module (b2) as defined above, wherein said module (b2) is a sequence wherein the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G and wherein the next nucleotide directly downstream of the start codon is a nucleotide selected from the group consisting of A, U and C.

[00152] Como mencionado acima, a sequência consenso Kozak (gcc)gccRccAUGG pode, inter alia, ser variante no que diz respeito ao nucleotídeo na posição -3 (isto é, 3 nucleotídeos a montante do códon inicial AUG) representada por um “R” desde que essa posição seja uma purina (isto é, adenina ou guanina). Nas UTRs descritas acima, o nucleotídeo que corresponde a essa posição é definido como um “A”. Entretanto, a presente invenção também se refere a moléculas de RNA que compreendem uma UTR correspondente que tem um “G” nessa posição.[00152] As mentioned above, the Kozak consensus sequence (gcc)gccRccAUGG may, inter alia, be variant with respect to the nucleotide at position -3 (i.e., 3 nucleotides upstream of the start codon AUG) represented by an “R” provided that this position is a purine (i.e., adenine or guanine). In the UTRs described above, the nucleotide corresponding to this position is defined as an “A”. However, the present invention also relates to RNA molecules comprising a corresponding UTR having a “G” at this position.

[00153] Consequentemente, em uma modalidade preferida, a molécula de RNA da presente invenção contém uma UTR como definido no item (b1), acima, em que, na dita sequência de UTR de (b1), o A na posição 5 de SEQ ID NO:1 é substituído por um G; ou em que, na dita sequência de UTR de (b2), o A na posição 6 de SEQ ID NO:2 é substituído por um G.[00153] Accordingly, in a preferred embodiment, the RNA molecule of the present invention contains a UTR as defined in item (b1), above, wherein, in said UTR sequence of (b1), the A at position 5 of SEQ ID NO:1 is replaced by a G; or wherein, in said UTR sequence of (b2), the A at position 6 of SEQ ID NO:2 is replaced by a G.

[00154] Como mencionado acima, a molécula de RNA da presente invenção pode também abrigar uma cauda poli-A. Como usado no presente documento, uma cauda poli-A se refere a uma sequência de nucleotídeos de adenina localizada no terminal 3’ do RNA. Uma cauda poli-A é comumente adicionada ao terminal 3’ do RNA por um processo denominado poliadenilação. Dessa forma, a presente invenção se refere a qualquer um dos RNA descritos acima, em que a molécula de RNA compreende uma cauda poli-A no terminal 3’.[00154] As mentioned above, the RNA molecule of the present invention may also harbor a poly-A tail. As used herein, a poly-A tail refers to a sequence of adenine nucleotides located at the 3' terminus of the RNA. A poly-A tail is commonly added to the 3' terminus of the RNA by a process called polyadenylation. Thus, the present invention relates to any of the RNAs described above, wherein the RNA molecule comprises a poly-A tail at the 3' terminus.

[00155] O comprimento da cauda poli-A não é particularmente limitado. Ainda, em modalidades preferidas, a molécula de RNA da presente invenção compreende uma cauda poli-A no terminal 3’, em que a cauda poliA tem um comprimento de pelo menos 50, 60, 70, 80, 90, 100 ou 110 nucleotídeos. Em uma modalidade mais preferida, a molécula de RNA da presente invenção compreende uma cauda poli-A no terminal 3’, em que a cauda poli-A tem um comprimento de pelo menos 120 nucleotídeos. Em outras modalidades preferidas, a molécula de RNA da presente invenção compreende uma cauda poli-A no terminal 3’, em que a cauda poli-A tem um comprimento de pelo menos 150, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900 ou 1.000 nucleotídeos.[00155] The length of the poly-A tail is not particularly limited. Further, in preferred embodiments, the RNA molecule of the present invention comprises a poly-A tail at the 3' terminus, wherein the poly-A tail has a length of at least 50, 60, 70, 80, 90, 100 or 110 nucleotides. In a more preferred embodiment, the RNA molecule of the present invention comprises a poly-A tail at the 3' terminus, wherein the poly-A tail has a length of at least 120 nucleotides. In other preferred embodiments, the RNA molecule of the present invention comprises a poly-A tail at the 3' terminus, wherein the poly-A tail has a length of at least 150, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900 or 1,000 nucleotides.

[00156] No caso de a molécula de RNA da presente invenção ser produzida por um método de transcrição in vitro como descrito no presente documento adicionalmente abaixo, a cauda poli-A está localizada no terminal 3’ do RNA adjacente à UTR no terminal 3’ da molécula de RNA, enquanto o plasmídeo que abriga a molécula de RNA da presente invenção é linearizado antes da transcrição in vitro a jusante da cauda poli-A a fim de assegurar que a molécula de RNA transcrita in vitro contenha a dita cauda poli-A.[00156] In the event that the RNA molecule of the present invention is produced by an in vitro transcription method as described herein further below, the poly-A tail is located at the 3' terminus of the RNA adjacent to the UTR at the 3' terminus of the RNA molecule, while the plasmid harboring the RNA molecule of the present invention is linearized prior to in vitro transcription downstream of the poly-A tail in order to ensure that the in vitro transcribed RNA molecule contains said poly-A tail.

[00157] Como mencionado acima, a molécula de RNA da presente invenção pode estar presente sob a forma de sequências de RNA fundidas de módulos (a) e (b), isto é, a molécula de RNA (fusão) que é formada pela transcrição de um gene híbrido produzido pela combinação de pelo menos duas sequências de nucleotídeos que codificam os ditos módulos. Tipicamente, isso é realizado pela clonagem de um cDNA em um vetor de expressão que permite a transcrição de toda a molécula de RNA. É conhecida uma variedade de métodos para produzir construtos de fusão, incluindo síntese de ácido nucleico, hibridização e/ou amplificação para produzir uma molécula de ácido nucleico de filamento duplo sintética “que codifica” a molécula de RNA da presente invenção. Tal molécula de ácido nucleico de filamento duplo (isto é, molécula de DNA) abriga em um filamento (isto é, no filamento de codificação ou senso) a sequência de DNA que corresponde à molécula de RNA da presente invenção e, consequentemente, “codifica” a molécula de RNA da presente invenção. Em outras palavras, tal molécula de ácido nucleico/DNA de filamento duplo compreende em um filamento as informações genéticas que correspondem à molécula de RNA transcrito da presente invenção como definido no presente documento acima. O termo “codificação” ou “que codifica” no contexto da presente invenção não é apenas usado em seu sentido convencional, isto é, para fazer referência ao DNA de um gene que codifica uma proteína (e, consequentemente, as informações genéticas que podem ser traduzidas em uma sequência de aminoácidos de polipeptídeo ou proteína). Em vez disso, em termos da presente invenção, em um construto em que as sequências de DNA individuais que codificam os módulos (a) e (b) são “fundidas” ou ligadas em uma molécula de DNA única (quimérica), o construto também compreende um componente (isto é, módulo (b)) que não é traduzido em uma proteína. No entanto, a sequência de DNA que corresponde ao módulo (b) fornece as informações, isto é, o “código”, para a estrutura das 5’ UTRs e, consequentemente, o termo “que codifica” na presente invenção também se refere às informações genéticas para as UTRs que podem ser expressadas, isto é, transcritas, se, por exemplo, estiverem presentes em uma molécula de ácido nucleico de filamento duplo. Dessa forma, o termo “que codifica” no contexto da presente invenção, embora seja comumente usado apenas para se referir à codificação/expressão de uma proteína, deve ser entendido de modo que a molécula de ácido nucleico possa ser transcrita na molécula de RNA correspondente que abriga partes que codificam uma proteína ou um polipeptídeo (isto é, módulo (a)) e partes “que codificam” a UTR (isto é, módulo (b)), em que as últimas representam o produto final quando expressadas visto que as UTRs não são traduzidas em proteínas ou polipeptídeos. Tal ácido nucleico de filamento duplo pode ser inserido em vetores de expressão por técnicas de biologia molecular padrão (consulte, por exemplo, Sambrook et al., Molecular Cloning, A laboratory manual, 2a Ed, 1989). O termo “vetor” como “vetor de expressão” ou “vetor de clonagem” no sentido da presente invenção é entendido como uma unidade de filamento duplo circular de DNA que replica em uma célula independentemente do DNA cromossômico e que é usado como um veículo para portar material genético para uma célula, onde isso pode ser replicado e/ou expressado (isto é, transcrito em RNA e traduzido em uma sequência de aminoácidos). Um vetor contendo DNA estranho é denominado DNA recombinante. O próprio vetor é geralmente uma sequência de DNA que tipicamente consistem em um inserto (isto é, módulo (b) que não é traduzido em uma proteína e o módulo (a), a região de codificação) e uma sequência maior que serve como a “cadeia principal” do vetor. Plasmídeos no sentido da presente invenção são encontrados com mais frequência em bactérias e são usados na pesquisa de DNA recombinante para transferir genes entre células e são, como tal, uma subpopulação de “vetores” como usado no sentido da presente invenção.[00157] As mentioned above, the RNA molecule of the present invention may be present in the form of fused RNA sequences of modules (a) and (b), i.e. the RNA molecule (fusion) that is formed by the transcription of a hybrid gene produced by the combination of at least two nucleotide sequences encoding said modules. Typically, this is accomplished by cloning a cDNA into an expression vector that allows transcription of the entire RNA molecule. A variety of methods are known for producing fusion constructs, including nucleic acid synthesis, hybridization and/or amplification to produce a synthetic double-stranded nucleic acid molecule “encoding” the RNA molecule of the present invention. Such a double-stranded nucleic acid molecule (i.e. DNA molecule) harbors in one strand (i.e. in the coding or sense strand) the DNA sequence that corresponds to the RNA molecule of the present invention and, consequently, “encodes” the RNA molecule of the present invention. In other words, such a double-stranded nucleic acid/DNA molecule comprises on one strand the genetic information corresponding to the transcribed RNA molecule of the present invention as defined herein above. The term “coding” or “coding” in the context of the present invention is not only used in its conventional sense, i.e., to refer to the DNA of a gene that encodes a protein (and, consequently, the genetic information that can be translated into a polypeptide or protein amino acid sequence). Rather, in terms of the present invention, in a construct in which the individual DNA sequences encoding modules (a) and (b) are “fused” or linked into a single (chimeric) DNA molecule, the construct also comprises a component (i.e., module (b)) that is not translated into a protein. However, the DNA sequence corresponding to module (b) provides the information, i.e. the “code”, for the structure of the 5’ UTRs and, consequently, the term “coding” in the present invention also refers to the genetic information for the UTRs that can be expressed, i.e. transcribed, if, for example, they are present in a double-stranded nucleic acid molecule. Thus, the term “coding” in the context of the present invention, although commonly used only to refer to the coding/expression of a protein, should be understood so that the nucleic acid molecule can be transcribed into the corresponding RNA molecule that harbors parts that encode a protein or a polypeptide (i.e. module (a)) and parts “coding” the UTR (i.e. module (b)), where the latter represent the final product when expressed since the UTRs are not translated into proteins or polypeptides. Such double-stranded nucleic acid can be inserted into expression vectors by standard molecular biology techniques (see, e.g., Sambrook et al., Molecular Cloning, A laboratory manual, 2nd Ed, 1989). The term “vector” as “expression vector” or “cloning vector” in the sense of the present invention is understood to mean a circular double-stranded unit of DNA that replicates in a cell independently of chromosomal DNA and that is used as a vehicle for delivering genetic material into a cell, where it can be replicated and/or expressed (i.e., transcribed into RNA and translated into an amino acid sequence). A vector containing foreign DNA is called recombinant DNA. The vector itself is usually a DNA sequence that typically consists of an insert (i.e., module (b) that is not translated into a protein and module (a), the coding region) and a larger sequence that serves as the “backbone” of the vector. Plasmids within the meaning of the present invention are most frequently found in bacteria and are used in recombinant DNA research to transfer genes between cells and are, as such, a subpopulation of “vectors” as used within the meaning of the present invention.

[00158] Dessa forma, a presente invenção também se refere a uma molécula de ácido nucleico que codifica a molécula de RNA da presente invenção.[00158] Thus, the present invention also relates to a nucleic acid molecule that encodes the RNA molecule of the present invention.

[00159] O ácido nucleico é, por exemplo, um DNA, que codifica os dois módulos principais (isto é, o módulo (a) e o módulo (b)) da molécula de RNA da presente invenção. A molécula de ácido nucleico acima da presente invenção é, de preferência, uma molécula de ácido nucleico recombinante. A molécula de ácido nucleico da invenção pode ser sintética ou semissintética.[00159] The nucleic acid is, for example, a DNA, which encodes the two main modules (i.e. module (a) and module (b)) of the RNA molecule of the present invention. The above nucleic acid molecule of the present invention is preferably a recombinant nucleic acid molecule. The nucleic acid molecule of the invention may be synthetic or semi-synthetic.

[00160] Fica evidente para o versado na técnica que sequências regulatórias adicionais podem ser adicionadas à molécula de ácido nucleico da invenção que codifica a molécula de RNA. Por exemplo, podem ser empregados intensificadores transcricionais e/ou sequências que permitem expressão induzida. Um sistema induzível adequado é, por exemplo, a expressão de gene regulada por tetraciclina como descrito, por exemplo, por Gossen e Bujard, Proc. Natl. Acad. Sci. USA 89 (1992), 5.547 a 5.551) e Gossen, Trends Biotech. 12 (1994), 58 a 62, ou um sistema de expressão de gene induzível por dexametasona como descrito, por exemplo, por Crook, EMBO J. 8 (1989), 513 a 519.[00160] It is apparent to one skilled in the art that additional regulatory sequences may be added to the nucleic acid molecule of the invention encoding the RNA molecule. For example, transcriptional enhancers and/or sequences that allow for induced expression may be employed. A suitable inducible system is, for example, tetracycline-regulated gene expression as described, for example, by Gossen and Bujard, Proc. Natl. Acad. Sci. USA 89 (1992), 5547-5551) and Gossen, Trends Biotech. 12 (1994), 58-62, or a dexamethasone-inducible gene expression system as described, for example, by Crook, EMBO J. 8 (1989), 513-519.

[00161] A presente invenção também se refere a um vetor, de preferência, um vetor de expressão, que compreende a molécula de ácido nucleico da presente invenção.[00161] The present invention also relates to a vector, preferably an expression vector, comprising the nucleic acid molecule of the present invention.

[00162] Em relação aos vetores que compreendem uma molécula de ácido nucleico que codifica a molécula de RNA da presente invenção, o mesmo se aplica, com as devidas mudanças, como foi apresentado acima no contexto dos vetores que compreendem a molécula de DNA da presente invenção como definido acima.[00162] With respect to vectors comprising a nucleic acid molecule encoding the RNA molecule of the present invention, the same applies, with due changes, as presented above in the context of vectors comprising the DNA molecule of the present invention as defined above.

[00163] A presente invenção também se refere a uma célula hospedeira que compreende o vetor da presente invenção. Dessa forma, a presente invenção se refere a um hospedeiro transfectado ou transformado com o vetor da invenção ou um hospedeiro não humano que porta o vetor da presente invenção, isto é, a uma célula hospedeira ou hospedeiro que é geneticamente modificado com uma molécula de ácido nucleico de acordo com a invenção ou com um vetor que compreende tal molécula de ácido nucleico.[00163] The present invention also relates to a host cell comprising the vector of the present invention. Thus, the present invention relates to a host transfected or transformed with the vector of the invention or a non-human host carrying the vector of the present invention, that is, to a host cell or host that is genetically modified with a nucleic acid molecule according to the invention or with a vector comprising such a nucleic acid molecule.

[00164] Em relação à célula hospedeira que compreende o vetor que compreende uma molécula de ácido nucleico que codifica a molécula de RNA da presente invenção, o mesmo se aplica, com as devidas mudanças, como foi apresentado acima no contexto das células hospedeiras que compreendem os vetores que compreendem a molécula de DNA da presente invenção como definido acima.[00164] In relation to the host cell comprising the vector comprising a nucleic acid molecule encoding the RNA molecule of the present invention, the same applies, with due changes, as was presented above in the context of the host cells comprising the vectors comprising the DNA molecule of the present invention as defined above.

[00165] A presente invenção também se refere a métodos de produção da molécula de RNA da presente invenção por meio do cultivo de uma célula hospedeira que abriga um vetor de expressão que codifica os módulos individuais da presente invenção ou toda a molécula de RNA da invenção em meio de cultura, e da recuperação da molécula de RNA da célula hospedeira ou meio de cultura. A presente invenção pode também se referir a um método para produzir uma molécula de RNA da presente invenção que compreende o cultivo da célula hospedeira da presente invenção e, opcionalmente, a recuperação da molécula de RNA da cultura.[00165] The present invention also relates to methods of producing the RNA molecule of the present invention by culturing a host cell harboring an expression vector encoding individual modules of the present invention or the entire RNA molecule of the invention in culture medium, and recovering the RNA molecule from the host cell or culture medium. The present invention may also relate to a method for producing an RNA molecule of the present invention comprising culturing the host cell of the present invention and, optionally, recovering the RNA molecule from the culture.

[00166] Os métodos de recuperação e/ou subsequentemente de purificação da molécula de RNA da presente invenção são conhecidos pelo versado na técnica.[00166] Methods of recovering and/or subsequently purifying the RNA molecule of the present invention are known to those skilled in the art.

[00167] A presente invenção também se refere a métodos de produção, em uma reação in vitro, da molécula de RNA da presente invenção por métodos conhecidos pelo versado na técnica. Mais especificamente, a molécula de RNA da presente invenção pode ser produzida in vitro com o uso de um sistema de transcrição in vitro. Sistemas de transcrição in vitro são comumente conhecidos e normalmente exigem um modelo de DNA linear purificado contendo uma sequência de DNA “que codifica” o módulo (b) e o módulo (a) como apresentado acima, em que a dita sequência de DNA está sob o controle de um promotor apropriado. Ademais, um sistema de transcrição in vitro também comumente exige trifosfatos de ribonucleotídeo, um sistema de tampão que inclui DTT e íons de magnésio, e uma RNA polimerase apropriada que fornece a atividade enzimática para a transcrição in vitro da sequência de DNA na molécula de RNA da presente invenção.[00167] The present invention also relates to methods of producing, in an in vitro reaction, the RNA molecule of the present invention by methods known to the skilled artisan. More specifically, the RNA molecule of the present invention can be produced in vitro using an in vitro transcription system. In vitro transcription systems are commonly known and typically require a purified linear DNA template containing a DNA sequence “coding” for module (b) and module (a) as set forth above, wherein said DNA sequence is under the control of an appropriate promoter. Furthermore, an in vitro transcription system also commonly requires ribonucleotide triphosphates, a buffer system that includes DTT and magnesium ions, and an appropriate RNA polymerase that provides the enzymatic activity for in vitro transcription of the DNA sequence into the RNA molecule of the present invention.

[00168] Métodos que são comumente usados para produzir moléculas de RNA com o uso de transcrição in vitro são bem conhecidas pelo versado na técnica e são, por exemplo, descritos em Methods Mol. Biol. 703 (2011):29 a 41.[00168] Methods that are commonly used to produce RNA molecules using in vitro transcription are well known to those skilled in the art and are, for example, described in Methods Mol. Biol. 703 (2011):29-41.

[00169] Como mencionado acima, no caso de a molécula de RNA da presente invenção ser produzida por um método de transcrição in vitro como descrito no presente documento adicionalmente abaixo, a cauda poli-A acima pode ser parte da molécula de RNA da presente invenção (e não necessariamente localizada, originalmente, no vetor de clonagem) e está localizada no terminal 3’ do RNA, por exemplo, adjacente à UTR no terminal 3’ da molécula de RNA. No caso de a molécula de RNA da presente invenção ser produzida por um método de transcrição in vitro, o plasmídeo que abriga a molécula de RNA da presente invenção é linearizado antes da transcrição in vitro a jusante da cauda poli-A a fim de garantir que a molécula de RNA transcrita in vitro contenha a dita cauda poli-A.[00169] As mentioned above, in the case where the RNA molecule of the present invention is produced by an in vitro transcription method as described herein further below, the above poly-A tail may be part of the RNA molecule of the present invention (and not necessarily located originally in the cloning vector) and is located at the 3' terminus of the RNA, for example adjacent to the UTR at the 3' terminus of the RNA molecule. In the case where the RNA molecule of the present invention is produced by an in vitro transcription method, the plasmid harboring the RNA molecule of the present invention is linearized prior to in vitro transcription downstream of the poly-A tail in order to ensure that the in vitro transcribed RNA molecule contains said poly-A tail.

[00170] Alternativamente, a molécula de RNA da presente invenção pode ser também quimicamente sintetizada, por exemplo, por síntese química convencional ou um sintetizador de sequência de nucleotídeos automatizado com o uso de um suporte de fase sólida e técnicas padrão.[00170] Alternatively, the RNA molecule of the present invention may also be chemically synthesized, for example, by conventional chemical synthesis or an automated nucleotide sequence synthesizer using a solid phase support and standard techniques.

[00171] A presente invenção também se refere a métodos de produção, em uma reação in vitro, da molécula de RNA da presente invenção por métodos conhecidos pelo versado na técnica e como apresentado acima e de recuperação da molécula de RNA da reação.[00171] The present invention also relates to methods of producing, in an in vitro reaction, the RNA molecule of the present invention by methods known to the person skilled in the art and as set forth above and of recovering the RNA molecule from the reaction.

[00172] Os métodos de recuperação e/ou subsequentemente de purificação da molécula de RNA da presente invenção são conhecidos pelo versado na técnica.[00172] Methods of recovering and/or subsequently purifying the RNA molecule of the present invention are known to those skilled in the art.

[00173] A molécula de RNA da presente invenção pode prontamente ser usada em sistemas de tradução in vitro conhecidos na técnica para a expressão eficiente de qualquer polipeptídeo ou proteína desejada codificada pela região de codificação do módulo (a).[00173] The RNA molecule of the present invention can readily be used in in vitro translation systems known in the art for the efficient expression of any desired polypeptide or protein encoded by the coding region of module (a).

[00174] Sistemas de tradução in vitro são conhecidos na técnica e podem diretamente ser usados com a molécula de RNA da presente invenção. Alternativamente, esses sistemas de tradução in vitro podem ser combinados com os sistemas de transcrição in vitro acima. Sistemas livres de célula correspondentes para a transcrição in vitro e/ou tradução in vitro são conhecidos e estão disponíveis. Esses sistemas livres de célula para a síntese de proteína (também chamada de síntese de proteína in vitro ou CFPS abreviado), permitem a expressão/produção de um polipeptídeo ou uma proteína com o uso de maquinário biológico sem o uso de células vivas. Nesses sistemas, o ambiente de síntese de proteína in vitro não é restrito por uma parede celular ou condições de homeostase necessárias para manter a viabilidade de célula e permite acesso direto e o controle do ambiente de tradução, o que é vantajoso para inúmeras aplicações, incluindo a otimização de produção de proteína, a otimização de complexos de proteína, para estudar a síntese de proteína, incorporar aminoácidos não naturais, varreduras de alto rendimento e biologia sintética. Componentes comuns de uma reação livre de célula incluem um extrato celular, uma fonte de energia, um suprimento de aminoácidos, cofatores como magnésio, e o DNA ou RNA que codifica o polipeptídeo ou proteína desejada. Um extrato celular pode ser obtido pela lise da célula de interesse e centrifugação das paredes celulares, genoma de DNA, e outros detritos. O que resta é o maquinário celular necessário que inclui ribossomas, aminoacil-tRNA sintetases, fatores de alongamento e iniciação de tradução, nucleases, etc. Em um sistema livre de célula para a síntese de polipeptídeos ou proteínas começando do DNA (isto é, em um sistema que inclui a etapa de transcrição in vitro e tradução in vitro), dois tipos de DNA são comumente usados, isto é, ou plasmídeos ou modelos de expressão linear (LETs). Em um sistema livre de célula para a síntese de polipeptídeos ou proteínas começando do RNA (isto é, em um sistema que inclui uma etapa de tradução in vitro apenas), um RNA pode diretamente ser usado. Essas reações livres de célula in vitro exigem uma fonte de energia que é normalmente fornecida por uma mistura separada contendo a fonte de energia necessária, junto com um suprimento de aminoácidos que são adicionados ao extrato para a reação. Fontes de energia comuns são piruvato de fosfoenol, fosfato de acetila e fosfato de creatina. Extratos celulares comuns que são comumente usados são produzidos de Escherichia coli (ECE), reticulócitos de coelho (RRL), germe de trigo (WGE) e células de inseto (ICE). Todos esses extratos estão comercialmente disponíveis.[00174] In vitro translation systems are known in the art and can be directly used with the RNA molecule of the present invention. Alternatively, these in vitro translation systems can be combined with the above in vitro transcription systems. Corresponding cell-free systems for in vitro transcription and/or in vitro translation are known and available. These cell-free systems for protein synthesis (also called in vitro protein synthesis or CFPS for short), allow the expression/production of a polypeptide or a protein using biological machinery without the use of living cells. In these systems, the in vitro protein synthesis environment is not restricted by a cell wall or homeostatic conditions necessary to maintain cell viability and allows direct access and control of the translation environment, which is advantageous for numerous applications, including optimization of protein production, optimization of protein complexes, for studying protein synthesis, incorporation of unnatural amino acids, high-throughput screenings and synthetic biology. Common components of a cell-free reaction include a cell extract, an energy source, a supply of amino acids, cofactors such as magnesium, and the DNA or RNA encoding the desired polypeptide or protein. A cell extract can be obtained by lysing the cell of interest and centrifuging the cell walls, DNA genome, and other debris. What remains is the necessary cellular machinery that includes ribosomes, aminoacyl-tRNA synthetases, elongation and translation initiation factors, nucleases, etc. In a cell-free system for the synthesis of polypeptides or proteins starting from DNA (i.e., in a system that includes both an in vitro transcription and in vitro translation step), two types of DNA are commonly used, i.e., either plasmids or linear expression templates (LETs). In a cell-free system for the synthesis of polypeptides or proteins starting from RNA (i.e., in a system that includes an in vitro translation step only), an RNA can directly be used. These in vitro cell-free reactions require an energy source that is typically provided by a separate mixture containing the required energy source, along with a supply of amino acids that are added to the extract for the reaction. Common energy sources are phosphoenol pyruvate, acetyl phosphate, and creatine phosphate. Common cell extracts that are commonly used are produced from Escherichia coli (ECE), rabbit reticulocytes (RRL), wheat germ (WGE), and insect cells (ICE). All of these extracts are commercially available.

[00175] Consequentemente, a presente invenção também se refere ao uso de uma molécula de RNA da presente invenção para a tradução in vitro de um polipeptídeo ou proteína desejada codificada por uma região de codificação contida na dita molécula de RNA.[00175] Accordingly, the present invention also relates to the use of an RNA molecule of the present invention for the in vitro translation of a desired polypeptide or protein encoded by a coding region contained in said RNA molecule.

[00176] Em relação às modalidades preferidas de tal uso de uma molécula de RNA da presente invenção, o mesmo se aplica, com as devidas mudanças, como foi apresentado acima no contexto da molécula de RNA como definida acima.[00176] With respect to preferred embodiments of such use of an RNA molecule of the present invention, the same applies, with due modifications, as set forth above in the context of the RNA molecule as defined above.

[00177] As moléculas de RNA como definido acima são particularmente úteis em cenários médicos e no tratamento de uma certa doença e, em particular, em terapias à base de RNA. Dessa forma, a presente invenção também se refere a uma composição farmacêutica que compreende a molécula de RNA da presente invenção, a molécula de ácido nucleico da presente invenção, o vetor da presente invenção ou a célula hospedeira da presente invenção e, opcionalmente, um carreador farmaceuticamente aceitável.[00177] RNA molecules as defined above are particularly useful in medical scenarios and in the treatment of a certain disease and, in particular, in RNA-based therapies. Accordingly, the present invention also relates to a pharmaceutical composition comprising the RNA molecule of the present invention, the nucleic acid molecule of the present invention, the vector of the present invention or the host cell of the present invention and, optionally, a pharmaceutically acceptable carrier.

[00178] O termo “tratamento” e similares são usados no presente documento para significar geralmente a obtenção de um efeito farmacológico e/ou fisiológico desejado. Consequentemente, o tratamento da presente invenção pode se referir ao tratamento de estados (agudos) de uma certa doença, mas pode também se referir ao tratamento profilático em termos de evitar completa ou parcialmente uma doença ou sintoma da mesma. De preferência, o termo “tratamento” deve ser entendido como senso terapêutico em termos de curar parcial ou completamente uma doença e/ou efeito adverso e/ou sintomas atribuídos à doença. “Agudo”, nesse aspecto, significa que o indivíduo apresenta sintomas da doença. Em outras palavras, o indivíduo a ser tratado está em necessidade real de um tratamento e o termo “tratamento agudo” no contexto da presente invenção se refere às medidas tomadas para tratar realmente a doença após o início da doença ou a quebra da doença. O tratamento pode ser também tratamento profilático ou preventivo, isto é, medidas tomadas para prevenção de doença, por exemplo, a fim de evitar a infecção e/ou o início da doença.[00178] The term “treatment” and the like are used herein to generally mean the achievement of a desired pharmacological and/or physiological effect. Accordingly, the treatment of the present invention may refer to the treatment of (acute) states of a certain disease, but may also refer to prophylactic treatment in terms of completely or partially avoiding a disease or symptom thereof. Preferably, the term “treatment” should be understood in the therapeutic sense in terms of partially or completely curing a disease and/or adverse effect and/or symptoms attributed to the disease. “Acute” in this regard means that the individual is experiencing symptoms of the disease. In other words, the individual to be treated is in real need of a treatment and the term “acute treatment” in the context of the present invention refers to the measures taken to actually treat the disease after the onset of the disease or the cessation of the disease. The treatment may also be prophylactic or preventive treatment, i.e. measures taken to prevent disease, for example in order to avoid infection and/or the onset of the disease.

[00179] A composição farmacêutica da presente invenção pode ser administrada através de uma grande faixa de classes de formas de administração conhecidas pelo versado na técnica. A administração pode ser sistêmica, local, oralmente, através de aerossóis incluindo, sem limitação, tabletes, injeção de agulha, o uso de inaladores, cremes, espumas, géis, loções e pomadas.[00179] The pharmaceutical composition of the present invention may be administered through a wide range of classes of administration forms known to the skilled artisan. Administration may be systemic, local, orally, through aerosols including, without limitation, tablets, needle injection, the use of inhalers, creams, foams, gels, lotions and ointments.

[00180] Como mencionado, a presente invenção se refere a uma composição farmacêutica, que compreende uma quantidade eficaz da molécula de RNA (ou a molécula de ácido nucleico, o vetor ou a célula hospedeira) da presente invenção de acordo com o disposto acima e pelo menos um excipiente ou carreador farmaceuticamente aceitável.[00180] As mentioned, the present invention relates to a pharmaceutical composition, which comprises an effective amount of the RNA molecule (or the nucleic acid molecule, the vector or the host cell) of the present invention as provided above and at least one pharmaceutically acceptable excipient or carrier.

[00181] Um excipiente ou carreador é uma substância inativa formulada ao lado do ingrediente ativo, isto é, a molécula de RNA (ou a molécula de ácido nucleico, o vetor ou a célula hospedeira) da presente invenção para o propósito de avolumar formulações que contêm ingredientes ativos potentes. Excipientes são, frequentemente, chamados de “agentes avolumadores”, “cargas” ou “diluentes”. O aumento de volume permite dispensação precisa e conveniente de uma substância farmacológica na produção de um forma de dosagem. Os mesmos também podem servir a vários propósitos de intensificação terapêutica, como facilitar a absorção de fármaco ou solubilidade, ou outras considerações farmacocinéticas. Excipientes podem ser também úteis no processo de fabricação, para auxiliar no manuseio da substância ativa relacionada como pela facilitação da fluidez de pó ou propriedades antiaderentes, além de auxiliar na estabilidade in vitro como prevenção de desnaturação ao longo da vida útil esperada. A seleção de excipientes apropriados também depende da rota de administração e da forma de dosagem, bem como do ingrediente ativo e outros fatores.[00181] An excipient or carrier is an inactive substance formulated alongside the active ingredient, i.e., the RNA molecule (or nucleic acid molecule, vector or host cell) of the present invention for the purpose of bulking formulations containing potent active ingredients. Excipients are often referred to as “bulking agents”, “fillers” or “diluents”. The increase in volume allows for accurate and convenient dispensing of a drug substance in the production of a dosage form. They may also serve various therapeutic enhancement purposes, such as facilitating drug absorption or solubility, or other pharmacokinetic considerations. Excipients may also be useful in the manufacturing process to aid in the handling of the related active substance such as by facilitating powder flowability or anti-adherent properties, in addition to aiding in in vitro stability such as preventing denaturation over the expected shelf life. The selection of appropriate excipients also depends on the route of administration and dosage form, as well as the active ingredient and other factors.

[00182] Dessa forma, a composição farmacêutica que compreende uma quantidade eficaz da molécula de RNA (ou da molécula de ácido nucleico, do vetor ou da célula hospedeira) da presente invenção pode estar em forma sólida, líquida ou gasosa e pode estar, inter alia, sob uma forma de (a) pó (ou pós), (a) tablete (ou tabletes), (a) solução (ou soluções) ou (a) aerossol (aerossóis). É preferido que a dita composição farmacêutica opcionalmente compreende um carreador e/ou diluente farmaceuticamente aceitável.[00182] Accordingly, the pharmaceutical composition comprising an effective amount of the RNA molecule (or nucleic acid molecule, vector or host cell) of the present invention may be in solid, liquid or gaseous form and may be, inter alia, in the form of (a) powder (or powders), (a) tablet (or tablets), (a) solution (or solutions) or (a) aerosol (aerosols). It is preferred that said pharmaceutical composition optionally comprises a pharmaceutically acceptable carrier and/or diluent.

[00183] Exemplos de carreadores, excipientes e/ou diluentes farmaceuticamente adequados são bem conhecidos na técnica e incluem soluções salinas tamponadas com fosfato, água, emulsões, como emulsões de óleo em água, vários tipos de agentes umectantes, soluções estéreis, etc. Composições que compreendem tais carreadores podem ser formuladas por métodos convencionais bem conhecidos. Essas composições farmacêuticas podem ser administradas ao indivíduo a uma dose adequada, isto é, em “uma quantidade eficaz” que pode facilmente ser determinada pelo versado na técnica por métodos conhecidos na técnica. O regime de dosagem será determinado pelo médico atendente e por fatores clínicos. Conforme é bem conhecido na técnica médica, dosagens para qualquer paciente dependem de muitos fatores, incluindo o tamanho, área de superfície do corpo, idade, o composto particular a ser administrado, gênero, tempo e rota de administração, saúde geral do paciente ou do indivíduo, e outros fármacos sendo administrados ao mesmo tempo.[00183] Examples of suitable pharmaceutical carriers, excipients and/or diluents are well known in the art and include phosphate buffered saline solutions, water, emulsions such as oil-in-water emulsions, various types of wetting agents, sterile solutions, etc. Compositions comprising such carriers can be formulated by conventional well-known methods. Such pharmaceutical compositions can be administered to the subject at a suitable dose, i.e., in an "effective amount" that can readily be determined by one of skill in the art by methods known in the art. The dosage regimen will be determined by the attending physician and clinical factors. As is well known in the medical art, dosages for any given patient depend on many factors, including size, body surface area, age, the particular compound to be administered, gender, time and route of administration, general health of the patient or subject, and other drugs being administered at the same time.

[00184] Dessa forma, de preferência, a molécula de RNA (ou a molécula de ácido nucleico, o vetor ou a célula hospedeira) da presente invenção é incluída em uma quantidade eficaz. O termo “quantidade eficaz” se refere a uma quantidade suficiente para induzir uma resposta terapêutica detectável no indivíduo ao qual a composição farmacêutica deve ser administrada. De acordo com o disposto acima, o teor da molécula de RNA (ou da molécula de ácido nucleico, do vetor ou da célula hospedeira) da presente invenção na composição farmacêutica não é limitado na medida em que é útil para o tratamento como descrito acima, mas, de preferência, contém 0,0000001 a 10% em peso por composição total. Além disso, a molécula de RNA (ou a molécula de ácido nucleico, o vetor ou a célula hospedeira) descrita no presente documento é, de preferência, empregada em um carreador. De modo geral, uma quantidade apropriada de um sal farmaceuticamente aceitável é usada no carreador para tornar a composição isotônica. Exemplos do carreador incluem, sem limitação, solução salina, solução de Ringer e solução de dextrose. De preferência, excipientes, carreadores ou estabilizantes aceitáveis são não tóxicos nas dosagens e concentrações empregadas, incluindo tampões como citrato, fosfato e outros ácidos orgânicos; contraíons formadores de sal, por exemplo, sódio e potássio; polipeptídeos de baixo peso molecular (> 10 resíduos de aminoácido); proteínas, por exemplo, albumina sérica, ou gelatina; polímeros hidrofílicos, por exemplo, polivinilpirrolidona; aminoácidos como histidina, glutamina, lisina, asparagina, arginina ou glicina; carboidratos incluindo glicose, manose ou dextrinas; monossacarídeos; dissacarídeos; outros açúcares, por exemplo, sacarose, manitol, trealose ou sorbitol; agentes quelantes, por exemplo, EDTA; tensoativos não iônicos, por exemplo, Tween, Pluronics ou polietileno glicol; antioxidantes incluindo metionina, ácido ascórbico e tocoferol; e/ou conservantes, por exemplo, cloreto de octadecildimetilbenzil amônio; cloreto de hexametônio; cloreto de benzalcônio, cloreto de benzetônio; fenol, álcool butílico ou benzílico; alquil parabenos, por exemplo, metil ou propil parabeno; catecol; resorcinol; ciclohexanol; 3-pentanol; e m-cresol). Carreadores adequados e suas formulações são descritos em mais detalhes em Remington’s Pharmaceutical Sciences, 17a ed., 1985, Mack Publishing Co.[00184] Thus, preferably, the RNA molecule (or the nucleic acid molecule, the vector or the host cell) of the present invention is included in an effective amount. The term “effective amount” refers to an amount sufficient to induce a detectable therapeutic response in the individual to whom the pharmaceutical composition is to be administered. According to the above, the content of the RNA molecule (or the nucleic acid molecule, the vector or the host cell) of the present invention in the pharmaceutical composition is not limited to the extent that it is useful for the treatment as described above, but preferably contains 0.0000001 to 10% by weight per total composition. Furthermore, the RNA molecule (or the nucleic acid molecule, the vector or the host cell) described herein is preferably employed in a carrier. In general, an appropriate amount of a pharmaceutically acceptable salt is used in the carrier to make the composition isotonic. Examples of the carrier include, without limitation, saline, Ringer's solution, and dextrose solution. Preferably, acceptable excipients, carriers, or stabilizers are nontoxic at the dosages and concentrations employed, including buffers such as citrate, phosphate, and other organic acids; salt-forming counterions, e.g., sodium and potassium; low molecular weight polypeptides (>10 amino acid residues); proteins, e.g., serum albumin, or gelatin; hydrophilic polymers, e.g., polyvinylpyrrolidone; amino acids such as histidine, glutamine, lysine, asparagine, arginine, or glycine; carbohydrates including glucose, mannose, or dextrins; monosaccharides; disaccharides; other sugars, e.g., sucrose, mannitol, trehalose, or sorbitol; chelating agents, e.g., EDTA; nonionic surfactants, e.g., Tween, Pluronics, or polyethylene glycol; antioxidants including methionine, ascorbic acid, and tocopherol; and/or preservatives, e.g., octadecyldimethylbenzyl ammonium chloride; hexamethonium chloride; benzalkonium chloride, benzethonium chloride; phenol, butyl or benzyl alcohol; alkyl parabens, e.g., methyl or propyl paraben; catechol; resorcinol; cyclohexanol; 3-pentanol; and m-cresol). Suitable carriers and their formulations are described in more detail in Remington’s Pharmaceutical Sciences, 17th ed., 1985, Mack Publishing Co.

[00185] O progresso terapêutico pode ser monitorado por avaliação periódica. A molécula de RNA (ou a molécula de ácido nucleico, o vetor ou a célula hospedeira) da presente invenção ou a composição farmacêutica da invenção pode estar em soluções, suspensões e emulsões aquosas ou não aquosas estéreis bem como cremes e supositórios. Exemplos de solventes não aquosos são propileno glicol, polietileno glicol, óleos vegetais como óleo de oliva, e ésteres orgânicos como oleato de etila. Carreadores aquosos incluem água, soluções alcoólicas/aquosas, emulsões ou suspensões, incluindo solução salina e meio tamponado. Conservantes e outros aditivos podem estar também presentes como, por exemplo, antimicrobianos, antioxidantes, agentes quelantes e gases inertes e similares. Além disso, a composição farmacêutica da invenção pode compreender agentes adicionais dependendo do uso pretendido da composição farmacêutica. Os ditos agentes podem ser, por exemplo, monolaurato de polioxietileno sorbitano, disponível comercialmente com o nome comercial Tween, propileno glicol, EDTA, Citrato, Sacarose bem como outros agentes que são adequados para o uso pretendido da composição farmacêutica que são bem conhecidos pelo versado na técnica.[00185] Therapeutic progress can be monitored by periodic evaluation. The RNA molecule (or nucleic acid molecule, vector or host cell) of the present invention or the pharmaceutical composition of the invention can be in sterile aqueous or non-aqueous solutions, suspensions and emulsions as well as creams and suppositories. Examples of non-aqueous solvents are propylene glycol, polyethylene glycol, vegetable oils such as olive oil, and organic esters such as ethyl oleate. Aqueous carriers include water, alcoholic/aqueous solutions, emulsions or suspensions, including saline and buffered media. Preservatives and other additives may also be present such as, for example, antimicrobials, antioxidants, chelating agents and inert gases and the like. Furthermore, the pharmaceutical composition of the invention may comprise additional agents depending on the intended use of the pharmaceutical composition. Said agents may be, for example, polyoxyethylene sorbitan monolaurate, commercially available under the trade name Tween, propylene glycol, EDTA, Citrate, Sucrose as well as other agents that are suitable for the intended use of the pharmaceutical composition that are well known to the person skilled in the art.

[00186] De acordo com esta invenção, o termo “composição farmacêutica” se refere a uma composição para administração a um paciente, de preferência, um paciente humano.[00186] In accordance with this invention, the term “pharmaceutical composition” refers to a composition for administration to a patient, preferably a human patient.

[00187] A composição farmacêutica da presente invenção pode ser para uso em terapias à base de RNA. Como mencionado acima, a molécula de RNA da presente invenção que compreende uma “região de codificação que codifica um polipeptídeo” pode ser usada em terapias à base de RNA, em que a “região de codificação que codifica um polipeptídeo” codifica um polipeptídeo ou proteína terapêutica ou farmaceuticamente ativa que tem um efeito terapêutico ou preventivo. Dessa forma, em modalidades preferidas, a composição farmacêutica da presente invenção pode ser para uso em terapias à base de RNA no tratamento ou prevenção de uma doença como citado na Tabela 1 acima. Consequentemente, terapias à base de RNA de acordo com a presente invenção podem ser para uso no tratamento ou prevenção de uma doença como citado na Tabela 1 acima.[00187] The pharmaceutical composition of the present invention may be for use in RNA-based therapies. As mentioned above, the RNA molecule of the present invention comprising a “coding region encoding a polypeptide” may be used in RNA-based therapies, wherein the “coding region encoding a polypeptide” encodes a therapeutic or pharmaceutically active polypeptide or protein that has a therapeutic or preventive effect. Thus, in preferred embodiments, the pharmaceutical composition of the present invention may be for use in RNA-based therapies in the treatment or prevention of a disease as set forth in Table 1 above. Accordingly, RNA-based therapies according to the present invention may be for use in the treatment or prevention of a disease as set forth in Table 1 above.

[00188] Dessa forma, a composição farmacêutica da presente invenção pode ser para uso em terapias à base de RNA em casos em que os defeitos genéticos descritos na Tabela 1 acima levam a uma doença que pode, então, ser tratada ou evitada por uma terapia de substituição de transcrito/terapia de substituição de enzima com a molécula de RNA da presente invenção, em que a molécula de RNA compreende uma “região de codificação para um polipeptídeo” que codifica uma versão intacta da proteína ou um fragmento funcional da mesma que compensa o gene defeituoso revelado. Em modalidades particularmente preferidas, a composição farmacêutica da presente invenção pode ser para uso em terapias à base de RNA no tratamento ou prevenção de doenças lisossômicas como doença de Gaucher, doença de Fabry, MPS I, MPS II (síndrome de Hunter), MPS VI e doenças de armazenamento de Glicogênio como, por exemplo, doença de armazenamento de Glicogênio tipo I (doença de von Gierecke), tipo II (doença de Pompe), tipo III (doença de Cor, tipo IV (doença de Andersen, tipo V (doença de McArdle, tipo VI (doença de Hers), tipo VII (doença de Tauri), tipo VII, tipo IX, tipo X, tipo XI (síndrome de Fanconi-Bickel), tipo XI ou tipo 0. Terapias de substituição de transcrito/terapias de substituição de enzima beneficamente não afetam o defeito genético subjacente, mas aumentam a concentração da enzima na qual o doente deficiente. Como exemplo, na doença de Pompe, a terapia de substituição de transcrito/terapia de substituição de enzima substitui a enzima lisossômica deficiente ácido alfa-glicosidase (GAA).[00188] Thus, the pharmaceutical composition of the present invention may be for use in RNA-based therapies in cases where the genetic defects described in Table 1 above lead to a disease that can then be treated or prevented by a transcript replacement therapy/enzyme replacement therapy with the RNA molecule of the present invention, wherein the RNA molecule comprises a “coding region for a polypeptide” that encodes an intact version of the protein or a functional fragment thereof that compensates for the defective gene disclosed. In particularly preferred embodiments, the pharmaceutical composition of the present invention may be for use in RNA-based therapies in the treatment or prevention of lysosomal diseases such as Gaucher disease, Fabry disease, MPS I, MPS II (Hunter syndrome), MPS VI and glycogen storage diseases such as, for example, glycogen storage disease type I (von Gierecke disease), type II (Pompe disease), type III (Cor disease), type IV (Andersen disease), type V (McArdle disease), type VI (Hers disease), type VII (Tauri disease), type VII, type IX, type X, type XI (Fanconi-Bickel syndrome), type XI or type O. Transcript replacement therapies/enzyme replacement therapies beneficially do not affect the underlying genetic defect, but increase the concentration of the enzyme in which the patient is deficient. As an example, in Pompe disease, the transcript replacement therapy/enzyme replacement therapy replaces the deficient lysosomal enzyme alpha-glucosidase acid (GAA).

[00189] Em outras modalidades preferidas, a composição farmacêutica da presente invenção pode ser para uso em terapias à base de RNA de acordo com a presente invenção, em que a “região de codificação que codifica um polipeptídeo” codifica um polipeptídeo, proteína ou peptídeo terapêutica ou farmaceuticamente ativo, que tem um efeito terapêutico ou preventivo, em que o dito polipeptídeo, proteína ou peptídeo é selecionada do grupo codificado pelos genes como apresentado na Tabela 1.[00189] In other preferred embodiments, the pharmaceutical composition of the present invention may be for use in RNA-based therapies according to the present invention, wherein the “coding region encoding a polypeptide” encodes a therapeutically or pharmaceutically active polypeptide, protein or peptide, which has a therapeutic or preventive effect, wherein said polypeptide, protein or peptide is selected from the group encoded by the genes as set forth in Table 1.

[00190] Em outras modalidades preferidas, terapias à base de RNA de acordo com a presente invenção podem ser para uso no tratamento de câncer, uma doença cardiovascular, uma infecção viral, uma disfunção imunológica, uma doença autoimune, um transtorno neurológico, um transtorno metabólico herdado ou um transtorno genético ou qualquer doença em que uma proteína ou fragmento de proteína produzido em uma célula pode ter um efeito benéfico para o paciente. Exemplos de câncer incluem câncer de cabeça e pescoço, câncer de mama, câncer renal, câncer de bexiga, câncer de pulmão, câncer de próstata, câncer ósseo, câncer do cérebro, câncer cervical, câncer anal, câncer de cólon, câncer colorretal, câncer de apêndice, câncer ocular, câncer gástrico, leucemia, linfoma, câncer do fígado, câncer de pele, câncer do ovário, câncer do pênis, câncer pancreático, câncer testicular, câncer da tiroide, câncer vaginal, câncer vulvar, câncer endometrial, câncer cardíaco e sarcoma.[00190] In other preferred embodiments, RNA-based therapies according to the present invention may be for use in the treatment of cancer, a cardiovascular disease, a viral infection, an immune dysfunction, an autoimmune disease, a neurological disorder, an inherited metabolic disorder or a genetic disorder or any disease in which a protein or protein fragment produced in a cell may have a beneficial effect on the patient. Examples of cancer include head and neck cancer, breast cancer, kidney cancer, bladder cancer, lung cancer, prostate cancer, bone cancer, brain cancer, cervical cancer, anal cancer, colon cancer, colorectal cancer, appendix cancer, eye cancer, gastric cancer, leukemia, lymphoma, liver cancer, skin cancer, ovarian cancer, penile cancer, pancreatic cancer, testicular cancer, thyroid cancer, vaginal cancer, vulvar cancer, endometrial cancer, heart cancer and sarcoma.

[00191] Exemplos de doenças cardiovasculares incluem aterosclerose, doença cardíaca coronariana, doença cardíaca pulmonar e cardiomiopatia.[00191] Examples of cardiovascular diseases include atherosclerosis, coronary heart disease, pulmonary heart disease, and cardiomyopathy.

[00192] Exemplos de disfunções imunológicas e doenças autoimunes incluem, sem limitação, doenças reumáticas, esclerose múltipla e asma.[00192] Examples of immune dysfunctions and autoimmune diseases include, without limitation, rheumatic diseases, multiple sclerosis, and asthma.

[00193] Exemplos de infecções virais incluem, sem limitação, infecções com vírus da imunodeficiência humana, vírus herpes simplex, papilomavírus humano bem como vírus da hepatite B e C.[00193] Examples of viral infections include, without limitation, infections with human immunodeficiency virus, herpes simplex virus, human papillomavirus as well as hepatitis B and C viruses.

[00194] Exemplos de transtornos neurológicos incluem, sem limitação, doença de Parkinson, esclerose múltipla e demência.[00194] Examples of neurological disorders include, without limitation, Parkinson's disease, multiple sclerosis, and dementia.

[00195] Exemplos de transtornos metabólicos herdados incluem, sem limitação, doença de Gaucher e Fenilcetonúria.[00195] Examples of inherited metabolic disorders include, without limitation, Gaucher disease and Phenylketonuria.

[00196] A invenção também se refere a um método de uma terapia à base de RNA. Dessa forma, a presente invenção se refere a um método para o tratamento de uma doença como câncer, uma doença cardiovascular, uma infecção viral, uma disfunção imunológica, uma doença autoimune, um transtorno neurológico, um transtorno metabólico herdado ou um transtorno genético por meio de uma terapia à base de RNA. Em relação às modalidades preferidas do método para tratamento, o mesmo se aplica, com as devidas mudanças, como foi apresentado acima no contexto da molécula de RNA ou da composição farmacêutica para uso em terapia à base de RNA como definido acima.[00196] The invention also relates to a method of an RNA-based therapy. Thus, the present invention relates to a method for the treatment of a disease such as cancer, a cardiovascular disease, a viral infection, an immune dysfunction, an autoimmune disease, a neurological disorder, an inherited metabolic disorder or a genetic disorder by means of an RNA-based therapy. With respect to the preferred embodiments of the method for treatment, the same applies, with due changes, as was presented above in the context of the RNA molecule or the pharmaceutical composition for use in RNA-based therapy as defined above.

[00197] Na presente invenção, o indivíduo é, em uma modalidade preferida, um mamífero como um cão, gato, porco, vaca, ovelha, cavalo, roedor, por exemplo, rato, camundongo, e porquinho-da-Índia, ou um primata, por exemplo, gorila, chimpanzé e ser humano. Em uma modalidade da máxima preferência, o indivíduo é um ser humano.[00197] In the present invention, the individual is, in a preferred embodiment, a mammal such as a dog, cat, pig, cow, sheep, horse, rodent, e.g., rat, mouse, and guinea pig, or a primate, e.g., gorilla, chimpanzee, and human. In a most preferred embodiment, the individual is a human.

[00198] Como mencionado acima, as moléculas de RNA como definido acima são particularmente úteis em cenários médicos e no tratamento de uma certa doença e, em particular, em terapias à base de RNA. Dessa forma, a presente invenção também se refere a uma composição farmacêutica que compreende a molécula de RNA, a molécula de ácido nucleico, o vetor ou a célula hospedeira da presente invenção e, opcionalmente, um carreador farmaceuticamente aceitável.[00198] As mentioned above, the RNA molecules as defined above are particularly useful in medical scenarios and in the treatment of a certain disease and, in particular, in RNA-based therapies. Accordingly, the present invention also relates to a pharmaceutical composition comprising the RNA molecule, the nucleic acid molecule, the vector or the host cell of the present invention and, optionally, a pharmaceutically acceptable carrier.

[00199] Ainda, em terapias de RNA, é frequentemente desejável silenciar o efeito da molécula de RNA em algum estágio.[00199] Furthermore, in RNA therapies, it is often desirable to silence the effect of the RNA molecule at some stage.

[00200] Isso pode, por exemplo, ser realizado fazendo-se uso de um mecanismo de RNAi (interferência de RNA) por meio do uso do filamento de ácido nucleico que é complementar à sequência de UTR da presente invenção. De fato, o tamanho pequeno das UTRs mínimas da presente invenção torna essa abordagem praticável visto que essas UTRs não formam estruturas secundárias ou terciárias e não existem em células normais. Consequentemente, o filamento complementar de tal sequência de UTR pode beneficamente ser usado em cenários médicos após o tratamento das doenças acima ou após as terapias à base de RNA acima com o uso da composição farmacêutica da presente invenção, silenciando, assim, as moléculas de RNA terapêuticas da presente invenção.[00200] This may, for example, be accomplished by making use of an RNAi (RNA interference) mechanism through the use of the nucleic acid strand that is complementary to the UTR sequence of the present invention. Indeed, the small size of the minimal UTRs of the present invention makes this approach feasible since these UTRs do not form secondary or tertiary structures and do not exist in normal cells. Accordingly, the complementary strand of such a UTR sequence may beneficially be used in medical scenarios after the treatment of the above diseases or after the above RNA-based therapies using the pharmaceutical composition of the present invention, thereby silencing the therapeutic RNA molecules of the present invention.

[00201] Dessa forma, uma abordagem de RNAi também é prevista no contexto desta invenção para uso na preparação de uma composição farmacêutica para silenciar o efeito das moléculas de RNA terapêuticas da presente invenção.[00201] Thus, an RNAi approach is also envisaged in the context of this invention for use in the preparation of a pharmaceutical composition to silence the effect of the therapeutic RNA molecules of the present invention.

[00202] O termo “interferência de RNA” ou “inibição de RNA” (RNAi/iRNA) descreve o uso de RNA de filamento duplo para direcionar mRNAs específicos para degradação, silenciando, assim, sua expressão. Moléculas de RNA de inibição preferidas podem ser selecionadas do grupo que consiste em RNA de filamento duplo (dsRNA), RNAi, siRNA, shRNA e stRNA. O dsRNA compatível com uma sequência genética é sintetizado in vitro e introduzido em uma célula. O dsRNA pode ser também introduzido em uma célula sob a forma de um vetor que expressa uma sequência-alvo genética na orientação senso e antissenso, por exemplo, sob a forma de um mRNA em forma de grampo. As sequências senso e antissenso podem ser também expressas de vetores separados, em que as moléculas antissenso e senso individuais formam RNA de filamento duplo mediante sua expressão. É conhecido na técnica que, em algumas ocasiões, a expressão de uma sequência na orientação senso ou mesmo de uma sequência promotora é suficiente para dar origem a dsRNA e, subsequentemente, a siRNA devido a mecanismos de amplificação interna em uma célula. Consequentemente, todos os meios e métodos que resultam em uma diminuição na atividade do polipeptídeo ou proteína codificada pela região de codificação devem ser usados de acordo com a presente invenção. Por exemplo, construtos senso, construtos antissenso, construtos com formato de grampo, moléculas senso e antissenso e combinações dos mesmos, podem ser usados para gerar/introduzir esses siRNAs. O dsRNA é alimentado em um processo natural, mas compreendido apenas parcialmente, incluindo dicer de nuclease altamente conservada que cliva moléculas precursoras de dsRNA em pequenos RNAs de interferência (siRNAs). A geração e a preparação de siRNA (ou siRNAs) bem como o método para inibir a expressão de um gene- alvo são, inter alia, descritos no documento WO 02/055693, Wei (2000) Dev. Biol. 15:239 a 255; La Count (2000) Biochem. Paras. 111:67 a 76; Baker (2000) Curr. Biol. 10:1.071 a 1.074; Svoboda (2000) Development 127:4.147 a 4.156 ou Marie (2000) Curr. Biol. 10:289 a 292. Estes siRNAs construíram, então, a parte específica de sequência de um complexo silenciador induzido por RNA (RISC), uma nuclease multicomplexo que destrói RNAs mensageiros homólogos ao disparador de silenciamento. Elbashir (2001) EMBO J. 20:6.877 a 6.888 mostrou que duplexos de RNAs de 21 nucleotídeo podem ser usados em cultura celular para interferir na expressão de gene em células de mamífero. Já é conhecido que o RNAi é mediado de forma muito eficiente por siRNA em células de mamíferos, mas a geração de linhagens celulares estáveis ou animais transgênicos não humanos foi limitada. No entanto, podem ser empregadas novas gerações de vetores para expressar estavelmente, por exemplo, RNAs curtos com formato de grampo (shRNAs). A expressão estável de siRNAs em Células de Mamíferos é, inter alia, mostrada em Brummelkamp (2002) Science 296:550 a 553. Além disso, Paul (2002) Nat. Biotechnol. 20:505 a 508 documentou a expressão eficaz de pequeno RNA de interferência em células humanas. A interferência de RNA por expressão de curtos RNAs de interferência e RNAs com formato de grampo em células de mamífero também foi mostrada por Yu (2002) PNAS 99:6.047 a 6.052. A abordagem de shRNA para silenciamento de gene é bem conhecida na técnica e pode compreender o uso de st RNAs (temporais pequenos); consulte, inter alia, Paddison (2002) Genes Dev. 16:948 a 958. Essas abordagens podem ser à base de vetor, por exemplo, o vetor pSUPER, ou vetores polIII de RNA podem ser empregados como ilustrado, inter alia, em Yu (2002), loc. cit.; Miyagishi (2002), loc. cit. ou Brummelkamp (2002), loc. cit. Prevê-se que as sequências regulatórias da presente invenção sejam usadas de maneira similar aos sistemas à base de vetores pSUPER ou polIII de RNA.[00202] The term “RNA interference” or “RNA inhibition” (RNAi/iRNA) describes the use of double-stranded RNA to target specific mRNAs for degradation, thereby silencing their expression. Preferred inhibitory RNA molecules can be selected from the group consisting of double-stranded RNA (dsRNA), RNAi, siRNA, shRNA, and stRNA. dsRNA compatible with a genetic sequence is synthesized in vitro and introduced into a cell. The dsRNA can also be introduced into a cell in the form of a vector that expresses a target genetic sequence in sense and antisense orientation, e.g., in the form of a hairpin mRNA. The sense and antisense sequences can also be expressed from separate vectors, wherein the individual antisense and sense molecules form double-stranded RNA upon expression. It is known in the art that, on some occasions, expression of a sequence in the sense orientation or even from a promoter sequence is sufficient to give rise to dsRNA and, subsequently, to siRNA due to internal amplification mechanisms in a cell. Accordingly, all means and methods that result in a decrease in the activity of the polypeptide or protein encoded by the coding region should be used in accordance with the present invention. For example, sense constructs, antisense constructs, hairpin constructs, sense and antisense molecules, and combinations thereof, can be used to generate/introduce such siRNAs. The dsRNA is fed into a natural, but only partially understood, process including the highly conserved nuclease dicer that cleaves dsRNA precursor molecules into small interfering RNAs (siRNAs). The generation and preparation of siRNA (or siRNAs) as well as the method for inhibiting the expression of a target gene are, inter alia, described in WO 02/055693, Wei (2000) Dev. Biol. 15:239-255; La Count (2000) Biochem. Paras. 111:67-76; Baker (2000) Curr. Biol. 10:1071-1074; Svoboda (2000) Development 127:4147-4156 or Marie (2000) Curr. Biol. 10:289-292. These siRNAs then construct the sequence-specific part of an RNA-induced silencing complex (RISC), a multicomplex nuclease that destroys messenger RNAs homologous to the silencing trigger. Elbashir (2001) EMBO J. 20:6877–6888 showed that 21-nucleotide RNA duplexes can be used in cell culture to interfere with gene expression in mammalian cells. It is already known that RNAi is mediated very efficiently by siRNA in mammalian cells, but the generation of stable cell lines or non-human transgenic animals has been limited. However, new generations of vectors can be used to stably express, for example, short hairpin RNAs (shRNAs). Stable expression of siRNAs in mammalian cells is, inter alia, shown in Brummelkamp (2002) Science 296:550–553. Furthermore, Paul (2002) Nat. Biotechnol. 20:505–508 documented the efficient expression of small interfering RNA in human cells. RNA interference by expression of short interfering RNAs and hairpin RNAs in mammalian cells has also been shown by Yu (2002) PNAS 99:6047-6052. The shRNA approach to gene silencing is well known in the art and may comprise the use of st (small temporal) RNAs; see, inter alia, Paddison (2002) Genes Dev. 16:948-958. Such approaches may be vector-based, e.g., the pSUPER vector, or RNA polIII vectors may be employed as illustrated, inter alia, in Yu (2002), loc. cit.; Miyagishi (2002), loc. cit. or Brummelkamp (2002), loc. cit. It is anticipated that the regulatory sequences of the present invention will be used in a manner similar to pSUPER or RNA polIII vector-based systems.

[00203] Métodos para deduzir e construir siRNAs são conhecidos na técnica e são descritos em Elbashir (2002) Methods 26:199 a 213, nas páginas da internet de vendedores comerciais de siRNA, por exemplo, Qiagen GmbH (https://www1.qiagen.com/GeneGlobe/Default.aspx); Dharmacon (www.dharmacon.com); Xeragon Inc. (http://www.dharmacon.com/ Default.aspx) e Ambion (www.ambion.com), ou na página da internet do grupo de pesquisa de Tom Tuschl (http://www.rockefeller.edu/labheads/ tuschl/sirna.html). Além disso, programas estão disponíveis online para deduzir siRNAs de uma dada sequência de mRNA (por exemplo, http://www.ambion.com/techlib/misc/siRNA_finder.html ou http://katahdin.cshl.org:9331/ RNAi/html/rnai.html). Resíduos de uridina na sobreposição 2-nt 3’ podem ser substituídos por 2’desoxitimidina sem perda de atividade, o que reduz significativamente os custos de síntese de RNA e pode também intensificar a resistência de duplexos de siRNA quando aplicados a células de mamífero (Elbashir (2001) loc. cit). Os siRNAs podem ser também sintetizados enzimaticamente com o uso de T7 ou outras RNA polimerases (Donze (2002) Nucleic Acids Res 30:e46). Duplexos de RNA curto que mediam interferência de RNA eficaz (esiRNA) podem ser também produzidos por hidrólise com RNase III de Escherichia coli (Yang (2002) PNAS 99:9.942 a 9.947). Além disso, foram desenvolvidos vetores de expressão para expressar siRNAs de filamento duplo conectados por pequenas alças de RNA com formato de grampo em células eucarióticas (por exemplo, (Brummelkamp (2002) Science 296:550 a 553). Todos esses construtos podem ser desenvolvidos com o auxílio dos programas citados acima. Além disso, ferramentas preditivas de sequência comercialmente disponíveis incorporadas a programas de análise de sequências ou vendidas separadamente, por exemplo, a siRNA Design Tool oferecida por www.oligoEngine.com (Seattle, WA) podem ser usadas para previsão de sequência de siRNA.[00203] Methods for deducing and constructing siRNAs are known in the art and are described in Elbashir (2002) Methods 26:199-213, on the websites of commercial siRNA vendors, e.g., Qiagen GmbH (https://www1.qiagen.com/GeneGlobe/Default.aspx); Dharmacon (www.dharmacon.com); Xeragon Inc. (http://www.dharmacon.com/Default.aspx) and Ambion (www.ambion.com), or on the website of Tom Tuschl's research group (http://www.rockefeller.edu/labheads/tuschl/sirna.html). Furthermore, programs are available online to deduce siRNAs from a given mRNA sequence (e.g., http://www.ambion.com/techlib/misc/siRNA_finder.html or http://katahdin.cshl.org:9331/RNAi/html/rnai.html). Uridine residues in the 2-nt 3´ overlap can be replaced by 2´deoxythymidine without loss of activity, which significantly reduces the costs of RNA synthesis and may also enhance the resistance of siRNA duplexes when applied to mammalian cells (Elbashir (2001) loc. cit). siRNAs can also be synthesized enzymatically using T7 or other RNA polymerases (Donze (2002) Nucleic Acids Res 30:e46). Short RNA duplexes that mediate efficient RNA interference (esiRNA) can also be produced by hydrolysis with Escherichia coli RNase III (Yang (2002) PNAS 99:9942–9947). In addition, expression vectors have been developed to express double-stranded siRNAs connected by short hairpin RNA loops in eukaryotic cells (e.g., (Brummelkamp (2002) Science 296:550–553). All of these constructs can be developed with the aid of the above programs. In addition, commercially available sequence prediction tools embedded in sequence analysis programs or sold separately, e.g., the siRNA Design Tool offered by www.oligoEngine.com (Seattle, WA), can be used for siRNA sequence prediction.

[00204] Consequentemente, podem ser usados RNAs de interferência específicos de acordo com a presente invenção como antagonistas/silenciadores da expressão e/ou função do polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção. Esses siRNAs são formados por um filamento complementar/antissenso e um senso, em que o filamento antissenso/senso compreende, de preferência, pelo menos 10, com mais preferência pelo menos 12, com mais preferência pelo menos 14, com mais preferência pelo menos 16, com mais preferência pelo menos 18, com mais preferência pelo menos 19, 20, 21 ou 22 nucleotídeos. Em uma modalidade ainda mais preferida, o filamento antissenso/senso compreende, de preferência, 25 ou mais nucleotídeos.[00204] Accordingly, specific interfering RNAs according to the present invention can be used as antagonists/silencers of the expression and/or function of the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention. These siRNAs are formed by a complementary/antisense and a sense strand, wherein the antisense/sense strand preferably comprises at least 10, more preferably at least 12, more preferably at least 14, more preferably at least 16, more preferably at least 18, most preferably at least 19, 20, 21 or 22 nucleotides. In an even more preferred embodiment, the antisense/sense strand preferably comprises 25 or more nucleotides.

[00205] Como mencionado acima, métodos para preparar siRNAs a serem usados de acordo com a presente invenção são bem conhecidos na técnica. Com base no ensinamento fornecido no presente documento, um versado na técnica se encontra facilmente na posição não apenas de preparar tais siRNAs, mas também de avaliar se um siRNA tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção. No presente documento, prevê-se que os siRNAs descritos acima conduzam à degradação da molécula de RNA da presente invenção que abriga uma região de codificação que codifica um polipeptídeo ou proteína e um módulo de UTR e, dessa forma, a um nível diminuído de polipeptídeo/proteína do polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00205] As mentioned above, methods for preparing siRNAs to be used in accordance with the present invention are well known in the art. Based on the teaching provided herein, one skilled in the art is readily in the position not only to prepare such siRNAs, but also to assess whether an siRNA has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention. Herein, it is anticipated that the siRNAs described above will lead to degradation of the RNA molecule of the present invention that harbors a coding region encoding a polypeptide or protein and a UTR module and thereby to a decreased polypeptide/protein level of the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00206] Consequentemente, a presente invenção se refere a uma molécula de RNA que é complementar a uma UTR da presente invenção como descrito no presente documento.[00206] Accordingly, the present invention relates to an RNA molecule that is complementary to a UTR of the present invention as described herein.

[00207] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGUGGCGUCUCCC (SEQ ID NO:11 ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:11.[00207] In a preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGUGGCGUCUCCC (SEQ ID NO:11 or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:11.

[00208] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGUGGCNGUCUCCC (SEQ ID NO:12), em que o nucleotídeo N na posição 10 de SEQ ID NO:12 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:12 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00208] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGUGGCNGUCUCCC (SEQ ID NO:12), wherein the nucleotide N at position 10 of SEQ ID NO:12 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:12 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00209] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUUGGCGUCUCCC (SEQ ID NO:13), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:13.[00209] In a preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUUGGCGUCUCCC (SEQ ID NO:13), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:13.

[00210] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUUGGCNGUCUCCC (SEQ ID NO:14), em que o nucleotídeo N na posição 10 de SEQ ID NO:14 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, embora A seja mais preferida, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:14 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00210] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUUGGCNGUCUCCC (SEQ ID NO:14), wherein the nucleotide N at position 10 of SEQ ID NO:14 is a nucleotide selected from the group consisting of U, G, C or A, although A is more preferred, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:14 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00211] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGCGGCGUCUCCC (SEQ ID NO:15), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:15.[00211] In a preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGCGGCGUCUCCC (SEQ ID NO:15), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:15.

[00212] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGCGGCNGUCUCCC (SEQ ID NO:16), em que o nucleotídeo N na posição 10 de SEQ ID NO:16 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:16 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00212] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGCGGCNGUCUCCC (SEQ ID NO:16), wherein the nucleotide N at position 10 of SEQ ID NO:16 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:16 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00213] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUCGGCGUCUCCC (SEQ ID NO:17), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:17.[00213] In a preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUCGGCGUCUCCC (SEQ ID NO:17), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:17.

[00214] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUCGGCNGUCUCCC (SEQ ID NO:18), em que o nucleotídeo N na posição 10 de SEQ ID NO:18 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, embora A seja mais preferida, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:18 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00214] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUCGGCNGUCUCCC (SEQ ID NO:18), wherein the nucleotide N at position 10 of SEQ ID NO:18 is a nucleotide selected from the group consisting of U, G, C or A, although A is more preferred, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:18 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00215] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGUGGCGUCCC (SEQ ID NO:19), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:19.[00215] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGUGGCGUCCC (SEQ ID NO:19), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:19.

[00216] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGUGGCNGUCCC (SEQ ID NO:20), em que o nucleotídeo N na posição 10 de SEQ ID NO:20 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:20 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00216] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGUGGCNGUCCC (SEQ ID NO:20), wherein the nucleotide N at position 10 of SEQ ID NO:20 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:20 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00217] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUUGGCGUCCC (SEQ ID NO:21), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:21.[00217] In a preferred embodiment, said UTR-complementary RNA molecule of the present invention comprises the sequence CAUCUUGGCGUCCC (SEQ ID NO:21), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:21.

[00218] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUUGGCNGUCCC (SEQ ID NO:22), em que o nucleotídeo N na posição 10 de SEQ ID NO:22 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, embora A seja mais preferida, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:22 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00218] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUUGGCNGUCCC (SEQ ID NO:22), wherein the nucleotide N at position 10 of SEQ ID NO:22 is a nucleotide selected from the group consisting of U, G, C or A, although A is more preferred, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:22 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00219] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGCGGCGUCCC (SEQ ID NO:23), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:23.[00219] In a preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGCGGCGUCCC (SEQ ID NO:23), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:23.

[00220] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGCGGCNGUCCC (SEQ ID NO:24), em que o nucleotídeo N na posição 10 de SEQ ID NO:24 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:24 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00220] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGCGGCNGUCCC (SEQ ID NO:24), wherein the nucleotide N at position 10 of SEQ ID NO:24 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:24 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00221] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUCGGCGUCCC (SEQ ID NO:25), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:25.[00221] In a preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUCGGCGUCCC (SEQ ID NO:25), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:25.

[00222] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUCGGCNGUCCC (SEQ ID NO:26), em que o nucleotídeo N na posição 10 de SEQ ID NO:26 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, embora A seja mais preferida, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:26 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00222] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUCGGCNGUCCC (SEQ ID NO:26), wherein the nucleotide N at position 10 of SEQ ID NO:26 is a nucleotide selected from the group consisting of U, G, C or A, although A is more preferred, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:26 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00223] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGUGGCGCUUC (SEQ ID NO:27), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:27.[00223] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGUGGCGCUUC (SEQ ID NO:27), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:27.

[00224] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGUGGCNGCUUC (SEQ ID NO:28), em que o nucleotídeo N na posição 10 de SEQ ID NO:28 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:28 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00224] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGUGGCNGCUUC (SEQ ID NO:28), wherein the nucleotide N at position 10 of SEQ ID NO:28 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:28 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00225] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUUGGCGCUUC (SEQ ID NO:29), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:29.[00225] In a preferred embodiment, said UTR-complementary RNA molecule of the present invention comprises the sequence CAUCUUGGCGCUUC (SEQ ID NO:29), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:29.

[00226] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUUGGCNGCUUC (SEQ ID NO:30), em que o nucleotídeo N na posição 10 de SEQ ID NO:30 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, embora A seja mais preferida, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:30 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00226] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUUGGCNGCUUC (SEQ ID NO:30), wherein the nucleotide N at position 10 of SEQ ID NO:30 is a nucleotide selected from the group consisting of U, G, C or A, although A is more preferred, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:30 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00227] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGCGGCGCUUC (SEQ ID NO:31), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:31.[00227] In a preferred embodiment, said UTR-complementary RNA molecule of the present invention comprises the sequence CAUGGCGGCGCUUC (SEQ ID NO:31), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:31.

[00228] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUGGCGGCNGCUUC (SEQ ID NO:32), em que o nucleotídeo N na posição 10 de SEQ ID NO:32 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:32 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00228] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUGGCGGCNGCUUC (SEQ ID NO:32), wherein the nucleotide N at position 10 of SEQ ID NO:32 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:32 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00229] Em uma modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUCGGCGCUUC (SEQ ID NO:33), ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:33.[00229] In a preferred embodiment, said UTR-complementary RNA molecule of the present invention comprises the sequence CAUCUCGGCGCUUC (SEQ ID NO:33), or a sequence showing 1 to 4 substitutions compared to SEQ ID NO:33.

[00230] Em uma outra modalidade preferida, a dita molécula de RNA complementar à UTR da presente invenção compreende a sequência CAUCUCGGCNGCUUC (SEQ ID NO:34), em que o nucleotídeo N na posição 10 de SEQ ID NO:34 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, embora A seja mais preferida, ou uma sequência que mostra 1 a 4 substituições em comparação com a SEQ ID NO:34 e que tem a capacidade de antagonizar/inibir/silenciar o polipeptídeo ou proteína codificada pela região de codificação da molécula de RNA da presente invenção.[00230] In another preferred embodiment, said RNA molecule complementary to the UTR of the present invention comprises the sequence CAUCUCGGCNGCUUC (SEQ ID NO:34), wherein the nucleotide N at position 10 of SEQ ID NO:34 is a nucleotide selected from the group consisting of U, G, C or A, although A is more preferred, or a sequence that shows 1 to 4 substitutions compared to SEQ ID NO:34 and that has the ability to antagonize/inhibit/silencing the polypeptide or protein encoded by the coding region of the RNA molecule of the present invention.

[00231] Em uma outra modalidade preferida, a presente invenção se refere a uma molécula de RNA selecionada do grupo que consiste em SEQ ID NO:11 a 34 que abriga um nucleotídeo(s) adicional(is) no terminal 5’ que se estende além do tripleto complementar ao códon inicial e que é complementar às sequências do polipeptídeo ou proteína desejada codificada pela região de codificação da molécula de RNA da presente invenção. De preferência, as sequências complementares que compreendem as sequências acima complementares às sequências de UTR da presente invenção (isto é, uma molécula de RNA selecionada do grupo que consiste em SEQ ID NO:11 a 34) compreende, de preferência, pelo menos 15, com mais preferência pelo menos 16, com mais preferência pelo menos 17, com mais preferência pelo menos 18, com mais preferência pelo menos 19, com mais preferência pelo menos 20, 21, 22, 23 ou 24 nucleotídeos. Em uma modalidade ainda mais preferida, essas sequências compreendem 25, 30, 35, 40 ou mais nucleotídeos. Aumentar o comprimento no terminal 5’ pode ser desejado afim de aumentar a especificidade da sequência complementar, evitando, assim, efeitos colaterais indesejados.[00231] In another preferred embodiment, the present invention relates to an RNA molecule selected from the group consisting of SEQ ID NO: 11 to 34 that harbors an additional nucleotide(s) at the 5' terminus that extends beyond the triplet complementary to the start codon and that is complementary to the sequences of the desired polypeptide or protein encoded by the coding region of the RNA molecule of the present invention. Preferably, the complementary sequences comprising the above sequences complementary to the UTR sequences of the present invention (i.e., an RNA molecule selected from the group consisting of SEQ ID NO: 11 to 34) preferably comprises at least 15, more preferably at least 16, more preferably at least 17, more preferably at least 18, more preferably at least 19, most preferably at least 20, 21, 22, 23 or 24 nucleotides. In an even more preferred embodiment, these sequences comprise 25, 30, 35, 40 or more nucleotides. Increasing the length at the 5' terminus may be desired in order to increase the specificity of the complementary sequence, thus avoiding undesirable side effects.

[00232] Em uma outra modalidade preferida, a presente invenção não apenas se refere a qualquer uma das moléculas de RNA acima, mas também a uma molécula de RNA selecionada do grupo que consiste em SEQ ID NO:11 a 34 que compreende até 5%, 10%, 20% ou 30% de incompatibilidade com as moléculas de RNA descritas acima. Além disso, as moléculas de RNA podem ser quimicamente modificadas como descrito no presente documento.[00232] In another preferred embodiment, the present invention not only relates to any of the above RNA molecules, but also to an RNA molecule selected from the group consisting of SEQ ID NO:11 to 34 that comprises up to 5%, 10%, 20% or 30% incompatibility with the RNA molecules described above. Furthermore, the RNA molecules can be chemically modified as described herein.

[00233] A presente invenção também se refere a um kit que compreende uma molécula de DNA da presente invenção, uma molécula de RNA da presente invenção, uma molécula de ácido nucleico da presente invenção, um vetor da presente invenção ou uma célula hospedeira da presente invenção. Em relação às modalidades preferidas, o mesmo se aplica, com as devidas mudanças, como foi apresentado acima no contexto da molécula de DNA, da molécula de RNA, da molécula de ácido nucleico, do vetor ou da célula hospedeira de acordo com a presente invenção. Vantajosamente, o kit da presente invenção compreende adicionalmente, opcionalmente (a) tampão(ões), soluções de armazenamento e/ou reagentes ou materiais restantes necessários para conduzir os usos e métodos acima e abaixo. Além disso, partes do kit da invenção podem ser embaladas individualmente em frascos ou garrafas ou em combinação em recipientes ou unidades de múltiplos recipientes. O kit da presente invenção pode ser vantajosamente usado, inter alia, para executar os métodos da invenção ou para a preparação da molécula de RNA da invenção e poderia ser empregado em uma variedade de aplicações referidas no presente documento, por exemplo, nos usos como apresentado acima e abaixo. Um outro componente que pode ser incluído no kit são instruções para um indivíduo que usa um kit para seu uso. A fabricação dos kits segue preferencialmente procedimentos padrão que são conhecidos pelo versado na técnica.[00233] The present invention also relates to a kit comprising a DNA molecule of the present invention, an RNA molecule of the present invention, a nucleic acid molecule of the present invention, a vector of the present invention or a host cell of the present invention. With respect to preferred embodiments, the same applies, with due changes, as was presented above in the context of the DNA molecule, the RNA molecule, the nucleic acid molecule, the vector or the host cell according to the present invention. Advantageously, the kit of the present invention additionally optionally comprises (a) buffer(s), storage solutions and/or reagents or remaining materials necessary to carry out the above and below uses and methods. Furthermore, parts of the kit of the invention may be packaged individually in vials or bottles or in combination in containers or multi-container units. The kit of the present invention may be advantageously used, inter alia, for carrying out the methods of the invention or for preparing the RNA molecule of the invention and could be employed in a variety of applications referred to herein, for example, in the uses as set forth above and below. A further component that may be included in the kit are instructions for a person using a kit for its use. The manufacture of the kits preferably follows standard procedures that are known to the person skilled in the art.

[00234] A presente invenção também se refere ao uso de uma UTR como descrito no presente documento para traduzir uma região de codificação de uma molécula de RNA em um polipeptídeo ou uma proteína codificada pela dita região de codificação.[00234] The present invention also relates to the use of a UTR as described herein to translate a coding region of an RNA molecule into a polypeptide or a protein encoded by said coding region.

[00235] Em uma modalidade mais preferida, a presente invenção também se refere ao uso de uma UTR como descrito no presente documento para aumentar a eficiência de tradução de uma região de codificação de uma molécula de RNA em um polipeptídeo ou uma proteína codificada pela dita codificação.[00235] In a more preferred embodiment, the present invention also relates to the use of a UTR as described herein to increase the translation efficiency of a coding region of an RNA molecule into a polypeptide or a protein encoded by said coding.

[00236] Em relação às modalidades preferidas do uso, o mesmo se aplica, com as devidas mudanças, como foi apresentado acima no contexto da molécula de RNA da presente invenção.[00236] Regarding the preferred embodiments of use, the same applies, with due changes, as presented above in the context of the RNA molecule of the present invention.

[00237] Em modalidades preferidas, a presente invenção se refere ao disposto a seguir como caracterizado pelos seguintes itens 1 a 20: 1. Uma molécula de DNA, que pode ser transcrita em um mRNA, que compreende um filamento com os seguintes elementos: (a) uma região de codificação, que inclui um códon inicial em seu terminal 5’, que codifica um polipeptídeo; e (b) diretamente a montante da dita sequência de codificação, uma sequência selecionada do grupo que consiste em: (b1) R1-CGCCACC (SEQ ID NO:1); ou uma sequência em que, na dita sequência, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; e (b2) R1-CNGCCACC (SEQ ID NO:2), em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em T, G, C ou A; ou uma sequência em que, na dita sequência, o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G, em que R1 é um promotor que é reconhecido por uma RNA polimerase dependente de DNA; ou que compreende o filamento complementar.[00237] In preferred embodiments, the present invention relates to the following as characterized by the following items 1 to 20: 1. A DNA molecule, which can be transcribed into an mRNA, which comprises a strand with the following elements: (a) a coding region, which includes a start codon at its 5' terminus, which encodes a polypeptide; and (b) directly upstream of said coding sequence, a sequence selected from the group consisting of: (b1) R1-CGCCACC (SEQ ID NO:1); or a sequence in which, in said sequence, the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G; and (b2) R1-CNGCCACC (SEQ ID NO:2), wherein the nucleotide N at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of T, G, C or A; or a sequence wherein, in said sequence, the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G, wherein R1 is a promoter that is recognized by a DNA-dependent RNA polymerase; or that comprises the complementary strand.

[00238] 2. A molécula de DNA de acordo com item 1, em que o promotor que é reconhecido por uma RNA polimerase dependente de DNA é selecionado do grupo que consiste em: (i) TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:3 e que é reconhecida por uma RNA polimerase dependente de DNA de T7; (ii) AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:4 e que é reconhecida por uma RNA polimerase dependente de DNA de T3; (iii) ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:5 e que é reconhecida por uma RNA polimerase dependente de DNA de SP6; e (iv) AATTAGGGCACACTATAGGGA (SEQ ID NO: 6) ou uma sequência que mostra 1 a 6 substituições em comparação com a SEQ ID NO:6 e que é reconhecida por uma RNA polimerase dependente de DNA de K11.[00238] 2. The DNA molecule according to item 1, wherein the promoter that is recognized by a DNA-dependent RNA polymerase is selected from the group consisting of: (i) TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3) or a sequence that shows 1 to 6 substitutions compared to SEQ ID NO:3 and that is recognized by a T7 DNA-dependent RNA polymerase; (ii) AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4) or a sequence that shows 1 to 6 substitutions compared to SEQ ID NO:4 and that is recognized by a T3 DNA-dependent RNA polymerase; (iii) ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) or a sequence that shows 1 to 6 substitutions compared to SEQ ID NO:5 and that is recognized by an SP6 DNA-dependent RNA polymerase; and (iv) AATTAGGGCACACTATAGGGA (SEQ ID NO: 6) or a sequence that shows 1 to 6 substitutions compared to SEQ ID NO:6 and that is recognized by a K11 DNA-dependent RNA polymerase.

[00239] 3. A molécula de DNA de acordo com item 1 ou 2, em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em T, G ou C, e em que nucleotídeo N não é um A.[00239] 3. The DNA molecule according to item 1 or 2, wherein the N nucleotide at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of T, G or C, and wherein the N nucleotide is not an A.

[00240] 4. A molécula de DNA de acordo com item 3, em que o dito nucleotídeo N na posição 2 de SEQ ID NO:2 é T.[00240] 4. The DNA molecule according to item 3, wherein said N nucleotide at position 2 of SEQ ID NO:2 is T.

[00241] 5. Um vetor que compreende a molécula de DNA do item 4.[00241] 5. A vector comprising the DNA molecule of item 4.

[00242] 6. Uma célula hospedeira que compreende o vetor do item 5.[00242] 6. A host cell comprising the vector of item 5.

[00243] 7. Uma composição que compreende: (v) molécula de DNA de acordo com qualquer um dos itens 1 a 4, o vetor de acordo com item 5 ou a célula hospedeira de acordo com item 6.[00243] 7. A composition comprising: (v) the DNA molecule according to any one of items 1 to 4, the vector according to item 5 or the host cell according to item 6.

[00244] 8. Uma molécula de RNA que compreende (a) uma região de codificação, que inclui um códon inicial em seu terminal 5’, que codifica um polipeptídeo; e (b) diretamente a montante da dita sequência de codificação, uma UTR selecionada do grupo que consiste em: (b1) uma UTR da sequência R2-CGCCACC (SEQ ID NO:1), ou uma sequência em que, na dita sequência de UTR, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; e (b2) uma UTR da sequência R2-CNGCCACC (SEQ ID NO:2), em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em U, G, C ou A, ou uma sequência em que, na dita sequência de UTR, o C na posição 7 de SEQ ID NO:2 é substituído por um A e o C na posição 8 de SEQ ID NO:2 é substituído por um G; e/ou o A na posição 6 de SEQ ID NO:2 é substituído por um G, em que R2 é uma sequência de RNA que corresponde à parte de uma região promotora que começa com o nucleotídeo em que uma RNA polimerase dependente de DNA inicia a síntese de RNA.[00244] 8. An RNA molecule comprising (a) a coding region, which includes a start codon at its 5’ terminus, that encodes a polypeptide; and (b) directly upstream of said coding sequence, a UTR selected from the group consisting of: (b1) a UTR of the sequence R2-CGCCACC (SEQ ID NO:1), or a sequence wherein, in said UTR sequence, the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G; and (b2) a UTR of the sequence R2-CNGCCACC (SEQ ID NO:2), wherein the nucleotide N at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of U, G, C or A, or a sequence wherein, in said UTR sequence, the C at position 7 of SEQ ID NO:2 is replaced by an A and the C at position 8 of SEQ ID NO:2 is replaced by a G; and/or the A at position 6 of SEQ ID NO:2 is replaced by a G, wherein R2 is an RNA sequence that corresponds to the portion of a promoter region that begins with the nucleotide at which a DNA-dependent RNA polymerase initiates RNA synthesis.

[00245] 9. A molécula de RNA de acordo com item 8, em que R2 é selecionado do grupo que consiste em: (i) GGGAGA (SEQ ID NO: 7); (ii) GGGAGA (SEQ ID NO: 8); (iii) GAAG (SEQ ID NO: 9); e (iv) GGGA (SEQ ID NO: 10).[00245] 9. The RNA molecule according to item 8, wherein R2 is selected from the group consisting of: (i) GGGAGA (SEQ ID NO: 7); (ii) GGGAGA (SEQ ID NO: 8); (iii) GAAG (SEQ ID NO: 9); and (iv) GGGA (SEQ ID NO: 10).

[00246] 10. A molécula de RNA de acordo com item 8 ou 9, em que o nucleotídeo N na posição 2 de SEQ ID NO:2 é um nucleotídeo selecionado do grupo que consiste em U, G ou C, e em que o nucleotídeo N não é um A.[00246] 10. The RNA molecule according to item 8 or 9, wherein the N nucleotide at position 2 of SEQ ID NO:2 is a nucleotide selected from the group consisting of U, G, or C, and wherein the N nucleotide is not an A.

[00247] 11. A molécula de RNA de acordo com item 10, em que o dito nucleotídeo N na posição 2 de SEQ ID NO:2 é U.[00247] 11. The RNA molecule according to item 10, wherein said N nucleotide at position 2 of SEQ ID NO:2 is U.

[00248] 12. A molécula de RNA de acordo com qualquer um dos itens 8 a 11, em que a molécula de RNA compreende uma cauda poli-A no terminal 3’.[00248] 12. The RNA molecule of any one of items 8 to 11, wherein the RNA molecule comprises a poly-A tail at the 3' terminus.

[00249] 13. A molécula de RNA de acordo com qualquer um dos itens 8 a 12, em que a cauda poli-A tem um comprimento de pelo menos 120 nucleotídeos.[00249] 13. The RNA molecule according to any one of items 8 to 12, wherein the poly-A tail has a length of at least 120 nucleotides.

[00250] 14. Uma molécula de ácido nucleico que codifica a molécula de RNA de qualquer um dos itens 8 a 13.[00250] 14. A nucleic acid molecule that encodes the RNA molecule of any one of items 8 through 13.

[00251] 15. Um vetor que compreende a molécula de ácido nucleico do item 14.[00251] 15. A vector comprising the nucleic acid molecule of item 14.

[00252] 16. Uma célula hospedeira que compreende o vetor do item 15.[00252] 16. A host cell comprising the vector of item 15.

[00253] 17. Uma composição farmacêutica que compreende a molécula de RNA de acordo com qualquer um dos itens 8 a 13, a molécula de ácido nucleico de acordo com item 14, o vetor de acordo com item 15 ou a célula hospedeira de acordo com item 16 e, opcionalmente, um carreador farmaceuticamente aceitável.[00253] 17. A pharmaceutical composition comprising the RNA molecule according to any one of items 8 to 13, the nucleic acid molecule according to item 14, the vector according to item 15 or the host cell according to item 16 and, optionally, a pharmaceutically acceptable carrier.

[00254] 18. A composição farmacêutica do item 17 para uso em terapias à base de RNA.[00254] 18. The pharmaceutical composition of item 17 for use in RNA-based therapies.

[00255] 19. Um kit que compreende a molécula de DNA de acordo com qualquer um dos itens 1 a 4, a molécula de RNA de acordo com qualquer um dos itens 8 a 13, a molécula de ácido nucleico de acordo com item 14, o vetor de acordo com item 5 ou 15 ou a célula hospedeira de acordo com item 6 ou 16.[00255] 19. A kit comprising the DNA molecule according to any one of items 1 to 4, the RNA molecule according to any one of items 8 to 13, the nucleic acid molecule according to item 14, the vector according to item 5 or 15 or the host cell according to item 6 or 16.

[00256] 20. Uso de uma UTR como definido no item 8(b) para traduzir uma região de codificação de uma molécula de RNA em um polipeptídeo ou uma proteína codificada pela dita região de codificação.[00256] 20. Use of a UTR as defined in item 8(b) to translate a coding region of an RNA molecule into a polypeptide or a protein encoded by said coding region.

[00257] Figura 1: mostra as sequências que abrigam uma sequência de “UTR mínima” junto com o nome dos respectivos construtos repórter de luciferase usados na presente invenção. As sequências abrigam partes do Promotor T7 e do elemento de Kozak seguido por um ATG de códon inicial. As primeiras 10 bases que incluem a sequência TATA e as 6 bases subsequentes (GGGAGA) são sequências derivadas de promotor T7, enquanto as bases restantes a montante do ATG de códon inicial pertencem ao elemento de Kozak (GCCACC). “Sp30” é uma sequência aleatória de 30 nucleotídeos. A sequência sublinhada na sequência n° 9 é a sequência de 5’ UTR de alfa globina humana (“hAg”) que tem um comprimento de 30 nucleotídeos.[00257] Figure 1: Shows the sequences harboring a “minimal UTR” sequence along with the name of the respective luciferase reporter constructs used in the present invention. The sequences harbor parts of the T7 Promoter and the Kozak element followed by a start codon ATG. The first 10 bases that include the TATA sequence and the subsequent 6 bases (GGGAGA) are T7 promoter-derived sequences, while the remaining bases upstream of the start codon ATG belong to the Kozak element (GCCACC). “Sp30” is a random sequence of 30 nucleotides. The underlined sequence in sequence #9 is the 5’ UTR sequence of human alpha globin (“hAg”) that is 30 nucleotides long.

[00258] Sequências 1 a 9 como mostrado na Figura 1 correspondem a SEQ ID NOs:37 a 45, respectivamente.[00258] Sequences 1 to 9 as shown in Figure 1 correspond to SEQ ID NOs:37 to 45, respectively.

[00259] Figuras 2A e B: mostram que o “C” extra na “UTR mínima” é essencial (sequência n° 1 e n°2 na Figura 1). A linhagem de células epiteliais alveolares humanas (A549) e a linhagem de células de carcinoma hepatocelular humano (HepG2) foram semeadas a uma densidade de 20.000 células/poço e 40.000 células/poço, respectivamente, em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM de codificação de luciferase (sequências 1 e 2 na Figura 1) com o uso de Lipofectamine2000. A expressão de luciferase foi medida 24 horas após a transfecção. Os valores representam ± SD médio de 3 réplicas e foram plotados contra a dose de transfecção e os dados foram analisados através de GraphPad Prism. Tanto em células A549 como HepG2, a deleção de C resultou em expressão inferior. Portanto, esse C extra foi incluído no modelo de todos os construtos.[00259] Figures 2A and B: Show that the extra “C” in the “minimal UTR” is essential (sequence #1 and #2 in Figure 1). The human alveolar epithelial cell line (A549) and the human hepatocellular carcinoma cell line (HepG2) were seeded at a density of 20,000 cells/well and 40,000 cells/well, respectively, in a 96-well plate. 24 hours after seeding, cells were transfected with different luciferase-encoding SNIM RNA constructs (sequences #1 and #2 in Figure 1) using Lipofectamine2000. Luciferase expression was measured 24 hours after transfection. Values represent mean ± SD of 3 replicates and were plotted against transfection dose and data were analyzed using GraphPad Prism. In both A549 and HepG2 cells, deletion of C resulted in lower expression. Therefore, this extra C was included in the model of all constructs.

[00260] Figura 3: mostra o efeito de nucleotídeos individuais como indicado e demonstra o efeito da distância entre o “C” extra e o elemento de Kozak em células transfectadas A549. O ensaio de luciferase e células transfectadas foi executado conforme descrito em Materiais e Métodos. Visto que doses superiores estavam foram da faixa linear, é apresentada aqui apenas resposta à dose de até 62,5 ng/poço. 5’UTR de alfa globina humana foi usada como controle positivo. Foram realizados experimentos de transfecção com moléculas de RNA de SNIM que abrigam sequências 3 a 8 da Figura 1, respectivamente. Linhagens de células epiteliais alveolares humanas (A549) foram semeadas a uma densidade de 20.000 células/poço em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM de codificação de luciferase (sequências n° 3 a 8 da Figura 1) com o uso de Lipofectamine2000. A expressão de luciferase foi medida 24 horas após a transfecção. Valores plotados contra a dose de transfecção e dados analisados através de GraphPad Prism. Os valores representam ± SD médio de 3 réplicas.[00260] Figure 3: Shows the effect of individual nucleotides as indicated and demonstrates the effect of the distance between the extra “C” and the Kozak element in transfected A549 cells. The luciferase assay and transfected cells were performed as described in Materials and Methods. Since higher doses were outside the linear range, only dose response up to 62.5 ng/well is presented here. Human alpha globin 5’UTR was used as a positive control. Transfection experiments were performed with SNIM RNA molecules harboring sequences 3 to 8 from Figure 1, respectively. Human alveolar epithelial cell lines (A549) were seeded at a density of 20,000 cells/well in a 96-well plate. 24 hours after seeding, cells were transfected with different luciferase-encoding SNIM RNA constructs (sequences #3–8 in Figure 1) using Lipofectamine2000. Luciferase expression was measured 24 hours after transfection. Values plotted against transfection dose and data analyzed using GraphPad Prism. Values represent mean ± SD of 3 replicates.

[00261] Em linhagem de células epiteliais alveolares (A549), a inserção de um “A” extra entre C e o elemento de Kozak (sequência n° 3 na Figura 1) resultou em expressão significativamente inferior (Figura 3). A inserção de um único “T” entre C e o elemento de Kozak (sequência n° 4 na Figura 1) resultou em níveis de expressão comparáveis àqueles alcançados com 5’UTR de alfa globina humana que foi usada como um controle positivo.[00261] In alveolar epithelial cell line (A549), insertion of an extra “A” between C and the Kozak element (sequence #3 in Figure 1) resulted in significantly lower expression (Figure 3). Insertion of a single “T” between C and the Kozak element (sequence #4 in Figure 1) resulted in expression levels comparable to those achieved with the human alpha globin 5’UTR which was used as a positive control.

[00262] Figura 4: mostra o efeito de nucleotídeos individuais como indicado e demonstra o efeito da distância entre o “C” extra e o elemento de Kozak em células transfectadas HepG2. O ensaio de luciferase e células transfectadas foi executado conforme descrito em Materiais e Métodos. Visto que doses superiores estavam foram da faixa linear, é apresentada aqui apenas resposta à dose de até 62,5 ng/poço. Foram realizados experimentos de transfecção com as sequências n° 3 a 8 da Figura 1. As linhagens de células de carcinoma hepatocelular (HepG2) foram semeadas a uma densidade de 40.000 células/poço em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM de codificação de luciferase (sequências n° 3 a 8 da Figura 1) com o uso de Lipofectamine2000. A expressão de luciferase foi medida 24 horas após a transfecção. Valores plotados contra a dose de transfecção e dados analisados através de GraphPad Prism. Os valores representam ± SD médio de 3 réplicas. Em ambas linhagens de células (células A549 (Figura 3) e HepG2 (Figura 4)), a inserção de um “A” extra entre C e o elemento de Kozak (sequência n° 3 da Figura 1) resultou em expressão significativamente inferior (Figuras 3 e 4). Em ambos os tipos de célula, a inserção de um único “T” entre C e o elemento de Kozak (sequência n° 4 da Figura 1) resultou em níveis de expressão comparáveis àqueles alcançados com 5’UTR de alfa globina humana que foi usada como um controle positivo. Em células HepG2, a sequência n° 1 (Figura 1) também foi igualmente eficaz.[00262] Figure 4: Shows the effect of individual nucleotides as indicated and demonstrates the effect of the distance between the extra “C” and the Kozak element in transfected HepG2 cells. The luciferase assay and transfected cells were performed as described in Materials and Methods. Since higher doses were outside the linear range, only dose response up to 62.5 ng/well is presented here. Transfection experiments were performed with sequences #3 to #8 of Figure 1. Hepatocellular carcinoma cell lines (HepG2) were seeded at a density of 40,000 cells/well in a 96-well plate. 24 hours after seeding, cells were transfected with different luciferase-encoding SNIM RNA constructs (sequences #3 to #8 of Figure 1) using Lipofectamine2000. Luciferase expression was measured 24 h post-transfection. Values plotted against transfection dose and data analyzed using GraphPad Prism. Values represent mean ± SD of 3 replicates. In both cell lines (A549 (Figure 3) and HepG2 (Figure 4) cells), insertion of an extra “A” between C and the Kozak element (sequence #3 in Figure 1) resulted in significantly lower expression (Figures 3 and 4). In both cell types, insertion of a single “T” between C and the Kozak element (sequence #4 in Figure 1) resulted in expression levels comparable to those achieved with the human alpha globin 5’UTR that was used as a positive control. In HepG2 cells, sequence #1 (Figure 1) was also equally effective.

[00263] Figura 5: mostra o efeito do elemento de TISU na expressão de luciferase em células A549. A resposta à dose detalhada e o ajuste de curva foram realizados para construtos de codificação de luciferase selecionados. Com base nos dados anteriores das Figuras 2 a 4, o elemento de TISU foi colocado em combinação da sequência 4 (Figura 1) que continha os dois atributos desejáveis: (C entre o Promotor T7 e o elemento de Kozak e o T extra entre C e o elemento de Kozak para alcançar a sequência n° 9 da Figura 1).[00263] Figure 5: Shows the effect of TISU element on luciferase expression in A549 cells. Detailed dose response and curve fitting were performed for selected luciferase encoding constructs. Based on the above data in Figures 2 to 4, TISU element was placed in combination of sequence 4 (Figure 1) which contained the two desirable attributes: (C between T7 Promoter and Kozak element and extra T between C and Kozak element to achieve sequence #9 of Figure 1).

[00264] A linhagem de células epiteliais alveolares humanas (A549) (Figuras 5 A e B) e linhagem de células de carcinoma hepatocelular humano (HepG2) (Figuras 5 C e D) foram semeadas a uma densidade de 20.000 células/poço e 40.000 células/poço respectivamente em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM de codificação de luciferase com o uso de Lipofectamine2000. A expressão de luciferase foi medida 24 e 48 horas após a transfecção (Figura 5E). Valores plotados contra a dose de transfecção e dados analisados através de GraphPad Prism. A transfecção de células A459 (A, B) e HepG2 (C, D) com diferentes mRNAs de codificação de luciferase como indicado. A atividade de luciferase foi medida 24 (A, C) e 48 (B, D) horas após a transfecção. Os valores representam ± SD médio de 3 réplicas.[00264] Human alveolar epithelial cell line (A549) (Figures 5 A and B) and human hepatocellular carcinoma cell line (HepG2) (Figures 5 C and D) were seeded at a density of 20,000 cells/well and 40,000 cells/well respectively in a 96-well plate. 24 hours after seeding, cells were transfected with different luciferase-encoding SNIM RNA constructs using Lipofectamine2000. Luciferase expression was measured 24 and 48 hours after transfection (Figure 5E). Values plotted against transfection dose and data analyzed via GraphPad Prism. Transfection of A459 (A, B) and HepG2 (C, D) cells with different luciferase-encoding mRNAs as indicated. Luciferase activity was measured 24 (A, C) and 48 (B, D) hours after transfection. Values represent mean ± SD of 3 replicates.

[00265] Em ambas as linhagens de células e em ambos os pontos no tempo medidos, foi obtida expressão significativamente superior com construto de luciferase contendo elemento de TISU (Figuras 5A a D).[00265] In both cell lines and at both time points measured, significantly higher expression was obtained with TISU element-containing luciferase construct (Figures 5A to D).

[00266] Figura 6: mostra o feito de elemento de TISU na expressão de luciferase em células A549 (Figura 6A) e em células HepG2 (Figura 6B). A linhagem de células epiteliais alveolares humanas (A549) e a linhagem de células de carcinoma hepatocelular humano (HepG2) foram semeadas a uma densidade de 20.000 células/poço e 40.000 células/poço respectivamente em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM de codificação de luciferase com o uso de Lipofectamine2000 (o eixo geométrico X mostra a quantidade em ng de RNA de SNIM por poço de uma placa de 96 poços). A expressão de luciferase foi medida 24 horas após a transfecção. Valores plotados contra a dose de transfecção e dados analisados através de GraphPad Prism. A transfecção de células A549 (A) e HepG2 (B) com diferentes mRNAs de codificação de luciferase como indicado.[00266] Figure 6: Shows the effect of TISU element on luciferase expression in A549 cells (Figure 6A) and HepG2 cells (Figure 6B). Human alveolar epithelial cell line (A549) and human hepatocellular carcinoma cell line (HepG2) were seeded at a density of 20,000 cells/well and 40,000 cells/well respectively in a 96-well plate. 24 hours after seeding, cells were transfected with different luciferase-encoding SNIM RNA constructs using Lipofectamine2000 (X-axis shows the amount in ng of SNIM RNA per well of a 96-well plate). Luciferase expression was measured 24 hours after transfection. Values plotted against transfection dose and data analyzed using GraphPad Prism. Transfection of A549 (A) and HepG2 (B) cells with different luciferase-encoding mRNAs as indicated.

[00267] Figura 7: mostra os resultados dos experimentos in vivo em camundongos com diferentes construtos de mRNA de codificação de Luciferase. Os construtos de luciferase como indicado na Figura 7 (para o respectivo elemento de sequência de UTR, consulte a Figura 1) foram testados in vivo em camundongos Balb/c (fêmeas, 6 a 8 semanas). Para esse cenário de experimento, um elemento de UTR adicional que mostrou-se intensificar a expressão de transgene (Publicação Internacional n° WO 2012/170930 A1) também foi testado para sua eficiência. O construto de Luciferase contendo esse elemento de UTR foi designado como Luc2-SUSA. 20 μg do respectivo RNA de SNIM foi complexado com LF-44 e injetado de modo intravenoso em camundongos Balb/c. O imageamento in vivo foi realizado 6 horas após a injeção empregando um sistema de imageamento IVIS e valores quantificados como fótons/s/cm2/sr foram plotados. Resultados de todo o imageamento de animal são mostrados na Figura 7A e os resultados de imageamento de todo o órgão são mostrados nas Figuras 7B (fígado), 7C (pulmão), 7D (baço), respectivamente.[00267] Figure 7: Shows the results of in vivo experiments in mice with different Luciferase-encoding mRNA constructs. The Luciferase constructs as indicated in Figure 7 (for the respective UTR sequence element, see Figure 1) were tested in vivo in Balb/c mice (females, 6 to 8 weeks old). For this experimental setting, an additional UTR element that has been shown to enhance transgene expression (International Publication No. WO 2012/170930 A1) was also tested for its efficiency. The Luciferase construct containing this UTR element was designated as Luc2-SUSA. 20 μg of the respective SNIM RNA was complexed with LF-44 and injected intravenously into Balb/c mice. In vivo imaging was performed 6 hours post-injection employing an IVIS imaging system and values quantified as photons/s/cm2/sr were plotted. Results of whole animal imaging are shown in Figure 7A and results of whole organ imaging are shown in Figures 7B (liver), 7C (lung), 7D (spleen), respectively.

[00268] Os órgãos retirados dos animais foram congelados em nitrogênio líquido e homogeneizados. As células foram lisadas em tampão de lise Tris-HCl e a atividade de luciferase foi medida. Os resultados são mostrados nas Figuras 7E (fígado), 7F (pulmão), 7G (baço), respectivamente.[00268] Organs removed from animals were frozen in liquid nitrogen and homogenized. Cells were lysed in Tris-HCl lysis buffer and luciferase activity was measured. The results are shown in Figures 7E (liver), 7F (lung), 7G (spleen), respectively.

[00269] A inserção de elemento de TISU resultou em expressão superior em comparação com 5’ e 3’ UTRs anteriormente publicadas (Publicação Internacional n° WO 2012/170930 A1). A adição de um único T entre C e Kozak (Sequência n° 4 da Figura 1) leva a níveis de expressão comparáveis observados com UTR de alfa globina humana (Sequência n° 8 da Figura 1). A adição de um elemento de TISU, na sequência n° 4 (Figura 1) aumentou adicionalmente a expressão (Sequência n° 9 da Figura 1). Foi surpreendentemente constatado que o efeito da UTR de alfa globina humana não era específico de sequência. Uma sequência de 30 nucleotídeos aleatória suportou nível de expressão similar à 5’UTR de alfa globina humana.[00269] The insertion of the TISU element resulted in higher expression compared to previously published 5’ and 3’ UTRs (International Publication No. WO 2012/170930 A1). The addition of a single T between C and Kozak (Sequence No. 4 of Figure 1) led to comparable expression levels observed with the human alpha globin UTR (Sequence No. 8 of Figure 1). The addition of a TISU element, in sequence No. 4 (Figure 1) further increased expression (Sequence No. 9 of Figure 1). Surprisingly, the effect of the human alpha globin UTR was not sequence specific. A random 30 nucleotide sequence supported a similar expression level to the human alpha globin 5’UTR.

[00270] Com base nos resultados in vitro em linhagens de células e experimentos in vivo em camundongos, as sequências n° 1, 4, 7 e 9 (Figura 1) são propostas como candidatos promissores para sequências que abrigam “UTRs mínimas” para terapia de transcrito. Essas sequências de UTR mínima não têm efeitos negativos sobre o rendimento de RNA durante a transcrição in vitro e o mRNA resultante é traduzido de modo muito mais eficiente em comparação com os mRNAs contendo UTRs do estado da técnica.[00270] Based on in vitro results in cell lines and in vivo experiments in mice, sequences #1, 4, 7 and 9 (Figure 1) are proposed as promising candidates for sequences harboring “minimal UTRs” for transcript therapy. These minimal UTR sequences have no negative effects on RNA yield during in vitro transcription and the resulting mRNA is translated much more efficiently compared to prior art UTR-containing mRNAs.

[00271] Figura 8: mostra valores de contagem de leucócitos (WBC) (Figura 8A), eritrócitos (RBC) (Figura 8B), plaquetas (Figura 8C), hemoglobina (Figura 8D) e hematócrito (Figura 8E) de camundongos com diferentes construtos de mRNA de codificação de Luciferase. O experimento foi realizado essencialmente como descrito na Figura 7 e os parâmetros sanguíneos foram analisados com o emprego de um Analisador para Hematologia Automatizado Sysmex KX-21N™ (IL, EUA).[00271] Figure 8: Shows white blood cell (WBC) (Figure 8A), red blood cell (RBC) (Figure 8B), platelet (Figure 8C), hemoglobin (Figure 8D), and hematocrit (Figure 8E) count values of mice with different Luciferase-encoding mRNA constructs. The experiment was performed essentially as described in Figure 7 and blood parameters were analyzed using a Sysmex KX-21N™ Automated Hematology Analyzer (IL, USA).

[00272] Figura 9: mostra experimentos de expressão com elemento de TISU contendo mRNA de codificação de EPO humano em comparação com aquela de mRNA de codificação de EPO humano contendo 5’ e 3’ UTRs das (Publicação Internacional n° WO 2012/170930 A1: Figuras 1 e 2) (UTR de SUSA) que é conhecido por suportar expressão de EPO muito elevada.[00272] Figure 9: Shows expression experiments with TISU element containing human EPO-encoding mRNA in comparison with that of human EPO-encoding mRNA containing 5’ and 3’ UTRs of (International Publication No. WO 2012/170930 A1: Figures 1 and 2) (SUSA UTR) which is known to support very high EPO expression.

[00273] A linhagem de células epiteliais alveolares humanas (A549) e a linhagem de células de carcinoma hepatocelular humano (HepG2) foram semeadas a uma densidade de 20.000 células/poço e 40.000 células/poço, respectivamente, em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com 250 ng de diferentes construtos de RNA de SNIM de codificação de EPO com o uso de Lipofectamine2000. Quantidades de EPO foram quantificadas 24 horas após a transfecção através de ELISA (Kit ELISA Human Erythropoietin Quantikine IVD da R&D Systems (MN, EUA)) e dados analisados através de GraphPad Prism. Os valores representam ± SD médio de 3 réplicas.[00273] Human alveolar epithelial cell line (A549) and human hepatocellular carcinoma cell line (HepG2) were seeded at a density of 20,000 cells/well and 40,000 cells/well, respectively, in a 96-well plate. 24 hours after seeding, cells were transfected with 250 ng of different EPO-encoding SNIM RNA constructs using Lipofectamine2000. EPO amounts were quantified 24 hours after transfection by ELISA (Human Erythropoietin Quantikine IVD ELISA Kit from R&D Systems (MN, USA)) and data analyzed by GraphPad Prism. Values represent mean ± SD of 3 replicates.

[00274] Figura 10: mostra experimentos de expressão com OTC humano. Para OTC humano, a expressão de elemento de TISU contendo mRNA que codifica hOTC foi comparada àquela de mRNA que codifica hOTC contendo 5’ UTR de alfa globina humana que é conhecida por render a expressão mais elevada em comparação com todas as outras combinações conhecidas até o presente momento.[00274] Figure 10: shows expression experiments with human OTC. For human OTC, the expression of TISU element containing mRNA encoding hOTC was compared to that of mRNA encoding hOTC containing human alpha globin 5' UTR which is known to yield the highest expression compared to all other combinations known to date.

[00275] As linhagens de células de carcinoma hepatocelular humano (HepG2) foram semeadas em placas de 96 poços e, 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM que codifica hOTC com o uso de Lipofectamine2000. 24 h após a transfecção, as células foram lisadas e quantidades de OTC quantificadas com o uso de Western Blot.[00275] Human hepatocellular carcinoma cell lines (HepG2) were seeded in 96-well plates and 24 hours after seeding, cells were transfected with different SNIM RNA constructs encoding hOTC using Lipofectamine2000. 24 h after transfection, cells were lysed and OTC amounts quantified using Western Blot.

[00276] Tanto hAg como o elemento de TISU contendo RNAs de SNIM que codificam hOTC resultaram em nível similar de expressão de hOTC (Figura 10A). Vinculina foi usada como mantenedor e as intensidades de banda foram quantificadas e usadas como padrão de quantificação interna (Figura 10B).[00276] Both hAg and the TISU element containing SNIM RNAs encoding hOTC resulted in similar level of hOTC expression (Figure 10A). Vinculin was used as maintainer and band intensities were quantified and used as internal quantification standard (Figure 10B).

[00277] Figura 11: Estruturas secundárias previstas de um espaçador de 30 nucleotídeos de comprimento aleatório presente na sequência 7 (esquerda) e 5’UTR de alfa globina humana presente na sequência 8 (direita).[00277] Figure 11: Predicted secondary structures of a random length 30 nucleotide spacer present in sequence 7 (left) and human alpha globin 5’UTR present in sequence 8 (right).

[00278] Outros aspectos e vantagens da invenção serão descritos nos exemplos seguintes, que são dados para fins de ilustração e não como limitação. Cada publicação, patente, pedido de patente ou outro documento citado neste pedido é aqui incorporado por referência em sua totalidade.[00278] Other aspects and advantages of the invention will be described in the following examples, which are given for purposes of illustration and not limitation. Each publication, patent, patent application or other document cited in this application is incorporated herein by reference in its entirety.

EXEMPLOSEXAMPLES I. MATERIAIS E MÉTODOSI. MATERIALS AND METHODS VETORES PLASMÍDICOSPLASMID VECTORS

[00279] As respectivas sequências de 5’ UTR junto com uma sequência de luciferase otimizada por códon foram sintetizadas por GeneScriptG (NJ, EUA) e clonadas em pUC57-Kan (GeneScript). No caso de EPO (eritropoietina humana otimizada por códon) e OTC (ornitina transcarbamilase otimizada por códon), o gene de luciferase de sequência de codificação foi substituído pela sequência de codificação do gene de EPO (SEQ ID NO: 35) e de OTC (SEQ ID NO: 36), respectivamente. As sequências de UTR usadas nos construtos junto com o nome do respectivo construto repórter de luciferase são mostrados na Figura 1.[00279] The respective 5’ UTR sequences along with a codon-optimized luciferase sequence were synthesized by GeneScriptG (NJ, USA) and cloned into pUC57-Kan (GeneScript). In the case of EPO (codon-optimized human erythropoietin) and OTC (codon-optimized ornithine transcarbamylase), the luciferase gene coding sequence was replaced with the coding sequence of the EPO (SEQ ID NO: 35) and OTC (SEQ ID NO: 36) gene, respectively. The UTR sequences used in the constructs along with the name of the respective luciferase reporter construct are shown in Figure 1.

PRODUÇÃO DE mRNAmRNA PRODUCTION

[00280] Para gerar mRNA transcrito in vitro (mRNA IVT), os plasmídeos foram linearizados por digestão de BstBI e purificados por extração de clorofórmio e precipitação de etanol. Foram usados plasmídeos lineares purificados como modelo para transcrição in vitro com o uso de Sistema-T7 de produção de RNA em larga escala RiboMax (Promega, Alemanha). Foi adicionado Análogo de Cap Anti-Reverso (ARCA) à mistura de reação para gerar mRNA com cap 5’ e o mRNA foi poliadenilado (Thermo Scientific) para gerar a cauda Poli-A em 3’ Poli-A.[00280] To generate in vitro transcribed mRNA (IVT mRNA), plasmids were linearized by BstBI digestion and purified by chloroform extraction and ethanol precipitation. Purified linear plasmids were used as template for in vitro transcription using RiboMax T7 Large Scale RNA Production System (Promega, Germany). Anti-Reverse Cap Analog (ARCA) was added to the reaction mixture to generate 5' capped mRNA and the mRNA was polyadenylated (Thermo Scientific) to generate the Poly-A tail on 3' Poly-A.

[00281] Adicionalmente, para a produção de mRNAs de SNIM, foram adicionados nucleotídeos quimicamente modificados, a saber, metil-CTP e tio-UTP (Jena Bioscience, Alemanha) a uma concentração final de ATP:CTP:UTP:metil-CTP:tio-UTP:GTP de 7,57mM:5,68mM:5,68mM:1,89mM:1,89mM:1,21mM. A mistura de IVT completa foi incubada a 37 °C por 2 horas seguido de uma digestão de DNA com DNaseI por 20 minutos a 37 °C. O RNA foi precipitado com acetato de amônio (concentração final de 2,5 M) e lavado com EtOH a 70%. A etapa de lavagem foi realizada duas vezes. Finalmente, o pélete de RNA foi ressuspenso em água livre de RNAse. Todos os mRNAs foram verificados em géis de agarose a 1%. Os RNAs transcritos são quimicamente modificados visto que cerca de 25% dos resíduos de uridina são 2-tiouridina (s2U) e cerca de 25% dos resíduos de citidina são 5-metilcitidina (m5C). As sequências das UTRs são dadas na Figura 1.[00281] Additionally, for the production of SNIM mRNAs, chemically modified nucleotides, namely methyl-CTP and thio-UTP (Jena Bioscience, Germany) were added to a final concentration of ATP:CTP:UTP:methyl-CTP:thio-UTP:GTP of 7.57mM:5.68mM:5.68mM:1.89mM:1.89mM:1.21mM. The complete IVT mixture was incubated at 37°C for 2 hours followed by a DNA digestion with DNaseI for 20 minutes at 37°C. RNA was precipitated with ammonium acetate (final concentration of 2.5 M) and washed with 70% EtOH. The washing step was performed twice. Finally, the RNA pellet was resuspended in RNAse-free water. All mRNAs were run on 1% agarose gels. The transcribed RNAs are chemically modified since about 25% of the uridine residues are 2-thiouridine (s2U) and about 25% of the cytidine residues are 5-methylcytidine (m5C). The sequences of the UTRs are given in Figure 1.

TRANSFECÇÃO IN VITROIN VITRO TRANSFECTION

[00282] A linhagem de células epiteliais alveolares humanas (A549) e a linhagem de células de carcinoma hepatocelular humano (HepG2) foram semeadas a uma densidade de 20.000 células/poço e 40.000 células/poço, respectivamente, em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM de codificação de luciferase com o uso do reagente de transfecção comercial LipofectamineTM2000 a uma razão de 2,5 μl de LipofectamineTM2000 por 1 μg de mRNA (eixo geométrico X nas Figuras 2 a 6 mostra uma quantidade em ng d RNA de SNIM por poço de uma placa de 96 poços). A formação de complexo foi preparada da seguinte forma: LipofectamineTM2000 e mRNA foram separadamente diluídos em meio de transfecção OptiMEM para aumentar para um volume total de 45 μl, cada. Essas misturas foram incubadas à temperatura ambiente durante 5 minutos. A solução de LipofectamineTM2000 foi, então, misturada com a solução de mRNA, seguido de mais 20 minutos de incubação à temperatura ambiente. As células foram incubadas em um volume de transfecção total de 90 μl a 37 °C (nível de CO2 a 5%) por uma hora. O meio de transfecção foi subsequentemente removido e as células foram lavadas com PBS. Subsequentemente, as células foram reincubadas com Meio L-15 de Leibovitz contendo FBS a 10%.[00282] The human alveolar epithelial cell line (A549) and the human hepatocellular carcinoma cell line (HepG2) were seeded at a density of 20,000 cells/well and 40,000 cells/well, respectively, in a 96-well plate. 24 hours after seeding, the cells were transfected with different luciferase-encoding SNIM RNA constructs using the commercial transfection reagent LipofectamineTM2000 at a ratio of 2.5 μL LipofectamineTM2000 per 1 μg mRNA (X-axis in Figures 2 to 6 shows the amount in ng of SNIM RNA per well of a 96-well plate). Complex formation was prepared as follows: LipofectamineTM2000 and mRNA were separately diluted in OptiMEM transfection medium to a total volume of 45 μL each. These mixtures were incubated at room temperature for 5 minutes. The LipofectamineTM2000 solution was then mixed with the mRNA solution, followed by an additional 20 minutes of incubation at room temperature. Cells were incubated in a total transfection volume of 90 μL at 37 °C (5% CO2 level) for one hour. The transfection medium was subsequently removed and the cells were washed with PBS. Subsequently, the cells were reincubated with Leibovitz's L-15 Medium containing 10% FBS.

CULTURA CELULARCELL CULTURE

[00283] Uma linhagem de células de adenocarcinoma alveolar humano (A549, ATCC CCL-185) foi cultivada em meio F12K de Ham suplementado com FBS a 10%. Uma linhagem de células de carcinoma hepatocelular humano (HepG2, ATCC HB-8065) foi cultivada em meio DMEM, suplementado com soro fetal bovino a 10%. Todas as linhagens de células foram cultivadas em uma atmosfera umidificada a um nível de CO2 a 5%. MEDIÇÃO DE BIOLUMINESCÊNCIA[00283] A human alveolar adenocarcinoma cell line (A549, ATCC CCL-185) was cultured in Ham's F12K medium supplemented with 10% FBS. A human hepatocellular carcinoma cell line (HepG2, ATCC HB-8065) was cultured in DMEM medium supplemented with 10% fetal bovine serum. All cell lines were cultured in a humidified atmosphere at a 5% CO2 level. BIOLUMINESCENCE MEASUREMENT

[00284] A Luciferase de Vagalume (FFL) é uma proteína repórter comum que não está endogenamente presente em mamíferos e pode ser detectada facilmente por imageamento luminescente. A luciferase catalisa a reação de luciferina e oxigênio, o que resulta em emissão de bioluminescência.[00284] Firefly Luciferase (FFL) is a common reporter protein that is not endogenously present in mammals and can be easily detected by luminescence imaging. Luciferase catalyzes the reaction of luciferin and oxygen, which results in bioluminescence emission.

[00285] A linhagem de células epiteliais alveolares humanas (A549) e a linhagem de células de carcinoma hepatocelular humano (HepG2) foram semeadas a uma densidade de 20.000 células/poço e 40.000 células/poço, respectivamente, em uma placa de 96 poços. 24 horas após a semeadura, as células foram transfectadas com diferentes construtos de RNA de SNIM de codificação de luciferase com o uso de Lipofectamine2000 (o eixo geométrico X mostra a quantidade em ng de RNA de SNIM por poço de uma placa de 96 poços). A bioluminescência foi medida 24 horas após a transfecção. Valores plotados contra a dose de transfecção e dados analisados através de GraphPad Prism.[00285] Human alveolar epithelial cell line (A549) and human hepatocellular carcinoma cell line (HepG2) were seeded at a density of 20,000 cells/well and 40,000 cells/well, respectively, in a 96-well plate. 24 hours after seeding, cells were transfected with different luciferase-encoding SNIM RNA constructs using Lipofectamine2000 (X-axis shows the amount in ng of SNIM RNA per well of a 96-well plate). Bioluminescence was measured 24 hours after transfection. Values plotted against transfection dose and data analyzed using GraphPad Prism.

[00286] Para quantificar a expressão de luciferase em lisado de tecido homogeneizado, os órgãos foram retirados dos animais, congelados em nitrogênio líquido, homogeneizados e as células foram lisadas em tampão de lise (Tris-HCl 25 mM pH 7,5 com Tritron-X100 a 0,1%).[00286] To quantify luciferase expression in homogenized tissue lysate, organs were removed from animals, frozen in liquid nitrogen, homogenized, and cells were lysed in lysis buffer (25 mM Tris-HCl pH 7.5 with 0.1% Tritron-X100).

ANIMAISANIMALS

[00287] Camundongos BALB/c fêmea de seis a oito semanas de idade foram obtidos junto à Janvier, Route Des Chênes SecsBP5, F-53940 Le Genest St. Isle, França, e mantidos sob condições específicas isentas de patógenos. Os camundongos foram aclimatados ao ambiente da instalação de animais durante pelo menos sete dias antes das experiências. Todos os procedimentos em animais foram aprovados e controlados pelo comitê de ética local e executados de acordo com as diretrizes da lei alemã de proteção da vida animal. FORMULAÇÕES LIPIDOIDES[00287] Six- to eight-week-old female BALB/c mice were obtained from Janvier, Route Des Chênes SecsBP5, F-53940 Le Genest St. Isle, France, and maintained under specific pathogen-free conditions. The mice were acclimatized to the environment of the animal facility for at least seven days prior to experiments. All animal procedures were approved and controlled by the local ethics committee and performed in accordance with the guidelines of the German Animal Protection Act. LIPIDOID FORMULATIONS

[00288] Lipidoides foram formulados com mRNA da seguinte forma: C12-(2-3-2), DOPE, Chol e DSPE-PEG2k (3,6:0,18:0,76:1 razão ponderal) foram dissolvidos em etanol e rapidamente injetados em uma solução tamponada com citrato (ácido cítrico 10 mM, NaCl 150 mM, pH=4,5) que compreende luciferase de vagalume que codifica mRNA quimicamente modificada a uma razão ponderal entre lipídeo/mRNA de 10,5 para render uma concentração final de etanol de 20% e dializada contra água. Os complexos de lipidoide/mRNA resultantes resultaram em nanopartículas carregadas positivamente (92,6 ± 0,7 nm; 21,0 ± 0,2 mV) e foram injetados de modo intravenoso na veia da cauda de camundongos contidos. Em um segundo experimento, os complexos de lipidoide/mRNA foram ajustados para PBS antes da injeção intravenosa, o que resultou em nanopartículas quase não carregadas (91,5 ± 0,6 nm; -0,7 ± 0,2 mV).[00288] Lipidoids were formulated with mRNA as follows: C12-(2-3-2), DOPE, Chol, and DSPE-PEG2k (3.6:0.18:0.76:1 weight ratio) were dissolved in ethanol and rapidly injected into a citrate-buffered solution (10 mM citric acid, 150 mM NaCl, pH=4.5) comprising chemically modified mRNA-encoding firefly luciferase at a lipid/mRNA weight ratio of 10.5 to yield a final ethanol concentration of 20% and dialyzed against water. The resulting lipidoid/mRNA complexes yielded positively charged nanoparticles (92.6 ± 0.7 nm; 21.0 ± 0.2 mV) and were injected intravenously into the tail vein of restrained mice. In a second experiment, lipidoid/mRNA complexes were adjusted to PBS prior to intravenous injection, which resulted in nearly uncharged nanoparticles (91.5 ± 0.6 nm; −0.7 ± 0.2 mV).

MEDIÇÃO DE ATIVIDADE DE LUC EM CAMUNDONGOS COM O USO DE IMAGEAMENTO BIOLUMINESCENTE IN VIVOMEASUREMENT OF LUC ACTIVITY IN MICE USING IN VIVO BIOLUMINESCENT IMAGING

[00289] Vinte e quatro horas após a administração, os camundongos foram anestesiados por injeção intraperitoneal de medetomidina (11,5 μg/kg de BW), midazolam (115 μg/kg de BW) e fentanila (1,15 μg/kg de BW). O substrato de D-luciferina (3 mg/100 μl de PBS por camundongo) foi aplicado através de injeção intravenosa. A bioluminescência foi medida 10 minutos depois, com o uso de um Sistema de Imageamento IVIS 100 (Xenogen, Alameda, EUA) e as configurações de câmera: Bin(HS), campo de visão 10, f1 f-parada, binagem de alta resolução e tempo de exposição de 5 min. O sinal foi quantificado e analisado com o uso do Software Living Image versão 2.50 (Xenogen, Alameda, EUA).[00289] Twenty-four hours after administration, mice were anesthetized by intraperitoneal injection of medetomidine (11.5 μg/kg BW), midazolam (115 μg/kg BW), and fentanyl (1.15 μg/kg BW). D-luciferin substrate (3 mg/100 μl PBS per mouse) was administered via intravenous injection. Bioluminescence was measured 10 min later using an IVIS 100 Imaging System (Xenogen, Alameda, USA) and camera settings: Bin(HS), field of view 10, f1 f-stop, high-resolution binning, and exposure time 5 min. The signal was quantified and analyzed using Living Image Software version 2.50 (Xenogen, Alameda, USA).

ANÁLISE DE WESTERN BLOT DE PROTEÍNA OTCOTC PROTEIN WESTERN BLOT ANALYSIS

[00290] Placas congeladas foram descongeladas e foi realizada a lise celular direta na placa. As proteínas foram lisadas com o uso de tampão de lise (TRIS 25 mM, Triton-X 100 a 0,1%, Sigma-Aldrich, Alemanha) complementado com inibidor de protease (cOmplete, livre de EDTA, Roche Diagnostics, Alemanha) e DNase (Solução de DNase I (2.500 U/ml), (Thermo Fisher, EUA). Após a lise, as amostras foram misturadas com Tampão de Amostra NuPage® LDS e Agente de Redução de Amostra (Thermo Fisher, EUA) e aquecidas por 10 min a 70 °C. Foi conduzida eletroforese em gel com o uso de 15 μl do lisado em Géis a 10% Bis-Tris Midi NuPAGE com XCell4 SureLock™ Midi, Sistema Bio-Rad Criterion™ (Thermo Fisher, EUA). As proteínas foram transferidas com o uso do Sistema de Transferência TransBlot® Turbo™ (Biorad, Alemanha) por 30 min. Após a transferência, as membranas foram bloqueadas com NET-gelatina por 30 min antes de uma membrana ser incubada de um dia para o outro a 4 °C com o anticorpo primário, diluído em NET-gelatina 1:2.000 (Anticorpo Policlonal OTC (Centro), AP6928c-AB Biocat, Alemanha). Após três etapas de lavagem com NET-gelatina, anticorpo secundário conjugado com peroxidase de raiz-forte (IgG-HRP anti-coelho de cabra, sc-2004, Santa Cruz Biotechnology, EUA), diluído 1:10.000 em NET-gelatina, foi adicionado por 1 h à TA. A membrana foi lavada novamente três vezes com NET-gelatina até que os sinais fossem visualizados com um kit de substrato quimioluminescente (substrato Luminata Crescendo Western HRP, Merck Millipore, Alemanha) e visualizados com o uso do Sistema ChemiDoc™ MP (Biorad, Alemanha).[00290] Frozen plates were thawed and direct cell lysis was performed on the plate. Proteins were lysed using lysis buffer (25 mM TRIS, 0.1% Triton-X 100, Sigma-Aldrich, Germany) supplemented with protease inhibitor (cOmplete, EDTA-free, Roche Diagnostics, Germany) and DNase (DNase I Solution (2,500 U/ml), (Thermo Fisher, USA). After lysis, samples were mixed with NuPage® LDS Sample Buffer and Sample Reducing Agent (Thermo Fisher, USA) and heated for 10 min at 70 °C. Gel electrophoresis was performed using 15 μl of the lysate on NuPAGE 10% Bis-Tris Midi Gels with XCell4 SureLock™ Midi, Bio-Rad Criterion™ System (Thermo Fisher, USA). Proteins were transferred using the TransBlot® Transfer System Turbo™ (Biorad, Germany) for 30 min. After transfer, membranes were blocked with NET-gelatin for 30 min before one membrane was incubated overnight at 4 °C with the primary antibody, diluted in NET-gelatin 1:2,000 (OTC Polyclonal Antibody (Center), AP6928c-AB Biocat, Germany). After three washing steps with NET-gelatin, horseradish peroxidase-conjugated secondary antibody (goat anti-rabbit IgG-HRP, sc-2004, Santa Cruz Biotechnology, USA), diluted 1:10,000 in NET-gelatin, was added for 1 h at RT. The membrane was washed again three times with NET-gelatin until signals were visualized with a chemiluminescent substrate kit (Luminata Crescendo Western HRP substrate, Merck Millipore, Germany) and visualized using the ChemiDoc™ MP System (Biorad, Germany).

MATERIAISMATERIALS

[00291] FBS, Meio L-15 de Leibovitz (Gibco), LipofectamineTM2000 e OptiMEM (Gibco) foram adquiridos junto à Invitrogen, Alemanha. PBS estéril foi preparado internamente. F-12K de Ham, DMEM e Tripsina-EDTA foram adquiridos junto à c.c.pro GmbH, Alemanha.[00291] FBS, Leibovitz's L-15 Medium (Gibco), LipofectamineTM2000 and OptiMEM (Gibco) were purchased from Invitrogen, Germany. Sterile PBS was prepared in-house. Ham's F-12K, DMEM and Trypsin-EDTA were purchased from c.c.pro GmbH, Germany.

II. RESULTADOSII. RESULTS II.A EXPERIMENTOS DE CULTURA CELULARII.A CELL CULTURE EXPERIMENTS

[00292] As Figuras 2A e B mostram que o “C” extra entre o Promotor T7 e o elemento de Kozak é essencial. Deletar essa base resulta em expressão reduzida em ambos os tipos de célula comparados. Para ambos os construtos (Sequências n° 1 e 2 da Figura 1), toda a faixa de dosagem e a faixa linear (valores excluídos: dose maior que 62,5 ng/poço excluída da análise) são apresentadas separadamente para comparação conveniente. Tanto em células A549 como HepG2, a deleção de C resultou em expressão inferior. Portanto, esse C extra foi incluído no modelo de todos os construtos.[00292] Figures 2A and B show that the extra “C” between the T7 Promoter and the Kozak element is essential. Deleting this base results in reduced expression in both cell types compared. For both constructs (Sequences #1 and #2 in Figure 1), the full dose range and the linear range (excluded values: dose greater than 62.5 ng/well excluded from analysis) are presented separately for convenient comparison. In both A549 and HepG2 cells, deletion of C resulted in lower expression. Therefore, this extra C was included in the model for all constructs.

[00293] Com base nos resultados obtidos em células A549 e HepG2, foram conduzidos experimentos adicionais com o construto contendo o “C” extra (Sequência n° 1: T7Luc2).[00293] Based on the results obtained in A549 and HepG2 cells, additional experiments were conducted with the construct containing the extra “C” (Sequence #1: T7Luc2).

[00294] Figura 3 e Figura 4.[00294] Figure 3 and Figure 4.

[00295] A sequência 1 foi usada como modelo e, a essa sequência, ou um único nucleotídeo (A, T, G ou C: sequência n° 3 a 6 da Figura 1, respectivamente), ou uma sequência aleatória, 30 nucleotídeos de comprimento e desprovida de qualquer estrutura secundária previsível (sequência 7) ou 5’ UTR de alfa globina humana (sequência 8) foi incorporada entre o “C” investigado e o elemento de Kozak.[00295] Sequence 1 was used as a model and, to this sequence, either a single nucleotide (A, T, G or C: sequence no. 3 to 6 of Figure 1, respectively), or a random sequence, 30 nucleotides long and devoid of any predictable secondary structure (sequence 7) or 5' UTR of human alpha globin (sequence 8) was incorporated between the investigated “C” and the Kozak element.

[00296] As células foram transfectadas e o ensaio de luciferase foi realizado como descrito em Materiais e Métodos. Visto que doses superiores estavam foram da faixa linear, é apresentada aqui apenas resposta à dose de até 62,5 ng/poço. 5’UTR de alfa globina humana foi usada como controle positivo.[00296] Cells were transfected and the luciferase assay was performed as described in Materials and Methods. Since higher doses were outside the linear range, only dose response up to 62.5 ng/well is presented here. Human alpha globin 5'UTR was used as a positive control.

[00297] Para resumir os resultados acima, as Figuras 1 a 4 mostram que um “C” extra entre o Promotor T7 e o elemento de Kozak é essencial no que diz respeito ao alcance de alta expressão de proteína por meio do emprego de 5’UTR minimalista. Deletar o nucleotídeo resulta em expressão reduzida. A adição de um “A” extra entre o “C” extra e o elemento de Kozak afeta negativamente a expressão. Quando uma base de pirimidina e, com a máxima preferência, um “T” é adicionado naquela posição, são obtidos níveis comparáveis com aqueles observados com 5’UTR de hAg.[00297] To summarize the above results, Figures 1 to 4 show that an extra “C” between the T7 Promoter and the Kozak element is essential for achieving high protein expression through the use of a minimalist 5’UTR. Deleting the nucleotide results in reduced expression. Addition of an extra “A” between the extra “C” and the Kozak element negatively affects expression. When a pyrimidine base and, most preferably, a “T” is added at that position, levels comparable to those observed with the hAg 5’UTR are obtained.

[00298] Subsequentemente, foram realizados Experimentos adicionais para: - elucidar o efeito do elemento de TISU quando combinado com a sequência que mais bem funciona (Sequência 9), e - determinar se o efeito de 5’ UTR de hAg é um efeito de sequência específica ou se é a distância entre 5’Cap e códon inicial importante.[00298] Subsequently, additional experiments were performed to: - elucidate the effect of the TISU element when combined with the best-functioning sequence (Sequence 9), and - determine whether the 5’ UTR effect of hAg is a sequence-specific effect or whether it is the distance between the 5’Cap and start codon that is important.

[00299] A Figura 5 o efeito do elemento de TISU na expressão de luciferase em células A549. O “elemento de TISU” incorpora “AG” em vez de “CC” na Sequência n° 9 como mostrado na Figura 1 cara-a-cara com a Sequência n° 4 como mostrado na Figura 1. As células A549 (Figuras 5A e B) bem como as células HepG2 (Figuras 5C e D) mostraram expressão de luciferase significativamente superior com o construto de luciferase contendo elemento de TISU junto com o “C” da Sequência n° 1 e o “T” adicional entre esse “C” e o elemento de Kozak 24 (A, C) e 48 (B, D) horas após a transfecção.[00299] Figure 5 shows the effect of the TISU element on luciferase expression in A549 cells. The “TISU element” incorporates “AG” instead of “CC” in Sequence #9 as shown in Figure 1 versus Sequence #4 as shown in Figure 1. A549 cells (Figures 5A and B) as well as HepG2 cells (Figures 5C and D) showed significantly higher luciferase expression with the luciferase construct containing the TISU element along with the “C” from Sequence #1 and the additional “T” between this “C” and the Kozak element 24 (A, C) and 48 (B, D) hours after transfection.

[00300] A Figura 6 mostra os resultados do mesmo experimento da Figura 5, mas com a adição de uma 5’UTR contendo uma sequência aleatória de 30 nucleotídeos, para mostrar uma comparação lado-a-lado da UTR de alfa globina humana (Sequência 8 da Figura 1) com uma sequência aleatória do mesmo comprimento (Sequência 7 da Figura 1). A expressão de luciferase foi medida em HepG2 (Figura 6A e células A549 (Figura 6B) 24 horas após a transfecção com RNAs de SNIM como indicado.[00300] Figure 6 shows the results of the same experiment as Figure 5, but with the addition of a 5’UTR containing a 30 nucleotide random sequence, to show a side-by-side comparison of the human alpha globin UTR (Sequence 8 of Figure 1) with a random sequence of the same length (Sequence 7 of Figure 1). Luciferase expression was measured in HepG2 (Figure 6A) and A549 cells (Figure 6B) 24 hours after transfection with SNIM RNAs as indicated.

[00301] A Figura 9 mostra os resultados de experimentos de expressão com elemento de TISU contendo mRNA que codifica hEPO em comparação com aquele de mRNA que codifica hEPO contendo 5’ e 3’ UTRs de (Publicação Internacional n° WO 2012/170930 A1: Figuras 1 e 2) (UTR de SUSA) que foi usado como um padrão após a transfecção de células A549 e HepG2 com o respectivo RNA de SNIM. Quantidades de EPO foram quantificadas 24 horas após a transfecção através de ELISA. Os valores representam ± SD médio de 3 réplicas.[00301] Figure 9 shows the results of expression experiments with TISU element containing mRNA encoding hEPO in comparison with that of mRNA encoding hEPO containing 5’ and 3’ UTRs of (International Publication No. WO 2012/170930 A1: Figures 1 and 2) (SUSA UTR) that was used as a standard after transfection of A549 and HepG2 cells with the respective SNIM RNA. Amounts of EPO were quantified 24 hours after transfection by ELISA. Values represent mean ± SD of 3 replicates.

[00302] Em células A549 humanas, a incorporação do elemento de TISU resultou em expressão superior em comparação com aquela alcançada com a incorporação de 5’ e 3’ UTRs (Figura 9A). Foram observados níveis de expressão comparáveis em células HepG2 (Figura 9B). Isso é especialmente surpreendente visto que a incorporação das UTRs 5’ e 3’ de SUSA produz os RNAs cerca de 200 nucleotídeos mais longos em comparação com a UTR de acordo com a presente invenção.[00302] In human A549 cells, incorporation of the TISU element resulted in higher expression compared to that achieved with incorporation of the 5' and 3' UTRs (Figure 9A). Comparable expression levels were observed in HepG2 cells (Figure 9B). This is especially surprising given that incorporation of the 5' and 3' UTRs of SUSA produces RNAs approximately 200 nucleotides longer compared to the UTR according to the present invention.

[00303] A Figura 10 mostra experimentos de expressão com OTC humano. Para comparação, o elemento de TISU contendo mRNA que codifica hOTC foi comparado àquele de mRNA que codifica hOTC contendo 5’ UTR de alfa globina humana que é conhecida por render expressão mais elevada em comparação com todas as outras combinações conhecidas até o presente momento.[00303] Figure 10 shows expression experiments with human OTC. For comparison, the TISU construct containing mRNA encoding hOTC was compared to that of mRNA encoding hOTC containing the human alpha globin 5' UTR which is known to yield higher expression compared to all other combinations known to date.

[00304] Células HepG2 foram transfectadas com diferentes construtos de RNA de SNIM que codifica hOTC, lisadas 24 horas depois e quantidades de OTC quantificadas por Western blotting.[00304] HepG2 cells were transfected with different SNIM RNA constructs encoding hOTC, lysed 24 hours later and amounts of OTC quantified by Western blotting.

[00305] Tanto hAg como o elemento de TISU contendo RNAs de SNIM que codificam hOTC resultaram em nível similar de expressão de hOTC (Figura 10A). Vinculina foi usada como mantenedor e as intensidades de banda foram comparadas com o uso de densitometria (Figura 10B).[00305] Both hAg and the TISU element containing SNIM RNAs encoding hOTC resulted in similar level of hOTC expression (Figure 10A). Vinculin was used as maintainer and band intensities were compared using densitometry (Figure 10B).

II.B APLICAÇÃO IV DE CONSTRUTOS LUC2 EM CAMUNDONGOSII.B IV APPLICATION OF LUC2 CONSTRUCTS IN MICE

[00306] Os resultados são mostrados nas Figuras 7 e 8.[00306] The results are shown in Figures 7 and 8.

[00307] Os seguintes construtos foram usados em aplicações IV em camundongos: Luc2 (+8+A) Luc2 (+8+T) Luc2 (+8+T) + TISU Luc2-hAg Luc2 Sp30 UTRs de Luc2-SUSA[00307] The following constructs were used in IV applications in mice: Luc2(+8+A) Luc2(+8+T) Luc2(+8+T) + TISU Luc2-hAg Luc2 Sp30 UTRs of Luc2-SUSA

[00308] 20 μg do respectivo RNA de SNIM foi complexado com LF- 44 e injetado IV em camundongos Balb/c. Como um controle adicional, a sequência de Luc2 flanqueada por intensificador de CMV humano no terminal 5’ (Luc2-SUSA) e 3’UTR do hormônio do crescimento humano no terminal 3’ também foi produzida. As sequências usadas como UTRs nesse construto foram retiradas da Patente Shire (WO 2012/170930 A1: ID de Sequência 1 / Figura 1.)[00308] 20 μg of the respective SNIM RNA was complexed with LF-44 and injected IV into Balb/c mice. As an additional control, the Luc2 sequence flanked by human CMV enhancer at the 5’ terminus (Luc2-SUSA) and human growth hormone 3’UTR at the 3’ terminus was also produced. The sequences used as UTRs in this construct were taken from the Shire Patent (WO 2012/170930 A1: Sequence ID 1 / Figure 1.)

[00309] O imageamento in vivo foi realizado 6 horas após a injeção empregando um sistema de imageamento IVIS e valores quantificados como fótons/s/cm2/sr foram plotados. São mostrados resultados de todo o imageamento de animal na Figura 7A e os resultados do imageamento de todo o órgão são mostrados nas Figuras 7B (fígado), 7C (pulmão), 7D (baço), respectivamente.[00309] In vivo imaging was performed 6 hours post-injection employing an IVIS imaging system and values quantified as photons/s/cm2/sr were plotted. Results from whole animal imaging are shown in Figure 7A and results from whole organ imaging are shown in Figures 7B (liver), 7C (lung), 7D (spleen), respectively.

[00310] Os órgãos retirados dos animais foram congelados em nitrogênio líquido, homogeneizados, lisados e a atividade de luciferase foi medida. Os resultados são mostrados nas Figuras 7E (fígado), 7F (pulmão), 7G (baço), respectivamente.[00310] Organs removed from the animals were frozen in liquid nitrogen, homogenized, lysed, and luciferase activity was measured. The results are shown in Figures 7E (liver), 7F (lung), 7G (spleen), respectively.

[00311] Os parâmetros sanguíneos dos animais foram analisados com o emprego do Analisador para Hematologia Automatizado Sysmex KX-21N™: valores de contagem de leucócitos (WBC) (Figura 8A), eritrócitos (RBC) (Figura 8B), plaquetas (Figura 8C), hemoglobina (Figura 8D) e hematócrito (Figura 8E) de camundongos com diferentes construtos de mRNA de codificação de Luciferase não mostra diferenças significativas.[00311] The blood parameters of the animals were analyzed using the Sysmex KX-21N™ Automated Hematology Analyzer: leukocyte count (WBC) (Figure 8A), erythrocyte (RBC) (Figure 8B), platelet (Figure 8C), hemoglobin (Figure 8D) and hematocrit (Figure 8E) values of mice with different Luciferase-encoding mRNA constructs do not show significant differences.

[00312] Figura 11: Estruturas secundárias previstas de um espaçador de 30 nucleotídeos de comprimento presente na sequência 7 (esquerda) e 5’UTR de alfa globina humana do mesmo comprimento presente na sequência 8 (direita). Embora as estruturas secundárias de ambas as sequências não sejam nem similares, as mesmas resultaram em níveis de expressão similares (Figuras 6A e 6B), que são ambos igualmente baixos em comparação com o T7Luc2(+8+T)-TISU.[00312] Figure 11: Predicted secondary structures of a 30 nucleotide long spacer present in sequence 7 (left) and human alpha globin 5’UTR of the same length present in sequence 8 (right). Although the secondary structures of both sequences are not even similar, they resulted in similar expression levels (Figures 6A and 6B), which are both equally low compared to T7Luc2(+8+T)-TISU.

Claims (13)

1. Molécula de DNA, que pode ser transcrita em um mRNA, caracterizada pelo fato de que compreende um filamento com os seguintes elementos: (i) uma região de codificação, que inclui um códon inicial em seu terminal 5’, que codifica um polipeptídeo; e (ii) diretamente a montante da dita sequência de codificação, a sequência: (b1) R1-CGCCACC (SEQ ID NO:1); ou uma sequência em que, na dita sequência, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; em que R1 é um promotor que é reconhecido por uma RNA polimerase dependente de DNA; ou que compreende o filamento complementar, em que o promotor que é reconhecido por uma RNA polimerase dependente de DNA é selecionado do grupo que consiste em: (iii) TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3) que é reconhecido por uma RNA polimerase dependente de DNA de T7; (iv) AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4) que é reconhecido por uma RNA polimerase dependente de DNA de T3; (v) i) ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) que é reconhecido por uma RNA polimerase dependente de DNA de SP6; e (vi) AATTAGGGCACACTATAGGGA (SEQ ID NO: 6) que é reconhecido por uma RNA polimerase dependente de DNA de K11.1. A DNA molecule that can be transcribed into an mRNA, comprising a strand with the following elements: (i) a coding region that includes a start codon at its 5’ terminus that encodes a polypeptide; and (ii) directly upstream of said coding sequence, the sequence: (b1) R1-CGCCACC (SEQ ID NO:1); or a sequence in which, in said sequence, the C at position 6 of SEQ ID NO:1 is replaced by an A and the C at position 7 of SEQ ID NO:1 is replaced by a G; and/or the A at position 5 of SEQ ID NO:1 is replaced by a G; wherein R1 is a promoter that is recognized by a DNA-dependent RNA polymerase; or comprising the complementary strand, wherein the promoter that is recognized by a DNA-dependent RNA polymerase is selected from the group consisting of: (iii) TAATACGACTCACTATAGGGAGA (SEQ ID NO: 3) that is recognized by a T7 DNA-dependent RNA polymerase; (iv) AATTAACCCTCACTAAAGGGAGA (SEQ ID NO: 4) that is recognized by a T3 DNA-dependent RNA polymerase; (v) i) ATTTAGGTGACACTATAGAAG (SEQ ID NO: 5) that is recognized by an SP6 DNA-dependent RNA polymerase; and (vi) AATTAGGGCACACTATAGGGA (SEQ ID NO: 6) that is recognized by a K11 DNA-dependent RNA polymerase. 2. Vetor, caracterizado pelo fato de que compreende a molécula de DNA como definida na reivindicação 1.2. Vector, characterized by the fact that it comprises the DNA molecule as defined in claim 1. 3. Célula hospedeira bacteriana ou fúngica, caracterizada pelo fato de que compreende o vetor como definido na reivindicação 2.3. Bacterial or fungal host cell, characterized by the fact that it comprises the vector as defined in claim 2. 4. Composição, caracterizada pelo fato de que compreende: a molécula de DNA como definida na reivindicação 1, o vetor como definido na reivindicação 2, ou a célula hospedeira como definida na reivindicação 3.4. Composition, characterized by the fact that it comprises: the DNA molecule as defined in claim 1, the vector as defined in claim 2, or the host cell as defined in claim 3. 5. Molécula de RNA, caracterizada pelo fato de que compreende (a) uma região de codificação, que inclui um códon inicial em seu terminal 5’, que codifica um polipeptídeo; e (b) diretamente a montante da dita sequência de codificação: (b1) uma UTR da sequência R2-CGCCACC (SEQ ID NO:1), ou uma sequência, em que, na dita sequência de UTR, o C na posição 6 de SEQ ID NO:1 é substituído por um A e o C na posição 7 de SEQ ID NO:1 é substituído por um G; e/ou o A na posição 5 de SEQ ID NO:1 é substituído por um G; em que R2 é uma sequência de RNA que corresponde à parte de uma região promotora que começa com o nucleotídeo onde uma RNA polimerase dependente de DNA inicia a síntese de RNA, em que R2 é selecionado do grupo que consiste em: (i) GGGAGA (SEQ ID NO: 7); (ii) GGGAGA (SEQ ID NO: 8); (iii) GAAG (SEQ ID NO: 9); e (iv) GGGA (SEQ ID NO: 10); e em que a molécula de RNA compreende uma cauda poli-A no terminal 3’ em que a UTR, conforme definida em (b), tem um comprimento máximo de 14 nucleotídeos quando R2 é (i) ou (ii); ou em que a UTR, conforme definida em (b), tem um comprimento máximo de 12 nucleotídeos quando R2 é (iii) ou (iv).5. An RNA molecule comprising (a) a coding region including a start codon at its 5’ terminus encoding a polypeptide; and (b) directly upstream of said coding sequence: (b1) a UTR of the sequence R2-CGCCACC (SEQ ID NO: 1), or a sequence wherein in said UTR sequence the C at position 6 of SEQ ID NO: 1 is replaced by an A and the C at position 7 of SEQ ID NO: 1 is replaced by a G; and/or the A at position 5 of SEQ ID NO: 1 is replaced by a G; wherein R2 is an RNA sequence corresponding to the portion of a promoter region beginning with the nucleotide where a DNA-dependent RNA polymerase initiates RNA synthesis, wherein R2 is selected from the group consisting of: (i) GGGAGA (SEQ ID NO: 7); (ii) GGGAGA (SEQ ID NO: 8); (iii) GAAG (SEQ ID NO: 9); and (iv) GGGA (SEQ ID NO: 10); and wherein the RNA molecule comprises a poly-A tail at the 3’ terminus in which the UTR, as defined in (b), has a maximum length of 14 nucleotides when R2 is (i) or (ii); or in which the UTR, as defined in (b), has a maximum length of 12 nucleotides when R2 is (iii) or (iv). 6. Molécula de RNA de acordo com a reivindicação 5, caracterizada pelo fato de que a cauda poli-A tem um comprimento de pelo menos 120 nucleotídeos.6. The RNA molecule of claim 5, wherein the poly-A tail has a length of at least 120 nucleotides. 7. Molécula de ácido nucleico, caracterizada pelo fato de que codifica a molécula de RNA como definida na reivindicação 5 ou 6.7. Nucleic acid molecule, characterized by the fact that it encodes the RNA molecule as defined in claim 5 or 6. 8. Vetor, caracterizado pelo fato de compreende a molécula de ácido nucleico como definida na reivindicação 7.8. Vector, characterized by the fact that it comprises the nucleic acid molecule as defined in claim 7. 9. Célula hospedeira bacteriana ou fúngica, caracterizada pelo fato de que compreende o vetor como definido na reivindicação 8.9. Bacterial or fungal host cell, characterized by the fact that it comprises the vector as defined in claim 8. 10. Composição farmacêutica, caracterizada pelo fato de que compreende a molécula de RNA como definida na reivindicação 5 ou 6, a molécula de ácido nucleico como definida na reivindicação 7, o vetor como definido na reivindicação 8, ou a célula hospedeira como definida na reivindicação 9, e, opcionalmente, um carreador farmaceuticamente aceitável.10. Pharmaceutical composition, characterized by the fact that it comprises the RNA molecule as defined in claim 5 or 6, the nucleic acid molecule as defined in claim 7, the vector as defined in claim 8, or the host cell as defined in claim 9, and, optionally, a pharmaceutically acceptable carrier. 11. Composição farmacêutica de acordo com a reivindicação 10, caracterizada pelo fato de que é para uso em terapias à base de RNA.11. Pharmaceutical composition according to claim 10, characterized by the fact that it is for use in RNA-based therapies. 12. Kit, caracterizado pelo fato de que compreende a molécula de DNA como definida na reivindicação 1, a molécula de RNA como definida na reivindicação 5 ou 6, a molécula de ácido nucleico como definida na reivindicação 7, o vetor como definido na reivindicação 2 ou 8, ou a célula hospedeira como definida na reivindicação 3 ou 9.12. Kit, characterized by the fact that it comprises the DNA molecule as defined in claim 1, the RNA molecule as defined in claim 5 or 6, the nucleic acid molecule as defined in claim 7, the vector as defined in claim 2 or 8, or the host cell as defined in claim 3 or 9. 13. Uso de uma UTR, como definida na reivindicação 5b, caracterizado pelo fato de que é para traduzir uma região de codificação de uma molécula de RNA em um polipeptídeo ou uma proteína codificada pela dita região de codificação.13. Use of a UTR as defined in claim 5b, characterized in that it is to translate a coding region of an RNA molecule into a polypeptide or a protein encoded by said coding region.
BR122024013538-8A 2016-03-31 2017-03-30 DNA MOLECULE, VECTOR, HOST CELL, COMPOSITION, RNA MOLECULE, NUCLEIC ACID MOLECULE, PHARMACEUTICAL COMPOSITION, KIT, AND, USE OF A UTR BR122024013538A2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP16163264.1 2016-03-31
EP16177094.6 2016-06-30

Publications (1)

Publication Number Publication Date
BR122024013538A2 true BR122024013538A2 (en) 2024-08-06

Family

ID=

Similar Documents

Publication Publication Date Title
JP7632905B2 (en) Novel minimal UTR sequence
CN115651927B (en) Methods and compositions for editing RNA
ES2732774T3 (en) UTRs that increase the efficiency of translation of RNA molecules
CN112153986B (en) Lipid-based formulation for delivery of RNA
Martins-Dias et al. Nonsense suppression therapies in human genetic diseases
ES2958832T3 (en) Plasmid containing a sequence coding for an mRNA with a cleaved poly(A) tail
CN113939591A (en) Methods and compositions for editing RNA
JP2024507394A (en) Formulations for aerosol formation and aerosols for delivering nucleic acids
BR122024013538A2 (en) DNA MOLECULE, VECTOR, HOST CELL, COMPOSITION, RNA MOLECULE, NUCLEIC ACID MOLECULE, PHARMACEUTICAL COMPOSITION, KIT, AND, USE OF A UTR
US20250223587A1 (en) Compositions and methods for treating a congenital eye disease
WO2025064656A1 (en) Compositions and methods for altering a nucleobase in a lipoprotein(a) polynucleotide
HK40081918B (en) Methods and compositions for editing rna
HK40081918A (en) Methods and compositions for editing rna
WO2025137275A1 (en) Novel cas nucleases and polynucleotides encoding the same
WO2025111391A1 (en) Compositions and methods for altering complement activation
HK40061041A (en) Methods and compositions for editing rnas