BR112019015244A2

BR112019015244A2 - ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos

Info

Publication number: BR112019015244A2
Application number: BR112019015244A
Authority: BR
Inventors: Chevessier-Tünnesen Frédéric; Poenisch Marion; Schlake Thomas
Original assignee: Curevac Ag
Priority date: 2017-03-24
Filing date: 2018-03-23
Publication date: 2020-04-14
Also published as: CN110914433A; EP3601576A1; RU2019132890A; SG11201906297QA; MX2019011215A; US20210403925A1; JP2024038121A; US20230332163A1; RU2019132890A3; SG10202110491PA; CA3050616A1; AU2018240515A1; WO2018172556A1; KR20190133699A; US11739335B2; JP2020513824A

Abstract

a presente invenção refere-se ao campo de biomedicina e, em particular, ao campo de ácidos nucleicos terapêuticos. a presente invenção provê ácidos nucleicos artificiais, em particular rnas, codificando proteínas associadas a crispr. uma composição (farmacêutica) e kit de partes compreendendo a mesma são também providos. ainda, a presente invenção refere-se ao ácido nucleico artificial, composição (farmacêutica) ou kit de partes para uso em medicina, e em particular no tratamento e/ou profilaxia de doenças condescendentes a tratamento com proteínas associadas de crispr.

Description

Relatório Descritivo da Patente de Invenção para ’’ÁCIDOS NUCLEICOS CODIFICANDO PROTEÍNAS ASSOCIADAS Â CRISPR E USOS DOS MESMOS.

[0001] A presente invenção refere-se a ácidos nucleicos artificiais, em particular RNAs, codificando proteínas associadas a CRISPR, e composições (farmacêuticas) e kit de partes compreendendo os mesmos. Os ditos ácidos nucleicos artificiais, em particular RNAs, composições (farmacêuticas) e kits são inter alia compreendidos para uso em medicina, por exemplo, em terapia de gene, e em particular no tratamento e/ou profilaxia de doenças condescendentes a tratamento com proteínas associadas a CRISPR, por exemplo, através de edição, ativação, inativação de gene ou modulação da expressão de genes-alvo de interesse.

[0002] Sistemas CRISPR (Repetições Palindrômicas Curtas Agrupadas e Regularmente lnterespaçadas)-Cas conferem proteção imune adaptativa a bactérias e arqueas contra elementos de DNA invasores (por exemplo, vírus, plasmídeos) usando RNAs de antissenso para reconhecer e clivar DNA estranho de uma maneira específica de sequência. Na classificação mais recente, os sistemas CRISPR-Cas diversos são divididos em duas classes de acordo com a configuração de seus efetores: sistemas CRISPR Classe 1 utilizam várias proteínas associadas a Cas (associadas a CRISPR) e CRISPR-RNA (crRNA) como um RNA-guia (gRNA) para formar um complexo efetor, enquanto sistemas CRISPR Classe 2 empregam uma proteína Cas de componente único grande em conjunto com crRNAs para mediar interferência com elementos de DNA estranhos. Sistemas CRISPR-Cas Classe 1 múltiplos, que incluem os sistemas tipo I e tipo III, foram identificados e funcionalmente caracterizados em detalhes. A maioria dos sistemas CRISPR-Cas Classe 2 que foram identificados e experimentalmente caracterizados até agora empregam endonucleases guiadas por RNA homólogas da

Petição 870190070557, de 24/07/2019, pág. 66/401

2/306 família Cas9 como efetores, que funcionam com endonucleases de multidomínio, junto com crRNA e crRNA de transativação (tracrRNA) ou, alternativamente, com um RNA-guia único sintético (sgRNA), para clivar ambos os filamentos do DNA-alvo invasor (Sander e Joung, Nat. Biotechnol. 2014 Abr; 32(4): 347-355, Boettcher e McManus, Mol. Cell. 2015 Maio 21; 58(4): 575-585).

[0003] O sistema CRISPR/Cas9 tipo II nativo funciona essencial· mente em três etapas. Quando da exposição a DNA estranho, uma sequência de DNA estranho curta (protoespaçador) é incorporada ao genoma bacteriano entre repetições palindrômicas curtas no loci de CRISPR. Uma extensão curta de nucleotídeos conservados proximais ao protoespaçador (motivo adjacente de protoespaçador (PAM)) é usada para adquirir o protoespaçador (fase de aquisição ou adaptação). Subsequentemente, o organismo procariótico hospedeiro transcreve e processa loci de CRISPR para gerar RNA de CRISP maduro (crRNA) contendo ambos elementos de repetição de CRISP e o segmento genético espaçador integrado do DNA estranho correspondendo ao elemento de DNA não próprio prévio, junto com RNA de CRISP de transativação (tracrRNA) (etapa de expressão ou maturação). Finalmente, crRNA e Cas9 se associam com o tracrRNA provendo um complexo crRNA:tracrRNA:Cas9 que se associa com a sequência complementar no DNA invasor. As endonucleases Cas9 então introduzem uma quebra de filamento duplo de DNA (DSB) no DNA-alvo (fase de interferência) (Sander e Joung, Nat. BiotechnoL 2014 Abr; 32(4): 347-355).

[0004] Células de mamífero respondem a DSBs ou através do método de união de extremidade não homóloga (NHEJ) ou reparo direcionado à homologia (HDR). NHEJ pode introduzir inserção ou deleção aleatória de extensões curtas de bases de nucleotídeo, levando a mutações de gene, e efeitos de perda de função. Em HDR, introdução de um segmento de DNA com regiões tendo homologia com as sequências

Petição 870190070557, de 24/07/2019, pág. 67/401

3/306 flanqueando ambos os lados da quebra de filamento duplo de DNA levará a reparo pelo maquinário da célula hospedeira (Sander e Joung, Nat. Biotechnol. 2014 Abr; 32(4): 347-355).

[0005] Um segundo sistema CRISPR Classe 2, putativo, tentativamente atribuído tipo V, foi recentemente identificado em vários genomas bacterianos. Os sistemas CRISPR-Cas do tipo V putativos contêm uma proteína de -1.300 aminoácidos, grande, chamada Cpf1 ou Cas12 (CRISPR de Prevotella, Francisella 1, Acidaminococcus sp BV3L6 (AsCpf1) e Lachnospiraceae bacterium ND2006 (LbCpfl)). Cpf1 requer apenas um crRNA curto para reconhecer e ligar à sua sequência de DNA-alvo, ao invés do RNA-guia de '-100-nt (crRNA e tracrRNA) para Cas9. Isto é, Cpf1 geralmente mostra um 42nt único que tem um 23 nt em sua extremidade 3’ que é complementar ao protoespaçador da sequência de DNA-alvo, PAMs TTTN 5’ do protoespaçador e gera como DSB projeções 5’ comparado com extremidades cegas para scCas9. Cpf1 ciiva eficientemente DNA-alvo seguido por um motivo adjacente de protoespaçador (PAM) rico em T curto, em contraste com o PAM rico em G seguindo o DNA-alvo para sistemas Cas9. Terceiro, Cpf1 introduz uma quebra de filamento duplo de DNA escalonado com uma projeção 5’ de 4 ou 5-nt (Zetsche e outros. Cell. 2015 Out 22; 163(3): 759-771). Eficiências no alvo de Cpf1 em células humanas são comparáveis a spCas9 e Cpf1 não mostra nenhuma divagem fora do alvo ou reduzida. [0006] Desde a aplicação de sistemas CRISPR/Cas em genomas de mamífero, a tecnologia se desenvolveu rapidamente: Cas9 cataliticamente inativa ou morta (dCas9), que não exibe nenhuma atividade de endonuclease, pode ser especificamente recrutada por gRNAs adequados para sequências de DNA-alvo de interesse. Tais proteínas Cas e suas variantes e derivados são de interesse particular como ferramentas de regulagem de gene versáteis, específicas de sequência e não mutagênicas. Por exemplo, gRNAs apropriados podem ser usados para

Petição 870190070557, de 24/07/2019, pág. 68/401

4/306 direcionar derivados de dCas9 com domínios de repressão ou ativação de transcrição a genes-alvo, resultando em repressão de transcrição (chamada interferência de CRISPR, CRISPRi) ou ativação (chamada ativação de CRISPR, CRISPRa).

[0007] Com essas inovações sucessivas, sistemas CRISPR-Cas foram amplamente adaptados para engenharia de genoma. Sistemas CRISPR-Cas são versáteis e prontamente customizáveis, uma vez que gRNAs específicos para um gene-alvo de interesse podem ser facilmente preparados, enquanto a proteína Cas não requer nenhuma modificação. Loci múltiplos podem ser facilmente direcionados através da introdução de vários gRNAs (multiplexação).

[0008] O sistema CRISPR/Cas foi adotado com sucesso como uma ferramenta robusta, versátil e precisa para ativação/repressão de edição e transcrição de genoma em organismos bacterianos e eucarióticos, e desencadeou o desenvolvimento de novas abordagens promissoras para propósitos de pesquisa e terapêuticos. No entanto, apesar de suas várias vantagens, aplicação do sistema CRISP/Cas é frequentemente dificultada por expressão pobre da proteína Cas.

[0009] É um objetivo da presente invenção satisfazer essas necessidades e prover novas abordagens terapêuticas melhoradas para tratamento de cânceres, doenças infecciosas e outras doenças e condições definidas aqui. O objetivo de base da presente invenção é atingido pela matéria-objeto reivindicada.

[0010] Embora a presente invenção seja descrita em detalhes abaixo, deve ser compreendido que a presente invenção não é limitada às metodologias, protocolos e reagentes particulares descritos aqui uma vez que esses podem variar. Deve ser também compreendido que a terminologia usada aqui não pretende limitar o escopo da presente invenção que será limitado apenas pelas reivindicações apensas. A menos que de outro modo definido, todos os termos técnicos e científicos

Petição 870190070557, de 24/07/2019, pág. 69/401

5/306 usados aqui têm os mesmos significados como comumente compreendido por um versado comum na técnica.

[0011] A seguir, os elementos da presente invenção serão descritos. Esses elementos são listados com modalidades específicas, no entanto, deve ser compreendido que eles podem ser combinados de qualquer maneira e em qualquer número para criar modalidades adicionais. Os exemplos e modalidades preferidos descritos de várias maneiras não devem ser considerados limitar a presente invenção apenas às modalidades explicitamente descritas. A presente descrição deve ser compreendida apoiar e compreender modalidades que combinam as modalidades explicitamente descritas com qualquer número dos elementos revelados e/ou preferidos. Ainda, quaisquer permutas e combinações de todos os elementos descritos no presente pedido devem ser consideradas reveladas pela descrição do presente pedido a menos que o contexto indique de outro modo.

[0012] Em todo o presente relatório e reivindicações que seguem, a menos que o contexto dite de outro modo, o termo compreendem e variações tais como compreende e compreendendo serão compreendidos implicar a inclusão de um membro, inteiro ou etapa declarado, mas não a exclusão de qualquer outro membro, inteiro ou etapa não declarado. O termo consiste em é uma modalidade particular do termo compreendem, em que qualquer um do membro, inteiro ou etapa não declarado é excluído. No contexto da presente invenção, o termo compreendem engloba o termo consistem em. O termo compreendendo então engloba incluindo bem como consistindo, por exemplo, uma composição compreendendo X pode consistir exclusivamente em X ou pode incluir algo adicional, por exemplo, X + Y.

[0013] Os termos um e uma e o, a e referência similar usados no contexto de descrição da invenção (especialmente no contexto das reivindicações) devem ser considerados compreender ambos o singular

Petição 870190070557, de 24/07/2019, pág. 70/401

6/306 e o plural, a menos que de outro modo indicado aqui ou claramente contradito pelo contexto. Menção de faixas de valores aqui pretende apenas servir como um método de abreviação de referência individualmente a cada valor separado que se encaixe dentro da faixa. A menos que de outro modo indicado aqui, cada valor individual é incorporado ao relatório como se fosse individualmente mencionado aqui. Nenhuma linguagem no relatório deve ser interpretada como indicando qualquer elemento não reivindicado essencial para a prática da invenção.

[0014] A palavra substancialmente não exclui completamente, por exemplo, uma composição que é substancialmente livre de Y pode ser completamente livre de Y. Onde necessário, a palavra substancialmente pode ser omitida da definição da invenção.

[0015] O termo cerca de em relação a um valor numérico x significa x ± 10%.

[0016] Na presente invenção, se não indicado de outro modo, características diferentes de alternativas e modalidades podem ser combinadas umas com as outras.

[0017] Para questão de clareza e legibilidade as definições que seguem são providas. Qualquer característica técnica mencionada para essas definições pode ser lida em cada e toda modalidade da invenção. Definições e explicações adicionais podem ser especificamente providas no contexto dessas modalidades.

Definições [0018] Molécula de ácido nucleico artificial: uma molécula de ácido nucleico artificial pode ser tipicamente compreendida ser uma molécula de ácido nucleico, por exemplo, um DNA ou RNA, que não ocorre naturalmente. Em outras palavras, uma molécula de ácido nucleico artificial pode ser compreendida como uma molécula de ácido nucleico não natural. Tal molécula de ácido nucleico pode ser não natural devido à sua sequência individual (que não ocorre naturalmente) e/ou devido a outras

Petição 870190070557, de 24/07/2019, pág. 71/401

7/306 modificações, por exemplo, modificações estruturais de nucleotídeos, que não ocorrem naturalmente. Uma molécula de ácido nucleico artificial pode ser uma molécula de DNA, uma molécula de RNA ou uma molécula híbrida compreendendo porções de DNA e RNA. Tipicamente, moléculas de ácido nucleico artificiais podem ser projetadas e/ou geradas através de métodos de engenharia genética para corresponder a uma sequência artificial desejada de nucleotídeos (sequência heteróloga). Neste contexto uma sequência artificial é geralmente uma sequência que pode não ocorrer naturalmente, isto é, ela difere da sequência do tipo selvagem em pelo menos um nucleotídeo. O termo tipo selvagem pode ser compreendido como uma sequência ocorrendo na natureza. Ainda, o termo molécula de ácido nucleico artificial” não é restrito significar uma molécula única mas é, tipicamente, entendido compreender um conjunto de moléculas idênticas. Desta maneira, ele pode se relacionara uma pluralidade de moléculas idênticas contidas em uma alíquota.

[0019] DNA: DNA é a abreviação comum para ácido desóxi-ribonucleico. Ela é uma molécula de ácido nucleico, isto é, um polímero consistindo em nucleotídeos. Esses nucleotídeos são geralmente monômeros de desóxi-adenosina-monofosfato, desóxi-timidina-monofosfato, desóxi-guanosina-monofosfato e desóxi-citidina-monofosfato que são em si compostos de uma porção açúcar (desoxirribose), uma porção base e uma porção fosfato, e polimerizam por uma estrutura de estrutura principal característica. A estrutura da estrutura principal é, tipicamente, formada por ligações fosfodiéster entre a porção açúcar do nucleotídeo, isto é, desoxirribose, de um primeiro monômero e uma porção fosfato de um segundo monômero, adjacente. A ordem especifica dos monômeros, isto é, a ordem das bases ligadas à estrutura principal do açúcar/fosfato, é chamada a sequência de DNA. DNA pode ser de filamento

Petição 870190070557, de 24/07/2019, pág. 72/401

8/306 simples ou filamento duplo. Na forma de filamento duplo, os nucleotideos do primeiro filamento tipicamente hibridizam com os nucleotideos do segundo filamento, por exemplo, através de emparelhamento de base A/T e emparelhamento de base G/C.

[0020] Sequência heteróloqa: duas sequências são tipicamente compreendidas ser ‘heterólogas’ se elas não forem deriváveis do mesmo gene. Isto é, embora sequências heterólogas possam ser deriváveis do mesmo organismo, elas naturalmente (na natureza) não ocorrem na mesma molécula de ácido nucleico, tal como no mesmo mRNA. [0021] Sítio de clonagem: um sítio de clonagem é tipicamente compreendido ser um segmento de uma molécula de ácido nucleico que é adequada para inserção de uma sequência de ácido nucleico, por exemplo, uma sequência de ácido nucleico compreendendo uma estrutura de leitura aberta. Inserção pode ser realizada através de qualquer método biológico molecular conhecido do versado na técnica, por exemplo, através de restrição e ligação. Um sítio de clonagem compreende tipicamente um ou mais sítios de reconhecimento de enzima de restrição (sítios de restrição). Esses um ou mais sítios de restrição podem ser reconhecidos por enzimas de restrição que clivam o DNA nesses sítios. Um sítio de clonagem que compreende mais de um sítio de restrição pode ser também chamado um sítio de clonagem múltiplo (MCS) ou um poliligante.

[0022] Molécula de ácido nucleico: uma molécula de ácido nucleico é uma molécula compreendendo, preferivelmente consistindo em componentes de ácido nucleico. O termo molécula de ácido nucleico referese preferivelmente a moléculas de DNA ou RNA. Ele é preferivelmente usado sinonimamente com o termo polinucleotídeo. Preferivelmente, uma molécula de ácido nucleico é um polímero compreendendo ou consistindo em monômeros de nucleotídeo, que são ligados covalente

Petição 870190070557, de 24/07/2019, pág. 73/401

9/306 mente uns aos outros por ligações fosfodiéster de uma estrutura principal de açúcar/fosfato. O termo molécula de ácido nucleico também compreende moléculas de ácido nucleico modificadas, tais como moléculas de DNA ou RNA modificadas na base, modificadas no açúcar ou modificadas na estrutura principal.

[0023] Estrutura de leitura aberta: uma estrutura de leitura aberta (ORF) no contexto da invenção pode ser tipicamente uma sequência de vários tripletos de nucleotídeo, que podem ser traduzidos em um peptídeo ou proteína. Uma estrutura de leitura aberta contém preferivelmente um códon de partida, isto é, uma combinação de três nucleotídeos subsequentes codificando geralmente o aminoácido metionina (ATG), em sua extremidade 5’ e uma região subsequente, que geralmente exibe um comprimento que é um múltiplo de 3 nucleotídeos. Uma ORF é preferivelmente terminada por um códon de parada (por exemplo, TAA, TAG, TGA). Tipicamente, este é o único códon de parada da estrutura de leitura aberta. Desta maneira, uma estrutura de leitura aberta no contexto da presente invenção é preferivelmente uma sequência de nucleotídeo, consistido em vários nucleotídeos que podem ser divididos por três, que começa com um códon de início (por exemplo, ATG) e que preferivelmente termina com um códon de parada (por exemplo, TAA, TGA ou TAG). A estrutura de leitura aberta pode ser isolada ou ela pode ser incorporada em uma sequência de ácido nucleico mais longa, por exemplo, em um vetor ou um mRNA. Uma estrutura de leitura aberta pode ser também chamada sequência de codificação de (proteína) ou, preferivelmente, sequência de codificação.

[0024] Peptídeo: um peptídeo ou polipeptídeo é tipicamente um polímero de monômeros de aminoácido, ligado por ligações peptídicas. Ele contém tipicamente menos de 50 unidades de monômero. Não obstante, o termo peptídeo não é uma renúncia a moléculas tendo mais de 50 unidades de monômero. Peptídeos longos são também chamados

Petição 870190070557, de 24/07/2019, pág. 74/401

10/306 polipeptídeos, tipicamente tendo entre 50 e 600 unidades monoméricas. [0025] Proteína: uma proteína compreende tipicamente um ou mais peptídeos ou polipeptídeos. Uma proteína é tipicamente dobrada em forma 3-dimensional, que pode ser necessária para a proteína exercer sua função biológica.

[0026] Sítio de restrição: um sítio de restrição, também chamado sítio de reconhecimento de enzima de restrição, é uma sequência de nucleotídeo reconhecida por uma enzima de restrição. Um sítio de restrição é tipicamente uma sequência de nucleotídeo preferivelmente palindrômica, curta, por exemplo, uma sequência compreendendo 4 a 8 nucleotídeos. Um sítio de restrição é preferivelmente especificamente reconhecido por uma enzima de restrição. A enzima de restrição tipicamente cliva uma sequência de nucleotídeo compreendendo um sítio de restrição neste sítio. Em uma sequência de nucleotídeo de filamento duplo, tal como uma sequência de DNA de filamento duplo, a enzima de restrição tipicamente corta ambos os filamentos da sequência de nucleotídeo.

[0027] RNA, mRNA: RNA é a abreviação comum para ácido ribonucleico. Ele é uma molécula de ácido nucleico, isto é, um polímero consistindo em nucleotídeos. Esses nucleotídeos são geralmente monômeros de adenosina-monofosfato, uridina-monofosfato, guanosina-monofosfato e citidina-monofosfato que são conectados uns aos outros ao longo de uma chapa estrutura principal. A estrutura principal é formada por ligações fosfodiéster entre o açúcar, isto é, ribose, de um primeiro monômero e uma porção fosfato de um segundo monômero, adjacente. A sucessão específica do monômero é chamada a sequência de RNA. Geralmente RNA pode ser obtenível através de transcrição de uma sequência de DNA, por exemplo, dentro de uma célula. Em células eucarióticas, transcrição é tipicamente realizada dentro do núcleo ou da mitocôndria. In vivo, transcrição de DNA geralmente resulta no chamado

Petição 870190070557, de 24/07/2019, pág. 75/401

11/306

RNA prematuro que tem que ser processado no chamado RNA mensageiro, geralmente abreviado como mRNA. Processamento do DNA prematuro, por exemplo, em organismos eucarióticos, compreende uma variedade de modificações pós-transcripcionais diferentes tais como união, capeamento de 5’, poliadenilação, exportação a partir do núcleo ou da mitocôndria e similar. A soma desses processos é também chamada maturação de RNA. O RNA mensageiro maduro geralmente provê a sequência de nucleotídeo que pode ser traduzida em uma sequência de aminoácido de um peptídeo ou proteína particular. Tipicamente, um mRNA maduro compreende um 5^!-cap, um 5^!-LJTR, uma estrutura de leitura aberta, uma 3^!~UTR e uma sequência poli(A). Além do RNA mensageiro, vários tipos de não codificação de RNA existem, os quais podem estar envolvidos em regulagem de transcrição e/ou tradução.

[0028] Sequência de uma molécula de ácido nucleico: a sequência de uma molécula de ácido nucleico é tipicamente compreendida ser a ordem particular e individual, isto é, a sucessão de seus nucleotídeos. A sequência de uma proteína ou peptídeo é tipicamente compreendida ser a ordem, isto é, a sucessão de seus aminoácidos.

[0029] Identidade de sequência: duas ou mais sequências são idênticas se elas exibirem o mesmo comprimento e ordem de nucleotídeos ou aminoácidos. A porcentagem de identidade tipicamente descreve o grau ao qual duas sequências são idênticas, isto é, ela descreve tipicamente a porcentagem de nucleotídeos que corresponde em sua posição na sequência a nucleotídeos idênticos de uma sequência de referência. Para determinação do grau de identidade (identidade %), as sequências a serem comparadas são tipicamente consideradas exibir o mesmo comprimento, isto é, o comprimento da sequência mais longa das sequências a ser comparada. Isso significa que uma primeira sequência consistindo em 8 nucleotídeos é 80% idêntica a uma segunda sequência consistindo em 10 nucleotídeos compreendendo a primeira sequência.

Petição 870190070557, de 24/07/2019, pág. 76/401

12/306

Em outras palavras, no contexto da presente invenção, identidade de sequências refere-se preferivelmente à porcentagem de nucleotídeos ou aminoácidos de uma sequência que têm a mesma posição em duas ou mais sequências tendo o mesmo comprimento. Especificamente, a identidade % das duas sequências de aminoácido ou duas sequências de ácido nucleico pode ser determinada alinhando as sequências para propósitos de comparação ótima (por exemplo, lacunas podem ser introduzidas em quaisquer sequências para melhora alinhamento com as outras sequências) e comparando os aminoácidos ou nucleotídeos em posições correspondentes. Lacunas são geralmente consideradas posições não idênticas, sem importar sua posição atual em um alinhamento. O melhor alinhamento é tipicamente um alinhamento de duas sequências que resulta na identidade percentual mais alta. A identidade percentual é determinada pelo número de nucleotídeos idênticos nas sequências sendo comparadas (isto é, identidade % · no. de posições idênticas/no. total de posições x 100). A determinação de identidade percentual entre duas sequências pode ser obtida usando um algoritmo matemático conhecido daqueles de habilidade na técnica.

[0030] Molécula de ácido nucleico estabilizada: uma molécula de ácido nucleico estabilizada é uma molécula de ácido nucleico, preferivelmente uma molécula de DNA ou RNA, que é modificada de modo que ela é mais estável à desintegração ou degradação, por exemplo, por fatores ambientais ou digestão enzimática, tal como por uma degradação de exo- ou endonuclease, do que a molécula de ácido nucleico sem a modificação. Preferivelmente, uma molécula de ácido nucleico estabilizada no contexto da presente invenção é estabilizada em uma célula, tal como uma célula procariótica ou eucariótica, preferivelmente em uma célula de mamífero, tal como uma célula humana. O efeito de estabilização pode ser também exercido fora de células, por exemplo,

Petição 870190070557, de 24/07/2019, pág. 77/401

13/306 em uma solução tampão, etc., por exemplo, em um processo de fabricação para uma composição farmacêutica compreendendo a molécula de ácido nucleico estabilizada.

[0031 ] Transfecção: o termo transfecção refere-se à introdução de moléculas de ácido nucleico, tais como moléculas de DNA ou RNA (por exemplo, mRNA), em células, preferivelmente em células eucarióticas. No contexto da presente invenção, o termo transfecção compreende qualquer método conhecido do versado na técnica para introdução de moléculas de ácido nucleico em células, preferivelmente em células eucarióticas, tais como em células de mamífero. Tais métodos compreendem, por exemplo, eletroporação, lipofecção, por exemplo, com base em lipídeos catiônicos e/ou Hpossomas, precipitação de fosfato de cálcio, transfecção baseada em nanopartículas, transfecção baseada em vírus ou transfecção baseada em polímeros catiônicos, tal como DEAEdextrano ou polietilenoimina, etc. Preferivelmente, a introdução é não viral.

[0032] Vetor: o termo vetor refere-se a uma molécula de ácido nucleico, preferivelmente a uma molécula de ácido nucleico artificial. Um vetor no contexto da presente invenção é adequado para incorporação ou carregamento de uma sequência de ácido nucleico desejada, tal como uma sequência de ácido nucleico compreendendo uma estrutura de leitura aberta. Tais vetores podem ser vetores de armazenamento, vetores de expressão, vetores de clonagem, vetores de transferência, etc. Um vetor de armazenamento é um vetor que permite o armazenamento conveniente de uma molécula de ácido nucleico, por exemplo, de uma molécula de mRNA. Desta maneira, o vetor pode compreender uma sequência correspondendo, por exemplo, a uma sequência de mRNA desejada ou uma parte da mesma, tal como uma sequência correspondendo à sequência de codificação e a 3’-UTR de um mRNA. Um

Petição 870190070557, de 24/07/2019, pág. 78/401

14/306 vetor de expressão pode ser usado para produção de produtos de expressão tal como RNA, por exemplo, mRNA, ou peptídeos, polipeptídeos ou proteínas. Por exemplo, um vetor de expressão pode compreender sequências necessárias para transcrição de uma extensão de sequência do vetor, tal como uma sequência de promotor, por exemplo, uma sequência de promotor de polimerase de RNA. Um vetor de clonagem é tipicamente um vetor que contém um sítio de clonagem, que pode ser usado para incorporar sequências de ácido nucleico ao vetor. Um vetor de clonagem pode ser, por exemplo, um vetor de plasmídeo ou um vetor de bacteriófago. Um vetor de transferência pode ser um vetor que é adequado para transferência de moléculas de ácido nucleico para células ou organismos, por exemplo, vetores virais. Um vetor no contexto da presente invenção pode ser, por exemplo, um vetor de RNA ou um vetor de DNA. Preferivelmente, um vetor é uma molécula de DNA. Preferivelmente, um vetor no senso do presente pedido compreende um sítio de clonagem, um marcador de seleção, tal como um fator de resistência a antibiótico e uma sequência adequados para multiplicação do vetor, tal como uma origem de replicação.

[0033] Veículo: um veículo é tipicamente compreendido ser um material que é adequado para armazenamento, transporte e/ou administração de um composto, tal como um composto farmaceuticamente ativo. Por exemplo, ele pode ser um líquido fisiologicamente aceitável, que é adequado para armazenamento, transporte e/ou administração de um composto farmaceuticamente ativo.

[0034] A presente invenção é baseada em parte na surpreendente constatação que elementos de 3’ e/ou 5’ UTR particulares podem mediar uma expressão aumentada de sequências de codificação, especificamente aquelas codificando proteínas associadas a CRISPR (Cas), tal como Cas9 ou Cpf1. Os presentes inventores constataram especifica

Petição 870190070557, de 24/07/2019, pág. 79/401

15/306 mente que certas combinações de elementos de 3’ e 5’ UTR são particularmente vantajosos para provisão de um perfil de expressão desejado e quantidades de proteína expressa. Em particular, expressão alta de proteína Cas por um período de tempo curto (mais ou menos 24 horas, expressão de pulso) pode ser desejada para muitas aplicações, por exemplo, a fim de minimizar exposição de DNA genômico para reduzir efeitos fora do alvo (isto é, quaisquer defeitos não intencionais sobre qualquer um ou mais alvo, gene ou transcrito celular). A ação sinergística de tais elementos 3’ e 5’ UTR em um ácido nucleico artificial codificando proteína associada a CRISP é particularmente benéfica quando expressão transiente de quantidades grandes de tais proteínas é desejada in vitro ou in vivo. Tais ácidos nucleicos artificiais então inter alia se prestam a várias aplicações terapêuticas que são condescendentes a tratamento através da introdução de mutações, inativações ou ativações de gene ou modulação da expressão de genes de interesse. [0035] Desta maneira, em um primeiro aspecto, a presente invenção refere-se então a uma molécula de ácido nucleico artificial compreendendo

a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISP; b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4; e c. pelo menos um elemento de região não traduzida 3’ derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9.

[0036] O termo UTR refere-se a uma região não traduzida flanqueando a sequência de codificação de um ácido nucleico artificial como aqui definido. Neste contexto, um elemento de UTR compreende ou consiste em uma sequência de ácido nucleico que é derivada da UTR

Petição 870190070557, de 24/07/2019, pág. 80/401

16/306 (de ocorrência natural, tipo selvagem) de um gene particular, preferivelmente como exemplificado aqui.

[0037] Quando se referindo a elementos de UTR derivados de uma UTR particular, referência é feita a sequências de ácido nucleico correspondendo à sequência da dita UTR (UTR parental) ou um homólogo, variante ou fragmento da dita UTR. O termo inclui sequências correspondendo à sequência do tipo selvagem inteira (comprimento integral) da dita UTR, ou um homólogo, variante ou fragmento da mesma, incluindo homólogos e variantes de comprimento integral, bem como fragmentos das ditas sequências do tipo selvagem de comprimento integral, homólogos e variantes, e variantes dos ditos fragmentos. O termo corresponde a significa que a sequência de ácido nucleico derivada da UTR parental pode ser uma sequência de RNA (por exemplo, igual à sequência de RNA usada para definição da dita sequência de UTR parental), ou uma sequência de DNA (de ambos filamentos de senso e antissenso e ambas madura e imatura), que corresponde a tal sequência de RNA.

[0038] Quando se referindo a um elemento de UTR derivado de uma UTR de um gene, ou um homólogo, fragmento ou variante da mesma, a expressão ou um homólogo, fragmento ou variante da mesma pode se referir ao gene, ou à UTR, ou ambos.

[0039] O termo homólogo no contexto de genes (ou sequências de ácido nucleico derivadas dos mesmos ou compreendidas pelo dito gene, tal como uma UTR) refere-se a um gene (ou uma sequência de ácido nucleico derivada do mesmo ou compreendida pelo dito gene) relacionado a um segundo gene (portal sequência de ácido nucleico) por descendente de uma sequência de DNA ancestral comum. O termo homólogo inclui genes separados pelo evento de especiação (ortólogo) e genes separados pelo evento de duplicação genética (parálogos).

Petição 870190070557, de 24/07/2019, pág. 81/401

17/306 [0040] O termo variante no contexto de sequências de ácido nucleico de genes refere-se a variantes de sequência de ácido nucleico, isto é, sequências de ácido nucleico ou genes compreendendo uma sequência de ácido nucleico que difere em pelo menos um ácido nucleico de uma sequência de ácido nucleico de referência (ou parental) de um ácido nucleico ou gene de referência (ou parental). Ácidos nucleicos ou genes variantes podem então compreender preferivelmente, em sua sequência de ácido nucleico, pelo menos uma mutação, substituição, inserção ou deleção comparado com sua respectiva sequência de referência. Preferivelmente, o termo variante como aqui usado inclui variantes de ocorrência natural e variantes engenheiradas de sequências de ácido nucleico ou genes. Desta maneira, uma variante como definido aqui pode ser derivada, de isolada de, relacionada à, baseada em ou homóloga à sequência de ácido nucleico de referência. Variantes podem ter preferivelmente uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente de pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97%, a uma sequência de ácido nucleico da respectiva sequência de ácido nucleico de ocorrência natural (tipo selvagem) ou gene, ou um homólogo, fragmento ou derivado do mesmo.

[0041 ] O termo fragmento no contexto de sequências de ácido nucleico ou genes refere-se a uma subsequência contínua da sequência de ácido nucleico de referência de comprimento integral (ou parental) ou gene. Em outras palavras, um fragmento pode ser tipicamente uma porção mais curta de uma sequência de ácido nucleico de comprimento integral ou gene. Desta maneira, um fragmento consiste, tipicamente, em uma sequência que é idêntica à extensão correspondente dentro da

Petição 870190070557, de 24/07/2019, pág. 82/401

18/306 sequência de ácido nucleico de comprimento integral ou gene. O termo inclui fragmentos de ocorrência natural bem como fragmentos engenheirados. Um fragmento preferido de uma sequência no contexto da presente invenção consiste em uma extensão contínua de ácidos nucleicos correspondendo a uma extensão contínua de entidades no ácido nucleico ou gene cujo fragmento é derivado que presenta pelo menos 20%, preferivelmente pelo menos 30%, mais preferivelmente pelo menos 40%, mais preferivelmente pelo menos 50%, ainda mais preferivelmente pelo menos 60%, ainda mais preferivelmente pelo menos 70% e sobretudo preferivelmente pelo menos 80% da sequência de ácido nucleico total (isto é, comprimento integral) ou gene a partir do qual o fragmento é derivado. Uma identidade de sequência indicada com relação a tal fragmento refere-se preferivelmente à sequência de ácido nucleico inteira ou gene. Preferivelmente, um fragmento pode compreender uma sequência de ácido nucleico tendo uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente de pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97% com uma sequência de ácido nucleico ou gene de referência do qual ela é derivada.

[0042] Elementos de UTR usados no contexto da presente invenção são preferivelmente funcionais, isto é, capazes de elicitar o mesmo efeito biológico desejado que as UTRs de ocorrência natural (tipo selvagem) das quais eles são derivados, isto é, em particular de controle da expressão (isto é, regulagem, preferivelmente aumento) da expressão de uma sequência de codificação operavelmente ligada. O termo operavelmente ligado” como aqui usado significa que sendo posto em uma relação funcional com uma sequência de codificação. Elementos de

Petição 870190070557, de 24/07/2019, pág. 83/401

19/306

UTR definidos aqui são preferivelmente operavelmente ligados, isto é, postos em uma relação funcional, à sequência de codificação do ácido nucleico artificial da invenção, preferivelmente de uma maneira que permite que eles controlem (isto é, regulem, preferivelmente aumentem) a expressão da dita sequência de codificação. O termo expressão como aqui usado inclui em geral todas as etapas de biossíntese de proteína, transcrição inter alia, processamento e tradução de mRNA. Os elementos de UTR especificados aqui, em particular nas combinações descritas, são particularmente pretendidos aumentar a transcrição de sequência de codificação codificando a proteína associada à CRISPR descrita aqui.

[0043] O ácido nucleico artificial da invenção compreende então vantajosamente um elemento de 5’ UTR e um elemento de 3’ UTR, cada um derivado de um gene selecionado daqueles indicados aqui. Elementos de 5’ UTR adequados são selecionados de elementos de 5’-UTR derivados de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4, preferivelmente como definido aqui. Elementos de 3’ UTR adequados são selecionados de elementos de 3’ UTR derivados de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9, preferivelmente como definido aqui.

[0044] Tipicamente, elementos de 5’- ou 3’-UTR das moléculas de ácido nucleico artificiais da invenção são heterólogos para a pelo menos uma sequência de codificação.

[0045] Preferivelmente, as UTRs (servindo como UTRs parentals para os elementos de UTR do ácido nucleico artificial da invenção) indicadas aqui compreendem as UTRs de ocorrência natural (tipo selvagem), bem como homólogos, fragmentos, variantes e sequências de RNA correspondentes das mesmas.

Petição 870190070557, de 24/07/2019, pág. 84/401

20/306 [0046] Em outras palavras, o ácido nucleico artificial pode compreender preferivelmente a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISPR; b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4 ou um homólogo, fragmento, variante ou sequência de RNA correspondente de qualquer uma das ditas 5’ UTRs; e c. pelo menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9 ou um homólogo, fragmento, variante ou sequência de RNA correspondente de qualquer uma das ditas 3’ UTRs.

[0047] As 5’ UTRs e 3’ UTRs são preferivelmente operavelmente ligadas à sequência de codificação do ácido nucleico artificial da invenção.

UTRs

5’ UTR [0048] O ácido nucleico artificial descrito aqui compreende pelo menos um elemento de 5’-UTR derivado de uma 5’ UTR de um gene como aqui indicado ou um homólogo, variante ou fragmento do mesmo.

[0049] O termo 5’-UTR refere-se a uma parte de uma molécula de ácido nucleico que está localizada 5’ (isto é, a montante) de uma estrutura de leitura aberta e que não é traduzida em proteína. No contexto da presente invenção, uma 5’-UTR começa com o sítio de início de transcrição e termina um nucieotídeo antes do códon de parada da estrutura de leitura aberta. A 5’-UTR pode compreender elementos para controle de expressão de gene, também chamados elementos reguladores. Tais elementos reguladores podem ser, por exemplo, sítios de ligação ribossomal. A 5’-UTR pode ser pós-transcripcionalmente modificada, por exemplo, pela adição de um 5’-Cap. Desta maneira, 5’-UTRs

Petição 870190070557, de 24/07/2019, pág. 85/401

21/306 podem correspondem preferivelmente à sequência de um ácido nucleico, em particular um mRNA maduro, que está localizada entre o 5’Cap e o códon de início, e mais especificamente a uma sequência, que se estende a partir de um nucleotídeo localizado 3’ para o 5’-Cap, preferivelmente a partir do nucleotídeo localizado imediatamente 3’ para o 5’~Cap, a um nucleotídeo localizado 5’ para o códon de início da sequência de codificação de proteína (sítio de início de transcrição), preferivelmente ao nucleotídeo localizado imediatamente 5’ para o códon de início da sequência de codificação de proteína (sítio de início de transcrição). O nucleotídeo localizado imediatamente 3’ para a 5’-Cap de um mRNA maduro corresponde tipicamente ao sítio de início de transcrição. 5’ UTRs têm tipicamente um comprimento de menos do que 500, 400, 300, 250 ou menos de 200 nucleotídeos. Em algumas modalidades, seu comprimento pode estar na faixa de pelo menos 10, 20, 30 ou 40, preferivelmente até 100 ou 150, nucleotídeos.

[0050] Preferivelmente, o pelo menos um elemento de 5’ UTR compreende ou consiste em uma sequência de ácido nucleico derivada da 5’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano, ou de uma variante da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano. [0051] Os nomes das UTRs compreendendo a extensão .1 ou var são idênticas à UTR sem a dita extensão.

Elementos de 5’ UTR derivados de gene TOP [0052] Alguns dos elementos de 5’ UTR especificados aqui podem ser derivados da 5’ UTR de um gene TOP ou de um homólogo, variante ou fragmento do mesmo.

[0053] Genes TOP são então tipicamente caracterizados pela pre

Petição 870190070557, de 24/07/2019, pág. 86/401

22/306 sença de um trato de oligopirimidina 5’ terminal (TOP) e, ainda, tipicamente por uma regulagem traducíonal associada a crescimento. No entanto, genes TOP com uma regulagem traducional específica de tecido são também conhecidos. mRNA que contém um 5’ TOP é frequentemente referido como mRNA de TOP. Desta maneira, genes que proveem tais RNAs mensageiros são referidos como genes TOP. Sequências TOP foram exemplo, encontradas em genes e mRNA codificando fatores de alongamento de peptídeo e proteínas ribossomais.

[0054] O trato de oligopirimidina 5’ terminal (5’ TOP ou TOP) é tipicamente uma extensão de nucleotídeos de pirimidina localizados na região 5’ terminal de uma molécula de ácido nucleico, tal como a região 5’ terminal de certas moléculas de mRNA ou a região 5’ terminal de uma entidade funcional, por exemplo, a região transcrita, de certos genes.

[0055] A 5’ UTR de um gene de TOP corresponde à sequência de uma 5’ UTR de um mRNA maduro derivado de um gene de TOP, que se estende preferivelmente a partir do nucleotídeo localizado 3’ até o 5’CAP para o nucleotídeo localizado 5’ até o códon de início. A sequência de TOP começa tipicamente com uma citidina, que geralmente corresponde ao sítio de início de transcrição, e é seguida por uma extensão de geralmente cerca de 3 a 30 nucleotídeos de pirimidina. A extensão de pirimidina e então a 5’ TOP termina um nucleotídeo 5’ para o primeiro nucleotídeo de purina localizado a jusante da TOP.

[0056] Uma 5'UTR de um gene de TOP tipicamente não compreende quaisquer códons de início, preferivelmente quaisquer AUGs a montante (uAUGs) ou estruturas de leitura aberta a montante (uORFs). Nela, AUGs a montante e estruturas de leitura aberta a montante são tipicamente compreendidas ser AUGs e estruturas de leitura aberta que ocorrem 5’ do códon de início (AUG) da estrutura de leitura aberta que deve ser traduzida. As 5’ UTRs de genes de TOP são geralmente bem curtas. Os comprimentos das 5’ UTRs de genes de TOP podem variar

Petição 870190070557, de 24/07/2019, pág. 87/401

23/306 entre 20 nucleotídeos até 500 nucleotídeos, e são tipicamente menos do que cerca de 200 nucleotídeos, preferivelmente menos do que cerca de 150 nucleotídeos, mais preferivelmente menos do que cerca de 100 nucleotídeos. Por exemplo, uma TOP pode compreender 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30 ou ainda mais nucleotídeos.

[0057] No contexto da presente invenção, um motivo de TOP é uma sequência de ácido nucleico que corresponde a uma 5’ TOP como acima definido. Desta maneira, um motivo de TOP no contexto da presente invenção é preferivelmente uma extensão de nucleotídeos de pirimidina tendo um comprimento de 3-30 nucleotídeos. Preferivelmente, o motivo de TOP consiste em pelo menos 3, preferivelmente pelo menos 4, mais preferivelmente pelo menos 6, mais preferivelmente pelo menos 7 e sobretudo preferivelmente pelo menos 8 nucleotídeos de pirimidina, em que a extensão de nucleotídeos de pirimidina começa preferivelmente em sua extremidade 5’ com um nucleotídeo de citosina. Nos genes de TOP e mRNAs de TOP, o motivo de TOP começa preferivelmente em sua extremidade 5’ com o sítio de início de transcrição e termina um nucleotídeo 5’ para o primeiro resíduo purina no dito gene ou mRNA. Um motivo TOP no senso da presente invenção está preferivelmente localizado na extremidade 5’ de uma sequência, que representa uma 5’ UTR, ou na extremidade 5’ de uma sequência, que codifica uma 5’ UTR. Desta maneira, preferivelmente, uma extensão de 3 ou mais nucleotídeos de pirimidina é chamada motivo de TOP no senso da presente invenção se esta extensão estiver localizada na extremidade 5’ de uma respectiva sequência, tal como a molécula de ácido nucleico artificial, o elemento 5’ UTR da molécula de ácido nucleico artificial ou a sequência de ácido nucleico que é derivada da 5’ UTR de um gene de TOP como descrito aqui. Em outras palavras, uma extensão de

Petição 870190070557, de 24/07/2019, pág. 88/401

24/306 ou mais nucleotídeos de pirimidina, que não está localizada na extremidade 5’ de uma 5’ UTR ou um elemento de 5’ UTR, mas em qualquer lugar dentro de uma 5’ UTR ou um elemento de 5’ UTR, preferivelmente nâo é referida como motivo de TOP.

[0058] Em modalidades particularmente preferidas, os elementos de 5’ UTR derivados de 5’ UTRs de genes de TOP exemplificados aqui nâo compreendem um motivo de TOP ou uma 5’ TOP, como acima definido. Desta maneira, a sequência de ácido nucleico do elemento de 5’ UTR, que é derivada de uma 5’ UTR de um gene de TOP, pode terminar em sua extremidade 3’ com um nucleotídeo localizado na posição 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 a montante do códon de início (por exemplo, A(U/T)G) do gene ou mRNA do qual ele é derivado. Desta maneira, o elemento de 5’ UTR não compreende qualquer parte da sequência de codificação de proteína. Desta maneira, preferivelmente, a única parte de codificação de aminoácido do ácido nucleico artificial é provida pela sequência de codificação codificando a proteína associada a CRISPR (e opcionalmente sequências de aminoácido adicionais como descrito aqui).

[0059] Elementos de 5’ UTR específicos previstos de acordo com a presente invenção são descritos em detalhes abaixo.

Elementos de 5’ UTR derivados de HSD17B4 [0060] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma 17-beta-hídroxiesteroíde desidrogenase 4 ou um homólogo, variante ou fragmento da mesma, preferivelmente sem o motivo de 5’ TOP.

[0061] Tais elementos de 5’ UTR compreende ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da 17-beta-hidroxiesteroide desidrogenase 4 (HSD17B4,

Petição 870190070557, de 24/07/2019, pág. 89/401

25/306 também referida como enzima multifuncional peroxissomal tipo 2), preferivelmente de um gene da 17-beta-hidroxlesteroide desidrogenase 4 (HSD17B4) de vertebrado, mais preferivelmente de um gene da 17beta-hidroxiesteroide desidrogenase 4 (HSD17B4) de mamífero, sobretudo preferivelmente de um gene da 17-beta-hidroxlesteroide desidrogenase 4 (HSD17B4) humana ou um homólogo, variante ou fragmento de qualquer uma das ditas 5’ UTRs, em que preferivelmente o elemento de 5’ UTR não compreende a 5’ TOP do dito gene.

[0062] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de HSD17B4, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 1 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 2 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou ainda 97%,

Petição 870190070557, de 24/07/2019, pág. 90/401

26/306 de identidade de sequência com a sequência de ácido nucleico de acordo com a SEQ ID NO: 2.

Elementos de 5-UTR derivados de RPL32 [0063] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma proteína Grande ribossomal (RPL), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento de 5’ UTR preferivelmente não tem o motivo de 5’ TOP (trato de oligopirimidina terminal).

[0064] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da proteína ribossomal Large 32 (RPL32), preferivelmente de um gene da proteína ribossomal Large 32 (L32) de vertebrado, mais preferivelmente de um gene da proteína ribossomal de mamífero Large 32 (L32), sobretudo preferivelmente de um gene da proteína ribossomal Large 32 (L32) humana ou um homólogo, variante ou fragmento de qualquer uma das ditas 5’ UTRs, em que o elemento 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene. O termo ^SiRPL32^!' inclui também variantes e fragmentos das mesmas, que são aqui também referidos como RPL32var ou 32L4.

[0065] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de RPL21, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 21 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%,

Petição 870190070557, de 24/07/2019, pág. 91/401

27/306 ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO:21, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 22 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO:22.

Elementos de 5’~UTR derivados de NDUFA4 [0066] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico que é derivada de uma 5’ UTR de um gene codificando uma subunidade de Citocroma c oxidase (NDUFA4) ou um homólogo, fragmento ou variante da mesma.

[0067] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da subunidade de Citocroma c oxidase (NDUFA4 ou Ndufa4.1), preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) de vertebrado, mais preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) de mamífero, sobre preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) humana ou um homólogo, variante ou fragmento da mesma. [0068] Desta maneira, ácidos nucleicos artificiais de acordo com a

Petição 870190070557, de 24/07/2019, pág. 92/401

28/306 invenção podem compreender um elemento de 5’ UTR derivado de um gene de NDUFA4, onde o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 9 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ iD NO:9 ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 10 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10.

Elementos de 5’-UTR derivados de SLC7A3 [0069] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando um membro 3 da família de veículo de soluto 7 (SLC7A3), ou um homólogo, fragmento ou variantes da mesma.

[0070] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’

Petição 870190070557, de 24/07/2019, pág. 93/401

29/306

UTR de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3 ou Slc7a3.1), preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) de vertebrado, mais preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) de mamífero, sobretudo preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) humano, ou um homologo, variante ou fragmento da mesma.

[0071 ] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de SLC7A3, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 15 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 16, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID

Petição 870190070557, de 24/07/2019, pág. 94/401

30/306

NO:16.

Elementos de 5’ UTR derivados de NOSIP [0072] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 5’ UTR de um gene codificando uma proteína de interação com Óxido nítrico sintase ou um homólogo, variante ou fragmento da mesma.

[0073] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da proteína de interação com Óxido nítrico sintase (NOSIP ou Nosip.T'), preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) de vertebrado, mais preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) de mamífero, sobretudo preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) humana ou um homólogo, variante ou fragmento da mesma.

[0074] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de NOSIP, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 11 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA

Petição 870190070557, de 24/07/2019, pág. 95/401

31/306 de acordo com a SEQ ID NO: 12, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12.

Elementos de 5-UTR derivados de ATP5A1 [0075] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma subunidade alfa de ATP sintase mitocondrial (ATP5A1), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.

[0076] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa da ATP sintase mitocondrial (ATP5A1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) de mamífero, mais preferivelmente ainda de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.

[0077] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de ATP5A1, em que o dito elemento de 5’ UTR compreende ou

Petição 870190070557, de 24/07/2019, pág. 96/401

32/306 consiste em uma sequência de DNA de acordo com a SEQ ID NO: 5 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 6, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6. Elementos de 5’~UTR derivados de ASAH1 [0078] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando a subunidade alfa de ATP sintase mitocondrial (ASAH1), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.

[0079] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa da ATP

Petição 870190070557, de 24/07/2019, pág. 97/401

33/306 sintase mitocondrial (ASAHI), preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de vertebrado, mais preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.

[0080] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de ASAH1, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 3 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 3, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 4, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4.

Petição 870190070557, de 24/07/2019, pág. 98/401

34/306

Elementos de 5’~UTR derivados de MP68 [0081] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (MP68), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.

[0082] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (MP68 ou ^,!Mp68), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de mamífero, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.

[0083] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de Mp68, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 7 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de

Petição 870190070557, de 24/07/2019, pág. 99/401

35/306 acordo com SEQ ID NO: 7, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 8, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8.

Elementos de 5- UTR derivados de RPL31 [0084] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (RPL31), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.

[0085] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (RPL31 ou Rpl31.T), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (RPL31) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial de (RPL31) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa de ATP sintase de mitocondrial (RPL31) humana, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.

[0086] Desta maneira, ácidos nucleicos artificiais de acordo com a

Petição 870190070557, de 24/07/2019, pág. 100/401

36/306 invenção podem compreender um elemento de 5’ UTR derivado de um gene de RPL31, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 13 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 14, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14.

Elementos de 5’ UTR derivados de TUBB4B [0087] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma subunidade alfa de ATP sintase mitocondrial (TUBB4B), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.

Petição 870190070557, de 24/07/2019, pág. 101/401

37/306 [0088] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B ou TUBB4B.1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.

[0089] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de TUBB4B, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 17 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 18, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos

Petição 870190070557, de 24/07/2019, pág. 102/401

38/306

70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18.

Elementos de 5‘ UTR derivados de UBQLN2 [0090] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (UBQLN2), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.

[0091] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2 ou Ubqln2.1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial de mamífero (UBQLN2) de mamífero, sobretudo preferivelmente um gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.

[0092] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de UBQLN2, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 19ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tem, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%,

Petição 870190070557, de 24/07/2019, pág. 103/401

39/306

89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 19, ou em que o dito elemento de 5’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 20, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20.

3’ UTR [0093] O ácido nucleico artificial descrito aqui compreende ainda pelo menos um elemento de 3’-UTR derivado de uma 3’-UTR de um gene como aqui indicado, ou um homólogo, variante, fragmento do dito gene. O termo 3’-UTR refere-se a uma parte de uma molécula de ácido nucleico, que está localizada 3’ (isto é, a jusante) de uma estrutura de leitura aberta e que não é traduzida em proteína. No contexto da presente invenção, uma 3’-UTR corresponde a uma sequência que está localizada entre o códon de parada da sequência de codificação de proteína, preferivelmente imediatamente 3’ para o códon de parada da sequência de codificação de proteína, e a sequência de poli(A) da molécula de ácido nucleico artificial, preferivelmente RNA.

Petição 870190070557, de 24/07/2019, pág. 104/401

40/306 [0094] Preferivelmente, o pelo menos um elemento de 3’ UTR compreende ou consiste em uma sequência de ácido nucleico derivada da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano, ou de uma variante da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano. Elementos de 3-UTR derivados de GNAS [0095] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma proteína de ligação ao nucleotídeo Guanina G(s) curto das isoformas de subunidade alfa (GNAS) ou um homólogo, variante ou fragmento do mesmo.

[0096] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS ou Gnas.1), preferivelmente de um gene curto das Isoformas de subunidade alfa da proteína de ligação ao nucleotídeo Guanina G(s) (GNAS) de vertebrado, mais preferivelmente de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS) de mamífero, sobretudo preferivelmente de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS) de humano ou um homólogo, variante ou fragmento do mesmo.

[0097] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de GNAS, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29 ou um

Petição 870190070557, de 24/07/2019, pág. 105/401

41/306 homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29, ou em que o dito elemento de 3’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 30, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 30.

Elementos de 3’ UTR derivados de CASP1 [0098] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma Caspase-1 (CASP1) ou um homólogo, variante ou fragmento da mesma.

[0099] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da Caspase-1 (CASPT' ou CASP1.1), preferivel

Petição 870190070557, de 24/07/2019, pág. 106/401

42/306 mente de um gene da Caspase-1 (CASP1) de vertebrado, mais preferivelmente de urn gene da Caspase-1 (CASP1) de mamífero, sobretudo preferivelmente de um gene da Caspase-1 (CASP1) de humano ou urn homólogo, variante ou fragmento da mesma.

[0100] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de CASP1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 25, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 26, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26.

Elementos de 3’ UTR derivados de PSMB3 [0101] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’-UTR que compreende ou consiste em

Petição 870190070557, de 24/07/2019, pág. 107/401

43/306 uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma subunidade beta tipo-3 de Proteassoma (PSMB3) ou um homólogo, variante ou fragmento da mesma.

[0102] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de vertebrado, mais preferivelmente de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de mamífero, sobretudo preferivelmente de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de humano ou um homólogo, variante ou fragmento da mesma.

[0103] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de PSMB3, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 23 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 24, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente

Petição 870190070557, de 24/07/2019, pág. 108/401

44/306 pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24.

Elementos de 3’ UTR derivados de ALB [0104] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene codificando Albumina de soro (ALB) ou um homólogo, variante ou fragmento da mesma.

[0105] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da Albumina do soro (ALB ou Albumina 7), preferivelmente de um gene da Albumina do Soro (ALB) de vertebrado, mais preferivelmente de um gene de Albumina do soro (ALB) de mamífero, sobretudo preferivelmente de um gene da Albumina do soro (ALB) de humano ou um homólogo, variante ou fragmento da mesma.

[0106] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de ALB, onde o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 35 ou um homólogo, variante ou fragmento da mesma, em particular de uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de

Petição 870190070557, de 24/07/2019, pág. 109/401

45/306 ácido nucleico de acordo com SEQ ID NO: 35, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 36, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36.

Elementos de 3’-UTR derivados de RPS9 [0107] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene codificando a proteína ribossomal 40S S9 (RPS9)) ou um homólogo, variante ou fragmento da mesma.

[0108] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da proteína ribossomal 40S S9 (RSPG ou RSP9.T), preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de vertebrado, mais preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de mamífero, sobretudo preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de humano ou um homólogo, variante ou fragmento da mesma.

[0109] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de RPS9, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 33 ou

Petição 870190070557, de 24/07/2019, pág. 110/401

46/306 um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 33, ou em que o dito elemento de 5’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 34, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34.

Elementos de 3^!-UTR derivados de COX6B1 [0110] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico que é derivada de uma 3’ UTR de um gene de COX6B1 ou um homólogo, variante ou fragmento da mesma. [0111] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de gene de COX6B1 (ou COX6B1.1), preferivelmente de um gene de COX6B1 de vertebrado, mais preferivelmente de um gene de COX6B1 de mamífero, sobretudo preferivelmente de um gene de COX6B1

Petição 870190070557, de 24/07/2019, pág. 111/401

47/306 humano ou um homólogo, variante ou fragmento da mesma.

[0112] Desta maneira, ácidos nuclelcos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de COX6B1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 27 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 28, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28.

Elementos de 3’~UTR derivados de NDUFA1 [0113] Ácidos nuclelcos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene de NDUFA1 ou um homólogo, variante ou fragmento da mesma.

Petição 870190070557, de 24/07/2019, pág. 112/401

48/306 [0114] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene de NDUFAL1 (ou Ndufa1.1), preferivelmente de um gene de NDUFA1 de vertebrado, mais preferivelmente de um gene de NDUFA1 de mamífero, sobretudo preferivelmente de um gene de NDUFA1 de humano ou um homólogo, variante ou fragmento da mesma.

[0115] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de NDUFA1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 31 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 32, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ

Petição 870190070557, de 24/07/2019, pág. 113/401

49/306

ID NO: 32.

Combinações de UTR [0116] Preferivelmente, o pelo menos um elemento de 5’ UTR e o pelo menos um elemento de 3’ UTR agem sinergisticamente para aumentar a expressão da pelo menos uma sequência de codificação operavelmente ligada às ditas UTRs. É pretendido aqui utilizar as 5’-UTRs e 3’-UTRs mencionadas em qualquer combinação útil. 5’ e 3’-UTRs particularmente úteis são listadas na Tabela 1A abaixo. Combinações particularmente úteis de 5’ UTRs e 3’-UTRs são listadas na Tabela 1B abaixo. Modalidades particularmente preferidas da invenção compreendem a combinação das CDS de escolha, isto é, Cas9, Cpf1, CasX, CasY ou Cas13 com uma combinação de UTR selecionada do grupo de HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var/ albumina7; 32L4 / albumina7; HSD17B4/CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 /PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufa1.1; Nosip.1 / Ndufa1.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1; e Ubqln2.1 /RPS9.1.

Tabela 1A

Descrição	Tipo de Sequência	SEQ ID NO
HSD17B45-UTR	DNA	SEQ ID NO: 1
HSD17B45-UTR	RNA	SEQ ID NO: 2
ASAH1 5-UTR	DNA	SEQ ID NO: 3
ASAH1 5-UTR	RNA	SEQ ID NO: 4
ATP5A15-UTR	DNA	SEQ ID NO: 5
TP5A15-UTR	RNA	SEQ ID NO: 6
Mp68 5'-UTR	DNA	SEQ ID NO: 7
Mp68 5'-UTR	RNA	SEQ ID NO: 8
Ndufa4 5-UTR	DNA	SEQ ID NO: 9
Ndufa4 5-UTR	RNA	SEQ ID NO: 10

Petição 870190070557, de 24/07/2019, pág. 114/401

50/306

Tabela 1A -continuação-

Descrição	Tipo de Sequência	SEQ ID NO
Nosip 5’-UTR	DNA	SEQ ID NO: 11
Nosip 5’-UTR	RNA	SEQ ID NO: 12
Rpl31 5'-UTR	DNA	SEQ ID NO: 13
Rpl31 5'-UTR	RNA	SEQ ID NO: 14
Slc7a3 5-UTR	DNA	SEQ ID NO: 15
Slc7a3 5-UTR	RNA	SEQ ID NO: 16
TUBB4B 5-UTR	DNA	SEQ ID NO: 17
TUBB4B 5-UTR	RNA	SEQ ID NO: 18
Ubqln2 5^S-UTR	DNA	SEQ ID NO: 19
Ubqln2 5^S-UTR	RNA	SEQ ID NO: 20
RPL32 (32L4) 5'-UTR	DNA	SEQ ID NO: 21
RPL32 (32L4) 5'-UTR	RNA	SEQ ID NO: 22
PSMB3 3^!-UTR	DNA	SEQ ID NO: 23
PSMB3 3-UTR	RNA	SEQ ID NO: 24
CASP13-UTR	DNA	SEQ ID NO: 25
CASP13-UTR	RNA	SEQ ID NO: 26
COX6B13-UTR	DNA	SEQ ID NO: 27
COX6B13-UTR	RNA	SEQ ID NO: 28
Gnas 3'-UTR	DNA	SEQ ID NO: 29
Gnas 3'-UTR	RNA	SEQ ID NO: 30
Ndufal 3-UTR	DNA	SEQ ID NO: 31
Ndufal 3-UTR	RNA	SEQ ID NO: 32
RPS9 3’-UTR	DNA	SEQ ID NO: 33
RPS9 3’-UTR	RNA	SEQ ID NO: 34
ALB7 3^S-UTR	DNA	SEQ ID NO: 35
ALB7 3^S-UTR	RNA	SEQ ID NO: 36

Petição 870190070557, de 24/07/2019, pág. 115/401

51/306

Tabela 1B: combinações de UTR úteis e construtos correspondentes

Combinação de UTR	SEQ ID NOs
HSD17B4 / Gnas	413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 10402-10408; 10554; 10599-10612
Slc7a3/Gnas	414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626
ATP5A1 / CASP	415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640
Ndufa4 / PSMB3	416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654
HSD17B4 / PSMB3	417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436; 10558; 10655-10668
RPL32 / albumina 7	418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682
32L4 / aibumina 7 (Gen5, HSL PoliC)	419; 2426-2441; 3586-3601; 4746-4761; 5906-5921; 7066-7081; 8226-8241; 9386-9401; 10444-10450; 10560; 10683-10696
HSD17B4 / CASP1	420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710
Slc7a3 / CASP1	421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724
Slc7a3 / PSMB3	422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738
Nosip / PSMB3	423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 10472-10478; 10564; 10739-10752
Ndufa4 / RPS9	424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766
HSD17B4/RPS9	425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780
ATP5A1 / Gnas	9498- 9609; 10493-10499; 10567; 10781-10794
Ndufa4 / COX6B1	9610-9721; 10500-10506; 10568; 10795-10808
Ndufa4 / Gnas	9722-9833; 10507-10513; 10569; 10809-10822
Ndufa4 / Ndufal	9834-9945; 10514-10520; 10570; 10823-10836
Nosip / Ndufal	9946-10057; 10521-10527; 10571; 10837-10850
Rpl31 / Gnas	10058-10169; 10528-10534; 10572; 10851-10864
TUBB4B/RPS9	10170-10281; 10535-10541; 10573; 10865-10878
Ubqln2 / RPS9	10282-10393; 10542-10548; 10574; 10879-10892
Mp68 / Gnasl	14526;14533; 14540
Mp68 / Ndufal	14527;14534; 14541

Petição 870190070557, de 24/07/2019, pág. 116/401

52/306 [0117] Em algumas modalidades, o ácido nucleico artificial codificando uma proteína associada a CRISPR da invenção compreende pelo menos uma combinação de UTR selecionada do grupo consistindo em HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var / albumina7; 32L4 / albumina7; HSD17B4 / CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 /PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufal .1; Nosip.1 / Ndufal.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1 ;Ubqln2.1 / RPS9.1; MP68 / Gnasl .1 e IVIP68 / Ndufal .1.

[0118] Em algumas modalidades, os ácidos nucleicos artificiais de acordo com a invenção compreendem pelo menos uma combinação de UTR selecionada das combinações de UTR reveladas no PCT/EP/2017/ 076775 em conexão com ácidos nucleicos artificiais codificando proteínas associadas a CRISPR, que é incorporado aqui a título de referência em sua totalidade. Desta maneira, em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem compreender pelo menos uma combinação de UTR selecionada do grupo consistindo em SLC7A3 / GNAS; ATP5A1 / CASP1; HSD17B4 / GNAS; NDUFA4 / COX6B1; NOSIP / NDUFA1, NDUFA4 / NDUFA1; ATP5A1 / GNAS; MP68 / NDUFA1; NDUFA4 / RPS9; NDUFA4 / GNAS; NDUFA4 / PSMB3; TUBB4B / RPS9.1; UQBLN2 / RPS9; RPL31 / GNAS) ou HSD17B4 / PSMB3.

[0119] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem então compreender ou consistir em uma sequência de ácido nucieico como revelado no PCT/EP2017/076775 em conexão com ácidos nucleicos artificiais codificando proteínas associadas a CRISPR.

[0120] Cada um dos elementos de UTR definidos na Tabela 1 em

Petição 870190070557, de 24/07/2019, pág. 117/401

53/306 referência a uma SEQ ID NO específica pode incluir variantes ou fragmentos das mesmas, exibindo pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a respectiva sequência de ácido nucleico definida por referência à sua SEQ ID NO específica. A última coluna da Tabela 1 revela claramente todas as possíveis cds Cas9 e Cpf1 que podem ser combinadas com as combinações de UTR vantajosas específicas mostradas na coluna ”5’ UTR incl. SEQ ID NO: e coluna 3’ UTR incl. SEQ ID NO., isto é, as combinações como revelado são modalidades preferidas da invenção para um versado na técnica. Uma modalidade especificamente preferida assemelha uma sequência de Cas9 ou Cpf1 da invenção com 5’UTR SLC7A3 (SEQ ID NO: 15/16) ou uma sequência derivada da mesma e com 3’UTR GNAS (SEQ ID NO: 29/30) ou uma sequência derivada da mesma.

[0121] Para facilidade de referência, a Tabela A1 descreve combinações de CDS e UTR particularmente preferidas e vantajosas.

[0122] Cada uma das sequências identificadas na Tabela 1 com referência à sua SEQ ID NO específica pode ser também definida por sua sequência de DNA correspondente, como indicado aqui.

[0123] Cada uma das sequências identificadas na Tabela 1 com referência à sua SEQ ID NO específica pode ser modificada (opcionalmente independentemente uma da outra) como descrito abaixo.

[0124] Ácidos nucleicos artificiais preferidos de acordo com a invenção podem compreender

a. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou

Petição 870190070557, de 24/07/2019, pág. 118/401

54/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou

b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou

c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou

d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou

e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSSLC7A3MB3 ou de um homólogo, um fragmento ou variante do mesmo; ou

f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de um homólogo, um fragmento ou variante do mesmo; ou

g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou

Petição 870190070557, de 24/07/2019, pág. 119/401

55/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou

h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou

i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou

j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou

k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou

l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou

m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, fragmento ou uma

Petição 870190070557, de 24/07/2019, pág. 120/401

56/306 variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou

n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1 ou de um homólogo, um fragmento ou variante do mesmo; ou

n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou

o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo; ou

p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo; ou

q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31 ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou

r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B ou de um homólogo, um fragmento ou

Petição 870190070557, de 24/07/2019, pág. 121/401

57/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou

s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo;

t. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou

u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo.

[0125] Ácidos nucleicos artificiais particularmente preferidos podem compreender uma combinação de UTRs de acordo com d, e, g ou I.

[0126] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de um homólogo, um fragmento ou uma variante do mesmo.

Sequência de codificação

Proteínas associadas a CRISPR [0127] O ácido nucleico artificial de acordo com a invenção compreende pelo menos uma sequência de codificação codificando uma proteína associada a CRISPR.

Petição 870190070557, de 24/07/2019, pág. 122/401

58/306 [0128] O termo proteína associada a CRISPR refere-se a endonucleases guiadas por RNA que são parte de um sistema CRISPR (Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas) (e seus homólogos, variantes, fragmentos ou derivados), que é usado por procarlontes para conferir imunidade adaptatlva contra elementos de DNA estranho. Proteínas associadas a CRISPR incluem, sem limitação, Cas9, Cpf1 (Cas12), C2c1, C2c3, C2c2, Cas13, CasX e CasY. Como aqui usado, o termo proteína associada a CRISPR inclui proteínas do tipo selvagem bem como homólogos, variantes, fragmentos e derivados dos mesmos. Desta maneira, quando se referindo a moléculas de ácido nucleico artificiais codificando Cas9, Cpf1 (Cas12), C2c1, C2c3, e C2c2, Cas13, CasX e CasY, as ditas moléculas de ácido nucleico artificiais podem codificar as respectivas proteínas do tipo selvagem ou homólogos, variantes, fragmentos e derivados das mesmas. [0129] Proteínas associadas a CRISPR podem ser codificadas por qualquer gene ou um homólogo, variante ou fragmento do mesmo. Quando se referindo a genes, o termo homólogo ou gene homólogo inclui genes ortólogos ou genes parálogos.

[0130] Proteínas associadas a CRISPR (e seus homólogos, variantes, fragmentos ou derivados) são preferivelmente funcionais, isto é, exibem propriedades biológicas desejadas, e/ou exercem funções biológicas desejadas. As ditas propriedades biológicas ou funções biológicas podem ser comparáveis ou até mesmo melhoradas comparado com a proteína de referência correspondente (ou parental). Proteínas associadas a CRISPR funcionais, e homólogos, variantes, fragmentos ou derivados das mesmas, preferivelmente retêm a habilidade em ser direcionadas por um RNA-gula para sequências de DNA de interesse de uma maneira específica de sequência. No entanto, a atividade de endonuclease (isto é, habilidade em introduzir DSBs na sequência de DNA de interesse) tipicamente exercida por proteínas associadas a CRISP do

Petição 870190070557, de 24/07/2019, pág. 123/401

59/306 tipo selvagem pode ser, mas não é necessariamente, retida em todos os homólogos, variantes, fragmentos e derivados funcionais de proteínas associadas a CRISPR como descrito aqui.

[0131] Especificamente, homólogos, variantes, fragmentos ou derivados funcionais são preferivelmente capazes de (1) interagir especificamente com uma sequência de DNA-alvo, (2) associação com um RNA-guia adequado e opcionalmente (3) reconhecimento de um motivo adjacente protoespaçador (PAM) que é justaposto à sequência de DNAalvo. Neste contexto, interagir com preferivelmente significa se ligar a, e opcionalmente (ainda) clivar (através de atividade de endonuclease ou nickase), ativar ou reprimir expressão e/ou recrutamento de efetores. Especificamente significa que a proteína associada a CRISPR interage com a sequência de DNA-alvo mais prontamente do que ela interage com outras sequências de DNA não alvo.

[0132] Quando se referindo a uma proteína associada a CRISP particular (tais como Casp9, Cpf1) aqui, a respectiva proteína deve ser entendida compreender todas as formas pós-traducionalmente modificadas da mesma. Modificações pós-traducionais (PTMs) podem resultar em modificações covalentes ou não covalentes de uma dada proteína. Modificações pós-traducionais comuns incluem glicosilação, fosforilação, ubiquitinação, S-nitrosiiação, metilação, N-acetilação, lipidação, formação de ligação dissulfeto, sulfação, acilação, desaminação, etc. PTMs diferentes pode resultar, por exemplo, em químicas, atividades, localizações, interações ou conformações diferentes. No entanto, todas proteínas associadas a CRISPR pós-traducionalmente modificadas previstas dentro do contexto da presente invenção preferivelmente permanecem funcionais, como definido acima.

Homólogos [0133] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente homólogos da

Petição 870190070557, de 24/07/2019, pág. 124/401

60/306 mesma. Quando se referindo a proteínas, o termo homólogo compreende ortólogos (ou proteínas hortólogas) e parálogos (ou proteínas parálogas). Neste contexto, ortólogos são proteínas codificadas por genes em espécies diferentes que se desenvolveram a partir de um gene ancestral comum através de especiação. Ortólogos frequentemente retêm a(s) mesma(s) função(ões) no curso de evolução. Desta maneira, funções podem ser perdidas ou ganhas quando comparando um par de ortólogos. No entanto, no contexto da presente invenção, proteínas associadas a CRISPR ortólogas preferivelmente retêm sua habilidade em se associar com um RNA-guia adequado para especificamente interagir com uma sequência de DNA de interesse (isto é, são funcionais). Parálogos são genes produzidos através de duplicação de gene dentro de um genoma. Parálogos tipicamente desenvolvem novas funções ou podem eventualmente se tornar pseudogenes. No contexto da presente invenção, proteínas associadas a CRISPR parálogas são preferivelmente funcionais, como acima definido.

Variantes [0134] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente variantes da mesma.

[0135] O termo variante como aqui usado com referência a proteínas preferivelmente refere-se a variantes de sequência, isto é, proteínas compreendendo uma sequência de aminoácido que difere em pelo menos um resíduo de aminoácido de uma sequência de aminoácido referência (ou de origem) de uma proteína de referência (ou de origem).

[0136] Proteínas variantes podem então preferivelmente compreender, em sua sequência de aminoácido, pelo menos uma mutação, substituição, inserção ou deleção de aminoácido comparado com sua respectiva sequência de referência. Substituições podem ser selecionadas

Petição 870190070557, de 24/07/2019, pág. 125/401

61/306 de substituições conservatives ou não conservatives. Em algumas modalidades, é preferido que uma variante de proteína codificada por pelo menos uma sequência de codificação do ácido nucleico artificial da invenção compreenda pelo menos uma substituição de aminoácido conservative, em que aminoácidos, tendo originado a partir da mesma classe, são trocados por outros. Em particular, esses são aminoácidos tendo cadeias laterais alifáticas, cadeias laterais positivamente ou negativamente carregadas, grupos aromáticos nas cadeias laterais ou aminoácidos, cujas cadeias laterais podem formar pontes de hidrogênio, por exemplo, cadeias laterais que têm uma função hidroxila. Através de constituição conservative, por exemplo, um aminoácido tendo uma cadeia lateral polar pode ser substituído por um outro aminoácido tendo uma cadeia lateral polar correspondente ou, por exemplo, um aminoácido caracterizado por uma cadeia lateral hidrofóbica pode ser substituído por um outro aminoácido tendo uma cadeia lateral hidrofóbica correspondente (por exemplo, serina (treonina) portreonina (serina) ou leucina (isoleucina) por isoleucina (leucina)).

[0137] Preferivelmente, o termo variante como usado aqui inclui variantes de ocorrência natural, por exemplo, preproteínas, proproteínas e proteínas associadas a CRISPR que foram submetidas a processamento proteolítico pós-traducional (isso pode envolver remoção da metionina N-terminal, peptídeo de sinal e/ou a conversão de uma proteína inativa ou não funcional em uma ativa ou funcional), e proteínas mutantes de ocorrência natural. O termo variante compreende ainda variantes engenheiradas de proteínas associadas a CRISPR, que podem ser modificadas (na sequência) para introduzir ou abolir uma certa propriedade e/ou funcionalidade biológica. Variantes de Cas9 engenheiradas são discutidas em detalhes abaixo. Os termos variantes de transcrito ou variantes unidas no contexto de proteína referem-se a variantes produzidas a partir de RNAs mensageiros que são inicialmente

Petição 870190070557, de 24/07/2019, pág. 126/401

62/306 transcritos a partir do mesmo gene, mas são subsequentemente submetidas à união alternativa (ou diferencial), em que exons particulares de um gene podem ser incluídos ou excluídos do mRNA mensageiro processado, final (mRNA). Variantes de transcrito de proteínas associadas a CRISPR, no entanto, preferivelmente retêm sua funcionalidade biológica desejada, como definido acima. Será notado que o termo variante pode ser essencialmente definido por meio de um grau mínimo de identidade de sequência (e preferivelmente também uma função/propriedades biológicas desejadas) comparado com uma proteína de referência. Desta maneira, homólogos, fragmentos ou certos derivados (que também diferem em termos de sua sequência de aminoácido da proteína de referência) podem ser classificados como variante também. Desta maneira, uma variante como definido aqui pode ser derivada de, isolada de, relacionada a, baseada em ou homóloga a uma proteína de referência, que pode ser uma proteína associada a CRISPR (tais como Cas9, Cpf1) como aqui definido ou um homólogo, fragmento, variante ou derivado da mesma.

[0138] Variantes de proteína associada a CRISPR (tais como Cas9, Cpf1) de acordo com a invenção têm preferivelmente uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, com uma sequência de aminoácido da respectiva proteína associada a CRISPR de ocorrência natural (tipo selvagem) (tais como Cas9, Cpf1) ou um homólogo, fragmento ou derivado da mesma.

Fragmentos [0139] Cada proteína associada a CRISPR exemplificada aqui (tais

Petição 870190070557, de 24/07/2019, pág. 127/401

63/306 como Cas9, Cpf1) compreende também preferivelmente fragmentos da mesma.

[0140] O termo fragmento refere-se a uma proteína ou poHpeptídeo que consiste em uma subsequência contínua da sequência de aminoácido de comprimento integral de uma proteína de referência (ou de origem) ou (poli) peptídeo, que é, com relação a esta sequência de aminoácido, N-terminalmente, C-terminalmente e/ou intrassequencialmente truncada comparado com a sequência de aminoácido da dita proteína de referência. Tal truncamento pode ocorrer ou no nível de aminoácido ou no nível de ácido nucleico, respectivamente. Em outras palavras, um fragmento pode tipicamente ser uma porção mais curta de uma sequência de comprimento integral de uma sequência de aminoácido. Desta maneira, um fragmento tipicamente consiste em uma sequência que é idêntica à extensão correspondente dentro da sequência de aminoácido de comprimento integral. O termo inclui fragmentos de ocorrência natural (tais fragmentos resultando de atividade de protease /n vivo de ocorrência natural) bem como fragmentos engenheirados.

[0141] O termo fragmento como aqui usado pode se referir a um peptídeo ou polipeptídeo compreendendo uma sequência de aminoácido de pelo menos 5 resíduos de aminoácido contíguos, pelo menos 10 resíduos de aminoácido contíguos, pelo menos 15 resíduos de aminoácido contíguos, pelo menos 20 resíduos de aminoácido contíguos, pelo menos 25 resíduos de aminoácido contíguos, pelo menos 40 resíduos de aminoácido contíguos, pelo menos 50 resíduos de aminoácido contíguos, pelo menos 60 resíduos de aminoácido contíguos, pelo menos 70 resíduos de aminoácido contíguos, pelo menos 80 resíduos de aminoácido contíguos, pelo menos 90 resíduos de aminoácido contíguos, pelo menos 100 resíduos de aminoácido contíguos, pelo menos 125 resíduos de aminoácido contíguos, pelo menos 150 resíduos de

Petição 870190070557, de 24/07/2019, pág. 128/401

64/306 aminoácido contíguos, pelo menos 175 resíduos de aminoácido contíguos, pelo menos 200 resíduos de aminoácido contíguo ou pelo menos 250 resíduos de aminoácido contíguos da sequência de aminoácido de uma proteína associada a CRISPR como aqui definido ou um homólogo, variante ou derivado da mesma.

[0142] Um fragmento preferido de uma sequência no contexto da presente invenção consiste em uma extensão contínua de aminoácidos correspondendo a uma extensão contínua de entidades na proteína cujo fragmento é derivado, que representa pelo menos 20%, preferivelmente pelo menos 30%, mais preferivelmente pelo menos 40%, mais preferivelmente pelo menos 50%, ainda mais preferivelmente pelo menos 60%, ainda mais preferivelmente pelo menos 70% e sobretudo preferivelmente pelo menos 80% da proteína total (isto é, comprimento total) ou (poli-)peptídeo do qual o fragmento é derivado.

[0143] Uma identidade de sequência indicada com relação a tal fragmento refere-se preferivelmente à sequência de aminoácido inteira da proteína de referência ou à sequência de ácido nucleico inteira codificando a dita proteína de referência. Preferivelmente, um fragmento de uma proteína associada a CRISPR (tais como Cas9 ou Cpf1), ou um homólogo, variante ou derivado da mesma, pode compreender tipicamente uma sequência de aminoácido tendo uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, com a sequência de aminoácido da dita proteína associada a CRISPR (por exemplo, Cas9, Cpf1) ou dito homólogo, variante ou derivado.

Petição 870190070557, de 24/07/2019, pág. 129/401

65/306

Derivados [0144] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente derivados da mesma.

[0145] O termo derivado, quando se referindo a proteínas, deve ser compreendido como uma proteína que foi modificada com relação a uma proteína de referência (ou parental) para incluir uma propriedade ou funcionalidade nova ou adicional. Derivados podem ser modificados para compreender funcionalidades biológicas desejadas (por exemplo, através da introdução ou remoção de porções ou domínios que conferem, melhoram, reduzem ou abolem afinidade ou especificidade de ligação-alvo ou atividades enzimáticas), propriedades de fabricação (por exemplo, através da introdução de porções que conferem uma solubiiidade aumentada ou excreção melhorada ou permitem purificação) ou propriedades farmacocinéticas/farmacodinâmicas para uso médico (por exemplo, através da introdução de porções que conferem estabilidade, biodisponibilidade, absorção aumentadas; distribuição e/ou eliminação reduzida). Derivados podem ser preparados através da introdução ou remoção de uma porção ou domínio que confere uma propriedade ou funcionalidade biológica de interesse. Tais porções ou domínios podem ser introduzidos na sequência de aminoácido (por exemplo, nos resíduos amino e/ou carboxila terminais) pós-traducionalmente ou no nível de sequência de ácido nucleico usando técnicas de engenharia genética padrão (cf. Sambrook, J. e outros, 2012 (4^a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York). Um derivado pode ser derivado de (e então opcionalmente inclui) a sequência de proteína associada a CRISPR de ocorrência natural (tipo selvagem) ou uma variante ou segmento da mesma.

[0146] Será compreendido que derivados de proteína associada a

Petição 870190070557, de 24/07/2019, pág. 130/401

66/306

CRISPR podem diferir (por exemplo, por meio de introdução ou remoção de porções de (poli)peptídeo e/ou domínios de proteína) em sua sequência de aminoácido da proteína de referência da qual eles são derivados, e então podem se qualificar como variantes também. No entanto, embora variantes de sequência sejam principalmente definidas em termos de sua identidade de sequência com uma sequência de aminoácido de referência, derivados são preferivelmente caracterizados pela presença ou ausência de uma propriedade ou funcionalidade biológica específica comparado com a proteína de referência.

[0147] Muitos derivados de proteína associada a CRISPR são baseados em variantes, fragmentos, variantes de fragmento ou fragmentos variantes das respectivas proteínas associadas a CRISPR de ocorrência natural (tipo selvagem). Por exemplo, derivados de proteína associada a CRISPR de acordo com a invenção podem incluir derivados baseados em variantes de proteína engenheirados compreendendo mutações que abolem atividade de endonuclease e/ou nickase, que foram engenheirados mais para incluir domínios efetores e adaptadores conferindo propriedades ou funcionalidades biológicas novas ou adicionais. [0148] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção então codifica um derivado de proteína associada a CRISPR (por exemplo, Cas9, Cpf1) como aqui definido, em que o dito derivado compreende pelo menos um domínio efetor adicional.

[0149] Um domínio efetor deve ser compreendido como uma porção de proteína que confere uma propriedade e/ou funcionalidade biológica adicional e/ou nova. No contexto da presente invenção, domínios efetores podem ser selecionados com base em sua capacidade de conferir uma função biológica (nova ou adicional) à proteína associada a CRISPR, preferivelmente sem interferir com sua habilidade em se associar com um RNA-guia adequado para especificamente interagir com uma sequência de DNA-alvo. A função biológica nova ou adicional pode

Petição 870190070557, de 24/07/2019, pág. 131/401

67/306 ser, por exemplo, repressão (indução de interferência de CRISPR, CRISPRi) ou ativação transcripcional (indução de ativação de CRISPR, CRISPRa). Domínios efetores de interesse no contexto da presente invenção podem então ser selecionados para domínios repressores transcripcionais, domínios box associados a Krüppel (KRAB), domínios de proteína de interação MAX 1 (MXI1), quatro domínios mSin3 concatenados (SID4X) ou domínios de ativação de transcrição, incluindo domínios de ativação VP16 do herpes simplex (VP64 ou VP160), domínio de ativação de subunidade de transativação de fator-κΒ (NF-κΒ) (p65AD). Tal(ais) domínio(s) efetor(es) pode(m) serfundido(s) a qualquer terminal amino (N-) ou carboxila (C-) da proteína associada a CRISP, ou ambos. Com domínios efetores adequados, transcrição pode ser também regulada no nível epigenético. Histona desmetilase LSD1 remove a marca de desmetilação de histona 3 em Lys4 (H3K4me2) dos potencializadores distais direcionados, levando à repressão de transcrição. O núcleo catalítico da histona acetiltransferase p300 (p300Núcleo) pode acetilar H3K27 (H3K27ac) em potencializadores proximais e distais direcionados, o que leva à ativação de transcrição. A funcionalidade biológica nova ou adicional pode, ainda ou alternativamente, ser o recrutamento de domínios efetores de interesse. Para esta finalidade, o domínio efetor pode ser um domínio de recrutamento”, preferivelmente um domínio ou motivo de interação proteína-proteína, tais como motivos WRPW (TrpArg-Pro-Trp) (Fisher e outros. Mol Cell Biol. 1996 Jun; 16(6):2670-7). A função biológica nova ou adicional pode, ainda ou alternativamente, ser o recrutamento de outras entidades de interesse, tais como RNAs. Para esta finalidade, o domínio efetor pode ser selecionado de domínios de interação de proteína-RNA, tal como domínio de choque térmico (CSD). [0150] Derivados de proteína associada a CRISPR compreendendo um domínio efetor então incluem (a) proteínas associadas a CRISPR

Petição 870190070557, de 24/07/2019, pág. 132/401

68/306 (ou homólogos, variantes, fragmentos das mesmas) que são diretamente fundidas (opcionalmente através de um ligante adequado) domínios efetores capazes de interagir com a sequência de DNA-alvo (ou elementos reguladores operavelmente ligados à mesma) e (b) proteínas associadas a CRISPR (ou homólogos, variantes, fragmentos das mesmas) que são fundidas a (opcionalmente através de um ligante adequado) domínios efetores que recrutam efetores adicionais (domínios, proteínas ou ácidos nucleicos) de interesse, que são, por sua vez, capazes de interagir com a sequência de DNA-alvo (ou elementos reguladores operavelmente ligados à mesma).

[0151] Domínios efetores podem ser fundidos a proteínas associadas a CRISPR (ou variantes ou fragmentos das mesmas), opcionalmente através de um ligante adequado (peptídeo), usando técnicas padrão de engenharia genética (cf. Sambrook, J. e outros., 2012 (4a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York).

[0152] Ligantes peptídicos de interesse são geralmente conhecidos na técnica e podem ser classificados em três tipos: ligantes flexíveis, ligantes rígidos e ligantes clivávels. Ligantes flexíveis são geralmente aplicados quando os domínios unidos requerem um certo grau de movimento ou interação, e são então de interesse particular no contexto de derivados de proteína associada a CRISPR da presente invenção. Eles são geralmente ricos em aminoácidos pequenos, não polares (por exemplo, Gly) ou polares (por exemplo, Ser ou Thr) para prover flexibilidade e solubilidade bodas, e permitir a mobilidade dos domínios de proteína conectados. A incorporação de Ser ou Thr pode manter a estabilidade do ligante em soluções aquosas através de formação de ligações hidrogênio com moléculas de água, e então reduzir interações desfavoráveis entre o ligante e as porções de proteína.

Petição 870190070557, de 24/07/2019, pág. 133/401

69/306 [0153] Os ligantes flexíveis mais comumente usados têm sequências consistindo principalmente em extensões de resíduos Gly e Ser (ligante ^!'GS). Um exemplo do ligante flexível mais amplamente usado tem a sequência de (Gly-Gly-Gly-Gly-Ser)n. Ao ajustar o número de cópia η, o comprimento deste ligante GS pode ser otimizado para obter separação apropriada dos domínios de proteína, ou manter as interações interdomínio necessárias. Além dos ligantes GS, muitos outros ligantes flexíveis foram projetados para proteínas de fusão recombinantes. Esses ligantes flexíveis são também ricos em aminoácidos pequenos ou polares tais como Gly e Ser, mas podem conter aminoácidos adicionais tais como Thr e Ala para manter flexibilidade, bem como aminoácidos polares tais como Lys e Glu para melhorar a solubilidade.

[0154] Vários outros tipos de ligantes flexíveis, incluindo KESGSVSSEQLAQFRSLD, EGKSSGSGSESKST e GSAGSAAGSGEF, foram aplicados para a construção de proteínas de fusão. Outros ligantes flexíveis incluem ligantes apenas de glicina (Gly)s ou (Gly)e.

[0155] Ligantes rígidos podem ser empregados quando separação dos domínios de proteína e redução de sua interferência tiverem que ser assegurados. Ligantes cliváveis, por outro lado, podem ser introduzidos para liberar domínios funcionais livres in vivo. Chen e outros, Adv Drug Deliv Rev. 2013 Out 15; 65(10): 1357-1369, revisam os ligantes peptídicos mais comumente usados e suas aplicações, e é aqui incorporado a título de referência em sua totalidade.

[0156] Além da fusão dos domínios efetores desejados à proteína associada a CRISP, há várias abordagens alternativas para mediação de um efeito biológico desejado sobre uma sequência-alvo de interesse. Essas abordagens utilizam essencialmente proteínas associadas a CRISPR (ou RNAs-guia) que são capazes de recrutar domínios efetores de interesse para a sequência de DNA-alvo. Essas abordagens podem prover opções adicionais e flexibilidade para recrutamento multiplex de

Petição 870190070557, de 24/07/2019, pág. 134/401

70/306 domínios efetores para uma sequência de DNA-aivo específica de interesse (tal como um promotor ou potencializador).

[0157] O método de ativação SunTag usa uma disposição de marcadores de epítopo de peptídeo pequenos fundidos a uma proteína associada a CRISP (por exemplo, dCas9) para recrutar cópias múltiplas de fragmento variável de cadeia simples (scFv) fundido à GFP super dobradora (sfGFP); para melhoria da dobra de proteína), fundido a (um) domínio(s) efetor(es), por exemplo, VP64. O método de ativação tripartido sinérgico (VPR) usa uma fusão em tandem de três domínios efetores (por exemplo, ativadores de transcrição, VP64, p65 e o transativador R do vírus Epstein-Barr (Rta)), para conferir a funcionalidade biológica desejada. O sistema de recrutamento à base de aptâmero (mediador de ativação sinérgico (SAM)) utiliza uma proteína associada a CRISPR (por exemplo, dCas9) com um RNA-guia com dois sítios de ligação (por exemplo, aptâmeros de RNA no tetraloop e o segundo tronco-aiça) para recrutar a proteína de revestimento MS2 de fago (MCP) que é fundida aos domínios efetores (por exemplo, ativadores transcripcionais, tais como p65 e fator de choque térmico 1 (HSF1)). Ainda, domínios efetores adicionais (por exemplo, VP64) podem ser fundidos à proteína associada a CRISPR, provendo um derivado de acordo com a presente invenção.

[0158] Os métodos de ativação descritos acima podem ser prontamente adaptados para conferir função de repressão transcripcional, ou outras funcionalidades biológicas desejadas, às proteínas associadas a CRISPR ou seus homólogos, variantes, fragmentos ou derivados como descrito aqui. Derivados de proteína associada a CRISPR e várias abordagens para mediação de CRISPRa e CRISPR! são revistos em Dominguez e outros, Nat Rev Mol Ceil Biol. 2016 Jan;17(1):5-15, que é aqui incorporado a título de referência em sua totalidade.

Petição 870190070557, de 24/07/2019, pág. 135/401

71/306

Peptídeos de Sinal [0159] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção compreende pelo menos uma sequência de ácido nucleico codificando peptídeo de sinal. A dita sequência de ácido nucleico está preferivelmente localizada dentro da região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos um peptídeo de sinal.

[0160] Um peptídeo de sinal (algumas vezes referido como sequência de sinal, sinal de direcionamento, sinal de localização, sequência de localização, peptídeo de trânsito, sequência líder ou peptídeo líder) é tipicamente um peptídeo curto (5-30 aminoácidos de comprimento) preferivelmente localizado no terminal N da proteína associada a CRISPR codificada (ou um homólogo, variante, fragmento ou um derivado da mesma).

[0161] Peptídeos de sinal preferivelmente fazem a mediação do transporte da proteína associada a CRISPR codificada (ou um homólogo, variante, fragmento ou derivado da mesma) para um compartimento celular definido, por exemplo, a superfície celular, o retículo en~ doplásmico (ER) ou o compartimento endossomal-lisossomal. Peptídeos de sinal são então inter alia úteis a fim de facilitar a excreção de proteínas expressas de uma linhagem de célula de produção.

[0162] Peptídeos de sinal exemplares compreendidos no contexto da presente invenção incluem, sem ser limitado aos mesmos, sequências de sinal de moléculas do MHC clássicas ou não classificas (por exemplo, sequências de sinal de moléculas do MHC I e II, por exemplo,

Petição 870190070557, de 24/07/2019, pág. 136/401

72/306 da molécula do MHC classe I HLA-A*0201), sequências de sinal de citocinas ou imunoglobulinas, sequências de sinal da cadeia invariante de imunoglobulinas ou anticorpos, sequências de sinal de Lampl, Tapasina, Erp57, Calreticulina, Calnexina, PLAT, EPO ou albumina e ainda proteínas associadas à membrana ou de proteínas associadas com o retículo endoplásmico (ER) ou o compartimento endossomal-lisossomal. Sobretudo preferivelmente, sequências de sinal são derivadas de HLA-A2 (humana), PLAT (humana), sEPO (humana), ALB (humana), IgE-líder (humana), CD5 (humana), IL 2 (humana), CTRB2 (humana), IgG-HC (humana), Ig-HC (humana), Ig-LC (humana), GpLuc, Igkappa (humana) ou um fragmento ou variante de qualquer uma das proteínas mencionadas acima, em particular HLA-A2, HsPLAT, sHsEPO, HsALB, HsPLAT(aa1-21), HsPLAT(aa1-22), IgE-líder, HsCD5(aa1-24), HslL2 (aa1-20), HsCTRB2(aa1-18), lgG-HC(aa1-19), lg-HC(aa1-19), Ig-LC (aa1-19), GpLuc(1-17) ou Mmlgkappa. A presente invenção compreende o uso das sequências de sinal mencionadas acima, ou variantes ou fragmentos das mesmas, contanto que essas variantes ou fragmentos sejam funcionais, isto é, capazes de direcionamento da proteína associada a CRISPR a um local (intra- ou extra)celular de interesse.

[0163] A sequência de ácido nucleico codificando o dito peptídeo de sinal é preferivelmente fundida à sequência de ácido nucleico codificando a proteína associada à CRISPR (ou seu homólogo, variante, fragmento ou derivado) na região de codificação do ácido nucleico artificial da invenção através de técnicas de engenharia genética padrão (cf. Sambrook, J. e outros, 2012 (4^a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York). Expressão da dita região de codificação fornece preferivelmente uma proteína associada a CRISPR compreendendo (preferivelmente em seu terminal N, terminal C ou ambos), o peptídeo de sinal codificado.

Petição 870190070557, de 24/07/2019, pág. 137/401

73/306

Sequência de localização nuclear (NLS) [0164] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender ainda preferivelmente uma sequência de ácido nucleico codificando pelo menos uma sequência de localização nuclear (NLS). A dita sequência de ácido nucleico está preferivelmente localizada na região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos uma sequência de localização nuclear (NLS).

[0165] Um sinal ou sequência de localização nuclear (NLS) é uma extensão curta de aminoácidos que faz a mediação do transporte de proteínas nucleares para o núcleo. Uma proteína associada a CRISPR codificada pelo ácido nucleico artificial da invenção é particularmente pretendida para terapia e pesquisa em células de mamífero, elas podem ser dotadas de pelo menos uma NLS a fim de permitir sua importação para o núcleo onde elas podem exercer seus efeitos sobre DNA genômico, a NLS preferivelmente interage com complexos de poro nuclear (NPCs) no envelope do núcleo, desta maneira facilitando o transporte da proteína associada a CRISPR para o núcleo.

[0166] Uma variedade de sequências de NLS é conhecida na técnica, e seu uso (ou adaptação para uso) de acordo com a presente invenção está dentro das habilidades e conhecimentos comuns do versado na técnica. O melhor sinal de transporte caracterizado é a NLS clássica (cNLS) para importação de proteína nuclear, que consiste em ou uma (monopartida) ou duas (bipartidas) extensões de aminoácidos básicos. Tipicamente, o motivo monopartido é caracterizado por um agrupamento de resíduos básicos precedidos por um resíduo de quebra

Petição 870190070557, de 24/07/2019, pág. 138/401

74/306 de hélice. Similarmente, o motivo bipartido consiste em dois agrupamentos de resíduos básicos separados por 9-12 resíduos. cNLSs monopartidas são exemplificadas pela NLS de antígeno T grande SV40 (¹²⁶PKKKRRV¹³²; SEQ ID NO: 381) e cNLSs bipartidas são exemplificadas pela NLS de nucleoplasmina (¹⁵⁵KRPAATKKAGQAKKKK¹⁷⁰; SEQ ID NO: 382). Resíduos consecutivos da lisina N~terminal da NLS monopartida são referidos como P1, P2, etc. cNLS monopartidas requerem tipicamente uma lisina na posição P1, seguido por resíduos básicos nas posições P2 e P4 para prover uma sequência de consenso livre K(K/R)X(K/R) (SEQ ID NO: 384; Lange e outros, J. Biol. Chem. 2007 Fev 23; 282(8): 5101-5105).

[0167] É desta maneira pretendido, de acordo com modalidades preferidas, que a molécula de ácido nucleico artificial compreenda ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS). A molécula de ácido nucleico artificial de acordo com a invenção pode então codificar 1, 2, 3, 4, 5 ou mais NLS, que são opcionalmente selecionadas da NLS exemplificada aqui. A dita sequência de ácido nucleico de codificação de NLS está preferivelmente localizada na região de codificação do ácido nucleico artificial da invenção e é preferivelmente fundido à sequência de ácido nucleico codificando a proteína associada a CRISPR, de modo que expressão da dita região de codificação provê uma proteína associada a CRISPR compreendendo a dita pelo menos uma NLS, preferivelmente em seu terminal N, terminal C ou ambos. Em outras palavras, a molécula de ácido nucleico artificial de acordo com a invenção pode preferivelmente codificar uma proteína associada a CRISPR compreendendo pelo menos uma NLS, preferivelmente em seu terminal N, terminal C ou ambos.

[0168] Uma NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de

Petição 870190070557, de 24/07/2019, pág. 139/401

75/306 acordo com a SEQ ID NO: 426 (MAPKKKRKVGIHGVPAA), também referida aqui como NLS2, que pode ser codificada por uma sequência de ácido nucleico de acordo com qualquer uma da SEQ ID NOs: 409; 2538, 1378; 3698; 4858; 6018; 7178; ou 8338, ou uma variante ou fragmento (funcional) de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende o uso de variantes ou fragmentos de NSL2, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com a SEQ ID NO: 426.

[0169] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 427 (KRPAATKKAGQAKKKK), também referida aqui como NLS4, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539; 1379; 3699; 4859;

Petição 870190070557, de 24/07/2019, pág. 140/401

76/306

6019; 7179; 8339, ou uma variante ou fragmento (funcional) de quaiquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende ainda o uso de variantes ou fragmentos de NSL4, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com SEQ ID NO: 427.

[0170] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 427 (KRPAATKKAGQAKKKK), também referida aqui como NLS4, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539; 1379; 3699; 4859; 6019; 7179; 8339, ou uma variante ou fragmento (funcional) de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%,

Petição 870190070557, de 24/07/2019, pág. 141/401

77/306

30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende ainda o uso de variantes ou fragmentos de NSL4, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com SEQ ID NO: 427.

[0171] É ainda compreendido aqui equipar a proteína associada a CRISPR com duas ou mais NLSs, e essas NLSs podem, por exemplo, ser selecionadas de NLS2 (caracterizada por SEQ ID NO: 426) e NLS4 (caracterizada por SEQ ID NO: 427) ou uma variante ou fragmento funcional de um ou ambos esses sinais de localização nuclear.

[0172] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 10575 (KRPAATKKAGQAKKKK), também referida aqui como NLS3, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539 1379; 3699; 4859; 6019; 7179; 8339, 10551; 10581, 10593; 10584; 10587; 10590;

Petição 870190070557, de 24/07/2019, pág. 142/401

78/306

10593; 10596, ou uma variante ou fragmento (funcional) da mesma de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende o uso de variantes ou fragmentos de NLS3, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com a SEQ ID NO: 427.

[0173] Desta maneira, sequências de NLS preferidas podem compreender ou consistir em uma sequência de aminoácido de acordo com as SEQ ID NO:426; 427; 10575; 381; 382; 384; 11957; 11958-11964 que podem ser codificadas por uma sequência de ácido nucleico de acordo com 409; 2538; 410; 2539: 10551; 10581; 11973; 11974-1198, 1378; 3698; 4858; 6018; 7178; 8338: 1379; 3699; 4859; 6019: 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005: 12013; 11966-11972; 11982-11988; 11990

Petição 870190070557, de 24/07/2019, pág. 143/401

79/306

11996; 11998-12004; 12006-12012; ou 12014-12020.

[0174] NLS preferidas adicionais podem compreender ou consistir em uma sequência de aminoácido de acordo com as SEQ ID NOs: 12021-14274.

[0175] As sequências de NLS como acima descrito são uma lista não iimitante de NLS geralmente usadas e aceitas. É compreendido que qualquer uma das enzimas de edição de gene mencionadas aqui, por exemplo, Cas9 ou Cpf1, pode ser combinada com qualquer outra NLS como conhecido na técnica e com qualquer número de sequências de NLS em uma sequência. Também combinações de sequências de NLS diferentes são convertidas pela descrição da invenção acima.

[0176] Também estão compreendidas no ensinamento da invenção sequências codificando uma proteína de edição de gene como revelado aqui ou na listagem de sequências compreendendo qualquer NLS como aqui revelado ou conhecido na técnica em qualquer número e/ou combinação de NLS (isto é, 573’ NLS).

Marcadores de proteína e peptídeo [0177] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção compreende ainda pelo menos uma sequência de ácido nucleico codificando marcador de proteína ou peptídeo. A dita sequência de ácido nucleico está preferivelmente localizada dentro da região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos um marcador de proteína ou peptídeo.

[0178] Marcadores de proteína e peptídeo são sequências de ami

Petição 870190070557, de 24/07/2019, pág. 144/401

80/306 noácido que podem ser introduzidas em proteínas de interesse para permitir purificação, detecção, localização ou para outros propósitos. Marcadores de proteína e peptídeo podem ser classificados com base em sua função e incluem, sem limitação, marcadores de afinidade (tal como proteína de ligação à quitina (CBP), proteína de ligação à maltose (MBP), glutationa-S-transferase (GST), marcadores de poli(His), marcadores de Fc, marcadores de Strep), marcadores de solubílização (tais como tiorredoxina (TRX) e poli(NANP)), marcadores de cromatografia (tais como marcadores de FLAG), marcadores de epítopo (marcador de V5, marcador de Myc, marcador de HA e marcador de NE), marcadores fluorescentes (tais como marcadores de GFP) ou outros (marcador de Av, permite biotinilação e subsequente isolamento).

[0179] A molécula de ácido nucleico artificial de acordo com a invenção pode então codificar 1,2, 3,4,5 ou mais marcadores de proteína ou peptídeo, que são opcionalmente selecionados dos marcadores de proteína exemplificados aqui. A dita sequência de ácido nucleico codificando marcador de proteína ou peptídeo está preferivelmente localizada na região de codificação da molécula de ácido nucleico artificial da invenção, e é preferivelmente fundida à sequência de ácido nucleico codificando a proteína associada a CRISPR, de modo que expressão da dita região de codificação provê uma proteína associada a CRISPR compreendendo o dito pelo menos um marcador de proteína ou peptídeo. Em outras palavras, a molécula de ácido nucleico artificial de acordo com a invenção pode preferivelmente codificar uma proteína associada a CRISPR compreendendo pelo menos um marcador de proteína ou peptídeo. Meios e métodos para introdução de ácidos nucleicos codificando tais marcadores de proteína ou peptídeo estão dentro das habilidades e conhecimento comum do versado na técnica.

[0180] A molécula de ácido nucleico artificial, preferivelmente RNA, da presente invenção pode codificar uma proteína associada a CRISPR

Petição 870190070557, de 24/07/2019, pág. 145/401

81/306 (tal como cas9, Cpf1) exibindo qualquer um dos traços ou características acima, se adequado ou necessário, em qualquer combinação umas com as outras, contanto que os traços ou características não interfiram uns com os outros. Desta maneira, a molécula de ácido nucleico artificial, em particular RNA, pode codificar qualquer proteína associada a CRISPR exemplificada aqui, ou um homólogo, variante, fragmento ou derivado da mesma, como aqui definido, que pode compreender uma ou mais NLSs, e opcionalmente uma ou mais sequências de sinal e/ou marcadores de proteína ou peptídeo, contanto que a proteína associada a CRISPR codificada (e a NLS, sequência de sinal, marcador de proteína/peptídeo) preferivelmente retenha sua função ou propriedade biológica desejada, como acima definido.

[0181] Também estão compreendidas nos ensinamentos da invenção todas as sequências tendo um marcador de proteína ou peptídeo sem a(s) dita(s) sequência(s) de marcador que foi(foram) introduzida(s) para purificação, detecção, localização ou para outros propósitos. Em outras palavras, uma sequência que é revelada na listagem de sequência com um marcador de proteína ou peptídeo é também claramente compreendida nos ensinamentos da invenção quando a sequência de marcador é removida. Um versado na técnica é prontamente capaz de remover qualquer sequência de marcador de uma sequência de proteína marcada, isto é, usar também as sequências da invenção em uma forma não marcada. O mesmo é verdadeiro para sequências de troncoalça de PolyC e histona que poderíam ser facilmente removidas da ou também adicionadas à proteína, se desejado.

Cas9 [0182] Cas9 refere-se a endonucleases de DNA CRISPR-Cas Tipo II guiadas por RNA, que podem ser codificadas pelo gene cas9 de Streptococcus pyogenes sorotipo M1 (Sequência de Referência NCBI: NCJ002737.2, SPy1046; S. pyogenes) i.e. spCas9, ou um homólogo,

Petição 870190070557, de 24/07/2019, pág. 146/401

82/306 variante ou fragmento da mesma. Cas9 pode ser preferivelmente recrutada por um RNA-guia (gRNA) para clivar, especificamente de sítio, uma sequência de DNA-alvo usando dois domínios de endonuclease distintos (domínios tipo H de HNH e RuVC/RNase), um para cada filamento da hélice dupla do DNA. RuvC e HNH juntos produzem quebras de filamento duplo (DSBs), e podem produzir separadamente quebras de filamento simples (Pedido de Patente Publicado U.S. No.2014-0068797 e Jinek M. e outros, Science. 2012 Ago 17;337(6096):816-21). Cas9 é preferivelmente capaz de reconhecer especificamente (e preferivelmente se ligar a) um motivo adjacente protoespaçador (RAM) justaposto à sequência de DNA-alvo. O RAM está tipicamente localizado na 3’ do DNAalvo e pode compreender ou consistir na sequência de três nucleotídeos NGG. Ele é tipicamente reconhecido pelo domínio de interação de PAM (domínio PI) localizado próximo do terminal C de Cas9.

[0183] Um grande número de proteínas Cas9 é conhecido na técnica e compreendido como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cas9 adequadas são listadas na Tabela 2 abaixo. Nela, cada fileira corresponde a uma proteína Cas9 como identificado pelo número de acesso do banco de dados da proteína correspondente (primeira coluna, A, No. Ac). A segunda coluna na Tabela 2 (B) indica a SEQ ID NO: correspondendo à respectiva sequência de aminoácido como provido aqui. Proteínas Cas9 preferidas são mostradas na listagem de sequência sob SEQ ID NO:428-441; SEQ ID NO: 10999-11001; e SEQ ID NO:442-1345. As sequências de mRNA otimizadas correspondentes que são modalidade preferida da invenção são mostradas na listagem de sequência sob SEQ ID NO:411; 25402553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 1147311475; 11591-11593; 11709-11711; 11827-11829: 11945-11947; 13942297; 3714-4617; 4874-5777; 6034-6937; 7194-8097; e 8354-9257.

Petição 870190070557, de 24/07/2019, pág. 147/401

83/306

Sequências de Aminoácido

Tabela 2. Proteínas Cas9 da invenção

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
1	Q99ZW2	Cas9_Q99ZW2_prot	428
2	A0Q5Y3	Cas9_A0Q5Y3__prot	429
3	J7RUA5	Cas9_J7RLJA5_prot	430
4	G3ECR1	Cas9j33ECR1_prot	431
5	J3F2B0	Cas9_J3F2B0__prot	432
6	Q03JI6	Cas9__Q03JI6___prot	433
7	C9X1G5	Cas9__C9X1 G5_prot	434
8	Q927P4	Cas9__Q927P4__prot	435
9	Q8DTE3	Cas9_Q8DTE3__prot	436
10	Q9CLT2	Cas9___Q9CLT2___prot	437
11	A1IQ68	Cas9_A1 IQ68__prot	438
12	Q6NKI3	Cas9_Q6NKI3__prot	439
13	Q0P897	Cas9__Q0P897_prot	440
14	Q03LF7	Cas9__Q03LF7___prot	441
15	T0TDV9	Cas9__T0TDV9_prot	442
16	A0A0D8BYB2	Cas9__A0A0D8BYB2__prot	443
17	A0A0M4TTU2	Cas9_A0A0M4TTU2„prot	444
18	A7H5P1	Cas9_A7H5P1__prot	445
19	A0A0W8KZ82	Cas9_A0A0W8KZ82_prot	446
20	A0A0E1ZMQ3	Cas9_A0A0E1ZMQ3_prot	447
21	W8KE67	Cas9_W8KE67_prot	448
22	A0A0B6V308	Cas9__A0A0B6V308_prot	449
23	A0A1E7PM50	Cas9_A0A1 E7PM50_prot	450
24	A0A1E7P6J5	Cas9_A0A1 E7P6J5...prot	451
25	A0A1D9BML5	Cas9_A0A1 D9BML5_prot	452
26	A5KEK9	Cas9_A5KEK9__prot	453
27	D2MWB9	Cas9__D2MWB9__prot	454
28	A0A0H4KTI1	Cas9_A0A0H4KTI 1„.prot	455
29	A0A0D7V4T2	Cas9..A0A0D7V4T2....prot	456
30	A0A059HXJ1	Cas9_A0A059HXJ1_prot	457

Petição 870190070557, de 24/07/2019, pág. 148/401

84/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
31	A0A1E7NYV5	Cas9__A0A1 E7NYV5„prot	458
32	A0A1E7P943	Cas9„ A0A1 E7P943_prot	459
33	A0A0E2UY67	Cas9__A0A0E2UY67_prot	460
34	A0A1B3X857	Cas9__A0A1 B3X857__prot	461
35	A0A0E9LLC5	Cas9.,A0A0E9LLC5....prot	462
36	A0A125S8M1	Cas9_A0A125S8M1__prot	463
37	A0A0S8HUJ8	Cas9_A0A0S8HUJ8__prot	464
38	A0A0A8GXC3	Cas9_A0A0A8GXC3_prot	465
39	A0A0A8GU36	Cas9_A0A0A8GU36_prot	466
40	A0A139BVD9	Cas9_A0A 139B VD9_prot	467
41	A3VED0	Cas9__A3VED0__prot	468
42	A0A0A8HTA3	Cas9..,A0A0A8HTA3...prot	469
43	A0A125S8L7	Cas9_A0A125S8L7_mprot	470
44	T2LKS6	Cas9_T2LKS6__prot	471
45	A0A0A8H849	Cas9_A0A0A8H849_prot	472
46	F5S4M8	Cas9...F5S4M8...prot	473
47	G1UFN3	Cas9__G 1U F N 3__prot	474
48	B5ZLK9	Cas9__B5ZLK9__prot	475
49	C5ZYI3	Cas9_C5ZYI3__prot	476
50	A0A0G3EK96	Cas9___.A0.A0G3EK9S___prot	477
51	A0A125S8M5	Cas9_A0A125S8M5__prot	478
52	A0A0L6CQ85	Cas9__A0A0L6CQ85__prot	479
53	A0A0L8B0U9	Cas9..AOAOL8BOU9..jorot	480
54	A0A178N1Y8	Cas9_A0A178N1 Y8__prot	481
55	A0A125S8I0	Cas9__AOA125S8IO__prot	482
56	A0A0A1PPJ7	Cas9__A0A0A1 PPJ7__prot	483
57	B8I085	Cas9__B8l085__prot	484
58	A0A1B8J9V3	Cas9_A0A1 B8J9V3_prot	485
59	I7GTK8	Cas9J7GTK8_prot	486
60	D3UFL8	Cas9__D3UFL8_prot	487
61	E1VQA3	Cas9__E1VQA3_prot	488
62	M4V7E7	Cas9__M4V7E7__prot	489
63	F4GDP9	Cas9__F4GDP9__prot	490

Petição 870190070557, de 24/07/2019, pág. 149/401

85/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
64	A0A0Q6WIJ3	Cas9__A0A0Q6WIJ3__prot	491
65	A0A0E9L8G0	Cas9._A0A0E9L8G0.prot	492
66	A0A0A1VBC9	Cas9_A0A0A 1 VBC9_prot	493
67	B1GZM3	Cas9__B1GZM3__prot	494
68	A0A1C0W3U5	Cas9_A0A1C0W3U5„prot	495
69	D5BR51	Cas9_.D5BR51_.prot	496
70	A0A1A7NZJ6	Cas9_A0A1A7NZJ6__prot	497
71	A0A125S8J2	Cas9_A0A125S8J2_prot	498
72	A0A0A2YBT2	Cas9_A0A0A2YBT2_.prot	499
73	A0A099UFG2	Cas9_A0A099UFG2_prot	500
74	A0A0C5JLX1	Cas9__A0A0C5JLX1_prot	501
75	A7HP89	Cas9_.A7HP89_.prot	502
76	A0A0J6BUV9	Cas9_A0A0J6BUV9_prot	503
77	A0A1C9ZTA2	Cas9_A0A 1C9ZT A2__prot	504
78	A0A087N7M8	Cas9_A0A087N7M8__prot	505
79	A0A0Q9CTQ5	Cas9_A0A0Q9CTQ5_prot	506
80	A0A101I188	Cas9_A0A 1011188_prot	507
81	V2Q0I9	Cas9_V2QOI9_prot	508
82	F9ZKQ5	Cas9_F9ZK.Q5_.prot	509
83	F0Q2T1	Cas9...F0Q2T1...prot	510
84	M4R7E0	Cas9__M4R7E0_prot	511
85	T1DV82	Cas9_T 1 DV82_prot	512
86	W0Q6X6	Cas9__W0Q6X6_prot	513
87	A0A0E9MLX9	Cas9.A0A0E9MLX9.prot	514
88	A0A0D6MWC5	Cas9_A0A0D6MWC5__prot	515
89	A0A087MCH0	Cas9_A0A087MCH0_prot	516
90	I3TWJ0	Cas9_.l3TWJ0_.prot	517
91	A0A011P7F8	Cas9__A0A011 P7F8...prot	518
92	A0A163RXL7	Cas9_A0A163RXL7_prot	519
93	A9HKP2	Cas9_A9HKP2_prot	520
94	A0A0N1EBR4	Cas9_A0A0N1 EBR4_prot	521
95	A0A0A8HLU7	Cas9__A0A0A8HLU7__prot	522
96	E1W6G3	Cas9_E1W6G3__prot	523

Petição 870190070557, de 24/07/2019, pág. 150/401

86/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
97	J4KDT3	Cas9_J4KDT3_prot	524
98	E3CY56	Cas9_E3CY56_prot	525
99	J7RUA5	Cas9__J7RUA5_prot	526
100	A0A151A3A4	Cas9_A0A 151 A3A4__prot	527
101	A0A1E5TL62	Cas9_A0A1 E5TL62...prot	528
102	M4S2X5	Cas9_M4S2X5__prot	529
103	E0F2V7	Cas9__E0F2V7__prot	530
104	A0A0N7KBI5	Cas9_A0A0N7KBI5_prot	531
105	A0A133QCR3	Cas9__A0A133QCR3_prot	532
106	K0G350	Cas9__K0G350_prot	533
107	U5ULJ7	Cas9__U5ULJ7__prot	534
108	F0ET08	Cas9_F0ET08_prot	535
109	A0A0S2F228	Cas9_A0A0S2F228_prot	536
110	A0A060QC50	Cas9_A0A060QC50__prot	537
111	C5S1N0	Cas9__C5S1 NO_prot	538
112	A0A0K1NCD0	Cas9_A0A0K1 NCD0...prot	539
113	A0A099TTS6	Cas9__A0A099TTS6__prot	540
114	A0A0D2SXK1	Cas9__A0A0D2SXK1__prot	541
115	A0A1E4MWW9	Cas9__A0A1 E4MWW9_prot	542
116	A0A0M3VQX7	Cas9_A0A0M3VQX7„prot	543
117	A0A0T0PVC7	Cas9_A0A0T0PVC7_prot	544
118	Q7MRD3	Cas9_Q7MRD3_prot	545
119	A0A160JE60	Cas9„ A0A 160J E60...prot	546
120	J6LE60	Cas9__J6LE60__prot	547
121	A0A0P1D4L3	Cas9_A0A0P1 D4L3__prot	548
122	A0A176I8B4	Cas9__A0A176l8B4__prot	549
123	A0A143DGZ8	Cas9.,A0A143DGZ8...prot	550
124	G2ZYP2	Cas9_G2ZYP2__prot	551
125	A6VLA7	Cas9_A6VLA7__prot	552
126	A0A151APJ0	Cas9..A0A151APJ0....prot	553
127	V9H606	Cas9__V9H606_prot	554
128	A0A0D6XNZ8	Cas9__A0A0D6XNZ8__prot	555
129	Q13CC2	Cas9__Q13CC2__prot	556

Petição 870190070557, de 24/07/2019, pág. 151/401

87/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
130	A5EIM8	Cas9__A5EIM8__prot	557
131	B1UZL4	Cas9_B1UZL4_prot	558
132	B1BJM3	Cas9__B1 BJM3_prot	559
133	Q20XX4	Cas9__Q20XX4__prot	560
134	A0A125S8L3	Cas9___A0A125S8L3___prot	561
135	A0A0B8Z713	Cas9_A0A0B8Z713_prot	562
136	A0A150D6Y2	Cas9__A0A150D6Y2__prot	563
137	A1WH93	Cas9_A1WH93_prot	564
138	R8LDU5	Cas9_R8LDU5_prot	565
139	A0A0F7K1T5	Cas9_A0A0F7K1T5_prot	566
140	R8NC81	Cas9__R8NC81__prot	567
141	A0A0P7L7M3	Cas9_A0A0P7L7M3„prot	568
142	F0PZE9	Cas9_F0PZE9__prot	569
143	C2UN05	Cas9__C2UN05__prot	570
144	T0HC86	Cas9__T0HC86__prot	571
145	R5QL13	Cas9_R5QL.13_.prot	572
146	A0A0J0YQ19	Cas9_A0A0J0YQ19_prot	573
147	A0A196P6K7	Cas9_A0A196P6K7_prot	574
148	R6QL84	Cas9_R6QL84__prot	575
149	A0A0J5QZM1	Cas9...A0A0J5QZM1...prot	576
150	A0A0P1ETF1	Cas9_A0A0P1 ETF1_prot	577
151	A0A125S8J5	Cas9_A0A125S8J5__prot	578
152	A0A1C6WUG4	Cas9_A0A1C6WUG4_prot	579
153	A0A1D3QUT4	Cas9_A0A1 D3QUT4_prot	580
154	F2B8K0	Cas9__F2B8K0__prot	581
155	A0A1D3PTA0	Cas9_A0A1 D3PTA0__prot	582
156	A0A0P7LDT0	Cas9.„A0A0P7LDT0...prot	583
157	A0A0R1LQW1	Cas9_A0A0R1 LQW1_prot	584
158	A0A159Z911	Cas9__A0A159Z911_prot	585
159	R5Y7W7	Cas9„R5Y7W7_prot	586
160	A8LN05	Cas9__A8LN05__prot	587
161	S0RVL7	Cas9__S0RVL7_prot	588
162	W1K9F9	Cas9__W1 K9F9__prot	589

Petição 870190070557, de 24/07/2019, pág. 152/401

88/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
163	A0A1E4DUI9	Cas9_A0A1E4DUI9_prot	590
164	A0A1E4F4V8	Cas9_A0A1 E4F4V8_prot	591
165	J8W240	Cas9_J8W240__prot	592
166	C6SFU3	Cas9_C6SFU3_prot	593
167	C5TLV5	Cas9_.C5TLV5_.prot	594
168	A0A0Y5JFG8	Cas9_A0A0Y5JFG8_prot	595
169	A0A125S8I7	Cas9__A0A125S8l7_prot	596
170	E4ZF34	Cas9_E4ZF34_prot	597
171	A0A0Y6L5Q1	Cas9._A0A0Y6L5Q1_.prot	598
172	A0A0T7L299	Cas9_A0A0T7L299_prot	599
173	X5EPV9	Cas9_X5EPV9_prot	600
174	C6SH44	Cas9._C6SH44_.prot	601
175	E0NB23	Cas9__E0N B23_prot	602
176	A9M1K5	Cas9__A9M 1 K5_prot	603
177	D0W2Z9	Cas9_D0W2Z9_prot	604
178	R0TXT9	Cas9_.R0TXT9_.prot	605
179	C6S593	Cas9_C6S593_prot	606
180	A0A1A6FJT6	Cas9__A0A1A6FJT6_prot	607
181	A0A0D8IYR9	Cas9_A0A0D8IYR9_prot	608
182	A0A0W7TPK7	Cas9_.A0A0W7TPK7_.prot	609
183	G9RUL1	Cas9_.G9RUL1_.prot	610
184	A0A0N8K819	Cas9_A0A0N8K819_prot	611
185	A0A0Q7HTH3	Cas9._A0A0Q7HTH3_.prot	612
186	A0A0Q0YQ33	Cas9._A0A0Q0YQ33_.prot	613
187	E8LGQ1	Cas9_E8LGQ1_prot	614
188	A0A0K1KC97	Cas9_A0A0K1 KC97_prot	615
189	A0A150MM34	Cas9_.A0A150MM34_.prot	616
190	H7F839	Cas9_.H7F839_.prot	617
191	A0A178TEJ9	Cas9__A0A178TEJ9__prot	618
192	A0A150MP45	Cas9_.A0A150MP45_.prot	619
193	A0A164FEH7	Cas9...A0A164FEH7_..prot	620
194	V6VHM9	Cas9_.V6VHM9_.prot	621
195	A0A096BCZ5	Cas9_A0A096BCZ5_prot	622

Petição 870190070557, de 24/07/2019, pág. 153/401

89/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
196	A0A0J8GDE4	Cas9_A0A0J8GDE4_prot	623
197	G9QLF2	Cas9._G9QLF2_.prot	624
198	D7N2B0	Cas9_.D7N2B0_.prot	625
199	S5ZZV3	Cas9_S5ZZV3_prot	626
200	A0A0N1BZF2	Cas9__A0A0N 1 BZF2_prot	627
201	A0A0C9MY24	Cas9...A0A0C9MY24_prot	628
202	A0A1C7NZW8	Cas9_A0A1C7NZW8_prot	629
203	H0UDA8	Cas9_H0UDA8__prot	630
204	E3HCA8	Cas9_.E3HCA8_.prot	631
205	A0A073IJU3	Cas9_.A0A073IJU3_.prot	632
206	W3RQ02	Cas9_W3RQ02_prot	633
207	A0A0U2W148	Cas9__A0A0U2W148_prot	634
208	G4CMU0	Cas9_.G4CMU0_.prot	635
209	A0A0H1A177	Cas9_A0A0H 1A177_prot	636
210	A0A125S8L4	Cas9_A0A125S8L4_prot	637
211	A0A0T2NHL9	Cas9_A0A0T2N H L9__prot	638
212	A0A1A9FXI0	Cas9_A0A1A9FXI0_prot	639
213	A0A139DPY2	Cas9_A0A139DPY2_prot	640
214	A0A1A7V637	Cas9_A0A 1 A7V637_prot	641
215	R5KSL2	Cas9_.R5KSL2_.prot	642
216	R7B4M2	Cas9_.R7B4M2_.prot	643
217	A0A143X3E0	Cas9_A0A143X3E0__prot	644
218	R6DVD3	Cas9...R6DVD3...prot	645
219	W0A9N2	Cas9_W0A9N2_prot	646
220	R5UJK1	Cas9_R5UJK1_prot	647
221	A5Z395	Cas9_A5Z395__prot	648
222	A0A0X1TKX4	Cas9_A0A0X1TKX4_prot	649
223	R7A6L3	Cas9_.R7A6L3_.prot	650
224	J2WFY6	Cas9_J2WFY6_prot	651
225	W1SA26	Cas9 _W1 SA26_prot	652
226	A0A099UAI1	Cas9_A0A099UAI 1_.prot	653
227	U2XW20	Cas9_U2XW20_prot	654
228	R6ACK8	Cas9_R6ACK8_prot	655

Petição 870190070557, de 24/07/2019, pág. 154/401

90/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
229	C4ZA16	Cas9__C4ZA16__prot	656
230	A0A133XDM2	Cas9_A0A133?<DM2...prot	657
231	V8C5L2	Cas9_V8C5L2_prot	658
232	E4MSY6	Cas9_E4MSY6_prot	659
233	A0A0A1H768	Cas9_A0A0A1 H768 ..pro t	660
234	A0A0Q7WLY8	Cas9_A0A0Q7WLY8_prot	661
235	A0A0R1JQF2	Cas9_A0A0R1 JQF2__prot	662
236	A0A142LIG4	Cas9_A0A 142LI G4_prot	663
237	R2S872	Cas9..R2S872...prot	664
238	A0A0E2RF34	Cas9_A0A0E2RF34_prot	665
239	A0A0R1IXU4	Cas9_A0A0R1 IXU4_prot	666
240	A0A0E2Q4M6	Cas9..,A0A0E2Q4M6....prot	667
241	A0A139MDP4	Cas9...A0A 139M D P4...prot	668
242	X8HGN9	Cas9_X8HGN9_prot	669
243	A0A1C3YEE6	Cas9_A0A1C3YEE6_prot	670
244	A0A0P6UEB3	Cas9_A0A0P6UEB3_prot	671
245	A0A0M3RT06	Cas9_A0A0M3RT06_prot	672
246	K0ZVL9	Cas9__K0ZVL9_prot	673
247	R0P7Y6	Cas9_R0P7Y6_prot	674
248	S0KIG9	Cas9...S0KIG9...prot	675
249	A0A081Q0Q9	Cas9...A0A081 Q0Q9...prot	676
250	F8LWC5	Cas9_F8LWC5_prot	677
251	I0SS54	Cas9J0SS54_prot	678
252	A0A125S8J6	Cas9_A0A 125S8J6_.prot	679
253	V8LWT4	Cas9__.V8L.WT 4_prot	680
254	A0A111NJ61	Cas9__A0A111NJ61_prot	681
255	A0A0A0DHL5	Cas9..,A0A0A0DHL5...prot	682
256	Q5M542	Cas9_.Q5M542_.prot	683
257	A0A0Z8LKF1	Cas9_A0A0Z8LKF1_prot	684
258	A0A126UMM8	Cas9_A0A126UMM8_prot	685
259	A0A0N8VNG6	Cas9_A0A0N8VNG6_prot	686
260	A0A081PRN2	Cas9_A0A081 PRN2_prot	687
261	T1ZF93	Cas9_T1ZF93_prot	688

Petição 870190070557, de 24/07/2019, pág. 155/401

91/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
262	A0A125S8J9	Cas9_A0A125S8J9_prot	689
263	A0A0H4LAU6	Cas9..A0A0H4L.AU6...prot	690
264	A0A0P0N7J4	Cas9_A0A0P0N7J4_prot	691
265	A0A1G0BAB7	Cas9_A0A1 G0BAB7__prot	692
266	F8LNX0	Cas9...F8LNX0...prot	693
267	U5P749	Cas9...U5P749...prat	694
268	K6QJ37	Cas9__K6QJ37_prot	695
269	D4KTZ0	Cas9_D4KTZ0_prot	696
270	U1GXL8	Cas9JJ1GXL8...prot	697
271	E8KVY4	Cas9..E8KVY4...prot	698
272	A0A173V977	Cas9_A0A173V977_prot	699
273	W3XZF8	Cas9...VV3XZF8...prot	700
274	A0A0X8G6A4	Cas9...A0A0X8G6A4...prot	701
275	A0A139RFX7	Cas9__A0A139RFX7_prot	702
276	A0A0R1M5J7	Cas9_A0A0R1 M5J7_prot	703
277	A0A0U3F8P4	Cas9_A0A0U3F8P4_prot	704
278	B1SGF4	Cas9_B 1SG F4_prot	705
279	A0A0U3EY47	Cas9__A0A0U3EY47__prot	706
280	A0A176T602	Cas9_A0A 176T602_prot	707
281	A0A1C3SQ53	Cas9..,A0A1C3SQ53...prot	708
282	F5WVI4	Cas9_F5WVI4_prot	709
283	H2A7K0	Cas9_H2A7K0__prot	710
284	A0A091BWC6	Cas9_A0A091 BWC6_prot	711
285	F5X275	Cas9..F5X275...prot	712
286	A0A081JGI6	Cas9_A0A081JGI6_prot	713
287	B9M9X8	Cas9_B9M9X8_prot	714
288	A0A1D2U437	Cas9_A0A1 D2U437...prot	715
289	E6WZS9	Cas9...E6WZS9...prot	716
290	S0J9K5	Cas9_S0J9K5_prot	717
291	A0A0R1J9U0	Cas9...A0A0R1J9U0....prot	718
292	X8KGX3	Cas9..X8KGX3...prot	719
293	A0A081R6F9	Cas9_A0A081 R6F9__prot	720
294	A0A139QZ91	Cas9__A0A 139QZ91 __prot	721

Petição 870190070557, de 24/07/2019, pág. 156/401

92/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
295	S1RM25	Cas9__.S1RM25_.prot	722
296	E0PQK3	Cas9_.E0PQK3_.prot	723
297	I0QHG7	Cas9.J0QHG7...prot	724
298	A0A0R1XK13	Cas9_A0A0R1XK13_prot	725
299	A0A1E9DYC7	Cas9__A0A1 E9DYC7...prot	726
300	A0A139NS17	Cas9_A0A139NS17_prot	727
301	A8AY02	Cas9_A8AY02_prot	728
302	E9DN79	Cas9_E9DN79_prot	729
303	A0A125S8J4	Cas9._A0A125S8J4_.prot	730
304	K8Z8F3	Cas9_.K8Z8F3_.prot	731
305	C7G697	Cas9_C7G697_prot	732
306	A0A0F2E4R3	Cas9_.A0A0F2E4R3_.prot	/33
307	I2NMF2	Cas9J2NMF2_prot	734
308	A0A173WZ1	Cas9__A0A 173VVZ1 __prot	735
309	A0A1F0FMT7	Cas9_A0A1 F0FMT7_prot	736
310	K1LQN8	Cas9_K1LQN8_prot	737
311	A0A125S8K1	Cas9_A0A 125S8K1__prot	738
312	A0A125S8K3	Cas9_A0A125S8K3_prot	739
313	H8MA21	Cas9_H8MA21_prot	740
314	W0SDH6	Cas9_.W0SDH6_.prot	741
315	J9E534	Cas9_.J9E534_.prot	742
316	A0A0V0PNI8	Cas9_A0A0V0PNI8_prot	743
317	A0A171J711	Cas9_A0A 171J 711 _prot	744
318	Q1WVK1	Cas9_Q 1WVK1 _prot	745
319	C0FXH5	Cas9_C0FXH5_prot	746
320	K0XCK7	Cas9_K0XCK7_prot	747
321	A0A125S8J8	Cas9_.A0A125S8J8_.prot	748
322	A0A060RE66	Cas9_.A0A060RE66_.prot	749
323	Q1QGC9	Cas9_Q1 QGC9_prot	750
324	D3NT09	Cas9_.D3NT09_.prot	751
325	A0A0R1MEF5	Cas9_.A0A0R1MEF5_.prot	752
326	A0A0R2CKA0	Cas9_.A0A0R2CKA0_.prot	753
327	V4Q7N5	Cas9_V4Q7N5_prot	754

Petição 870190070557, de 24/07/2019, pág. 157/401

93/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
328	Q2RX87	Cas9__Q2RX87__prot	755
329	A0A0R2FKF9	Cas9_A0A0R2FKF9_prot	756
330	R7BDB6	Cas9__R7BDB6_mprot	757
331	A0A1C9ZUE2	Cas9_A0A 1C9ZU E2__prot	758
332	S2WQ18	Cas9_S2WQ18„prot	759
333	A0A1C9ZTA0	Cas9_A0A1 C9ZTA0__prot	760
334	F0RSV0	Cas9_F0RSV0__prot	761
335	A0A0N0IXQ9	Cas9_A0A0N0IXQ9_prot	762
336	A0A0R1X611	Cas9_A0A0R1X611_ prof	763
337	B2KB46	Cas9_B2KB46_prot	764
338	U2KF13	Cas9__U2KF13__prot	765
339	D5ESN1	Cas9..D5ESN1....prot	766
340	R7HI23	Cas9_R7HI23__prot	767
341	I9J7D5	Cas9J9J7D5__prot	768
342	A0A0B0BZE8	Cas9__A0A0B0BZE8__prot	769
343	R5W806	Cas9„R5W806_prot	770
344	G6B158	Cas9__G6B158_prot	771
345	U2IU08	Cas9__U2IU08__prot	772
346	A0A096AT21	Cas9__A0A096AT21__prot	773
347	R6ZCR1	Cas9_R6ZCR 1_ prof	774
348	D1W6R4	Cas9_D1W6R4__prot	775
349	D1VXP4	Cas9__D 1 VXP4__prot	776
350	U7USL1	Cas9JJ7USL1...prot	777
351	E2N8V1	Cas9__E2N8V1_prot	778
352	R6D2P4	Cas9__R6D2P4__prot	779
353	A0A134BD56	Cas9__A0A134BD56__prot	780
354	A0A099BT78	Cas9..,A0A099BT78...prot	781
355	R7CVK2	Cas9_mR7CVK2_prot	782
356	D2EJF1	Cas9_D2 E J F1 __prot	783
357	A0A069QG82	Cas9..A0A06SQG82....prot	784
358	R5LWG1	Cas9_R5LWG1_prot	785
359	C9LGP5	Cas9__C9LGP5__prot	786
360	Q6KIQ7	Cas9__Q6KIQ7__prot	787

Petição 870190070557, de 24/07/2019, pág. 158/401

94/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
361	A0A180F6C8	Cas9._A0A180F6C8_.prot	788
362	C0WRP7	Cas9_C0WRP7_prot	789
363	A0A174NKB5	Cas9_A0A 174N KB5_.prot	790
364	U2Y346	Cas9_U2Y346_prot	791
365	A0A125S8I5	Cas9__A0A125S8i5_prot	792
366	R7CG17	Cas9_.R7CG17_.prot	793
367	F3A050	Cas9_F3A050_prot	794
368	D1AUW6	Cas9_D1AUW6_prot	795
369	A0A0X8KN88	Cas9._A0A0X8KN88_.prot	796
370	A0A0D5BKQ5	Cas9._A0A0D5BKQ5_.prot	797
371	A0A0N1DVV7	Cas9_A0A0N 1 DW7_prot	798
372	A0A085Z0I3	Cas9_.AOAO85ZOI3_.prot	799
373	J3TRJ9	Cas9_.J3TRJ9_.prot	800
374	A0A0F6CLF2	Cas9_A0A0F6CLF2_prot	801
375	A0A199XSD8	Cas9_A0A199XSD8_prot	802
376	A0A0B8YC59	Cas9_.A0A0B8YC59_.prot	803
377	K2M2X7	Cas9_K2M2X7_prot	804
378	A0A1B9Y472	Cas9_A0A1 B9Y472_prot	805
379	A0A0Q4DTQ9	Cas9_A0A0Q4DTQ9_prot	806
380	S4EM46	Cas9_.S4EM46_.prot	807
381	A0A1D2JYF3	Cas9_A0A1 D2JYF3_.prot	808
382	A0A0R2FVI8	Cas9_A0A0R2FVI8_prot	809
383	A0A174LFF7	Cas9..A0A174LFF7_prot	810
384	A0A173SPI3	Cas9_A0A173SPI3_prot	811
385	D0DRL9	Cas9__D0DRL9__prot	812
386	A0A175A1Y1	Cas9_A0A 175A1Y1 __prot	813
387	A0A062XBE5	Cas9_.A0A062XBE5_.prot	814
388	A0A0K8MIK7	Cas9_.A0A0K8MIK7_.prot	815
389	A0A0R1TV35	Cas9_A0A0R1TV35_prot	816
390	A0A125S8J7	Cas9..A0A125S8J7...prot	817
391	A0A0R1ZP43	Cas9_A0A0R1ZP43_prot	818
392	W4T7U3	Cas9_W4T7U3_prot	819
393	A0A0J5P9G6	Cas9_A0A0J5P9G6_prot	820

Petição 870190070557, de 24/07/2019, pág. 159/401

95/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
394	A0A0R2CL57	Cas9__A0A0R2CL57__prot	821
395	R6U7U5	Cas9__R6U7U5__prot	822
396	A0A0R2AFH9	Cas9_A0A0R2AFH9_prot	823
397	E7MR72	Cas9__E7M R72__prot	824
398	A0A1C0YPC7	Cas9.,A0A1C0YPC7...prot	825
399	A0A179EQS1	Cas9_A0A179EQS1_prot	826
400	W9EE99	Cas9_W9EE99_prot	827
401	A0A0R2BKJ5	Cas9_A0A0R2BKJ5_prot	828
402	E6LI02	Cas9...E6Li02....prot	829
403	V5XLV7	Cas9..V5XLV7..prot	830
404	G2KVM6	Cas9__G2KVM6__prot	831
405	A0A1C5TF27	Cas9.,A0A1C5TF27..prot	832
406	H3NFH0	Cas9_H3NFH0_prot	833
407	A0A081BKX9	Cas9_A0A081 BKX9__prot	834
408	A0A1C7DHH3	Cas9__A0A1C7DHH3__prot	835
409	R7GMQ9	Cas9...R7GMQ9...prot	836
410	R6QHH1	Cas9__R6QHH1_mprot	837
411	A0A174HSW2	Cas9_A0A174HSW2_prot	838
412	A0A0R2HIR8	Cas9__A0A0R2 ΗI R8_prot	839
413	A0A0H3GNI1	Cas9..,A0A0H3GNI1....prot	840
414	A0A0F5ZHG0	Cas9_A0A0F5ZHG0__prot	841
415	A0A0H3J2A7	Cas9_A0A0H3J2A7__prot	842
416	A0A166RWM5	Cas9_A0A166RWM5_prot	843
417	A0A1E6FAD7	Cas9_A0A1 E6FAD7_prot	844
418	A0A1E8EQS5	Cas9__A0A1 E8EQS5_prot	845
419	A0A1E7DWS8	Cas9__A0A1 E7DWS8_prot	846
420	A0A1E5ZAU0	Cas9_A0A1 E5ZAU0...prot	847
421	A0A1E8EI75	Cas9_A0A1 E8EI75_prot	848
422	R3WHR8	Cas9_R3WH R8__prot	849
423	A0A097B8A9	Cas9__A0A097B8A9_prot	850
424	A0A095XEU7	Cas9__A0A095XEU7_prot	851
425	A0A0R1RFJ4	Cas9_A0A0R1 RFJ4__prot	852
426	A0A160NBB3	Cas9__A0A 160N BB3_prot	853

Petição 870190070557, de 24/07/2019, pág. 160/401

96/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
427	I6T669	Cas9J6T669_prot	854
428	H1GG18	Cas9_H 1GG18_prot	855
429	A0A017H668	Cas9_A0A017H668_.prot	856
430	A0A121IZ21	Cas9_A0A121IZ21_prot	857
431	A0A1B4XLG6	Cas9__A0A1 B4XLG6 ..prot	858
432	U6S081	Cas9_.U6S081_.prot	859
433	E6GPD8	Cas9_E6GPD8_prot	860
434	H3NQF8	Cas9_H3NQF8__prot	861
435	D4J3S7	Cas9_.D4J3S7_.prot	862
436	G5JVJ9	Cas9_G5JVJ9_prot	863
437	R9MHT9	Cas9_R9M HT9__prot	864
438	R2SDC4	Cas9_.R2SDC4_.prot	865
439	H7FYD8	Cas9_.H7FYD8_.prot	866
440	A0A1D2JQJ5	Cas9_A0A1 D2JQJ5_prot	867
441	A0A1D2LU44	Cas9_A0A1 D2LU44_prot	868
442	C9BHR2	Cas9...C9BHR2...prot	869
443	L2LBP5	Cas9__L2L.BP5_.prot	870
444	R6ZAM8	Cas9_R6ZAM8_prot	871
445	A6BJV4	Cas9_A6BJV4_prot	872
446	A0A174GDD3	Cas9_A0A 174G D D3_prot	873
447	C9BWE2	Cas9_.C9BWE2_.prot	874
448	A0A173UVP4	Cas9_A0A173UVP4__prot	875
449	R5BQB0	Cas9_.R5BQB0_.prot	876
450	D7N6R3	Cas9__D7N6R3_prot	877
451	A0A1C5P2V8	Cas9.__A0A1C5P2V8_.prot	878
452	B5CL59	Cas9_B5CL59_prot	879
453	A0A0R2JSC5	Cas9_.A0A0R2JSC5_.prot	880
454	A0A1C6BK34	Cas9_.A0A1C6BK34_.prot	881
455	R7KBA0	Cas9_R7KBA0_prot	882
456	A0A0R2HM97	Cas9_A0A0R2HMS7_prot	883
457	U7PCQ1	Cas9_U7PCQ1_prot	884
458	R5V4T4	Cas9_R5V4T 4_prot	885
459	A0A133QT10	Cas9_A0A 133QT1O_prot	886

Petição 870190070557, de 24/07/2019, pág. 161/401

97/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
460	A0A0E2EP65	Cas9_A0A0E2EP65_prot	887
461	R5MT23	Cas9_R5MT23_prot	888
462	A0A0R2DR00	Cas9_A0A0R2DR00_prot	889
463	R5N3I1	Cas9__R5N3l1__prot	890
464	I0SF74	Cas9J0SF74_prot	891
465	E6J3R0	Cas9_E6J3R0__prot	892
466	U2YFI6	Cas9__U2YFI6__prot	893
467	A0A0R2DIR3	Cas9__A0A0R2DIR3__prot	894
468	U2U1P0	Cas9JJ2U1PO.jorot	895
469	A0A134CKK1	Cas9_A0A134CKK1_prot	896
470	A0A0R2N0I6	Cas9__AOAOR2NOI6__prot	897
471	A0A125S8I2	Cas9__A0A125S8i2_prot	898
472	A0A0R1ZCI7	Cas9_A0A0R 1ZC17_prot	899
473	A0A0R1SCA3	Cas9__A0A0R1 SCA3_prot	900
474	D9PRA6	Cas9__D9PRA6__prot	901
475	A0A0D0ZAW2	Cas9_A0A0D0ZAW2_prot	902
476	F9N0W8	Cas9_F9N0W8_prot	903
477	B0RZQ7	Cas9__B0RZQ7_prot	904
478	R6XMN7	Cas9__R6XMN7__prot	905
479	U2SSY7	Cas9 JJ2SSY7...prot	906
480	S4NUM0	Cas9_S4N U MO_prot	907
481	A0A072ETA7	Cas9_A0A072ETA7__prot	908
482	R5RU71	Cas9_R5RU71_prot	909
483	A0A174FD97	Cas9__A0A174FD97_prot	910
484	A0A0A8K7X7	Cas9__A0A0A8K7X7__prot	911
485	R5Z6B4	Cas9__R5Z6B4__prot	912
486	S1NSG8	Cas9.S1NSG8..prot	913
487	A0A1D8P523	Cas9_A0A1 D8P523_prot	914
488	A0A1C6IPF7	Cas9__A0A1 C6I PF7__prot	915
489	A0A0R1MNC7	Cas9„ A0A0R1 MNC7...prot	916
490	A0A132HQM8	Cas9_A0A132HQM8_prot	917
491	A0A0M9VGT5	Cas9__A0A0M9VGT5__prot	918
492	F9MP31	Cas9__F9MP31__prot	919

Petição 870190070557, de 24/07/2019, pág. 162/401

98/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
493	A0A0R1V7X0	Cas9__A0A0R1 V7X0__prot	920
494	A0A0X7BAB3	Cas9__A0A0X7BAB3_prot	921
495	R7K435	Cas9__R7K435__prot	922
496	I3Z8Z5	Cas9J3Z8Z5__prot	923
497	A0A173YKH0	Cas9_A0A173YKH0„prot	924
498	A0A174PI34	Cas9_A0A174PI34_prot	925
499	A0A1C6E673	Cas9__A0A1C6E673__prot	926
500	R5YGP2	Cas9__R5YGP2__prot	927
501	A0A076P3F6	Cas9..A0A076P3F6....prot	928
502	A0A176Y372	Cas9__A0A176Y372_prot	929
503	D3I574	Cas9__D3l574__prot	930
504	S2D876	Cas9.S2D87S„.prot	931
505	A0A0R1F6R4	Cas9_A0A0R1 F6R4__prot	932
506	J9YH95	Cas9_J9YH95__prot	933
507	R5SXF4	Cas9_R5SXF4_prot	934
508	R6P3Z6	Cas9_R6P3Z6_prot	935
509	A0A0R1IS26	Cas9_A0A0R1 IS26_prot	936
510	A0A0H4LAX2	Cas9__A0A0H4LAX2__prot	937
511	A0A0K2LF21	Cas9__A0A0K2LF21__prot	938
512	A0A0R1QGB6	Cas9_A0A0R1QGB6„prot	939
513	A0A143W8R3	Cas9_A0A 143W8R3_prot	940
514	M4KKI8	Cas9__M4KKI8__prot	941
515	A0A0R1FUZ5	Cas9_A0A0R1 FUZ5 ..prot	942
516	F6ITQ2	Cas9_F6ITQ2_prot	943
517	A0A1E3KQ44	Cas9_A0A1 E3KQ44__prot	944
518	A0A173WIE2	Cas9__A0A173WI E2_prot	945
519	G4Q6A5	Cas9_G4Q6A5„prot	946
520	A0A0K1MWW2	Cas9_A0A0K1 MWW2_prot	947
521	A0A0H0YP06	Cas9_A0A0H0YP06__prot	948
522	A0A0C9QP69	Cas9_A0A0C9QP69_prot	949
523	A0A0E4H4H8	Cas9__A0A0E4H4H8_prot	950
524	C2CKI6	Cas9_C2CKI6_prot	951
525	A0A0M2FYH7	Cas9_A0A0M2FYH7„prot	952

Petição 870190070557, de 24/07/2019, pág. 163/401

99/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
526	R6TGN6	Cas9__R6TGN6__prot	953
527	I9L4B5	Cas9J9L4B5___prot	954
528	A0A133KEN0	Cas9__A0A133KEN0_prot	955
529	A0A139NKI7	Cas9_A0A 139N Kl 7__prot	956
530	T5JDL4	Cas9.T5JDL4..prot	957
531	C5F8S2	Cas9_.C5F8S2_.prot	958
532	S4ZP66	Cas9__S4ZP66__prot	959
533	S2LEI5	Cas9__.S2LEI5__.prot	960
534	A0A0R1UKG9	Cas9„ AQAQR1 UKG9....prot	961
535	A0A174P7Q9	Cas9_A0A174P7Q9__prot	962
536	K6R5Z8	Cas9__K6R5Z8__prot	963
537	A0A0R1S2S1	Cas9...A0A0R1S2S1...prot	964
538	A0A0R1MEL8	Cas9...A0A0R1 MEL8__prot	965
539	A0A0C9Q7U6	Cas9__A0A0C9Q7U6__prot	966
540	A0A179YJ40	Cas9_A0A179YJ40_prot	967
541	C7TEQ6	Cas9_C7TEQ6_prot	968
542	E0NI75	Cas9_E0NI75__prot	969
543	A0A133ZK65	Cas9_A0A 133ZK65_prot	970
544	A0A0R1RRH5	Cas9__.A0.A0R1 RRH5_prot	971
545	E0NJ84	Cas9_E0NJ84„prot	972
546	A0A0R2HZC9	Cas9...A0A0R2HZC9...prot	973
547	A0A180AER3	Cas9__A0A180AER3__prot	974
548	D6GRK4	Cas9_D6GRK4_prot	975
549	A0A1B3WEM9	Cas9_A0A1 B3WEM9_prot	976
550	A0A116L128	Cas9__A0A116L128__prot	977
551	A0A127TRM8	Cas9__A0A127TRM8__prot	978
552	A0A0R1W1T1	Cas9_A0A0R 1W1T1 ...prot	979
553	A0A1A5VIM0	Cas9_A0A1A5VIM0_prot	980
554	K6RXS8	Cas9_K6RXS8__prot	981
555	X0QNI0	Cas9...XQQNI0...prot	982
556	R5WWQ0	Cas9_R5WWQ0_prot	983
557	C7XMU0	Cas9_C7XMU0_prot	984
558	D6LEV9	Cas9__D6LEV9__prot	985

Petição 870190070557, de 24/07/2019, pág. 164/401

100/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
559	A0A128ECZ8	Cas9_A0A128ECZ8_prot	986
560	A0A133NAH6	Cas9..A0A133NAH6...prot	987
561	A0A0X3Y1U5	Cas9_A0A0X3Y1 U5_prot	988
562	A0A116M370	Cas9_A0A116M370__prot	989
563	A0A116KLL2	Cas9...A0AT16KLL2...prot	990
564	A0A1B2IXP8	Cas9...A0A1 B2IXP8__prot	991
565	A0A0R1LCE0	Cas9__A0A0R1 LCEO__prot	992
566	A0A0R1WWN2	Cas9_A0A0R1WWN2_prot	993
567	A0A0C6FZC2	Cas9..A0A0C6FZC2...prot	994
568	A0A127X7N0	Cas9. A0A127X7N0...prot	995
569	A0A1B4Z6K5	Cas9__A0A1 B4Z6K5__prot	996
570	R9LW52	Cas9_R9LW52„prot	997
571	A0A0B2XHU2	Cas9_A0A0B2XH U2_prot	998
572	A0A1B2A6P4	Cas9__A0A1 B2A6P4__prot	999
573	A0A0P6SHS4	Cas9_A0A0P6SHS4_prot	1000
574	A0A0H3BZZ0	Cas9_A0A0H3BZZ0_prot	1001
575	A0A0R1TGJ3	Cas9_A0A0R1TGJ3_prot	1002
576	Q1JLZ6	Cas9_Q 1J LZ6__prot	1003
577	Q48TU5	Cas9__Q48TU5__prot	1004
578	G6CGE4	Cas9_G6CGE4„prot	1005
579	Q1JH43	Cas9_Q 1J H43...prot	1006
580	R5C8N0	Cas9_R5C8N0__prot	1007
581	A0A0R1SN52	Cas9...A0A0R 1 SN52...prot	1008
582	A0A0R2DGS6	Cas9_A0A0R2DGS6_prot	1009
583	A0A0R1SDU2	Cas9_A0A0R1 SDU2_prot	1010
584	A0A0D0YUU5	Cas9__A0A0D0YUU5__prot	1011
585	S9AZZ0	Cas9..S9AZZ0...prot	1012
586	A0A0E1XG84	Cas9.A0A0E1XG84.prot	1013
587	R6ET93	Cas9_R6 ET 93_prot	1014
588	S9BFF6	Cas9_S9BFF6_prot	1015
589	A0A1B3PSQ7	Cas9...A0A1 B3PSQ7...prot	1016
590	A0A137PP63	Cas9_A0A137PP63__prot	1017
591	S9KSN8	Cas9__S9KSN8__prot	1018

Petição 870190070557, de 24/07/2019, pág. 165/401

101/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
592	Q8E042	Cas9__Q8E042__prot	1019
593	S8HGI0	Cas9....S8HGI0...prot	1020
594	S8H4C8	Cas9__S8H4C8_prot	1021
595	F0FD37	Cas9__F0FD37__prot	1022
596	J3JPT0	Cas9_J3JPT0_prot	1023
597	F8Y040	Cas9_F8Y040_prot	1024
598	A0A0R2JE56	Cas9__A0A0R2 J E56__prot	1025
599	A0A1A9E0X4	Cas9__A0A1A9E0X4__prot	1026
600	A0A0E1EMN2	Cas9_A0A0E1 EMN2_prot	1027
601	A0A1C0BC24	Cas9__A0A 1 C0BC24_prot	1028
602	A0A1E2WAR5	Cas9__A0A1 E2WAR5__prot	1029
603	S8FJS0	Cas9_S8FJS0„prot	1030
604	F4FTI2	Cas9_F4FTI2__prot	1031
605	K4Q9P5	Cas9_K4Q9P5__prot	1032
606	M4YX12	Cas9_M4YX12_prot	1033
607	F9HIG7	Cas9__F9HIG7_prot	1034
608	F5WVJ4	Cas9__F5WVJ4__prot	1035
609	D6E761	Cas9__D6E761__prot	1036
610	I0Q2W2	Cas9J0Q2W2__prot	1037
611	C5WH61	Cas9_C5WH61„prot	1038
612	A0A1C2CVQ9	Cas9_A0A1C2CVQ9_prot	1039
613	K8MQ90	Cas9__K8MQ90__prot	1040
614	A0A0R1JG51	Cas9..A0A0R1JG51....prot	1041
615	J9W3C2	Cas9__J9W3C2_prot	1042
616	Q1J6W2	Cas9_Q1 J6W2_prot	1043
617	R5GJ26	Cas9__R5GJ26__prot	1044
618	A0A172Q7S3	Cas9 ,,ΑΟ.ΑΙ 72Q7S3...prot	1045
619	A0A060RIR3	Cas9_A0A060R 1 R3__prot	1046
620	A0A1C5U497	Cas9_A0A1C5U497__prot	1047
621	S5R5C8	Cas9....S5R5C8...prot	1048
622	A0A0W7V6X6	Cas9_A0A0W7V6X6_prot	1049
623	A0A1C5S579	Cas9_A0A1 C5S579__prot	1050
624	A0A125S8J0	Cas9__A0A125S8J0__prot	1051

Petição 870190070557, de 24/07/2019, pág. 166/401

102/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
625	E0PEL3	Cas9_E0PEL3_prot	1052
626	J4K985	Cas9...J4K985...prot	1053
627	U2PI18	Cas9_.U2PI18_.prot	1054
628	G5KAN2	Cas9_G5KAN2_prot	1055
629	Q7P7J1	Cas9_Q7P7J 1_prot	1056
630	A0A0F2D9H7	Cas9_A0A0F2D9H7_prot	1057
631	A0A1D7ZZ65	Cas9_A0A1 D7ZZ65_prot	1058
632	E7FPD8	Cas9_E7FPD8_prot	1059
633	A0A176TM67	Cas9_A0A176TM67_prot	1060
634	G6AFY6	Cas9_G6AFY6_prot	1061
635	E9FPR9	Cas9_E9FPR9_prot	1062
636	I7QXF2	Cas9_.l7QXF2_.prot	1063
637	I0TCL1	Cas9_.IOTCL1_.prot	1064
638	A0A173R3H4	Cas9_A0A173R3H4_prot	1065
639	A0A178KKP5	Cas9_A0A178KKP5_prot	1066
640	H6PBR9	Cas9_.H6PBR9_.prot	1067
641	F4AF10	Cas9_F4AF 10__prot	1068
642	A0A134C7A8	Cas9_A0A134C7A8_prot	1069
643	A0A0R1SG79	Cas9_A0A0R1 SG79_prot	1070
644	A0A0F2DWP8	Cas9_.A0A0F2DWP8_.prot	1071
645	A0A0R1K630	Cas9__A0A0R1 K630_prot	1072
646	A0A135YMA6	Cas9_A0A135YMA6_prot	1073
647	F0I6Z8	Cas9_.FOI6Z8_.prot	1074
648	E9FJ16	Cas9_E9FJ 16..prot	1075
649	C2D302	Cas9_C2 D302_prot	1076
650	Q8E5R9	Cas9_Q8E5R9_prot	1077
651	E8JP81	Cas9_.E8JP81_.prot	1078
652	A0A0R1RHH9	Cas9__A0A0R1 RHH9_prot	1079
653	A0A0F3FWK9	Cas9_A0A0F3FWK9_prot	1080
654	A0A0R2I8Q5	Cas9_A0A0R2l8Q5_prot	1081
655	A0A150NPH1	Cas9_.A0A150NPH1_.prot	1082
656	E7S4M3	Cas9_E7S4M3_prot	1083
657	A0A143ASS0	Cas9_A0A 143ASS0_prot	1084

Petição 870190070557, de 24/07/2019, pág. 167/401

103/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
658	A0A0R2HDR9	Cas9_A0A0R2HDR9_prot	1085
659	A0A0B2JE32	Cas9„-A0A0B2 J E32... prot	1086
660	A0A0R2KUQ3	Cas9_A0A0R2KUQ3__prot	1087
661	A0A0W7V0H0	Cas9_A0A0W7V0H0_prot	1088
662	R6TGA0	Cas9_.R6TGA0_.prot	1089
663	A0A0H5B4T2	Cas9_.A0A0H5B4T2_.prot	1090
664	U2J559	Cas9__U2J559__prot	1091
665	A0A075SSB9	Cas9_A0A075SSB9__prot	1092
666	A0A096B7Z5	Cas9_.A0A096B7Z5.prot	1093
667	L9PS87	Cas9_.L9PS87_.prot	1094
668	A0A134D9V8	Cas9_A0A134D9V8_prot	1095
669	F7UWL3	Cas9_.F7UWL3_.prot	1096
670	G7SP82	Cas9_.G7SP82_.prot	1097
671	A0A0R2E213	Cas9_A0A0R2 E213_prot	1098
672	R7I2K1	Cas9_R7l2K1_prot	1099
673	C0WXA2	Cas9_.C0WXA2_.prot	1100
674	A0A0Z8GCN2	Cas9_.A0A0Z8GCN2_.prot	1101
675	R5GUN8	Cas9_R5G U N 8_prot	1102
676	A0A116RA22	Cas9_A0A116RA22_prot	1103
677	A0A0Z8JWB5	Cas9_.A0A0Z8JWB5_.prot	1104
678	A0A116KAQ7	Cas9__A0A116KAQ7_prot	1105
679	G0M2Gi	Cas9_G0M2G7_prot	1106
680	A0A1C5P5Q5	Cas9_A0A1C5P5Q5_prot	1107
681	A0A0H1TNR9	Cas9_A0A0H 1TN R9__prot	1108
682	F2NB82	Cas9_F2NB82__prot	1109
683	J7TMY5	Cas9_J7TMY5_prot	1110
684	A0A125S8I1	Cas9_.A0A125S8H_.prot	1111
685	A0A078RYQ2	Cas9_.A0A078RYQ2_.prot	1112
686	A0A0F3H9Z9	Cas9_A0A0F3H9Z9_prot	1113
687	E5V117	Cas9_.E5V117_.prot	1114
688	J4TM44	Cas9_J4TM44_prot	1115
689	I7L6U4	Cas9J7L6U4_prot	1116
690	R5J5B2	Cas9_R5J5B2_prot	1117

Petição 870190070557, de 24/07/2019, pág. 168/401

104/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
691	A0A1B2ULM2	Cas9_A0A1 B2ULM2_prot	1118
692	A0A0P6UDU2	Cas9..A0A0P6UDU2...prot	1119
693	V8LSG7	Cas9_V8L.SG7_prot	1120
694	D5BC98	Cas9_D5BC98_prot	1121
695	K0MXA7	Cas9..K0MXA7...prot	1122
696	G9WGU4	Cas9_.G9WGU4_.prot	1123
697	A0A1C2D810	Cas9_A0A 1C2 D810_prot	1124
698	A0A087BJ94	Cas9_A0A087BJ94_prot	1125
699	A0A0R1S4R8	Cas9_.A0A0R1S4R8_.prot	1126
700	E0QLT3	Cas9_.E0QLT3_.prot	1127
701	C4VKS7	Cas9_C4VKS7_prot	1128
702	A9DTN2	Cas9_.A9DTN2_.prot	1129
703	K2PT21	Cas9_.K2PT21_.prot	1130
704	E7RR33	Cas9_E7RR33_prot	1131
705	A0A0N0CU60	Cas9_A0A0N0CU60_prot	1132
706	A0A0P7LUX3	Cas9_.A0A0P7LUX3_.prot	1133
707	R7D1C6	Cas9_R7D1C6_prot	1134
708	V8BZU1	Cas9_V8BZU 1_prot	1135
709	A0A0F4LG72	Cas9_A0A0F4LG72_prot	1136
710	J4KB57	Cas9_.J4KB57_.prot	1137
711	W1U735	Cas9_W1 U735_prot	1138
712	A0A095ZV18	Cas9_A0A095ZV 18_prot	1139
713	R5BUB1	Cas9_.R5BUB1_.prot	1140
714	F2C4I5	Cas9_F2C4l5_prot	1141
715	E1LI65	Cas9_E1LI65_prot	1142
716	A0A0N0UTU1	Cas9._A0A0N0UTU1_.prot	1143
717	C5NZ04	Cas9_.C5NZ04_.prot	1144
718	A0A081Q742	Cas9_.A0A081Q742_.prot	1145
719	A0A0F2DF30	Cas9_A0A0F2DF30_prot	1146
720	A0A0F4LMR6	Cas9_A0A0F4LMR6_prot	1147
721	A0A0E2EBU7	Cas9_A0A0E2EBU7_prot	1148
722	A0A0E2EGB1	Cas9_A0A0E2EGB1_prot	1149
723	A0A0C3A2P0	Cas9_A0A0C3A2P0_prot	1150

Petição 870190070557, de 24/07/2019, pág. 169/401

105/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
724	M2CG59	Cas9_M2CG59_prot	1151
725	R5R3T7	Cas9...R5R3T7..prot	1152
726	D6KPM9	Cas9_D6KPM9_prot	1153
727	U2VD49	Cas9_U2VD49_prot	1154
728	D6S374	Cas9_.D6S374_.prot	1155
729	A0A0R2KGU9	Cas9_A0A0R2 KG U9_prot	1156
730	A0A0F6MNW4	Cas9_A0A0F6M N W4__prot	1157
731	A0A0X3ARL2	Cas9_A0A0X3ARL2_prot	1158
732	A0A088RCP8	Cas9_.A0A088RCP8_.prot	1159
733	S3KPV3	Cas9_.S3KPV3_.prot	1160
734	M2CIC2	Cas9_M2CIC2_prot	1161
735	M2SLU3	Cas9_.M2SLU3_.prot	1162
736	A0A0D4CLL6	Cas9_.A0A0D4CLL6_.prot	1163
737	R6I3U9	Cas9_R6l3U9_prot	1164
738	F5U0T2	Cas9_F5U0T2_prot	1165
739	A0A0F4LIJ0	Cas9_.A0A0F4LIJ0_.prot	1166
740	A0A0N0CQ86	Cas9_.A0A0N0CQ86_.prot	1167
741	I3C2S4	Cas9_l 3C2S4_prot	1168
742	U2QKG2	Cas9_U2QKG2_prot	1169
743	D1YP75	Cas9_.D1YP75_.prot	1170
744	A0A091BLA4	Cas9_A0A091 BLA4_prot	1171
745	A0A100YPE0	Cas9_A0A100YPE0_prot	1172
746	E1LBR5	Cas9_.E1LBR5_.prot	1173
747	R5BD80	Cas9_.R5BD80_.prot	1174
748	W3Y2C1	Cas9_.W3Y2C1_.prot	1175
749	E1QW44	Cas9_E1QW44_prot	1176
750	A0A134A1I6	Cas9_.A0A134A1l6_.prot	1177
751	A0A0F4M7Y5	Cas9_.A0A0F4M7Y5_.prot	1178
752	A0A133YSB7	Cas9_A0A133YSB7_prot	1179
753	A0A089Y508	Cas9_A0A089Y508_prot	1180
754	A0A162CL99	Cas9_A0A 162CL99_.prot	1181
755	A0A133YDF1	Cas9_A0A133YDF1_prot	1182
756	A0A133YY65	Cas9_A0A 133Y Y65_prot	1183

Petição 870190070557, de 24/07/2019, pág. 170/401

106/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
757	A0A0B4S2L0	Cas9_A0A0B4S2L0_prot	1184
758	A0A0R2DLB6	Cas9._A0A0R2DLB6_.piOt	1185
759	A0A0G3MB19	Cas9_A0A0G3MB19_prot	1186
760	A0A0Q3K6A2	Cas9_A0A0Q3K6A2_prot	1187
761	A0A134AG29	Cas9_A0A134AG29_.prot	1188
762	A0A0N1DXX4	Cas9_A0A0N 1 DXX4_prot	1189
763	A0A1E4DZC0	Cas9_A0A1 E4DZC0_prot	1190
764	J9R1Q7	Cas9_J9R1Q7_prot	1191
765	A0A1C4DJV4	Cas9_A0A1 C4DJV4_prot	1192
766	A0A077KK20	Cas9_A0A077KK20_prot	1193
767	A0A085ZZC2	Cas9_A0A085ZZC2_prot	1194
768	W1V0U5	Cas9_W1V0U5_prot	1195
769	A0A0K9XVX7	Cas9_.A0A0K9XVX7_.prot	1196
770	A0A1H5RY71	Cas9_A0A1 H5RY71__prot	1197
771	A0A0J7IGI6	Cas9_A0A0J7IGI6_prot	1198
772	A0A086AYB7	Cas9_A0A086AYB7_prot	1199
773	A0A125S8K4	Cas9_A0A 125S8K4__prot	1200
774	M3INT0	Cas9_M3INT0_prot	1201
775	R5FLM1	Cas9_R5FLM1_prot	1202
776	U5Q7L9	Cas9_U5Q7L9_prot	1203
777	A0A1E3DW10	Cas9_A0A1 E3DW10__prot	1204
778	K0NQV3	Cas9_K0NQV3_prot	1205
779	J2KJ07	Cas9._J2KJ07_.prot	1206
780	A0A0U5KB17	Cas9_A0A0U5KB17_prot	1207
781	A0A0D6ZH65	Cas9_A0A0D6ZH65_prot	1208
782	A0A139PB46	Cas9_A0A139PB46_prot	1209
783	A0A139NVJ1	Cas9_A0A139N VJ 1_prot	1210
784	A0A139NSX3	Cas9_A0A139NSX3_prot	1211
785	E0Q490	Cas9_E0Q490_prot	1212
786	E3ELL7	Cas9_E3EL.L7_.prot	1213
787	A0A061CF22	Cas9_A0A061CF22_prot	1214
788	F3UXG6	Cas9_F3UXG6_prot	1215
789	A0A125S8K2	Cas9_A0A125S8K2_prot	1216

Petição 870190070557, de 24/07/2019, pág. 171/401

107/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
790	A0A0B7IR20	Cas9_A0A0B7l R20_prot	1217
791	A0A174J8H3	Cas9_A0A174J8H3_prot	1218
792	D7IW96	Cas9_D7IW96_prot	1219
793	A0A1A9I5Z1	Cas9_A0A1A9l5Z1_prot	1220
794	W0EYD8	Cas9_W0EYD8_.prot	1221
795	E2N1F9	Cas9__E2N 1 F9__prot	1222
796	D7VKD0	Cas9_D7VKD0_prot	1223
797	R7N9S8	Cas9_R7N9S8_prot	1224
798	C7M7G9	Cas9_C7M7G9_prot	1225
799	J0WLS6	Cas9_J0WLS6_prot	1226
800	A0A174L7S6	Cas9_A0A174L7S6_prot	1227
801	S2KA46	Cas9_.S2KA46_.prot	1228
802	A0A0A2F4C3	Cas9_.A0A0A2F4C3_.prot	1229
803	U2JCC9	Cas9_U2JCC9_prot	1230
804	A0A136MV65	Cas9_A0A136MV65_prot	1231
805	K1M8Y6	Cas9_K1M8Y6_prot	1232
806	F9YQX1	Cas9_.F9YQX1_.prot	1233
807	A0A0B7IQ14	Cas9_A0A0B7IQ14_prot	1234
808	A0A0B7IB79	Cas9_A0A0B7l B79_prot	1235
809	A0A0A2EHM8	Cas9_A0A0A2EHM8_prot	1236
810	A0A173V1H2	Cas9_A0A173V1 H2_.prot	1237
811	R7DKC0	Cas9_R7DKC0_prot	1238
812	U5CHH4	Cas9_U5CHH4_prot	1239
813	L1NKM1	Cas9_.L1NKM1_.prot	1240
814	A0A127VAB0	Cas9_A0A127VAB0__prot	1241
815	D7JGI6	Cas9_D7JGI6_prot	1242
816	A0A0U3BTM1	Cas9_A0.A0U3BTM1_.prot	1243
817	A0A0M4G8J7	Cas9_.A0A0M4G8J7_.prot	1244
818	A0A0A6Y3B0	Cas9_A0A0A6Y3B0_prot	1245
819	A0A015SZB2	Cas9_A0A015SZB2_prot	1246
820	A0A0E2RG29	Cas9_A0A0E2RG29_prot	1247
821	A0A0E2A7Q9	Cas9_A0A0E2A7Q9_prot	1248
822	A0A015Y7X0	Cas9_A0A015Y7X0_prot	1249

Petição 870190070557, de 24/07/2019, pág. 172/401

108/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
823	A0A0E2SQU9	Cas9__A0A0E2SQU9__prot	1250
824	A0A0E2T2C8	Cas9..A0A0E2T2C8..prot	1251
825	A0A017N289	Cas9_A0A017N289__prot	1252
826	A0A015UHU2	Cas9_A0A015U H U2__prot	1253
827	E5C8Y3	Cas9.E5C8Y3.prot	1254
828	C2M5N8	Cas9_.C2M5N8_.prot	1255
829	J4XAP6	Cas9_J4XAP6_prot	1256
830	A0A1B8ZVU5	Cas9_A0A1 B8ZVU5_prot	1257
831	A0A1E5KUU0	Cas9_A0A1 E5KUU0_prot	1258
832	A0A1E9S993	Cas9_.A0A1E9S993_.prot	1259
833	F0P0P2	Cas9_F0 P0 P2_prot	1260
834	B7B6H7	Cas9_.B7B6H7_.prot	1261
835	W1R7X2	Cas9__W1 R7X2_.prot	1262
836	X5KBF9	Cas9_X5KBF9_prot	1263
837	A0A0B7HB18	Cas9_A0A0B7H B18_prot	1264
838	I8UMX3	Cas9_J 8 U MX3_prot	1265
839	L1PRF6	Cas9_L1 PRF6_prot	1266
840	S3CB04	Cas9_S3CB04_prot	1267
841	A0A098LI38	Cas9_A0A098LI38_prot	1268
842	A0A125S8K9	Cas9__A0A125S8K9_prot	1269
843	E6K6M2	Cas9_.E6K6M2_.prot	1270
844	A0A1E5UGK6	Cas9_A0A1 E5UGK6_prot	1271
845	F2IKJ5	Cas9_.F2IKJ5_.prot	1272
846	A0A150XH78	Cas9_A0A150XH78_prot	1273
847	G8X9H3	Cas9_G8X9H3_prot	1274
848	A0A109Q6P7	Cas9_A0A109Q6P7_prot	1275
849	A0A101CFI9	Cas9_.A0A101CFI9_.prot	1276
850	A0A0T0M2G2	Cas9_.A0A0T0M2G2_.prot	1277
851	K1I305	Cas9_K1l305_prot	1278
852	L1P954	Cas9_L1P954_prot	1279
853	J0DFD8	Cas9_J0DFD8_prot	1280
854	H1YII5	Cas9_H1YII5_prot	1281
855	G2Z1C1	Cas9_G2Z1C1_prot	1282

Petição 870190070557, de 24/07/2019, pág. 173/401

109/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
856	A0A1E5TBF5	Cas9_A0A1 E5TBF5_prot	1283
857	A0A0K1NMP1	Cas9_A0A0K1NMP1„prot	1284
858	A0A0E3VRY2	Cas9_A0A0E3VRY2_prot	1285
859	A0A133Q212	Cas9_A0A 133Q212_prot	1286
860	A0A1E4APC4	Cas9__A0A1 E4APC4_.pr ot	1287
861	U2QLH7	Cas9_.U2QLH7_.prot	1288
862	A0A1D3UU01	Cas9__A0A1D3UU01_prot	1289
863	A0A096CIC5	Cas9_A0A096CIC5_prot	1290
864	I4ZCD3	Cas9_J4ZCD3_prot	1291
865	A0A137SV51	Cas9_.A0A137SV51_.prot	1292
866	A0A0X8BZ89	Cas9__A0A0X8BZ89_prot	1293
867	A0A096D253	Cas9..,A0A096D253...prot	1294
868	A0A134B2X0	Cas9__A0A 134B2X0__prot	1295
869	D1W1M7	Cas9_D1W1M7_prot	1296
870	U2LB41	Cas9_U2LB41_prot	1297
871	C9MPM6	Cas9_C9MPM6_prot	1298
872	R7D4J2	Cas9_R7D4J2_prot	1299
873	A0A1C5L2R1	Cas9__A0A1C5L2R1__prot	1300
874	A0A1D3UYE2	Cas9_A0A1 D3UYE2„prot	1301
875	R9I6A5	Cas9_.R9l6A5_.prot	1302
876	A0A0M1W3D2	Cas9__A0A0M 1 W3D2_prot	1303
877	R7NZZ9	Cas9__R7NZZ9_prot	1304
878	A0A0P7AYC1	Cas9..A0A0P7AYC1....prot	1305
879	F3ZS64	Cas9_.F3ZS64_.prot	1306
880	B6W3J8	Cas9_B6W3J8_prot	1307
881	I9UHX4	Cas9_l9UHX4_prot	1308
882	F9DDR2	Cas9_.F9DDR2_.prot	1309
883	A0A069SLB0	Cas9_.A0A069SLB0_.prot	1310
884	K4I9M9	Cas9__K4l9M9__prot	1311
885	F3PY63	Cas9_F3PY63_prot	1312
886	E5WV33	Cas9_E5VW33_prot	1313
887	R5MDQ9	Cas9_R5M DQ9_prot	1314
888	R5K6G6	Cas9_R5K6G6_prot	1315

Petição 870190070557, de 24/07/2019, pág. 174/401

110/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
889	S0FEG1	Cas9__S0FEG1__prot	1316
890	A0A078PYN7	Cas9_A0A078PYN7__prot	1317
891	E5CB73	Cas9_E5CB73_.prot	1318
892	U6RJS5	Cas9_U6RJS5_prot	1319
893	A0A1B7ZF33	Cas9_A0A1 B7ZF33_prot	1320
894	C9RJP1	Cas9_.C9RJP1__prot	1321
895	I8X6S1	Cas9 J 8X6S 1_prot	1322
896	A0A0D0IUN5	Cas9__A0A0D0IUN5_prot	1323
897	E1Z024	Cas9._E1Z024.prot	1324
898	A0A173UDH4	Cas9.. A0A173U DH4_prot	1325
899	A0A0J9G920	Cas9__A0A0J9G920_prot	1326
900	A0A1C2BS21	Cas9_A0A 1C2 BS21 _prot	1327
901	A0A174HS76	Cas9_.A0A174HS76_.prot	1328
902	R6V444	Cas9_R6V444_prot	1329
903	A0A167Y4I1	Cas9__A0A167Y4H__prot	1330
904	R7ZSP8	Cas9._R7ZSP8_.prot	1331
905	W4PXW0	Cas9_W4PXW0_prot	1332
906	U2DMI6	Cas9__U2DMI6__prot	1333
907	W4PHU4	Cas9_W4PHU4_prot	1334
908	I4A2W8	Cas9J4A2W8__prot	1335
909	G8XA12	Cas9_.G8XA 12_.prot	1336
910	A0A1B9E9Q0	Cas9_A0A1 B9E9Q0_prot	1337
911	R5CLM1	Cas9_R5CLM1_prot	1338
912	A0A180FK19	Cas9_A0A 180FK19...prot	1339
913	R6E3D1	Cas9_R6E3D1_prot	1340
914	A0A101CN94	Cas9_A0A101CN94_prot	1341
915	A0A0K8QW18	Cas9_A0A0K8QW18_prot	1342
916	A0A1H6BLP7	Cas9_A0A1 H6BLP7_prot	1343
917	R5ZG15	Cas9_R5ZG 15_prot	1344
918	I0AP30	Cas9J0AP30_prot	1345
935	Q99ZW2	NLS2_STRP1 (SF370)cas9_Q99Z W2_NLS4_prot	1362
936	A0Q5Y3	N LS2_cas9_A0Q5Y3_N LS4_.prot	1363

Petição 870190070557, de 24/07/2019, pág. 175/401

111/306

Fileira	Coluna A No. Ac. Da Proteína	Proteína (Cas9/Cpf1)	Coluna B SEQ ID NO
937	J7RUA5	NLS2__cas9__J7RUA5__NLS4__prot	1364
938	G3ECR1	N LS2...cas9-G3ECR 1 ... N LS4__prot	1365
939	J3F2B0	NL.S2...cas9...J3F2B0...NLS4...prot	1366
940	Q03JI6	N LS2_cas9_Q03J I ©__ N LS4_prot	1367
941	C9X1G5	N LS2_.cas9_.C9X1 G5_N LS4_.prot	1368
942	Q927P4	N LS2_cas9_.Q927P4__N LS4_prot	1369
943	Q8DTE3	NLS2_cas9_Q8DTE3_NLS4_prot	1370
944	Q9CLT2	N LS2_cas9_Q9CLT2_N LS4_prot	1371
945	A1IQ68	NLS2_cas9_A1 IQ68_.NLS4_.prot	1372
946	Q6NKI3	N LS2 ,.cas9.. Q6N Kl 3_N L.S4...prat	1373
947	Q0P897	N LS2_cas9_Q0P897_N LS4_prot	1374
948	Q03LF7	NLS2_cas9_.Q03LF7_.NLS4._.prot	1375

[0184] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção que compreende uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 como definido pelo número de acesso do banco de dados provido sob a respectiva coluna na Tabela 2 ou um homólogo, variante, fragmento ou derivado da mesma. Em particular, a proteína Cas9 codificada pode compreender ou consistir preferivelmente em uma sequência de aminoácido como indicado sob a respectiva coluna na Tabela 2 ou um homólogo, variante, fragmento ou derivado da mesma.

[0185] Especificamente, em modalidades preferidas da invenção a molécula de ácido nucleico artificial pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma das SEQ ID NOs: 428-1375, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo

Petição 870190070557, de 24/07/2019, pág. 176/401

112/306 menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0186] Em particular, a proteínas Cas9 codificada pode compreender preferivelmente pelo menos um sinal de localização nuclear (NLS), mais preferivelmente dois NLS selecionados de NLS2 e NLS4 como acima definido. Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 com sinais de localização nucleares, compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma das SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou SEQ ID NOs: 12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0187] Variantes de Cas9 funcionais preferidas compreendidas aqui incluem inter alia, mortaCas9 (dCas9) e nickases de Cas9.

[0188] O termo dCas9 refere-se a uma Cas9 com nuclease desa

Petição 870190070557, de 24/07/2019, pág. 177/401

113/306 tivada, também chamada cataliticamente inativa, Cas9 cataliticamente morta ou cas9 morta. Tais nucleases são isentas de toda ou uma porção de atividade de endonuclease e podem então ser usadas para regular genes de uma maneira guiada por RNA (Jinek, M. e outros. Science. 2012 Ago 17;337(6096):816-21). Nucleases dCas9 compreendem mutações que inativam atividade de endonuclease de Cas9, tipicamente em ambos os resíduos catalíticos (D10A no domínio RuvC-1 e H840A no domínio HNH, numeradas com relação à Cas9 de S. pyogenes, isto é, spCas9). Outros resíduos catalíticos podem, no entanto, ser mutados a fim de reduzir a atividade de um ou ambos os domínios de nuclease, dCas9 é preferivelmente incapaz de clivar dsDNA, mas retém sua habilidade em se associar com gRNAs adequados e especificamente se ligar a DNA-alvo. O mutante duplo de Cas9 com mudanças em posições de aminoácido D10A e H840A inativa completamente ambas as atividades de nuclease e nickase. Derivados de Cas9 baseados em dCas9 podem ser usados para transportar domínios efetores adicionais para uma sequência de DNA-alvo, desta maneira induzindo, por exemplo, CRISPRa ou CRISPR! (como discutido em algum outro ponto aqui).

[0189] O termo nickase de Cas9 refere-se a variantes de Cas9 que não retêm a habilidade de introduzir quebras de filamento duplo em uma sequência de ácido nucleico-alvo, mas mantêm a habilidade de se ligar a e introduzir uma quebra de filamento simples em um sítio-alvo. Tais variantes incluirão tipicamente uma mutação em um, mas não em ambos, os domínios de endonuclease Cas9 (HNH e RuvC). Desta maneira, uma mutação de aminoácido na posição D10A ou H840A em Cas, numerada em relação à Cas9 de S. pyogenes), isto é, spCas9, pode resultar na inativação da atividade catalítica de nuclease e converte Cas9 em uma nickase.

[0190] Variantes de Cas9 adicionais são conhecidas na técnica e

Petição 870190070557, de 24/07/2019, pág. 178/401

114/306 compreendidas como variantes de acordo com a presente invenção. O Pedido de Patente U.S. No. 20140273226 discute o gene Cas9 de S. pyogenes, proteína Cas9 e variantes da proteína Cas9 incluindo sequências de codificação de Cas9 otimizadas no códon específicas de hospedeiro e proteínas de fusão Cas9. O Pedido de Patente U.S. 20140315985 ensina um número grande de polipeptídeos Cas9 do tipo selvagem exemplares (por exemplo, SEQ ID NO: 1-256, SEQ ID NOS: 795-1346 do Pedido de Patente U.S> No. 20140273226) incluindo a sequência de Cas9 de S. pyogenes (SEQ ID NO: 8 do Pedido de Patente U.S. No. 20140273226). Modificações e variantes de proteínas Cas9 são também discutidas. A descrição das presentes referências é incorporada aqui em sua totalidade.

[0191] Em modalidades adicionais, ácidos nuclelcos artificiais de acordo com a invenção codificam uma proteína Cas9, ou uma isoforma, homólogo, variante, fragmento ou derivado da mesma, como indicado na Tabela 2 do PCT/EP2017/076775, que é aqui incorporado a título de referência em sua totalidade. Por exemplo, os ácidos nucleicos artificiais da invenção podem então compreender pelo menos uma sequência de codificação codificando uma proteína Cas9 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma da SEQ ID NOs: 428-1345 ou 1362-1375do PCT/EP2017/076775 ou uma isoforma, homólogo, variante, fragmento ou derivado (funcional) da mesma.

Sequências de ácido nucleico [0192] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 como aqui definido, em que a dita sequência de ácido nucleico é definida por qualquer uma de SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114

Petição 870190070557, de 24/07/2019, pág. 179/401

115/306

8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 35543567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 36503663; 3666-3679; 3682-3695; 9514-9527: 9626-9639; 9738-9751; 98509863; 9962-9975, 10074-10087; 10186-10199; 10298-10311 ;23302343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 24262439; 2442-2455; 2458-2471; 2474-2487: 2490-2503; 2506-2519; 25222535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 1020210215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 1001 ΟΙ 0023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 81468159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 82428255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 95789591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250-10263: 10362-10375; 9290-9303; 9306-9319; 9322-9335; 93389351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 94349447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; 27; 996-1009; 2156-2169; 3316-3329; 4476-4489; 56365649; 6796-6809; 7956-7969; 1010- 1913; 2170-3073; 3330-4233; 4490-5393; 5650-6553; 6810-7713; 7970-8873, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma

Petição 870190070557, de 24/07/2019, pág. 180/401

116/306 sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0193] Em modalidades preferidas, os ácidos nucleicos artificiais da invenção codificam ainda, em sua região de codificação, pelo menos um sinal de localização nuclear. A sequência de ácido nucleico codificando o(s) slnal(ais) de localização nuclear é preferivelmente fundida ao ácido nucleico codificando a proteína Cas9, ou um homólogo, variante, fragmento ou derivado da mesma, como aqui definido, de modo a facilitar transporte da dita proteína Cas9, ou seu homólogo, variante, fragmento ou derivado da mesma, para o núcleo. Em modalidades preferidas, os ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas9, ou um homólogo, variante, fragmento ou derivado da mesma, fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NOs: 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988; 11990-11996; 1199812004; 12006-12012; 12014-12020 ou qualquer sequência de ácido nucleico codificando a proteínas de SEQ ID NOs: 12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, In particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%,

Petição 870190070557, de 24/07/2019, pág. 181/401

117/306

80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0194] A presente invenção compreende a combinação benéfica de regiões de codificação de proteína associada à CRISPR com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucieico codificando uma proteína Cas9 ou um homóiogo, variante, fragmente ou derivado da mesma fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 101/ΟΙ 0183-10282-10295: 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994

Petição 870190070557, de 24/07/2019, pág. 182/401

118/306

10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 69866999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 1012210135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 81628175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 82588271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 96909703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular sequências de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0195] A presente invenção compreende a combinação benéfica de regiões de codificação de proteína associada a CRISPR com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas9 ou um homólogo, variante, fragmento ou derivado da mesma fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer SEQ ID NO selecionada do grupo consistindo em SEQ

Petição 870190070557, de 24/07/2019, pág. 183/401

119/306

ID NO: 14274, SEQ ID NO: 14275, SEQ ID NO: 14276, SEQ ID NO: 14277, SEQ ID NO: 14278, SEQ ID NO: 14279, SEQ ID NO: 14280, SEQ ID NO: 14281 e SEQ ID NO: 14282; mais preferivelmente SEQ ID NO: 14281, SEQ ID NO: 417 (HSD17B4/PSMB3.1 i.e. construto HSD17B4_ NLS2..STRP1 (SF370)-cas9_HsOpt_NLS4_PSMB3.1; Hsopt - otimização de Homo sapiens) ou SEQ ID NO:414 (Slc7a3.1 / Gnasl, i.e. construto Scl7a3.1__NLS2_STRP1(SF370)-cas9__HsOpt_NLS4_Gnas.1).

[0196] Vantajosamente, qualquer sequência de Cas9 como revelado pode ser selecionada para uso na invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cas9 e mRNAs codificando versões diferentes das respectivas sequências de proteína Cas9, isto é, sequências do tipo selvagem ou otimizadas.

[0197] Ainda, a excisão precisa do Trato CAG do Gene da Huntingtina por nickase de Cas9 está compreendida nos ensinamentos da presente invenção com referência a PMID 29535594, que é aqui incorporado a título de referência. Também, a divagem de RNA programável e reconhecimento por um Sistema CRISPR-Cas9 natural de Neisseria meningitidis está compreendida nos ensinamentos da invenção com referência a PMID 29456189 que é aqui incorporado a título de referência. Ainda, ligação e divagem dependente de RNA de CRISPR de RNAs endógenos pela Cas9 de Campylobacter jejuni são compreendidas nos ensinamentos da invenção com referência a PMID 29499139 que é aqui incorporado a título de referência. Também ativação de gene alvo in vivo através de modulação transepigenética mediada por CRISPR/Cas9 é compreendida nos ensinamentos da invenção, com referência ao PMID 29224783, que é aqui incorporado a título de referência.

[0198] Em uma modalidade adicional, a presente invenção compreende também as sequências de ácido nucleico como mostrado na Tabela 2A.

Petição 870190070557, de 24/07/2019, pág. 184/401

120/306

Tabela 2A. Sequências de Cas9 otimizadas preferidas adicionais da in venção

5‘ UTR	Cas9 incl. NLS	3‘UTR	SEQ ID NO
Slc7a3.1	N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4	Gnas.1	14521
Ubqln2.1	N LS2J5TRP1 (SF370)-cas9(opt1 )_N LS4	RPS9.1	14522
HSD17B4	N LS2JSTRP 1 (SF370)-cas9(opt1 )__N LS4	PSBM3	14523
HSD17B4	N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4	Gnas.1	14524
Nosip.1	N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4	Ndufa1.1	14525
Mp68	N LS2JSTRP 1 (SF370)-cas9(opt1 )__N LS4	Gnas.1	14526
Mp68	N LS2_STRP 1 (SF370)-cas9(opt1 )_N LS4	Ndufa1.1	14527
Slc7a3.1	N LS2_STRP1 (SF370)-cas9(opt2)__N LS4	Gnas.1	14528
Ubqln2.1	N LS2JSTRP1 (SF370)-cas9(opt2)...N LS4	RPS9.1	14529
HSD17B4	N LS2_STRP 1 (SF370)-cas9(opt2)_N LS4	PSBM3	14530
HSD17B4	N LS2__STRP 1 (SF370)-cas9(opt2)_N LS4	Gnas.1	14531
Nosip.1	N LS2JSTRP1 (SF370)-cas9(opt2)...N LS4	Ndufa1.1	14532
Mp68	N LS2__STRP 1 (SF370)~cas9(opt2)_N LS4	Gnas.1	14533
Mp68	N LS2__STRP 1 (SF370)-cas9(opt2)_N LS4	Ndufa1.1	14534
Slc7a3.1	N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4	Gnas.1	14535
Ubqln2.1	N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4	RPS9.1	14536
HSD17B4	N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4	PSBM3	14537
HSD17B4	N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4	Gnas.1	14538
Nosip.1	N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4	Ndufa1.1	14539
Mp68	N LS2_STRP1 (SF370)-cas9(opt10)_N LS4	Gnas.1	14540
Mp68	N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4	Ndufa1.1	14541

[0199] Em uma modalidade adicional, NLS2JSTRP1(SF370)~ cas9JHsOptJ\ILS4 (SEQ ID NO: 412) é combinada com as combinações de UTR como mostrado na Tabela 2A, isto é, com Slc7a3.1 (SEQ ID NO: 15/16) / Gnas.1 (SEQ ID NO: 29/30).

Tabela 2B. Sequências de Cas9 preferidas adicionais da invenção

5‘ UTR	Cas9 (Hsopt) íncl. NLS	3‘UTR	SEQ ID NO
Slc7a3.1	NLS2__STRP1(SF370)-cas9__HsOpt__NLS4	Gnas.1	414
Ubqln2.1	NLS2_STRP1(SF370)-cas9_HsOpt_NLS4	RPS9.1	14542
HSD17B4(V2)	NLS2_STRP1(SF370)-cas9_HsOpt_NLS4	PSBM3	417
HSD17B4ÍV2)	NLS2_STRP1(SF370)-cas9_HsOpt_NLS4	Gnas.1	14543
Nosip.1	NLS2_STRP1(SF370)-cas9_HsOpt_NLS4	Ndufa1.1	14544
Mp68	NLS2_STRP1(SF370)~cas9_HsOpt_NLS4	Gnas.1	14545
Mp68	NLS2_STRP1(SF370)-cas9_HsOpt_NLS4	Ndufa1.1	14546

[0200] Em modalidades adicionais, as sequências de ácido nucleico

Petição 870190070557, de 24/07/2019, pág. 185/401

121/306 artificiais de acordo com a invenção podem compreender ou consistir em sequências de ácido nucleico de acordo com SEQ ID NOs: 1380 1393; 1394 - 2297; 2314™ 2327; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458

- 2471; 2474 - 2487; 2490 - 2503; 2506 - 2519; 2522 - 2535; 9498 -9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 - 10295; 2540 - 2553; 2554 - 3457; 3474 3887; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650

- 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 -10087; 10186-10199; 10298 -10311; 3700 - 3713; 3714 - 4617; 4634 - 4647; 4650 - 4663; 4666 - 4679; 4682

- 4695; 4698 -4711; 4714 - 4727; 4730 - 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530

- 9543; 9642 - 9655; 9754 -9767; 9866 -9879; 9978 - 9991; 10090 10103; 10202 - 10215; 10314-10327; 4860 - 4873; 4874-5777; 5794

- 5807; 5810 - 5823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 - 5999; 6002 - 6015; 9546 - 9559; 9658 - 9671; 9770

- 9783; 9882 - 9895; 9994 - 10007; 10106-10119; 10218 - 10231; 10330 - 10343; 6020 - 6033; 6034 - 6937; 6954 - 6967; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 -7079; 7082-7095; 7098 - 7111; 7114 - 7127; 7130-7143; 7146-7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010

- 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 7180 - 7193; 7194-8097; 8114-8127; 8130-8143; 8146-8159; 8162-8175; 8178

- 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322 - 8335; 9578 - 9591; 9690 -9703; 9802-9815; 9914-9927; 10026- 10039; 10138-10151; 10250 -10263; 10362 - 10375; 8340 - 8353; 8354 - 9257; 9274 - 9287; 9290

Petição 870190070557, de 24/07/2019, pág. 186/401

122/306

- 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 - 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466

- 9479; 9482 - 9495; 9594 -9607: 9706 - 9719; 9818-9831; 9930 - 9943; 10042 - 10055; 10154 - 10167; 10266 - 10279; 10378 -- 10391; 411; 1380 - 1393; 2540 - 2553; 3700 - 3713; 4860 - 4873; 6020 - 6033; 7180

- 7193; 8340 - 8353; 1394 - 2297; 2554 - 3457; 3714 - 4617; 4874 5777; 6034 - 6937; 7194 - 8097; 8354 - 9257; 2314 - 2327; 3474 - 3887 : 4634-4647; 5794-5807; 6954-6967; 8114-8127; 9274-9287; 413

- 425; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458 - 2471; 2474 - 2487; 2490

- 2503; 2506 - 2519; 2522 - 2535; 9498 -9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 10295; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650

- 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 -10087; 10186-10199; 10298 -10311; 4650 - 4663; 4666 - 4679; 4682 - 4695; 4698 -4711; 4714 - 4727; 4730

- 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530 - 9543; 9642 - 9655; 9754 -9767; 9866 9879; 9978-9991; 10090- 10103; 10202- 10215; 10314- 10327; 58105823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 - 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 -

QA71 - Q77H Q7&^- QO0O QftQfv OUUZ - oulu, ~ í, ~ - destra,

9994 -10007; 10106 -10119; 10218 - 10231; 10330 -10343; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 7079; 7082- 7095; 7098- 7111; 7114-7127; 7130- 7143; 7146- 7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 8130 - 8143; 8146

- 8159; 8162 - 8175; 8178 - 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322

Petição 870190070557, de 24/07/2019, pág. 187/401

123/306

8335: 9578 - 9591; 9690 - 9703; 9802 - 9815; 9914 - 9927; 10026 -10039; 10138-10151; 10250 -10263; 10362 - 10375; 9290 - 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466 - 9479; 9482 - 9495; 9594 -9607; 9706 - 9719; 9818 - 9831; 9930 - 9943; 10042 -10055; 10154 - 10167; 10266 - 10279; 10378 - 10391 do PCT/EP2017/076775 ou homólogos, fragmentos, variantes ou derivados (funcionais) das mesmas. Cpf1 [0201 ] Cpf1 (CRISPR de Prevctelia e Frandsella 1) ou ”Cas12” refere-se a endonucleases de DNA guiadas por RNA, que pertencem aos sistemas CRiSPR-Cas tipo V classe 2 putativos (Zetsche e outros, Cell. 2015 Out 22; 163(3): 759-771) e homólogos, variantes, fragmentos e derivados das mesmas. Genes codificando Cpr1 incluem o gene cpf1 de Frandsella tuíarensís subsp. novidda (cepa U112) (Sequência de Referência NCBI: NZ_CP009633.1, AW25_RS03035) ou homólogos, variantes ou fragmentos do mesmo. Com base em análise de sequência, Cpf1 contém apenas um domínio de endonuclease RuvC, e um segundo domínio de nuclease (NUC) novo putativo (Zetsche e outros, Cell. 2015 Out 22; 163(3): 759-771, Gao e outros, Cell Res. 2016 Ago;26(8):901-13).

[0202] Proteínas Cpf1 preferivelmente se associam com um crRNA formando um complexo Cpf1 :crRNA que é preferivelmente capaz de interagir especificamente com uma sequência de DNA-alvo. Complexos de Cpf1 :crRNA são preferivelmente capazes de clivar eficientemente DNAalvo seguido por um motivo adjacente protoespaçador rico em T curto (PAM) localizado 5’ do DNA-alvo, e podem introduzir quebras de filamento duplo de DNA escalonado com uma sobreposição 5’ de 4 ou 5-nt.

Seguêndas de aminoáddo [0203] Várias proteínas Cpf1 são conhecidas na técnica e são compreendidas como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cpf1 adequadas são listadas na Tabela 3

Petição 870190070557, de 24/07/2019, pág. 188/401

124/306 abaixo. Nela, cada fileira corresponde a uma proteína Cpf1 como identificado por seu número de acesso no banco de dados (primeira coluna, A, No. Ac.). A segunda coluna na Tabela 3 (B) indica a SEQ ID NO: correspondendo à respectiva sequência de aminoácido conforme provido aqui. Proteínas Cpf1 preferidas são mostradas na listagem de sequência sob SEQ ID NOs: 1346-1347; 10576-10577; e1348-1361. As sequências de mRNA otimizadas correspondentes que sâo modalidade preferida da invenção são mostradas na listagem de sequência sob SEQ ID NO: 10552; 3458-3459; 3460-34732298-2299; 4618-4619;

5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; e 9260-9273.

Tabela 3. Proteínas Cpf1

	Coluna A	Coluna B
Fileira	No. Ac.	SEQ ID NO
1	U2UMQ6	1346
2	A0Q7Q2	1347
3	A8WNM2	1348
4	E3LGD2	1349
5	A0A182DWE3	1350
6	A0A0B6KQP9	1351
7	A0A0E1N6W4	1352
8	V6HCU8	1353
9	A0A0E1N9S2	1354
10	A0A1B8PW75	1355
11	A0A1J0L0B6	1356
12	A0A1F3JTA5	1357
13	A0A1G2R4W1	1358
14	A0A1F5S360	1359
15	A0A1F5ENJ2	1360
16	A0A1J4U637	1361
17	U2UMQ6 (NLS2___cpf1__U2UMQ6__NLS4__prot)	1376
18	A0Q7Q2 (NLS2__cpf1__A0Q7Q2__NLS4__prot)	1377

Petição 870190070557, de 24/07/2019, pág. 189/401

125/306 [0204] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção então compreende uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 como definido pelo número de acesso no banco de dados provido sob a respectiva coluna na Tabela 3, ou um homólogo, variante, fragmento ou derivado da mesma. Em particular, a proteína Cpf1 codificada pode compreender ou consistir preferivelmente em uma sequência de aminoácido como indicado sob a respectiva coluna na Tabela 3, ou um homólogo, variante, fragmento ou derivado da mesma.

[0205] Especificamente, em modalidades preferidas a molécula de ácido nucleico artificial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma de SEQ ID NO: 1346-1347; 10576-10577; ou 1348-1361, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0206] Em particular, a proteína Cpf1 codificada pode compreender preferivelmente pelo menos um sinal de localização nuclear (NLS), mais preferivelmente dois NLS selecionados de NLS2 e NLS4 como acima definido. Em modalidades preferidas, a molécula de ácido nucleico arti

Petição 870190070557, de 24/07/2019, pág. 190/401

126/306 ficial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 com sinais de localização nuclear, compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma de SEQ ID NOs: 992-993 ou um homólogo, variante, fragmento ou derivado (funcional) do mesmo compreendendo ou consistindo em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0207] Em modalidades adicionais, ácidos nucleicos artificiais de acordo com a invenção codificam uma proteína Cpf1, ou uma isoforma, homólogo, variante, fragmento ou derivado da mesma, como indicado na Tabela 3 do PCT/EP2017/076775, que é aqui incorporado a título de referência em sua totalidade. Especificamente, a molécula de ácido nucleico artificial (RNA) da invenção pode então compreender uma sequência de codificação codificando uma proteína Cpf1 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma SEQ ID NOs: 1346-1361 ou 1376-1377 ou 10576-10577 do PCT/EP2017/076775 ou uma isoforma, homólogo, variante, fragmento ou derivado (funcional) da mesma.

Sequências de ácido nucleico [0208] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico

Petição 870190070557, de 24/07/2019, pág. 191/401

127/306 codificando uma proteína Cpf1 como definido aqui, em que a dita sequência de ácido nucleico é definida por qualquer uma das SEQ ID NOs: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 1008810089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 1007210073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 1010410105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 1012010121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 70487049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 71447145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912

Petição 870190070557, de 24/07/2019, pág. 192/401

128/306

9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525: 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377;

10407; 10414;	10421;	10428;	10435;	10442;	10449;	10456;	10463;
10470; 10477;	10484;	10491;	10498;	10505;	10512;	10519;	10526;
10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583;	10579-
10580; 10585-10586;	10588-10589;	10591	-10592;	10594-10595;
10597-10598;	10554-10574; 10601;	10602;	10615;	10616;	10629;
10630; 10643;	10644;	10657;	10658;	10671;	10672;	10685;	10686;
10699; 10700;	10713;	10714;	10727;	10728;	10741;	10742;	10755;
10756; 10769;	10770;	10783;	10784;	10797;	10798;	10811;	10812;
10825; 10826;	10839;	10840;	10853;	10854;	10867;	10868;	10881;
10882; 10603;	10604;	10617;	10618;	10631;	10632;	10645;	10646;
10659; 10660;	10673;	10674;	10687;	10688;	10701;	10702;	10715;
10716; 10729;	10730;	10743;	10744;	10757;	10758;	10771;	10772;
10785; 10786;	10799;	10800;	10813;	10814;	10827;	10828;	10841;
10842; 10855;	10856;	10869;	10870;	10883;	10884;	10605;	10606;
10619; 10620;	10633;	10634;	10647;	10648;	10661;	10662;	10675;
10676; 10689;	10690;	10703;	10704;	10717;	10718;	10731;	10732;
10745; 10746;	10759;	10760;	10773;	10774;	10787;	10788;	10801;
10802; 10815;	10816;	10829;	10830;	10843;	10844;	10857;	10858;
10871; 10872;	10885;	10886;	10607;	10608;	10621;	10622;	10635;
10636; 10649;	10650;	10663;	10664;	10677;	10678;	10691;	10692;
10705; 10706;	10719;	10720;	10733;	10734;	10747;	10748;	10761;
10762; 10775;	10776;	10789;	10790;	10803;	10804;	10817;	10818;
10831; 10832;	10845;	10846;	10859;	10860;	10873;	10874;	10887;

Petição 870190070557, de 24/07/2019, pág. 193/401

129/306

10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;

10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;

10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777: 10778;

10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;

10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;

10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668: 10681;

10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;

10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;

10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;

10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352

9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548; ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0209] Em uma outra modalidade preferida, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 como aqui definido, em que a dita sequência de ácido nucleico é definida por qualquer uma da SEQ ID

Petição 870190070557, de 24/07/2019, pág. 194/401

130/306

NO: 10549 (i.e. AsCpfl 32L4__AsCpf1(Hsopt)-NLS3-3xHA-tag_albumina7) ou SEQ ID NO: 10550 (i.e. LbCpfl = 32L4....LbCpf1(Hsopt)NLS3-3xHA-tag_albumina7); ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0210] Em modalidades preferidas, os ácidos nucleicos artificiais da invenção codificam ainda, em sua região de codificação, pelo menos um sinal de localização nuclear. A sequência de ácido nucleico codificando o(s) sinal(ais) de localização nuclear é preferivelmente fundida ao ácido nucleico codificando a proteína Cpf1, ou seu homólogo, variante, fragmento ou derivado, como definido aqui, de modo a facilitar transporte da dita proteína Cpf 1, ou seu homólogo, variante, fragmento ou derivado, para o núcleo. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cpf 1, ou seu homólogo, fragmento, variante ou derivado, fundida a pelo menos um sinal de localização, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NOs: 10551; 10581; 10593; 10584; 10587; 10590; 10593; 10596; 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988;

Petição 870190070557, de 24/07/2019, pág. 195/401

131/306

11990-11996; 11998-12004; 12006-12012; 12014-12020 ou sequências de ácido nucleico codificando qualquer uma de uma combinação de SEQ ID NO:12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0211] Vantajosamente, as sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como Cpf1, ou seus homólogos, variantes, fragmentos ou derivados, são combinadas com a região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, os ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cpf1, ou um homólogo, variante ou fragmento da mesma, que são fundidos ainda a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID Nos: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 1008810089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487;

Petição 870190070557, de 24/07/2019, pág. 196/401

132/306

10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 1007210073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479: 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 1010410105; 10216-10217; 10328-10329; 10404: 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5Ο/Π ΚΟ/Ν· &QE& CQE7- £0*70 COQÔ· EQfM CCiAC SQOA ΕΩΟ-1· o4U~Oo41, bobo-bob/, bo/z-ba/o, booo-booy, byU4~byub, byzU~byzl, 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 1012010121; 10232-10233; 10344-10345; 10405: 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 70487049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 71447145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 99129913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526;

Petição 870190070557, de 24/07/2019, pág. 197/401

133/306

10533;	10540;	10547; ^!	9288-9289; 10401; 10553: 10582-1058310579-
10580;	10585-10586;	10588-10589; 10591-10592; 10594-10595;
10597-10598;	10554-10574; 10601; 10602; 10615; 10616; 10629;
10630;	10643;	10644;	10657; 10658; 10671; 10672; 10685; 10686;
10699;	10700;	10713;	10714; 10727; 10728; 10741; 10742; 10755;
10756;	10769;	10770;	10783; 10784; 10797; 10798; 10811; 10812;
10825;	10826;	10839;	10840; 10853; 10854; 10867; 10868; 10881;
10882	10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646;
10659;	10660;	10673;	10674; 10687; 10688; 10701; 10702: 10715;
10716;	10729;	10730;	10743; 10744; 10757; 10758; 10771; 10772;
10785;	10786;	10799;	10800; 10813; 10814; 10827; 10828; 10841;
10842;	10855;	10856;	10869; 10870; 10883; 10884; 10605: 10606;
10619;	10620;	10633;	10634; 10647; 10648; 10661; 10662; 10675;
10676;	10689;	10690;	10703; 10704; 10717; 10718; 10731; 10732;
10745;	10746;	10759;	10760; 10773; 10774; 10787; 10788: 10801;
10802;	10815;	10816;	10829; 10830; 10843; 10844; 10857; 10858;
10871;	10872;	10885;	10886; 10607; 10608; 10621; 10622; 10635;
10636;	10649;	10650;	10663; 10664; 10677; 10678; 10691: 10692;
10705;	10706;	10719;	10720; 10733; 10734; 10747; 10748; 10761;
10762;	10775;	10776;	10789; 10790; 10803; 10804; 10817; 10818;
10831;	10832;	10845;	10846; 10859; 10860; 10873; 10874: 10887;
10888;	10609;	10610;	10623; 10624; 10637; 10638; 10651; 10652;
10665;	10666;	10679;	10680; 10693; 10694; 10707; 10708; 10721;
10722;	10735;	10736;	10749; 10750; 10763; 10764; 10777; 10778;
10791;	10792;	10805;	10806; 10819; 10820; 10833; 10834; 10847;
10848;	10861;	10862;	10875; 10876; 10889; 10890; 10611; 10612;
10625;	10626;	10639;	10640; 10653; 10654; 10667; 10668; 10681;
10682;	10695;	10696;	10709; 10710; 10723; 10724; 10737; 10738;
10751;	10752;	10765;	10766; 10779; 10780; 10793; 10794; 10807;
10808;	10821;	10822;	10835; 10836; 10849; 10850; 10863; 10864;

Petição 870190070557, de 24/07/2019, pág. 198/401

134/306

10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0212] Vantajosamente, qualquer sequência de Cpf1 como aqui revelado pode ser selecionada para uso na invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cpf1 e mRNAs codificando versões diferentes das respectivas sequências de proteína Cpf1, isto é, sequências do tipo selvagem ou otimizadas.

[0213] Em modalidades adicionais, as sequências de ácido nucleico artificiais de acordo com a invenção podem compreender ou consistir em uma sequência de ácido nucleico de acordo com SEQ ID NOs: 2298 - 2299; 3458 - 3459; 4618 - 4619; 5778 - 5779; 6938 - 6939; 8098 8099; 9258 - 9259; 2300 - 2313; 3460 - 3473; 4620 - 4633; 5780 5793; 6940 - 6953; 8100 - 8113; 9260 - 9273; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 2344 - 2345;

Petição 870190070557, de 24/07/2019, pág. 199/401

135/306

2360 - 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440

- 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960

- 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584 - 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664

- 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864 - 9865; 9976 - 9977; 10088 -10089; 10200 -10201; 10312 -10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656

- 9657; 9768-9769; 9880 - 9881; 9992 - 9993; 10104- 10105; 10216 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; ARRR - ARA7· AR79 - AR7R- ARRR - ARRQ- RQf)4 - RQDA· - RQ91 AQRR

- 5937; 5952 - 5953; 5968 - 5969; 5984 - 5985; 6000 - 6001; 6016 - 6017; 9560 - 9561; 9672 - 9673; 9784 - 9785; 9896 - 9897; 10008 - 10009; 10120-10121; 10232 - 10233; 10344 - 10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 6984 - 6985; 7000 - 7001; 1016 - 7017; 7032 - 7033; 7048 - 7049; 7064 -7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160 - 7161; 7176 - 7177; 9576 - 9577; 9688 - 9689; 9800 - 9801; 9912

- 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462;

Petição 870190070557, de 24/07/2019, pág. 200/401

136/306

10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704

- 9705; 9816-9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264

- 10265; 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304-9305; 9320-9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416

- 9417; 9432 - 9433; 9448 - 9449; 9464 - 9465; 9480 - 9481; 9496 - 9497; 9608 - 9609; 9720 - 9721; 9832 - 9833; 9944 - 9945; 10056 - 10057;

10168 - 10169;	10280	- 10281;	10392	- 10393	10408;	10415;	10422
10429; 10436;	10443;	10450;	10457;	10464;	10471;	10478;	10485
10492; 10499;	10506;	10513;	10520;	10527;	10534;	10541;	10548
10552; 10594 -	10595;	10582 -	10583;	10585 -	10586;	10588 -	10589
10591 - 10592;	10594	- 10595;	10597	- 10598	10553	10599;	10600
10613; 10614;	10627;	10628;	10641;	10642;	10655;	10656;	10669
10670; 10683;	10684;	10697;	10698;	10711;	10712;	10725;	10726
10739; 10740;	10753;	10754;	10767;	10768;	10781;	10782;	10795
10796; 10809;	10810;	10823;	10824;	10837;	10838;	10851;	10852
10865; 10866;	10879;	10880;	10601;	10602;	10615;	10616;	10629
10630; 10643;	10644;	10657;	10658;	10671;	10672;	10685;	10686
10699; 10700;	10713;	10714;	10727;	10728;	10741;	10742;	10755
10756; 10769;	10770;	10783;	10784;	10797;	10798;	10811;	10812
10825; 10826;	10839;	10840;	10853;	10854;	10867;	10868;	10881
10882; 10603;	10604;	10617;	10618;	10631;	10632;	10645;	10646
10659; 10660;	10673;	10674;	10687;	10688;	10701;	10702;	10715
10716; 10729;	10730;	10743;	10744;	10757;	10758;	10771;	10772
10785; 10786;	10799;	10800;	10813;	10814;	10827;	10828;	10841
10842; 10855;	10856;	10869;	10870;	10883;	10884;	10605;	10606

Petição 870190070557, de 24/07/2019, pág. 201/401

137/306

10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;

10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;

10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788: 10801;

10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;

10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;

10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691: 10692;

10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;

10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;

10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;

10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;

10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;

10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;

10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;

10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;

10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;

10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;

10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;

10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;

10877; 10878; 10891; 10892; 2298 - 2299; 3458 - 3459; 4618 - 4619; 577A £x77Q- QOhO *

2313; 3460 - 3473; 4620 - 4633; 5780 - 5793; 6940 - 6953; 8100-8113; 9260 - 9273; 2314 - 2327; 3474 - 3887 ; 4634 - 4647; 5794 - 5807; 6954 - 6967; 8114 - 8127; 9274 - 9287; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 - 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 10553; 2344 - 2345; 2360 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440 - 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960 - 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479;

Petição 870190070557, de 24/07/2019, pág. 202/401

138/306

10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584

- 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664 - 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864

- 9865; 9976 - 9977; 10088 - 10089; 10200 - 10201; 10312 - 10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656 -9657; 9768-9769; 9880 - 9881; 9992 - 9993; 10104- 10105; 10216 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856 - 5857; 5872 - 5873; 5888 - 5889; 5904 - 5905; 5920 - 5921; 5936

- 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361;

10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462;

10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525;

10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704

- 9705; 9816-9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264

Petição 870190070557, de 24/07/2019, pág. 203/401

139/306

- 10265: 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304-9305; 9320-9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416

10168 - 10169;	10280 - 10281;	10392 - 10393	10408;	10415;	10422;
10429; 10436;	10443; 10450;	10457; 10464;	10471;	10478;	10485;
10492; 10499;	10506; 10513;	10520; 10527;	10534;	10541:	10548;
10554-- 10574;	10594- 10595;	10582- 10583	10585	- 10586	10588
-- 10589; 10591	-10592; 10594	-10595; 10597	-10598; 10599; 10600;
10613; 10614;	10627; 10628;	10641; 10642;	10655;	10656:	10669;
10670; 10683;	10684; 10697;	10698; 10711;	10712;	10725;	10726;
10739; 10740;	10753; 10754;	10767; 10768;	10781;	10782;	10795;
10796; 10809;	10810; 10823;	10824; 10837;	10838;	10851:	10852;
10865; 10866;	10879; 10880;	10601; 10602;	10615;	10616;	10629;
10630; 10643;	10644; 10657;	10658; 10671;	10672;	10685;	10686;
10699; 10700;	10713; 10714;	10727; 10728;	10741;	10742:	10755;
10756; 10769;	10770; 10783;	10784; 10797;	10798;	10811;	10812;
10825; 10826;	10839; 10840;	10853; 10854;	10867;	10868;	10881;
10882; 10603;	10604; 10617;	10618; 10631;	10632;	10645:	10646;
10659; 10660;	10673; 10674;	10687; 10688;	10701;	10702;	10715;
10716; 10729;	10730; 10743;	10744; 10757;	10758;	10771;	10772;
10785; 10786;	10799; 10800;	10813; 10814;	10827;	10828;	10841;
10842; 10855;	10856; 10869;	10870; 10883;	10884;	10605;	10606;
10619; 10620;	10633; 10634;	10647; 10648;	10661;	10662;	10675;
10676; 10689;	10690; 10703;	10704; 10717;	10718;	10731;	10732;
10745; 10746;	10759; 10760;	10773; 10774;	10787;	10788;	10801;
10802; 10815;	10816; 10829;	10830; 10843;	10844;	10857;	10858;
10871; 10872;	10885; 10886;	10607; 10608;	10621;	10622;	10635;

Petição 870190070557, de 24/07/2019, pág. 204/401

140/306

10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;

10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;

10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;

10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;

10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;

10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;

10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;

10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;

10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;

10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;

10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;

10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;

10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;

10877; 10878; 10891; 10892 do PCT/EP2017/076775 ou homólogos, fragmentos, variantes ou derivados (funcionais) das mesmas.

Cas13, CasX, CasY e outras (endo)nudeases

Sequências de aminoácido [0214] Várias proteínas Cas13, CasX e CasY são conhecidas na técnica e compreendidas como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cas13, CasX e CasY adequadas são mostradas sob SEQ ID NO: 10893-10925; 10926-10998 (Cas13 i.e. WP15770004, WP18451595, WP21744063, WP21746774, ERK53440, WP31473346, CVRQ01000008, CRZ35554, WP22785443,

WP36091002, WP12985477, WP13443710, ETD76934, WP38617242, WP2664492, WP4343973, WP44065294, ADAR2DD, WP47447901, ERI81700, WP34542281, WP13997271, WP41989581, WP47431796, WP14084666, WP60381855, WP14165541, WP63744070,

WP65213424, WP45968377, ΕΗΘ06562, WP6261414, EKB06014, WP58700060, WP13446107, WP44218239, WP12458151, ERJ81987, ERJ65637, WP21665475, WP61156637, WP23846767, ERJ87335,

Petição 870190070557, de 24/07/2019, pág. 205/401

141/306

WP5873511, WP39445055, WP52912312, WP53444417,

WP12458414, WP39417390, ΕΘΑ10535, WP61156470, WP13816155, WP5874195, WP39437199, WP39419792, WP39431778,

WP46201018, WP39442171, WP39426176, WP39418912,

WP39434803, WP39428968, WP25000926, EFU31981, WP4343581, WP36884929, BAU18623, AFJ07523, WP14708441, WP36860899, WP61868553, KJJ86756, EGQ18444, EKY00089, WP36929175, WP7412163, WP44072147, WP42518169, WP44074780,

WP15024765, WP49354263, WP4919755, WP64970887,

WP61710138); 11002; 11003 (CasX, i.e. OGP07438, OHB99618); e11004-11010 (CasY, i.e. OJI08769, OGY82221, OJI06454, APG80656, OJI07455, OJI09436, PIP58309).

[0215] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como Cas13, ou seu homólogo, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas13, ou um homólogo, variante ou fragmento da mesma, que são ainda fundidos a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NO: 1101111042; 11249-11280; 11044-11116; 11282-11354; 11131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 1183911870; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%,

Petição 870190070557, de 24/07/2019, pág. 206/401

142/306

89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. Também outras proteínas Cas13 são compreendidas na descrição da invenção, isto é, Cas13a, Cas13b, Cas13c e Cas13d (como aparente a partir de PMID 29551514 e 29551272, aqui incorporados a título de referência). Também incorporadas aqui a título de referência estão as publicações PMID 26593719, 28976959 e 29070703 relacionadas a Cas13.

[0216] Um grande número de proteínas é conhecido na técnica e compreendidos como proteínas associadas a CRISPR no contexto da presente invenção. Sequências de Cas13 preferidas da invenção são Proteína Cas13d (SEQ ID NO: 14294-14321) e suas sequências de mRNA otimizadas tendo SEQ ID NO: 14322-14349, SEQ ID NO: 1435014377, SEQ ID NO: 14378-14405, SEQ ID NO: 14406-14433, SEQ ID NO: 14434-14461, SEQ ID NO: 14462-14489 e SEQ ID NO:1449014517.

[0217] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como CasX, ou seus homólogos, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína CasX, ou um homólogo, variante ou fragmento da mesma, que são fundidos ainda a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NO: 11120

Petição 870190070557, de 24/07/2019, pág. 207/401

143/306

11122; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0218] Vantajosamente, qualquer sequência de Cas13, CasX ou CasY como aqui revelado ou na listagem de sequência pode ser selecionada para o uso da invenção como proteínas associadas a CRISPR no contexto da presente invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cas13, CasX ou CasY e mRNAs codificando versões diferentes das respectivas sequências de proteína Cas13, CasX ou CasY, isto é, sequências de proteína do tipo selvagem ou otimizadas.

[0219] Ainda, editores à base de adenina (ABEs) que fazem a mediação da conversão de A*T em G*C em DNA genômico como descrito no PMID 29160308 são incorporados aqui a título de referência bem como a própria publicação PMID 29160308. De acordo com os autores, ABEs introduz mutações por ponto mais eficientemente e de modo mais nítido, e com menos modificação de genoma fora do alvo, do que um método à base de nuclease de Cas9 atual, e pode instalar mutações de correção de doença ou supressão de doença em células humanas. Endonucleases ARMAN [0220] Ainda, o uso de novos sistemas CRISPR-Cas de micróbios

Petição 870190070557, de 24/07/2019, pág. 208/401

144/306 não cultivados, isto é, Cas9 de ARMAN, ARMAN-1 (ARMAN-1 de acidiphilum de Candidatus Microarcheaum) e ARMAN-4 (ARMAN-4 de acidiphilum de Candidatus Parvarchaeum) não arequa, é compreendido nos ensinamentos da invenção com referência aPMID 28005056, 20421484 e 17185602 que são aqui incorporados a título de referência. [0221] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como CasY, ou seu homólogo, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com LJTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína CasY, ou um homólogo, variante ou fragmento da mesma, que são ainda fundidos a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NO: 1112311130; 11360-11366; 11242-11248; 11478-11484; 11596-11602; 11714-11720; 11832-11838; 11950-11956 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

qRNAs [0222] Como discutido aqui, um sistema CRISPR-Cas funcional requer tipicamente a presença de um RNA-guia (gRNA) que se associa

Petição 870190070557, de 24/07/2019, pág. 209/401

145/306 com e recruta uma proteína associada a CRISPR para uma sequência de DNA-alvo complementar. A estrutura e características do RNA-guia tipicamente dependem da escolha da proteína associada a CRISPR particular.

[0223] Como aqui usado, o termo RNA-guia então refere-se a qualquer molécula de RNA capaz de direcionar a uma proteína associada a CRISPR para uma sequência de DNA-alvo de interesse. RNAsguia (gRNAs) compreendem preferivelmente uma i) primeira região de complementaridade que é capaz de hibridizar especificamente com uma sequência de DNA-alvo e ii) uma segunda região que interage com uma proteína associada a CRISPR.

[0224] A dita região, que é tipicamente localizada na extremidade 5’ do gRNA, compreendendo uma sequência de nucleotídeo curta que é complementar a uma sequência de DNA-alvo, é também referida aqui como uma região de direcionamento”. O termo região refere-se a uma seção/segmento de uma molécula, por exemplo, uma extensão contínua de nucleotídeos em um RNA. A região de direcionamento pode ser cerca de 17-20, por exemplo, 21-23, nucleotídeos de comprimento ou pode ser mais longa ou mais curta (gRNA truncado). Ela pode preferivelmente interagir com a sequência de DNA-alvo através de ligação hidrogênio entre pares de base complementares (isto é, bases emparelhadas).

[0225] O gRNA pode ser de qualquer comprimento, contanto que ele compreenda um gene de direcionamento e seja preferivelmente capaz de recrutar uma proteína associada a CRISPR para uma sequência de DNA-alvo de uma maneira específica de sequência. Desta maneira, gRNAs podem ser de pelo menos 10, pelo menos 11, pelo menos 12, mais preferivelmente pelo menos 13, pelo menos 14, pelo menos 15 e sobretudo preferivelmente pelo menos 16 ou pelo menos 17

Petição 870190070557, de 24/07/2019, pág. 210/401

146/306 nudeotídeos ou pelo menos 18 nudeotídeos ou pelo menos 19 nucleotídeos ou pelo menos 20 nudeotídeos de comprimento. Em algumas modalidades, o gRNA compreende uma região de direcionamento que é preferivelmente de pelo menos 21, pelo menos 22, pelo menos 23, pelo menos 24, pelo menos 25 ou mais de comprimento e ii) uma segunda região que interage com uma proteína associada a CRISPR.

[0226] Como aqui usado, o termo gRNA inclui gRNAs de duas moléculas bem como RNAs de molécula única. O gRNA pode ou não compreender características de estrutura secundária para interação com a proteína associada a CRISPR.

[0227] O sistema CIRSPR~Cas9 tipo II emprega naturalmente gRNAs de duas moléculas. Tais gRNAs de duas moléculas (tracrRNA/ crRNA) compreende tipicamente uma molécula de crRNA (RNA CRISPR RNA direcionadora ou crRNA ou repetição de crRNA) e um tracrRNA correspondente (CRISPR RNA de trans-ação ou RNA ativadora ou tracrRNA). Um cRNA compreende ambas uma região de direcionamento (filamento simples) e uma extensão (região formador de dúplex) de nudeotídeos que foram uma metade do dúplex de dsRNA da região de ligação a Cas9 do gRNA. Um tracrRNA correspondente compreende uma extensão de nudeotídeos (região de formação de dúplex) que forma a outra metade do dúplex de dsRNA da região de ligação a Cas9 do gRNA. Em outras palavras, uma extensão de nudeotídeos de um crRNA é complementar a e hibridiza com uma extensão de nudeotídeos de um tracrRNA para formar o dúplex de dsRNA da região de ligação a Cas9 do gRNA. Desta maneira, cada crRNA pode ser dito ter um tracrRNA correspondente. O crRNA provê ainda a região de direcionamento de filamento simples. Desta maneira, um crRNA e um tracrRNA (como um par correspondente) hibridizam para formar um gRNA.

Petição 870190070557, de 24/07/2019, pág. 211/401

147/306 [0228] O crRNA e o tracrRNA podem ser também unidos para prover RNAs-guia de molécula simples (artificial) (RNAs-guia simples, sgRNAs). Um sgRNA compreende tipicamente um crRNA conectado em sua extremidade 3’ à extremidade 5’ de um tracrRNA através de uma sequência de alça (vide, por exemplo, Pedido de Patente U.S. No. 20140068797). Similar a crRNA, sgRNA compreende uma região de direcionamento de complementaridade com uma sequência de polinucleotídeo-alvo, tipicamente adjacente a uma segunda região que forma ligações hidrogênio de par de base que formam uma estrutura secundária, tipicamente uma estrutura de tronco. sgRNAs são tipicamente de -100 nucleotídeos de comprimento, no entanto, o termo também inclui RNAs-guia simples truncados (tru-sgRNAs) de aproximadamente 17-18 nt (Fu, Y. e outros, Nat. Biotechnol. 2014 Mar;32(3):279-84). O termo também compreende sgRNAs em miniatura funcionais com características dispensáveis removidas, que retêm um módulo essencial e conservado chamado o nexus localizado na porção de sgRNA que corresponde a tracrRNA (não crRNA) (cf. Pedido de Patente U.S. No. 20140315985 e Briner, A.E. e outros, Mol Cell. 2014 Out 23;56(2):333-9). O nexus está localizado imediatamente a jusante (isto é, localizado na direção 3’ a partir do) do tronco inferior em sistemas CRISPR~Cas9 Tipo II. O termo sgRNA também compreende mortadRNAs (dRNAs) compreendendo regiões de direcionamento encurtadas de 11-15 nucleotídeos. Tais dRNAs podem ser usados para recrutar endonucleases Cas9 cataliticamente ativas para se direcionar a sequências de DNA-alvo para alteração de expressão de gene sem indução de DSBs (cf. Dahlman,

J.E. e outros, Nat Biotechnol. 2015 Nov;33(11):1159-61). Derivados de sgRNA são também compreendidos pelo termo. Tais derivados incluem tipicamente porções ou entidades adicionais conferindo uma funcionalidade nova ou adicional. Particularmente, aptâmeros de MS2 adicionados à tetra-alça de sgRNA e/ou estruturas de tronco-alça são capazes

Petição 870190070557, de 24/07/2019, pág. 212/401

148/306 de seletivamente recrutar proteínas compreendendo os ditos domínios MS2 para o DNA-alvo (sgRNA-MS2) (cf. Konermann, S. e outros. Nature. 2015 Jan 29; 517(7536): 583-588). Modificações adicionais são também concebíveis e compreendidas aqui.

[0229] O uso de tracrRNA/crRNA ou sgRNAs como gRNAs não é limitada a proteínas Cas9. Qualquer outro sistema associado a CRISPR, preferivelmente do sistema CRISPR-Cas tipo II, pode ser usado em conexão com tais gRNAs. No entanto, outros gRNAs podem ser requeridos para assegurar funcionalidade das outras proteínas CRISPR-Cas, e tais gRNAs são também compreendidos na respectiva definição. Por exemplo, proteínas associadas a CRISPR tipo V, tal como Cpf1, são guiadas por um crRNA simples e curto (42-44 nt), compreendendo tipicamente alça tronco simples em uma sequência de repetição direta.

[0230] gRNAs, tais como tracr/RNA/crRNA, sgRNAs ou crRNAs podem ser providos através de qualquer meio adequado, por exemplo, em forma nua ou complexada como descrito aqui no contexto de moléculas de ácido nucleico artificiais, por exemplo, usando lipídeos ou carreadores (poli)catiônicos, mas são tipicamente administrados através de um vetor. Vetores adequados (como definido na seção intitulada Definições) incluem qualquer ácido nucleico que seja capaz de preferivelmente ubiquamente expressar gRNAs funcionais (isto é, que seja capaz de recrutar a respectiva proteína associada a CRISPR para a a sequência de DNA-alvo). Vetores então incluem plasmídeos e vetores virais, em particular vetores lentivirais e vetores de vírus adenoassociados (AAV).

RNAs [0231] A molécula de ácido nucleico artificial da invenção pode ser preferivelmente um RNA. Será compreendido que o termo RNA referese a moléculas de ácido ribonucleico caracterizadas pela sucessão específica de seus nucleotídeos unidos para formas as ditas moléculas

Petição 870190070557, de 24/07/2019, pág. 213/401

149/306 (isto é, sua sequência de RNA). O termo RNA” pode então ser usado para se referir a moléculas de RNA ou sequências de RNA como será compreendido prontamente pelo versado na técnica no respectivo contexto. Por exemplo, o termo RNA como usado no contexto da invenção refere-se preferivelmente a uma molécula de RNA (a dita molécula sendo caracterizada, inter alia, por sua sequência de RNA particular). O termo RNA no contexto de modificações de sequência será compreendido se relacionar a sequências de RNA modificadas, mas tipicamente inclui também as moléculas de RNA resultantes (que são modificadas com relação à sua sequência de RNA). Em modalidades preferidas, o RNA pode ser um mRNA, um RNA viral ou um RNA de replicon, preferivelmente um mRNA.

RNAs mono-, bi- e multicistrônicos [0232] De acordo com algumas modalidades da presente invenção, a molécula de ácido nucleico artificial, preferivelmente RNA, pode ser mono-, bi- ou multicistrônica, preferivelmente como aqui definido. RNAs bi- ou multicistrônicos compreendem tipicamente duas (bicistrônica) ou mais (multicistrônica) estruturas de leitura aberta (ORF). Uma estrutura de leitura aberta neste contexto é uma sequência de códon que é traduzivel em um peptídeo ou proteína. As sequências de codificação em uma molécula de ácido nucleico artificial bi- ou multicistrônica, preferivelmente RNA, preferivelmente codificam proteínas distintas como definido aqui. Molécula de ácido nucleico artificial bi- ou até mesmo multicistrônica, preferivelmente RNAs, pode codificar, por exemplo, pelo menos duas, três, quatro, cinco, seis ou mais (preferivelmente diferentes) proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas) como aqui definido. O termo codificando duas ou mais proteínas pode significar, sem ser limitado ao mesmo, que a molécula de ácido nucleico artificial bi- ou até mesmo multicistrônica, preferivelmente RNA, pode codificar, por exemplo, pelo menos duas, três, quatro, cinco, seis

Petição 870190070557, de 24/07/2019, pág. 214/401

150/306 ou mais (preferivelmente diferentes) proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas).

[0233] Em algumas modalidades, as sequências de codificação codificando duas ou mais proteínas associadas a CRISPR, ou homólogos, variantes, fragmentos ou derivados das mesmas como aqui definido, podem ser separadas no RNA bis- ou multicistrônico por pelo menos uma sequência IRES (sítio de entrada ribossomal interno). O termo IRES (sítio de entrada ribossomal interno) refere-se a uma sequência de RNA que permite início de tradução. Um IRES pode funcionar como um sítio de ligação de ribossomo único, mas pode também servir para prover uma molécula de ácido nucleico artificial bi~ ou até mesmo multicistrônica, preferivelmente RNA como acima definido, que codifica várias proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas), que devem ser traduzidas pelos ribossomos independentemente umas das outras. Exemplos de sequências de IRES, que podem ser usadas de acordo com a invenção, são aquelas derivadas de picornavírus (por exemplo, FMDV), pestvirus (CFFV), poliovirus (PV), vírus da encefalomiocardite (ECMV), vírus da doença do pé e da boca (FMDV), vírus da hepatite C (HCV), vírus da febre suína clássica (CSFV), vírus do leucoma do camundongo (MLV), vírus da imunodeficiência simiana (SIV) ou vírus da paralisia do grilo (CrPV).

[0234] De acordo com modalidades adicionais, a pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode codificar pelo menos duas, três, quatro, cinco, seis, sete, oito e mais proteínas associadas a CRISPR (ou homólogos, variantes, fragmentos ou derivados das mesmas) como aqui definido ligadas com ou sem uma sequência ligante de aminoácido, em que a dita sequência ligante pode compreender ligantes rígidos ligantes flexíveis, ligantes cliváveis (por exemplo, peptídeos de autocliva

Petição 870190070557, de 24/07/2019, pág. 215/401

151/306 gem) ou uma combinação dos mesmos. Ligantes exemplares são descritos na seção intitulada Derivados. A respectiva descrição é aplicável à ligação de proteínas associadas a CRISP múltiplas, mutatis mutandis. Nela, proteínas associadas a CRISPR como aqui definido podem ser idênticas ou diferentes ou uma combinação das mesmas.

[0235] Preferivelmente, a molécula de ácido nucleico artificial, preferivelmente RNA, compreende um comprimento de cerca de 50 a cerca de 20000, ou 100 a cerca de 20000 nucleotídeos, preferivelmente de cerca de 250 a cerca de 20000 nucleotídeos, mais preferivelmente de cerca de 500 a cerca de 10000, ainda mais preferivelmente de cerca de 500 a cerca de 5000.

[0236] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode ainda ser de filamento simples ou filamento duplo. Quando provida como um RNA de filamento duplo, a molécula de ácido nucleico artificial compreende preferivelmente um filamento de senso e um de antissenso correspondente.

Modificações de ácido nucleico [0237] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, da Invenção, ou qualquer outro ácido nucleico definido aqui (por exemplo, um vetor), podem ser providas na forma de ácidos nucleicos modificados. Modificações de ácido nucleico adequadas compreendidas no contexto da presente invenção são descritas abaixo. A expressão qualquer outro ácido nucleico como aqui definido pode, mas tipicamente não, refere-se a gRNAs.

[0238] De acordo com modalidades preferidas, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (sequência) da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é modificada como aqui definido. Uma modificação como aqui definido preferivelmente leva a uma estabilização da dita molécula de ácido nucleico artificial, preferivelmente RNA. Mais preferivelmente,

Petição 870190070557, de 24/07/2019, pág. 216/401

152/306 a invenção então provê uma molécula de ácido nucleico artificial estabilizada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).

[0239] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (para qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode então ser provida como uma molécula de ácido nucleico artificial estabilizada, preferivelmente RNA, em particular mRNA, isto é, que é essencialmente resistente à degradação in vivo (por exemplo, por uma exoou endo-nuclease).

[0240] Tal estabilização pode ser realizada, por exemplo, por uma estrutura principal de fosfato modificada da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Uma modificação de estrutura principal em relação à presente invenção é uma modificação em que fosfatos da estrutura principal dos nucleotídeos contidos no dito RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são quimicamente modificados. Nucleotídeos que podem ser preferivelmente usados nesta relação incluem, por exemplo, uma estrutura principal de fosfato modificada com fosforotioato, preferivelmente pelo menos um dos oxigênios fosfato contidos na estrutura principal de fosfato sendo substituídos por um átomo de enxofre. Molécula de ácido nucleico artificial estabilizada, preferivelmente RNAs (ou outros ácidos nucleicos, em particular RNAs, como aqui definido) podem incluir ainda, por exemplo: análogos de fosfato não iônicos tais como, por exemplo, fosfonatos de alquila e arila, em que o oxigênio fosfato carregado é substituído por um grupo alquila ou arila, ou fosfodiésteres e alquilfosfotriésteres, em que o resíduo de oxigênio carregado está presente em forma alquilada. Tais modificações de estrutura principal incluem tipica

Petição 870190070557, de 24/07/2019, pág. 217/401

153/306 mente, sem implicar qualquer limitação, modificados do grupo consistindo em metilfosfonato, fosforamidatos e fosforotioatos (por exemplo, citidina-5’-O-(1 -tiofosfato)).

[0241 ] Abaixo, modificações específicas são descritas, as quais são preferivelmente capazes de estabilizar a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui).

Modificações químicas [0242] O termo modificação como aqui usado pode se referir a modificações químicas compreendendo modificações de estrutura principal bem como modificações de açúcar ou modificações de base.

[0243] Neste contexto, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode conter análogos/modificações de nucleotídeo (nucleotídeos ou nucleosídeos modificados), por exemplo, modificações de estrutura principal, modificações de açúcar ou modificações de base.

[0244] Uma modificação de estrutura principal em relação à presente invenção é uma modificação em que fosfatos da estrutura principal dos nucleotídeos contidos na dita molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), aqui são quimicamente modificados. Uma modificação de açúcar em relação à presente invenção é uma modificação química do açúcar dos nucleotídeos do ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Ainda, uma modificação de base em relação à presente invenção é uma modificação química da porção de base dos nucleotídeos da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Neste contexto, análogos de nucleotídeo ou modificações são

Petição 870190070557, de 24/07/2019, pág. 218/401

154/306 preferivelmente selecionados a partir de análogos de nucleotídeo que sâo aplicáveis para transcrição e/ou tradução.

Modificações de açúcar [0245] Ácidos nuclelcos (quimicamente) modificados, em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de açúcar, isto é, nucleosídeos/nucleotídeos que são modificados em sua porção açúcar.

[0246] Por exemplo, o grupo 2’ hidroxila (OH) pode ser modificado ou substituído com um número de diferentes substituintes óxi ou desóxi. Exemplos de modificações de grupo óxi-2’ hidroxila incluem, mas não estão limitados a, alcóxi ou arilóxi (-OU, por exemplo, R ··· H, alquila, cicloalquila, arila, aralquila, heteroarila ou açúcar); polietilenoglioóis (PEG), -O(CH2CH2O)nCH2CH2OR; ácidos nuclelcos bloqueados (LNA), em que a 2’ hidroxila está conectada, por exemplo, por uma ponte metileno, ao carbono 4’ do mesmo açúcar ribose; e grupos amino (-Ο-amino, em que o grupo amino, por exemplo, NRR, pode ser alquilamino, dialquilamino, heterociclila, arilamino, diarilamino, heteroarilamino ou di-heteroarilamino, etileno diamina, poliamino) ou aminoalcóxi.

[0247] Modificações desóxi incluem hidrogênio, amino (por exemplo, NH2; alquilamino, dialquilamino, heterociclila, arilamino, diaril amino, heteroaril amino, di-heteroaril amino ou aminoácido); ou o grupo amino pode ser ligado ao açúcar através de um ligante, em que o ligante compreende um ou mais dos átomos deC, Ne O.

[0248] O grupo açúcar pode conter também um ou mais carbonos que possuem a configuração estereoquímica oposta àquela do carbono correspondente em ribose. Desta maneira, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode incluir nucleotídeos contendo, por exemplo, arabinose como o açúcar.

Petição 870190070557, de 24/07/2019, pág. 219/401

155/306

Modificações de Estrutura Principal:

[0249] Ácidos nucleicos (químicamente modificados), em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de estrutura principal, isto é, nucleosídeos/nucleotídeos que são modificados em sua estrutura principal de fosfato.

[0250] Os grupos fosfato da estrutura principal podem ser modificados substituindo um ou mais dos átomos de oxigênio com um substitute diferente. Ainda, os nucleosídeos e nudeotídeos modificados podem incluir a substituição integral de uma porção fosfato não modificada com um fosfato modificado como aqui descrito.

[0251] Exemplos de grupos fosfato modificados incluem, mas não estão limitados a, fosforotioato, fosforoselenatos, borano fosfatos, ésteres de borano fosfato, hidrogênio fosfonatos, fosforamidatos, alquil ou aril fosfonatos e fosforotriésteres. Fosforoditioatos têm ambos oxigênios de não ligados substituídos por enxofre. O ligante fosfato também pode ser modificado pela substituição de um oxigênio de ligação com nitrogênio (fosforamidatos em ponte), enxofre (fosforotioatos em ponte) e carbono (metileno-fosfonatos em ponte).

Modificações de base:

[0252] Ácidos nucleicos (quimicamente) modificados, em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de (núcleo-)base, isto é, nucleosídeos/nucleotídeos que são modificados em sua porção nucleobase.

[0253] Exemplos de nucleobases encontradas em RNA incluem, mas não estão limitados a, adenina, guanina, citosina e uracila. Por exemplo, os nucleosídeos e nudeotídeos descritos aqui podem ser quimicamente modificados na face do sulco principal. Em algumas modalidades, as modificações químicas de sulco prindpal podem incluir um grupo amino, um grupo tiol, um grupo alquila ou um grupo halo.

Petição 870190070557, de 24/07/2019, pág. 220/401

156/306 [0254] Em algumas modalidades, os análogos/modificações de nucleotídeo são selecionados de modificações de base, que são preferivelmente selecionadas de 2~amino-6-cloropurinoribosídeo-5-trifosfato,

2-Aminopurino-ribosideo-5'-trifosfato; 2-aminoadenosina-5'-trifosfato, 2^,Amino-2^,”desoxicitldino-trifosfato₎ 2-tiocitidlno-5'-trifosfato, 2-tiourldino-5^!-trifosfato, Z'-Fluortimidino-S'-trifosfato, 2^s-O~Metil-inosina-5^!-trifosfato 4-tiouridino-5'-trifosfato, 5-aminoalilcitidino-5'-trifosfato, 5-aminoaliluridino-5'-trifosfato, 5-bromocitidino-5^!-trifosfato, 5-bromouridino-5'trifosfato, 5-Bromo-2'-desoxicitidino-5'-trifosfato, 5-Bromo-2'-desoxiuridino-5'-trifosfato, 5-iodocitidino-5'-trifosfato, 5-lodo-2'-desoxicitidino-5'trifosfato, 5-iodouridino~5’-trifosfato, S-lodo-Z’-desoxiuridino-S'-trifosfato,

5-metilcitidino-5'-trifosfato, 5-metiluridino-5'-trifosfato, 5-Propinil-2'-desoxicitídino-õ-trífosfato, 5-Propinil-2^,-desoxíuridino-5'-trifosfato_i 6-azacitidino-5⁸-trifosfato, e-azauridino-S’-trifosfato, 6-cloropurinoribosídeo-5'~ trifosfato, 7-desazaadenosina-5'-trifosfato, 7-desazaguanosina-5’-trifosfato, 8-azaadenosina-5'-trifosfato, 8-azidoadenosina-5'-trifosfato, benzímidazol-ribosídeo-5'~trifosfato, N1 ~metiladenosina~5'~trifosfato, N1 -metilguanosina-5'-trifosfato, N6-metiladenosina-5'-trifosfato, 06-metilguanoslna-õ-trifosfato, pseudouridino-5'-trifosfatoou puromicin-5-trifosfato, xantosina-5^s-trifosfato. Preferência particular é dada a nucleotídeos para modificações de base selecionadas do grupo de nucleotídeos modificados na base consistindo em 5-metilcitidino-5'-trifosfato, 7-desazaguanosina-5'~trifosfato, 5-bromocitidino-5'-trifosfato e pseudouridino~5'~trifos~ fato.

[0255] Em algumas modalidades, nucleosídeos modificados incluem piridin-4-ona ribonucleosídeo, 5-aza-uridina, 2-tio-5-aza-uridina,

2- tiouridina, 4-tio-pseudouridina, 2-tio-pseudouridina, 5-hidroxiuridina,

3- metiluridina, 5-carboximetil-uridina, 1-carboximetil-pseudouridina, 5propinil-uridina, 1-propinil-pseudouridina, 5-taurinometiluridina, 1-taurinometil-pseudouridina, 5-taurinometil-2-tio-uridina, 1-taurinometil-4-tio

Petição 870190070557, de 24/07/2019, pág. 221/401

157/306 uridina, 5-metil-uridina, 1-metil-pseudouridina, 4-tio-1-metil-pseudouridina, 2-tio-1-metil-pseudouridina, 1-metil-1-desaza-pseudouridina, 2-tio1 -metil~1-desaza-pseudouridina, di-hidrouridina, di~hidropseudouridina,

2-tio-di-hidrouridina, 2-tio-di-hidropseudouridina, 2-metoxiuridina, 2-metóxi-4-tio-uridina, 4-metóxi-pseudouridina e 4-metóxi-2-tio-pseudouridina.

[0256] Em algumas modalidades, nucieosídeos modificados incluem 5-aza-citidina, pseudoisocitidína, 3-metil-citidina, N4-acetilcitidina, 5-formilcitidina, N4-metilcitidina, 5-hidroximetilcitidina, 1-metilpseudoisocitidina, pirrol-citidina, pirrol-pseudoisocitidina, 2-tio-citidina,

2-tio-5-metil~citidina, 4-tio-pseudoisocitidina, 4-tio~ 1 -metil-pseudoisocitl· dina, 4-tio-1 -metil-1 -desaza-pseudoisocitidina, 1 -metil-1 -desaza-pseudoisocitidina, zebularina, 5-aza-zebularina, 5-metil-zebularina, 5-aza-2tio-zebularina, 2-tio-zebularina, 2-metóxi-citidina, 2-metóxi~5~metil-citi~ dina, 4-metóxi-pseudoisocitidina e 4^βΙόχί~1~η'ΊβίΗ-ρ36υΰοί3οαίίΰΙη3.

[0257] Em outras modalidades, nucieosídeos modificados incluem 2~aminopurina, 2, 6-diaminopurina, 7-desaza-adenina, 7-desaza~8~aza~ adenina, 7-desaza-2-amínopurina, 7-desaza-8-aza-2-aminopurina, 7desaza-2,6-diaminopurína, 7-desaza-8-aza-2,6-diaminopurina, 1 -metiladenosina, N6~metiladenosina, N6-isopenteniladenosina, N6-(cis-hi~ droxi-isopenteniQadenosina, 2-metiltio-N6-(cis-hidróxi-isopentenil) adenosina, N6-glícínilcarbamoiladenosina, N6-treonilcarbamoiladenosina, 2~metiltio-N6-treonil carbamoiladenosina, N6,N6~dimetiladenosina, 7metiladenina, 2-metiltio-adenina e 2-metóxi-adenina.

[0258] Em outras modalidades, nucieosídeos modificados incluem inosina, 1 -Metil-inosina, wiosina, wibutosina, 7-desaza-guanosina, 7-desaza-8-aza-guanosina, 6-tio-guanosina, 6-tio-7-desaza-guanosina, 6tio-7-desaza-8-aza-guanosina, 7-metil-guanosina, 6-tio-7-metil-guanosina, 7-metilinosina, 6-metóxi-guanosina, 1-metilguanosina, N2-metilguanosina, N2,N2-dimetilguanosina, 8-oxo-guanosina, 7-metil-8-oxo

Petição 870190070557, de 24/07/2019, pág. 222/401

158/306 guanosina, 1-metik6-tio-guanosina, N2-metil-6-tio-guanosina e N2,N2dimetik6-tio-guanosina.

[0259] Em algumas modalidades, o nucleotídeo pode ser modificado na face de sulco principal e pode incluir substituição de hidrogênio em C-5 de uracila com um grupo metila ou um grupo halo. Em modalidades específicas, um nucleosídeo modificado é 5'-O-(1~tiofosfato)~adenosina, 5'-O-(1-tiofosfato)-citidina, 5^!-O-(1-tiofosfato)-guanosina, 5-0(l-tiofosfato)-uridina ou 5'-O-(1-tiofosfato)-pseudouridina.

[0260] Em algumas modalidades, o RNA modificado da invenção (ou qualquer outro ácido nucleico modificado, em particular RNA, como aqui definido) pode compreender modificações de nucleosídeo selecionadas de 6-aza-citidina, 2-tio-citidina, a-tio-citidina, Pseudo-iso-citidina,

5- aminoalil-uridina, 5-iodo-uridina, N1-metikpseudouridina, 5,6-di-hk drouridina, o-tio-uridina, 4-tio-uridina, 6-aza-uridina, 5-hidróxi-uridina, desóxktimidina, 5-metikuridina, Pirrol-citidina, inosina, o-tio-guanosina,

6- metil-guanosina, 5-metikcitdina, 8-oxo-guanosina, 7-desaza-guanosina, N1-metikadenosina, 2-amino-6-Cloro-purina, N6-metil-2-amino~ purina, Pseudo-iso-citidina, 6-Cloro-purina, N6-metikadenosina, a-tioadenosina, 8-azido-adenosina, 7-desaza-adenosina.

[0261] Em algumas modalidades, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), não compreende nenhuma das modificações químicas como aqui descrito. Tais ácidos nucleicos artificiais modificados podem, não obstante, compreender uma modificação de lipídeo ou uma modificação de sequência como descrito abaixo.

Modificações de lipídeo [0262] De acordo com modalidades adicionais, moléculas de ácido nucleico artificiais, preferivelmente RNAs, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) contêm pelo

Petição 870190070557, de 24/07/2019, pág. 223/401

159/306 menos uma modificação de lipídeo.

[0263] Tal molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA da invenção (ou dito ácido nucleico, em particular RNA, descrito aqui) tipicamente compreende (i) uma molécula de ácido nucleico artificial, preferivelmente RNA como definido aqui (ou dito ácido nucleico, em particular RNA), (ii) pelo menos um ligante covalentemente ligado com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito ácido nucleico, em particular RNA) e (iii) pelo menos um lipídeo covalentemente ligado com o respectivo ligante.

[0264] Alternativamente, a molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA (ou outro ácido nucleico como definido aqui), compreende pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) e pelo menos um lipídeo (bifuncional) covalentemente ligado (sem um ligante) com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA). [0265] Alternativamente, a molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) compreende (i) uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), (ii) pelo menos um ligante covalentemente ligado com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) e (iii) pelo menos um lipídeo covalentemente ligado com o respectivo ligante, e também (iv) pelo menos um lipídeo (bifuncional) covalentemente ligado (sem um ligante) com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou outro dito ácido nucleico, em particular RNA). [0266] Neste contexto, é particularmente preferido que a modificação de lipídeo esteja presente nas extremidades terminais de uma mo

Petição 870190070557, de 24/07/2019, pág. 224/401

160/306 lécula de ácido nucleico artificial linear, preferivelmente RNA (ou qualquer outro ácido nucleico definido aqui).

Modificações de Sequência [0267] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção, preferivelmente um mRNA, ou qualquer outro ácido nucleico como definido aqui é modificado na sequência, isto é, compreende pelo menos uma modificação de sequência como descrito abaixo. Sem desejar ser limitado por teoria específica, tais modificações de sequência podem aumentar a estabilidade e/ou aumentar a expressão das moléculas de ácido nucleico artificiais da invenção, preferivelmente RNAs.

Modificação de teor de G/C [0268] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, mais preferivelmente mRNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode ser modificada, e então estabilizada, através da modificação de seu teor de guanosina/citosina (G/C), preferivelmente através da modificação do teor de G/C da pelo menos uma sequência de codificação. Em outras palavras, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) e preferivelmente sua sequência pode ser de G/C modificada.

[0269] Uma sequência de ácido nucleico com G/C modificada (preferivelmente RNA) tipicamente refere-se a um ácido nucleico (preferivelmente RNA) compreendendo uma sequência de ácido nucleico (preferivelmente RNA) que é baseada em uma sequência de ácido nucleico do tipo selvagem modificada (preferivelmente RNA) e compreende um número alterado de nucleotídeos de guanosina e/ou citosina comparado com a dita sequência de ácido nucleico do tipo selvagem (preferivelmente RNA). Tal número alterado de nucleotídeos de G/C

Petição 870190070557, de 24/07/2019, pág. 225/401

161/306 pode ser gerado substituindo códons contendo nucleotídeos de adenosina ou timidina por códons sinônimos contendo nucleotídeos de guanosina ou citosina. Desta maneira, as substituições de códon preferivelmente não alteram os resíduos de aminoácido codificados, mas alteram exclusivamente o teor de G/C do ácido nucleico (preferivelmente RNA). [0270] Em uma modalidade particularmente preferida da presente invenção, o teor de G/C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificado, particularmente aumentado, comparado com o teor de G/C da sequência de codificação do respectivo ácido nucleico do tipo selvagem, isto é, não modificado. A sequência de aminoácido codificada pela molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é preferivelmente não modificada comparado com a sequência de aminoácido codificada pelo respectivo ácido nucleico do tipo selvagem, preferivelmente RNA.

[0271] Tal modificação da molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é baseada no fato de que a sequência de qualquer região de RNA (ou outro ácido nucleico) a ser traduzido é importante para tradução eficiente do dito RNA (ou dito outro ácido nucleico). Desta maneira, a composição do RNA (ou dito outro ácido nucleico) e a sequência de vários nucleotídeos são importantes. Em particular, sequências tendo um teor de G (guanosina)/C (citosina) aumentado são mais estáveis do que as sequências tendo um teor de A (adenosina)/U (uracila) aumentado.

[0272] De acordo com a invenção, os códons da molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro

Petição 870190070557, de 24/07/2019, pág. 226/401

162/306 ácido nucleico, em particular RNA, como definido aqui) são então variados comparado com o respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico), enquanto retendo a sequência de aminoácido traduzida, de modo que elas incluem uma quantidade aumentada de nucleotídeos de G/C.

[0273] Em relação ao fato que vários códons codificam um e o mesmo aminoácido (a chamada degeneração do código genético), os códons mais favoráveis para a estabilidade podem ser determinados (o chamado uso de códon alternativo). Dependendo do aminoácido a ser codificado pela molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), há várias possibilidades para modificação de sua sequência de ácido nucleico, comparado com sua sequência do tipo selvagem. No caso de aminoácidos, que são codificados por códons, que contêm exclusivamente nucleotídeos G ou C, nenhuma modificação do códon é necessária.

[0274] Desta maneira, os códons para Pro (CCC ou CCG), Arg (CGC ou CGG), Ala (GCC ou GCG) e Gly (GGC ou GGG) não requerem modificação, uma vez que nenhum A ou U está presente. Em contraste, códons que contêm nucleotídeos A e/ou U podem ser modificados através de substituição de outros códons, que codificam os mesmos aminoácidos, mas não contêm nenhum A e/ou U. Exemplos desses são: os códons para Pro podem ser modificados de CCU ou CCA para CCC ou CCG; os códons para Arg podem ser modificados de CGU ou CGA ou AAGA ou AGG para CGC ou CGG; os códons para Ala podem ser modificados de GCU ou GCA para GCC ou GCG; os códons para Gly para podem modificados de GGU ou GGA para GGC ou GGG. Em outros casos, embora nucleotídeos A ou U não possam ser eliminados dos códons, é, no entanto, possível diminuir o teor de A e U usando códons que contêm um teor menor de nucleotídeos A e/ou U. Exemplos desses

Petição 870190070557, de 24/07/2019, pág. 227/401

163/306 são: os códons para Phe podem ser modificados de UUU para UUC; os códons para Leu podem ser modificados de UUA, UUG, CUU ou CUA para CUC ou CUG; os códons para Ser podem ser modificados de UCU ou UCA ou AGU para UCC, UCG ou AGC; o códon para Tyr pode ser modificado de UAU para UAC; o códon para Cys pode ser modificado de UGU para UGC; o códon para His pode ser modificado de CAU para CAC; o códon para Gin pode ser modificado de CAA para CAG; os códons para He podem ser modificados de AUU ou AUA para AUG; os codons para Thr podem ser modificados de ACU ou ACA para AGO ou ACG; o códon para Asn pode ser modificado de AAU para AAC; o códon para Lys pode ser modificado de AAA para AAG; os códons para Vai podem ser modificados de GUU ou GUA para GUC ou GUG; o códon para Asp pode ser modificado de GAU para GAC; o códon para Glu pode ser modificado de GAA para GAG; o códon de parada UAA pode ser modificado para UAG ou UGA, No caso dos códons para Met (AUG) e Trp (UGG), por outro lado, nâo há nenhuma possibilidade de modificação de sequência. As substituições listadas acima podem ser usadas ou individualmente ou em todas as combinações possíveis para aumentar o teor de G/C da sequência de ácido nucleico artificial da invenção, preferivelmente sequência de RNA (ou qualquer outra sequência de ácido nucleico como aqui definido) comparado com sua sequência de ácido nucleico do tipo selvagem particular (Isto é, a sequência original). Desta maneira, por exemplo, todos os códons para Thr ocorrendo na sequência do tipo selvagem podem ser modificados para ACC (ou ACG). Preferivelmente, no entanto, por exemplo, combinações das possibilidades de substituição acima são usadas:

substituição de todos os códons codificando Thr na sequência original (RNA do tipo selvagem) para ACC (ou ACG) e substituição de todos os códons originalmente codificando

Petição 870190070557, de 24/07/2019, pág. 228/401

164/306

Ser para UCC (ou UCG ou AGC); substituição de todos os códons co dificando He na sequência original para AUC e substituição de todos os codons originalmente codificando Lys para AAG e substituição de todos os códons originalmente codificando Tyr para UAC; substituição de todos os códons codificando Vai na sequência original para GLJC (ou GUG) e substituição de todos os códons originalmente codificando Glu para GAG e substituição de todos os códons originalmente codificando Ala para GCC (ou GCG) e substituição de todos os códons originalmente codificando Arg para CGC (ou CGG); substituição de todos os códons codificando

Va! na sequência original para GUC (ou GUG) e substituição de todos os códons originalmente codificando

Glu para GAG e substituição de todos os códons originalmente codificando Ala para GCC (ou GCG) e substituição de todos os códons originalmente codificando Gly para GGC (ou GGG) e substituição de todos os códons originalmente codificando

Asn para AAC; substituição de todos os códons codificando Vai na se quência original para GUC (ou GUG) e substituição de todos os códons originalmente codificando Phe para UUC e substituição de todos os códons originalmente codificando Cys para UGC e substituição de todos os códons originalmente codificando

Leu para CUG (ou CUC) e substituição de todos os códons originalmente codificando

Petição 870190070557, de 24/07/2019, pág. 229/401

165/306

Gin para CAG e substituição de todos os códons originalmente codificando Pro para CCC (ou CCG); etc.

[0275] Preferivelmente, o teor de G/C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) é aumentado em pelo menos 7%, mais preferivelmente em pelo menos 15%, particularmente preferivelmente em pelo menos 20%, comparado com o teor de G/C da sequência de codificação do ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), que codifica pelo menos uma proteína como aqui definido.

[0276] De acordo com modalidades preferidas, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, mais preferivelmente pelo menos 70%, ainda mais preferivelmente pelo menos 80% e sobretudo preferivelmente pelo menos 90%, 95% ou até mesmo 100% dos códons substituídos na região codificando uma proteína associada a CRISPR, ou um homólogo, variante, fragmento ou derivado como definido aqui ou a sequência inteira da sequência de RNA do tipo selvagem, são substituídos, desta maneira aumentando o teor de G/C da dita sequência.

[0277] Neste contexto, é particularmente preferível aumentar o teor de G/C da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), preferivelmente de sua pelo menos uma sequência de codificação, para o máximo (isto é, 100% dos códons substituíveis) comparado com a sequência do tipo selvagem.

[0278] Uma modificação preferida adicional da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é baseada na constatação que a eficiência de tradução é também determinada por

Petição 870190070557, de 24/07/2019, pág. 230/401

166/306 uma frequência diferente na ocorrência dos tRNAs em células. Desta maneira, se os chamados códons raros estiverem presentes na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA) para um grau aumentado, a sequência de RNA correspondente modificada (ou dito outro ácido nucleico, em particular RNA) é traduzida em um grau significantemente mais pobre do que no caso onde códons codificando tRNAs relativamente frequentes estão presentes.

[0279] Em algumas modalidades preferidas, em molécula de ácido nucleico artificial modificada, preferivelmente RNAs (ou qualquer outro ácido nucleico) definido aqui, a região que codifica uma proteína é modificada comparado com a região correspondente do ácido nucleico do tipo selvagem, preferivelmente RNA, de modo que pelo menos um códon da sequência do tipo selvagem, que codifica um tRNA que é relativamente raro na célula, é trocado por um códon, que codifica um tRNA que é relativamente frequente na célula e carrega o mesmo aminoácido que o tRNA relativamente raro.

[0280] Desta maneira, as sequências da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são modificadas de modo que códons para os quais tRNAs frequentemente ocorrendo estão disponíveis são inseridos. Em outras palavras, de acordo com a invenção, através desta modificação todos os códons da sequência do tipo selvagem, que codificam um tRNA que é relativamente raro na célula, podem ser em cada caso trocados por um códon, que codifica um tRNA que é relativamente frequente na célula e que, em cada caso, carrega o mesmo aminoácido que o tRNA relativamente raro. Quais tRNAs ocorrem relativamente frequente na célula e que, em contraste, ocorrem relativamente raramente, é conhecido de um versado na técnica: c.f., por

Petição 870190070557, de 24/07/2019, pág. 231/401

167/306 exemplo, Akashi Curr. Opin. Genet. Dev. 2001, 11(6): 660-666. Os códons que usam para o aminoácido particular o tRNA que ocorre com mais frequência, por exemplo, o códon Gly, que usa o tRNA, que ocorre com mais frequência na célula (humana), são particularmente preferidos.

[0281] De acordo com a invenção, é particularmente preferível ligar o teor de G/C sequencial que é aumentado, em particular maximizado, na molécula de ácido nucleico artificial modificada, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), com os códons frequentes sem modificação da sequência de aminoácido codificada que é codificada pela sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA. Tais modalidades preferidas permitem a provisão de uma molécula de ácido nucleico artificial eficientemente traduzida e estabilizada (modificada), preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido).

[0282] A determinação de uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido) como descrito acima (teor de G/C aumentado; troca de tRNAs) pode ser realizada usando o programa de computador explicado no WO02/098443, cujo teor é incluído em seu escopo integral na presente invenção. Usando este programa de computador, a sequência de nucleotídeo de qualquer ácido nucleico desejado, em particular RNA, pode ser modificada com o auxílio do código genético ou a sua natureza degenerativa de modo que um teor de G/C máximo resulta, em combinação com o uso de códons que codificam tRNAs ocorrendo o mais frequentemente possível na célula, a sequência de aminoácido codificada pelo ácido nucleico modificado, em particular RNA, preferivelmente não sendo modificada comparado com a sequência não modificada.

[0283] Alternativamente, é também possível modificar apenas o teor

Petição 870190070557, de 24/07/2019, pág. 232/401

168/306 de G/C ou apenas o uso de códon comparado com a sequência original. O código-fonte em Visual Basic 6.0 (ambiente de desenvolvimento usado: Microsoft Visual Studio Enterprise 6.0 com Servicepack 3) é também descrito no WO 02/098443.

Modificação de teor de A/U [0284] Em modalidades adicionais da presente invenção, o teor de A/U no ambiente do sítio de ligação de ribossomo da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é aumentado comparado com o teor de A/U no ambiente do sítio de ligação de ribossomo de seu respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA).

[0285] Esta modificação (um teor de A/U aumentado ao redor do sitio de ligação de ribossomo) aumenta a eficiência de ligação de ribossomo à dita molécula de ácido artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Uma ligação efetiva dos ribossomos ao sítio de ligação de ribossomo (sequência Kozak) por sua vez tem o efeito uma tradução eficiente da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).

Modificações de DSE [0286] De acordo com modalidades adicionais da presente invenção, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode ser modificada com relação a elementos de sequência potencialmente desestabilizadores. Particuiarmente, a sequência de codificação e/ou a região não traduzida 5’ e/ou 3’ da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), pode ser modificada comparado com o respectivo ácido

Petição 870190070557, de 24/07/2019, pág. 233/401

169/306 nudeico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nudeico do tipo selvagem), de modo que ela não contenha quaisquer elementos de sequência desestabilizadores, a sequência de aminoácido codificada da molécula de ácido nudeico artificial modificada, preferivelmente RNA (ou dito outro ácido nudeico, em particular RNA), preferivelmente não sendo modificada comparado com seu respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nudeico do tipo selvagem).

[0287] É conhecido que, por exemplo, em sequências dos RNAs eucarióticos, elementos de sequência desestabilizadores (DSE) ocorrem, aos quais proteínas de sinal se ligam e regulam a degradação en~ zimática de RNA in vivo. Para estabilização adicional da molécula de ácido nucleico artificial modificada, preferivelmente RNA, opdonalmente na região que codifica uma proteína associada a CRISPR como definido aqui, ou qualquer outro ácido nucleico como aqui definido, uma ou mais tais modificações comparado com a região correspondente do ácido nucleico do tipo selvagem, preferivelmente RNA, podem então ser realizadas, de modo que quaisquer ou substancialmente quaisquer elementos de sequência desestabilizadores estão contidos na mesma.

[0288] De acordo com a invenção, DSE presente nas regiões não traduzidas (3’- e/ou 5’-UTR) pode também ser eliminada na molécula de ácido nudeico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), portais modificações. Tais sequências de desestabilização são, por exemplo, sequências ricas em AU (AURES), que ocorrem nas seções 3’-UTR de vários RNAs instáveis (Caput e outros, Proc. Natl. Acad. Sei. USA 1986, 83: 1670 a 1674). A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é então preferivelmente modificada comparado com o respectivo ácido nudeico do tipo selvagem, preferivelmente RNA (ou dito

Petição 870190070557, de 24/07/2019, pág. 234/401

170/306 respectivo outro ácido nucleico do tipo selvagem) de modo que a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), não contenha quaisquer de tais sequências de desestabilização. Isso também se aplica àqueles motivos de sequência que são reconhecidos por possíveis endonucleases, por exemplo, a sequência GAACAAG, que está contida no segmento 3’LJTR do gene codificando o receptor de transferrina (Binder e outros, EMBO J. 1994, 13: 1969 a 1980). Esses motivos de sequência sâo também preferivelmente removidos da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).

Sequências adaptadas para uso de códon humano [0289] Uma modificação preferida adicional da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é baseada na constatação que códons codificando o mesmo aminoácido tipicamente ocorrem em frequências diferentes. De acordo com modalidades preferidas adicionais, na molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), a sequência de codificação é modificada comparado com a região correspondente do respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico do tipo selvagem), de modo que a frequência dos códons codificando o mesmo aminoácido corresponde à frequência de ocorrência natural daquele códon de acordo com o uso de códon humano como, por exemplo, mostrado na Tabela 4.

[0290] Por exemplo, no caso do aminoácido alanina (Ala) presente em uma sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), a sequência de codificação do tipo

Petição 870190070557, de 24/07/2019, pág. 235/401

171/306 selvagem é preferivelmente adaptada de um modo que o códon GCC seja usado com uma frequência de 0,40, o códon GCT seja usado com uma frequência de 0,28, o códon ^!'GCA seja usado com uma frequência de 0,22 e o códon GCG seja usado com uma frequência de 0,10, etc.

(vide Tabela 4).

Tabela 4. Tabela de uso de códon humano

Aminoácido	códon	fração	/1000	Aminoácido	códon	fração	/1000
Ala	GCG	0,10	7,4	Pro	CCG	0,11	6,9
Ala	GCA	0,22	15,8	Pro	CCA	0,27	16,9
Ala	GCT	0,28	18,5	Pro	CCT	0,29	17,5
Ala	GCC*	0,40	27,7	Pro	CCC*	0,33	19,8
Cys	TGT	0,42	10,6	Gin	CAG*	0,73	34,2
Cys	TGC*	0,58	12,6	Gin	CAA	0,27	12,3
Asp	GAT	0,44	21,8	Arg	AGG	0,22	12,0
Asp	GAC*	0,56	25,1	Arg	AGA*	0,21	12,1
Glu	GAG*	0,59	39,6	Arg	CGG	0,19	11,4
Glu	GAA	0,41	29,0	Arg	CGA	0,10	6,2
Phe	TTT	0,43	17,6	Arg	CGT	0,09	4,5
Phe	TTC*	0,57	20,3	Arg	CGC	0,19	10,4
Gly	GGG	0,23	16,5	Ser	AGT	0,14	12,1
Gly	GGA	0,26	16,5	Ser	AGC*	0,25	19,5
Gly	GGT	0,18	10,8	Ser	TCG	0,06	4,4
Gly	GGC*	0,33	22,2	Ser	TCA	0,15	12,2
His	CAT	0,41	10,9	Ser	TCT	0,18	15,2
His	CAC*	0,59	15,1	Ser	TCC	0,23	17,7
He	ATA	0,14	7,5	Thr	ACG	0,12	6,1
He	ATT	0,35	16,0	Thr	ACA	0,27	15,1
He	ATC*	0,52	20,8	Thr	ACT	0,23	13,1
Lys	AAG*	0,60	31,9	Thr	ACC*	0,38	18,9
Lys	AAA	0,40	24,4	Vai	GTG*	0,48	28,1
Leu	TTG	0,12	12,9	Vai	GTA	0,10	7,1
Leu	TTA	0,06	7,7	Vai	GTT	0,17	11,0
Leu	CTG*	0,43	39,6	Vai	GTC	0,25	14,5
Leu	CTA	0,07	7,2	Trp	TGG*	1	13,2
Leu	CTT	0,12	13,2	Tyr	TAT	0,42	12,2
Leu	CTC	0,20	19,6	Tyr	TAG*	0,58	15,3
Met	ATG*	1	22,0	Parada	TGA*	0,61	1,6
Asn	AAT	0,44	17,0	Parada	TAG	0,17	0,8
Asn	AAC*	0,56	19,1	Parada	TAA	0,22	1,0

*: códon mais frequente

Petição 870190070557, de 24/07/2019, pág. 236/401

172/306

Sequência otimizada no códon [0291 ] Como descrito acima, é preferido de acordo com a invenção que todos os códons da sequência do tipo selvagem que codificam um tRNA, que é relativamente raro na célula, sejam trocados por um códon que codifica um tRNA, que é relativamente frequente na célula e que, em cada caso, carrega o mesmo aminoácido que o tRNA relativamente raro.

[0292] Desta maneira, é particularmente preferido que os códons mais frequentes sejam usados para cada aminoácido codificado (vide Tabela 4, os códons mais frequentes são marcados com asteriscos). Tal procedimento de otimização aumenta o índice de adaptação do códon (CAI) e por fim maximiza o CAI. No contexto da invenção, sequências com CAI aumentado ou maximizado são referidas como sequências com códon otimizado e/ou sequências com CAI aumentado e/ou maximizado. De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular, RNA, como aqui definido) compreende pelo menos uma sequência de codificação, em que a sequência de codificação é otimizada no códon como aqui descrito. Mais preferivelmente, o índice de adaptação de códon (CAI) da pelo menos uma sequência de codificação é pelo menos 0,5, pelo menos 0,8, pelo menos 0,9 ou pelo menos 0,95. Sobretudo mais preferivelmente, o índice de adaptação do códon (CAI) da pelo menos uma sequência de codificação é 1.

[0293] Por exemplo, no caso do aminoácido alanina (Ala) presente na sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), a sequência de codificação do tipo selvagem é adaptada de um modo que o códon humano mais frequente GCC é sempre usado para o dito aminoácido, ou para o aminoácido Cisteína

Petição 870190070557, de 24/07/2019, pág. 237/401

173/306 (Cys), a sequência do tipo selvagem é adaptada de um modo que o códon humano mais frequente TGC é sempre usado para o dito aminoácido, etc.

Sequências otimizadas em C [0294] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificada através da modificação, preferivelmente aumento, do teor de citosina (C) da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), em particular em sua pelo menos uma sequência de codificação.

[0295] Em modalidades preferidas, o teor de C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificado, preferivelmente aumentado, comparado com o teor de C da sequência de codificação do respectivo ácido nucleico do tipo selvagem (não modificado). A sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção preferivelmente não é modificada comparado com a sequência de aminoácido codificada pelo respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou o respectivo outro ácido nucleico do tipo selvagem).

[0296] Em modalidades preferidas, a dita molécula de ácido nucleico modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é modificada de modo que pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70% ou 80% ou pelo menos 90% do teor de citosina máximo teoricamente possível ou até mesmo um teor de citosina máximo é atingido.

[0297] Em modalidades preferidas adicionais, pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% ou até mesmo 100% dos

Petição 870190070557, de 24/07/2019, pág. 238/401

174/306 códons do ácido nucleico do tipo selvagem, preferivelmente RNA, sequências que são otimizáveis no teor de citosina são substituídas por códons tendo um teor de citosina mais alto do que os presentes na sequência do tipo selvagem.

[0298] Em modalidades preferidas adicionais, alguns dos códons da sequência de codificação do tipo selvagem podem ser ainda modificados de modo que um códon para um tRNA relativamente raro na célula é trocado por um códon para um tRNA relativamente frequente na célula, contanto que o códon substituído por um tRNA relativamente frequente carregue o mesmo aminoácido que o tRNA relativamente raro do códon do tipo selvagem original. Preferivelmente, todos dos códons para um tRNA relativamente raro são substituídos por um códon para um tRNA relativamente frequente na célula, exceto códons codificando aminoácidos, que são exclusivamente codificados por códons não contendo nenhuma citosina, ou exceto glutamina (Gin), que é codificada por dois códons, cada um contendo o mesmo número de citosinas.

[0299] Em modalidades preferidas adicionais da presente invenção, a molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificada de modo que pelo menos 80%, ou pelo menos 90%, do teor de citosina máximo teoricamente possível ou até mesmo um teor de citosina máximo seja obtido por meio de códons, que codificam tRNAs relativamente frequentes na célula, em que a sequência de aminoácido permanece sem modificação.

[0300] Devido à degeneração do código genético de ocorrência natural, mais de um códon pode codificar um aminoácido particular. Desta maneira, 18 de 20 aminoácidos de ocorrência natural sâo codificados por mais de um códon (com Tryp e Met sendo uma exceção), por exemplo, por 2 códons (por exemplo, Cys, Asp, Glu), por três códons (por exemplo, He), por 4 códons (por exemplo, Al, Gly, Pro) ou por 6 códons

Petição 870190070557, de 24/07/2019, pág. 239/401

175/306 (isto é, Leu, Arg, Ser). No entanto, nem todos os códons codificando o mesmo aminoácido são utilizados com a mesma frequência sob condições in vivo. Dependendo de cada organismo único, um perfil de uso de códon típico é estabelecido.

[0301 ] O termo códon com teor de citosina otimizável como usado dentro do contexto da presente invenção refere-se a códons que exibem um teor menor de citosinas do que outros códons codificando o mesmo aminoácido. Desta maneira, qualquer códon do tipo selvagem, que possa ser substituído por um outro códon codificando o mesmo aminoácido e exibindo um número maior de citosina do que aquele códon, é considerado ser otimizável em citosina (otimizável em C). Qualquer tal substituição de um códon do tipo selvagem otimizável em C pelo códon com C otimizada específico dentro de uma sequência de codificação do tipo selvagem aumenta seu teor de C total e reflete uma sequência de RNA modificada enriquecida em C.

[0302] De acordo com algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) e em particular sua pelo menos uma sequência de codificação, compreende ou consiste em uma sequência maximizada em C contendo códons com C otimizada para todos os códons potencialmente com C otimizável. Desta maneira, 100% ou todos dos códons com C otimizável teoricamente são preferivelmente substituídos por códons com C otimizada em todo o comprimento da sequência de codificação.

[0303] Neste contexto, códons com teor de citosina otimizável são códons que contêm um número menor de citosinas do que outros códons codificando o mesmo aminoácido. Qualquer um dos códons GCG, GCA, GCU codifica o aminoácido Ala, que pode ser trocado pelo códon GCC codificando o mesmo aminoácido, e/ou o códon UGLJ que codifica Cys pode ser trocado pelo códon

Petição 870190070557, de 24/07/2019, pág. 240/401

176/306

UGC codificando o mesmo aminoácido e/ou o códon GAU que codifica Asp pode ser trocado peio códon GAC codificando o mesmo aminoácido, e/ou o códon UUU que codifica Phe pode ser trocado pelo códon UUC codificando o mesmo aminoácido, e/ou qualquer um dos códons GGG, GGA, GGU que codificam Gly pode ser trocado pelo códon GGC codificando o mesmo aminoácido, e/ou o códon CAU que codifica His pode ser trocado pelo códon CAC codificando o mesmo aminoácido, e/ou qualquer um dos códons AUA, AUU que codificam lie pode ser trocado pelo códon AUC, e/ou qualquer um dos códons UUG, UUA, CUG, CUU codificando Leu pode ser trocado pelo códon CUC codificando esses aminoácidos, e/ou o códon AAU que codifica Asn pode ser trocado pelo códon AAC codificando o mesmo aminoácido, e/ou qualquer um dos códons COG, CCA, CCU codificando Pro pode ser trocado pelo códon CCC codificando o mesmo aminoácido, e/ou qualquer um dos códons AGG, AGA, CGG, CGU codificando Arg pode ser trocado pelo códon CGC codificando o mesmo aminoácido, e/ou qualquer um dos códons AGU, AGC, UCG, UCA, UCU codificando Ser pode ser trocado pelo códon UCC codificando o mesmo aminoácido, e/ou qualquer um dos códons ACG, ACU codificando Thr pode ser trocado pelo códon ACC codificando o mesmo aminoácido, e/ou qualquer um dos códons GUG, GUA, GUU codificando Vai pode ser trocado pelo códon GUC codificando o mesmo aminoácido,

Petição 870190070557, de 24/07/2019, pág. 241/401

177/306 e/ou o códon UAU codificando Tyr pode ser trocado pelo códon UAC codificando o mesmo aminoácido.

[0304] Em qualquer um dos casos acima, o número de citosinas é aumentado em 1 por códon trocado. Troca de todos os códons não C otimizada (correspondendo a códons otimizáveis em C) da sequência de codificação resulta em uma sequência de codificação maximizada em C. No contexto da invenção, pelo menos 70%, preferivelmente pelo menos 80%, mais preferivelmente pelo menos 90%, dos códons não C otimizada dentro da pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são substituídos por códons com C otimizada.

[0305] Pode ser preferido que para alguns aminoácidos a porcentagem de códons com C otimizável substituídos por códons com C otimizada seja menos do que 70%, enquanto para outros aminoácidos a porcentagem de códons substituídos é maior do que 70% para satisfazer a porcentagem total de otimização de C de pelo menos 70% de todos os códons do tipo selvagem com C otimizável da sequência de codificação. [0306] Preferivelmente, em uma molécula de ácido nucleico artificial otimizada em C, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), pelo menos 50% dos códons do tipo selvagem com C otimizável para qualquer dado aminoácido são substituídos por códons otimizados em C, por exemplo, qualquer RNA enriquecido em C modificado (ou outro ácido nucleico, em particular RNA) contém preferivelmente pelo menos 50% de códons otimizados em C nas posições de códon do tipo selvagem com C otimizável codificando qualquer um dos aminoácidos mencionados acima Ala, Cys, Asp, Phe, Gly, His, He, Leu, Asn, Pro, Arg, Ser, Thr, Vai e Tyr, preferivelmente pelo menos 60%.

Petição 870190070557, de 24/07/2019, pág. 242/401

178/306 [0307] Neste contexto, códons codificando aminoácidos, que não sâo otimizáveis no teor de citosina e que são, no entanto, codificados por pelo menos dois códons, podem ser usados sem nenhum processo de seleção adicional. No entanto, o códon da sequência do tipo selvagem que codifica um tRNA relativamente raro na célula, por exemplo, uma célula humana, pode ser trocado por um códon que codifica um tRNA relativamente frequente na célula, em que ambos codificam o mesmo aminoácido. Desta maneira, o códon relativamente raro GAA codificando Glu pode ser trocado pelo códon relativamente frequente GAG codificando o mesmo aminoácido, e/ou o códon relativamente raro AAA codificando Lys pode ser trocado pelo códon frequente relativo AAG codificando o mesmo aminoácido, e/ou o códon relativamente raro GAA codificando Gin pode ser trocado pelo códon relativamente frequente CAG codificando o mesmo aminoácido.

[0308] Neste contexto, os aminoácidos Met (AUG) e Trp (UGG), que são codificados por apenas um códon cada um, permanecem sem modificação. Códons de parada não são otimizados no teor de citosina, no entanto, os códons de parada relativamente raros âmbar, ocre (UAA, UAG) podem ser trocados pelo códon de parada relativamente frequente opal (UGA).

[0309] As substituições únicas listadas acima podem ser usadas individualmente bem como em todas as combinações possíveis a fim de otimizar o teor de citosina da molécula de ácido nucleico artificial modificada, preferivelmente RNA, comparado com a sequência do tipo selvagem.

[0310] Desta maneira, a pelo menos uma sequência de codificação como definido aqui pode ser mudada comparado com a sequência de

Petição 870190070557, de 24/07/2019, pág. 243/401

179/306 codificação do respectivo ácido nucleico do tipo selvagem, preferivelmente RNA, de tal maneira que um aminoácido codificado por pelo menos dois ou mais códons, dos quais um compreende uma citosina adicional, tal códon pode ser trocado pelo códon otimizado em C compreendendo uma citosina adicional, em que o aminoácido é preferivelmente não alterado comparado com a sequência do tipo selvagem.

[0311] De acordo com modalidades particularmente preferidas, a combinação da invenção compreende uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo (em adição às 5’ UTR e 3’ UTR especificadas aqui) pelo menos uma sequência de codificação como definido aqui, em que (a) o teor de G/C da pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, é aumentada comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico do tipo selvagem correspondente (preferivelmente RNA) e/ou (b) em que o teor de C da pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico do tipo selvagem correspondente (preferivelmente RNA) e/ou (c) em que os códons na pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, e em que a sequência de aminoácido codificada pela molécula de ácido nucleico artificial, preferivelmente RNA, não está sendo preferivelmente modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico do tipo selvagem correspondente (preferivelmente RNA).

Petição 870190070557, de 24/07/2019, pág. 244/401

180/306

Sequências de Ácido Nucleico Modificadas [0312] As modificações de sequência indicadas acima podem em geral ser aplicadas a qualquer uma das sequências de ácido nucleico descritas aqui, e são particularmente compreendidas ser aplicadas às sequências de codificação compreendendo ou consistindo em sequências de ácido nucleico codificando proteínas associadas a CRISPR como aqui definido, e opcionalmente NLS ou outras porções, domínios ou marcadores de peptídeo ou proteína. As modificações (incluindo modificações químicas, modificações de lipídeo e modificações de sequência) podem, se adequado ou necessário, se combinadas umas com as outras em qualquer combinação, contanto que as modificações combinadas não Interfiram umas com as outras, e preferivelmente contanto que a proteína associada a CRISPR codificada (e a NLS, sequência de sinal, marcador de proteína/peptídeo) preferivelmente retenha sua funcionalidade ou propriedade biológica desejada, como acima definido.

[0313] Em modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína associada a CRISPR, em que a dita sequência de codificação foi modificada como descrito acima.

[0314] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína Cas9 ou um homólogo, variante, fragmento ou derivado da mesma, em que a dita sequência de codificação compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 1018610199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391;

Petição 870190070557, de 24/07/2019, pág. 245/401

181/306

2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 99789991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 58265839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 59225935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 95469559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 70187031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 81948207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 82908302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 99149927; 10026-10039; 10138-10151; 10250-10263; 10362-10375; 92909303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 93869399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 94829495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo

Petição 870190070557, de 24/07/2019, pág. 246/401

182/306

97%, de identidade de sequência com qualquer uma dessas sequências.

[0315] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína Cpf1 ou um homólogo, variante, fragmento ou derivado da mesma, em que a dita sequência de codificação compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 69686969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 1020010201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543 2344-2345; 23602361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 24562457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 95129513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 46804681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 47764777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 95449545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840Petição 870190070557, de 24/07/2019, pág. 247/401

183/306

5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 59365937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 95609561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208P9AQ· R97R· 89ΑΠ S941 &9RA P9R7· 8979 ^97^- 8988 898Q8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-105831057910580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686;

10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755;

10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812;

10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881;

10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646;

10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715;

10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772;

10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841;

10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606;

10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;

Petição 870190070557, de 24/07/2019, pág. 248/401

184/306

10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;

10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801;

10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;

10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;

10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;

10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;

10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;

10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;

10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;

10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;

10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;

10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;

10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;

10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;

10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;

10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;

10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;

10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente

Petição 870190070557, de 24/07/2019, pág. 249/401

185/306 peto menos 85%, ainda mais preferivelmente peto menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0316] O ácido nudeico artificial de acordo com a invenção pode, na(s) mesma região(ões) (ácido nudeico monocistrônico) ou diferente^) (ácido nudeico multicistrônico), codificar mais proteínas ou peptídeo. As respectivas sequências de ácido nudeico de codificado podem ser submetidas às mesmas modificações de sequência como descrito acima. Em particular, a sequência de codificação do ácido nucleico artificial da invenção pode compreender uma ou mais sequências codificando um ou mais sinais de localização nuclear (NLS), que são preferivelmente fundidos à sequência de ácido nudeico codificando a proteína associada a CRISPR. Essas sequências podem ser modificadas como descrito acima, também.

[0317] As sequências de codificação modificadas (ou ’'otimizadas) podem ser combinadas com qualquer uma das UTRs reveladas aqui.

[0318] Desta maneira, em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem pelo menos um elemento de 5’ UTR como aqui definido, pelo menos um elemento de 3’ UTR como aqui definido e uma sequência de codificação codificando uma proteína Cas9 ou Cpf1 ou um homólogo, variante, fragmento ou derivado (funcional) do mesmo, em que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO:413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 1040210408; 10554; 10599-10612 (HSD17B4 / Gnas.1); SEQ ID NO:414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626 (Slc7a3.1 / Gnas.1); SEQ ID NO:415; 2362-2377; 3522-3537: 4682-4697; 5842-5857; 70027017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640

Petição 870190070557, de 24/07/2019, pág. 250/401

186/306 (ATP5A1 / CASP.1); SEQ ID NO:416; 2378-2393; 3538-3553; 46984713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654 (Ndufa4.1 / PSMB3.1); SEQ ID NO:417; 23942409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 93549369; 10430-10436; 10558; 10655-10668 (HSD17B4 / PSMB3.1); SEQ ID NO:418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 (RPL32var / albumina7); SEQ ID NO:419; 2426-2441; 3586-3601; 4746-4761; 5906-5921; 7066-7081; 8226-8241; 9386-9401; 10444-10450; 10560; 10683-10696 (32L4 / albumina7); SEQ ID NO:420; 2442-2457; 36023617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710 (HSD17B4 / CASP1.1); SEQ ID NO:421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724 (Slc7a3.1 / CASP1.1); SEQ ID NO:422; 2474-2489; 3634-3649; 4794-4809; 59545969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 1072510738 (Slc7a3.1 / PSMB3.1); SEQ ID NO:423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 1047210478; 10564; 10739-10752 (Nosip.1 / PSMB3.1); SEQ ID NO:424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766 (Ndufa4.1 / RPS9.1); SEQ ID NO:425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 71627177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780 (HSD17B4 / RPS9.1); SEQ ID NO:9498- 9609; 10493-10499; 10567; 10781-10794 (ATP5A1 / Gnas.1); SEQ ID NO:9610-9721; 1050010506; 10568; 10795-10808 (Ndufa4.1 / COX6B1.1); SEQ ID NO:97229833; 10507-10513; 10569; 10809-10822 (Ndufa4.1 / Gnas.1); SEQ ID NO:9834-9945; 10514-10520; 10570; 10823-10836 (Ndufa4.1 / Ndufal. 1); SEQ ID NO:9946-10057; 10521-10527; 10571; 10837-10850 (Nosip.1 / Ndufal.1); SEQ ID N0:10058-10169; 10528-10534; 10572;

Petição 870190070557, de 24/07/2019, pág. 251/401

187/306

10851-10864 (Rpl31.1 / Gnas.1); SEQ ID N0:10170-10281; 1053510541; 10573; 10865-10878 (TUBB4B.1 /RPS9.1); SEQ ID NO:1028210393; 10542-10548; 10574; 10879-10892 (Ubqln2.1 / RPS9.1) ou urn homólogo, variante ou fragmento de qualquer uma das ditas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. É facilmente aparente para um versado na técnica qual SEQ ID NO pertence a qual proteína (Cas9 ou Cpf1) pela orientação dada na linha Outras informações na listagem de sequência sob <223>, onde é revelado se a respectiva SE ID NO: lembra um produto de mRNA variante de Cpf1 ou um produto de mRNA variante de Cas9.

5’ Cap [0319] De acordo com modalidades preferidas da invenção, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA) como aqui definido, pode ser modificada através da adição de uma chamada estrutura ‘5’ cap’, que preferivelmente estabiliza a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) como descrito aqui.

[0320] Um 5’ cap é uma entidade, tipicamente uma entidade nucleotídeo modificado, que geralmente faz capeamento da extremidade 5’ de um mRNA maduro. Um 5’ cap pode ser tipicamente formado por um nucleotídeo modificado, particularmente por um derivado de um nucleotídeo guanina. Preferivelmente, o 5’ cap é ligado ao terminal 5’ através

Petição 870190070557, de 24/07/2019, pág. 252/401

188/306 de uma ligação 5’-5’-trifosfato. Um 5’ cap pode ser metilado, por exemplo, m7GpppN, em que N é o nucleotídeo 5’ terminal do ácido nucleico carregando o 5’ cap, tipicamente a extremidade 5’ de um mRNA. M7GpppN é a estrutura 5’-cap, que ocorre naturalmente em mRNA transcrito por polimerase II e então preferivelmente não é considerado uma modificação compreendida em um mRNA modificado neste contexto. Desta maneira, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender uma m7GpppN como 5’-cap, mas ainda a dita molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou outro ácido nucleico), compreende tipicamente pelo menos uma modificação adicional como definido aqui. [0321] Exemplos adicionais de estruturas 5’ cap incluem glicerila, resíduo desóxi abásico invertido (porção), nucleotídeo de 4’,5’-metileno, nucleotídeo de l-(beta-D-eritrofuranosila), nucleotídeo de 4’-tio, nucleotídeo carbocíclico, nucleotídeo de 1,5-anidroexitol, L-nucleotídeos, alfanucleotídeo, nucleotídeo base modificado, nucleotídeo de treo-pentofuranosil, nucleotídeo de 3’,4’-seco acíclico, nucleotídeo de 3,4-di-hidroxibutila acíclico, nucleotídeo de 3,5-dí-hidroxipentila acíclico, porção de nucleotídeo invertida 3’,3’, porção abásica invertida 3’,3’, porção de nucleotídeo invertida 3’-2’, porção abásica invertida 3’-2’, fosfato de 1,4butanodiol, 3’-fosforamídato, hexilfosfato, fosfato de aminoexila, 3’-fosfato, 3’-fosforotioato, fosforoditioato ou porção metilfosfonato em ponte ou não em ponte. Essas estruturas 5’-cap modificadas são consideradas como pelo menos uma modificação neste contexto.

[0322] Estruturas 5’-cap modificadas particularmente preferidas são cap1 (metilação da ribose do nucleotídeo adjacente de m7G), cap2 (metilação adicional da ribose do 2^o nucleotídeo a jusante de m7G), cap3 (metilação adicional da ribose do 3^o nucleotídeo a jusante de m7G), cap4 (metilação da ribose no 4^o nucleotídeo a jusante de m7G), ARCA

Petição 870190070557, de 24/07/2019, pág. 253/401

189/306 (análogo de cap antirreverso), ARCA modificado (por exemplo, ARCA modificado com fosforotioato), CleanCap (TriLink) ou uma estrutura de Cap como revelado no WO2017053297A1 (aqui incorporado a titulo de referência), inosina, Nl-metil-guanosina, 2^!-fluor-guanosina, 7-desazaguanosina, 8-oxo-guanosina, 2-amíno-guanosina, LNA-guanosina e 2azido-guanosina.

[0323] De acordo com modalidades preferidas, o ácido nucleico artificial compreende um grupo metila na posição 2’-0 da posição ribose2’-0 do primeiro nucleotídeo adjacente à estrutura de cap na extremidade 5’ do RNA (cap-1). Tipicamente, metilação pode ser obtida através da ação de Cap 2’-O~Metiltransferase, utilizando ácidos nucleicos artificiais capeados m7GpppN (preferivelmente RNA) como um substrato e S-adenosinametionina (SAM) como um doador de metila para metilar RNA capeado (cap~0) resultando na estrutura cap-1. A estrutura cap-1 foi relatada aumentar a eficiência de tradução de mRNA e desta maneira pode ajudar a melhorar a eficácia de expressão do ácido nucleico artificial da invenção, preferivelmente RNA, descrito aqui.

Poli(A) [0324] De acordo com modalidades preferidas adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) contém uma sequência de poli(A).

[0325] Uma sequência de poli(A), também chamada cauda poli(A) ou cauda 3’-poii(A), é tipicamente compreendida ser uma sequência de nucleotídeos de adenosina, por exemplo, de até cerca de 400 nucleotídeos de adenosina, por exemplo, de a partir de cerca de 20 a cerca de 400, preferivelmente de a partir de cerca de 50 a cerca de 400, mais preferivelmente de a partir de cerca de 50 a cerca de 300, ainda mais preferivelmente de a partir de cerca de 50 a cerca de 250, sobretudo preferivelmente de a partir de cerca de 60 a cerca de 250 nucleotídeos

Petição 870190070557, de 24/07/2019, pág. 254/401

190/306 de adenosina. Como aqui usado, uma sequência de ροΠ(Α) pode também compreender cerca de 10 a 200 nucleotídeos de adenosina, preferivelmente cerca de 10 a 100 nucleotídeos de adenosina, mais preferivelmente cerca de 40 a 80 nucleotídeos de adenosina ou ainda mais preferivelmente cerca de 50 a 70 nucleotídeos de adenosina. Uma sequência de poli(A) está tipicamente localizada na extremidade 3’ de um RNA, em particular um mRNA.

[0326] Desta maneira, em modalidades preferidas adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) contém em seu terminal 3’ uma cauda poli(A) de tipicamente cerca de 10 a 200 nucleotídeos de adenosina, preferivelmente cerca de 10 a 100 nucleotídeos de adenosina, mais preferivelmente cerca de 40 a 80 nucleotídeos de adenosina ou ainda mais preferivelmente cerca de 50 a 70 nucleotídeos de adenosina.

[0327] Preferivelmente, a sequência de poli(A) na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA), é derivada de um modelo de DNA através de transcrição de RNA in vitro. Alternativamente, a sequência de poli(A) pode ser também obtida in vitro através de métodos comuns de síntese química sem ser necessariamente transcrita a partir de um progenitor de DNA.

[0328] Além disso, sequências de poli(A), ou caudas de poli(A), podem ser geradas através de poliadenilação enzimática da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA) usando kits de poliadenilação comercialmente disponíveis e protocolos correspondentes conhecidos na técnica. Poliadenilação é tipicamente compreendida ser a adição de uma sequência de poli(A) a uma molécula de ácido nucleico, tal como uma molécula de RNA, por exemplo, um mRNA prematuro. Poliadenilação

Petição 870190070557, de 24/07/2019, pág. 255/401

191/306 pode ser induzida por um chamado sinal de poliadenilação. O sinal está preferivelmente localizado dentro de uma extensão de nudeotídeos na extremidade 3’ do mRNA a ser poliadenilado. Um sinal de poliadenilação compreende tipicamente um hexâmero consistindo em nucleotídecs adenina e uradl/timina, preferivelmente a sequência de hexâmero AAUAAA. Outras sequências, preferivelmente sequências de hexâmero, são também concebíveis. Poliadenilação tipicamente ocorre durante processamento de um pré-mRNA (também chamado mRNA prematuro). Tipicamente, maturação de RNA (de pré-mRNA para mRNA maduro) compreende uma etapa de poliadenilação.

[0329] Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender um sinal de poliadenilação que provê poliadenilação a um RNA (transcrito) através de fatores de proteína específicos (por exemplo, fator de especificidade de divagem e poliadenilação (CPSF), fator de estimulação de divagem (CstF), fatores de divagem I e II (CF I e CF II), polimerase de poli(A) (PAP)).

[0330] Neste contexto, um sinal de poliadenilação de consenso é preferido compreendendo a sequência de consenso NN(U/T)ANA. Em um aspecto particularmente preferido, o sinal de poliadenilação compreende uma das sequências que seguem: AA(U/T)AAA ou A(U/T)(U/T) AAA (em que uridina está geralmente presente em RNA e timidina está geralmente presente em DNA).

Poli(C) [0331] De acordo com modalidades preferidas adidonais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) contém uma cauda poli(C) no terminal 3’ de tipicamente cerca de 10 a

Petição 870190070557, de 24/07/2019, pág. 256/401

192/306

200 nucleotídeos citosina, preferivelmente cerca de 10 a 100 nucieotídeos citosina, mais preferivelmente cerca de 20 a cerca de 70 nucleotídeos citosina ou ainda mais preferivelmente cerca de 20 a 60 ou até mesmo 10 a 40 nucleotídeos citosina.

Alça-tronco de histona (HSL) [0332] Em algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) compreende uma sequência/estrutura de alça-tronco de histona (HSL). Tais sequências de alça-tronco de histona são preferivelmente selecionadas de sequências de alça-tronco de histona como revelado no WO2012/019780, cuja descrição é aqui incorporada a título de referência.

[0333] Uma sequência de alça-tronco de histona, adequada para ser usada na presente invenção, é preferivelmente selecionada de pelo menos uma da fórmula (I) ou (II) que segue:

fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) fórmula (li) (sequência de tronco-alça com elementos limítrofes de tronco):

[N0-2GN3..5] [No_4(ü/T)No_4] [Ns-sCIfe] tronco! silçsj troncok em que:

Ni-β [N0-2GN3-5] [No^(U/T)N_o^] [N3-5CN0-2]

-----! '--.....------------------· ·, '---' ⁵-------y-----Ύ tronco! tronco! _a^_a tronco2 tronco2 , ... . elemento limítrofe elemsmo hmltrote elementos limítrofes de troncol ou tronco2 hh-s é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de

Petição 870190070557, de 24/07/2019, pág. 257/401

193/306 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C, ou um análogo de nucleotídeo do mesmo;

troncol [N0-2GN3-5] é complementar reverso ou parcialmente complementar reverso com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotídeos;

em que No-2Ó uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, GeC ou um análogo de nucleotídeo do mesmo;

em que N3-5 θ uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma, contanto que sua nucleotídeo citidina complementar seja substituída por guanosina;

sequência de alça [N0-4(U/T)N0-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nucleotídeos;

em que cada N0-4 é independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucleotídeo selecionada de A, U, T, G e C ou um análogo de nucleotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva

Petição 870190070557, de 24/07/2019, pág. 258/401

194/306 de entre 5 a 7 nudeotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;

em que N0-2 é uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contendo que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;

em que 0 troncol e 0 tronco2 são capazes de emparelhamento de base um com 0 outro formando uma sequência reversa complementar, em que 0 emparelhamento de base pode ocorrer entre 0 troncol e 0 tronco2, por exemplo, emparelhamento de base WatsonCrick de nudeotídeos A e U/T ou G e C ou por emparelhamento de base não Watson Crick, por exemplo, emparelhamento de base wobble, emparelhamento de base Watson-Crick, emparelhamento de base Hoogsteen, emparelhamento de base Hoogsten ou são capazes de emparelhamento de base um com 0 outro formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre 0 troncol e tronco2, com base em que uma ou mais bases no tronco não têm uma base complementar na sequência de complementaridade reversa do outro tronco.

[0334] De acordo com uma modalidade preferida, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender pelo menos uma sequência de tronco-alça de histona (HSL)

Petição 870190070557, de 24/07/2019, pág. 259/401

195/306 de acordo com peto menos uma da fórmula (Ia) ou (Ha) específica que segue:

fórmula (Ia) (sequência de tronco-alça sem elementos limítrofes de tronco):

[No-tGNw] [Ni.₃(U/T)N₀.2] [N3.5CN0.1] x__________ç,y -----------_v' tronco 1 alça tronco 2 fórmula (Ha) (sequência de tronco-alça com elementos limítrofes de tronco):

N2-5 IW1GN3-5] [Ni-3(U/T)N₀_₂] [N3-5CN0-1] N2-5

.... · ----------------...-----------------. ..J--· ·--

V tronco 1 troncol alça. tronco2 tronco2 elemento limítrofe elemento limítrofe em que:

N, C, G, T e U são como acima definido.

[0335] De acordo com uma modalidade mais particularmente preferida adicional, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) pode compreender peto menos uma sequência de tronco-alça de histona de acordo com peto menos uma da fórmula (Ib) ou (llb) específica que segue:

Fórmula (Ib) (sequência de tronco-alça sem elementos limítrofes de fes de tronco):

[N1GN4] [N₂(U/T)Ni] [N4CN1]

V M y ·.

tronco! atoa trooco2 fórmula (llb) (sequência de tronco-alça com elementos limítrofes de tronco):

Petição 870190070557, de 24/07/2019, pág. 260/401

196/306

N₄-5 [N1GN4] [N₂(U/T)Ni] [N4CN1] N4-5 \__________' „__________X.---------,.--------V V trancol troncol alça tronco2 tronccS elemento limítrofe elemento limítrofe em que

N, C, G, T e U são como acima definido.

[0336] Uma sequência de tronco-alça de histona particularmente preferida é a sequência CAAAGGCTCTTTTCAGAGCCACCA ou mais preferivelmente a sequência de RNA correspondente CAAAGGCUCUUUUCAGAGCCACCA.

Porções de miRNA [0337] Em uma modalidade adicional, porções de não codificação, isto é, por exemplo, porções de miRNA, são combinadas com as sequências da invenção. Porções de não codificação podem ser selecionadas de sequências de ácido nucleico de uma ou mais reveladas na lista que segue: uma 5’-UTR;

uma 3-UTR;

uma porção de miRNA;

um Cap;

uma sequência de poli(C) uma sequência de tronco-alça de histona uma sequência de poli(A) ou um sinal de poliadenilação;

uma porção de IRES uma porção grampo de cabelo.

porções para proteínas de ligação a RNA uma porção que previne degradação de 3’-5’ porções que regulam taxas de declínio de RNA

Petição 870190070557, de 24/07/2019, pág. 261/401

197/306 [0338] Os acima são termos genéricos. Porções específicas que se encaixam nesses termos genéticos são também providas pela presente invenção. Detalhes de porções da lista acima, incluindo sequências pertencentes às modalidades específicas, são providos abaixo.

[0339] Embora a lista acima proveja itens na forma singular, é igualmente possível que mais de uma porção respectiva seja selecionada. Porções de ácido nucleico não incluídas na lista acima podem ser igualmente selecionadas. Preferivelmente, pelo menos um módulo ou porção é da lista acima.

[0340] Em modalidades típicas, pelo menos uma porção 5’-UTR e/ou pelo menos uma porção 3^!~UTR é selecionada. Preferivelmente, pelo menos uma 5’-UTR e pelo menos uma 3’-UTR é selecionada.

[0341 ] Um miRNA pode ser também selecionado como uma porção na presente invenção. Qualquer porção de miRNA conhecida na técnica pode ser selecionada. Tal porção pode ser selecionada de sequênciasalvo de microRNA, sequências de microRNA ou sementes de microRNA. Por exemplo, sequências de miRNA (sequências-alvo de microRNA, sequências de microRNA ou sementes de microRNA) são descritas nos WO2015085318A2, US2005/0261218, US20170211066, WO2017201332, WO2017201328, WO2017201349, WO2017201347, WO2017201348, WO2017201342, WO2017201346, US20160177295, WO2014113089, EP2946014, W02016100812, WO2013126803 e US2005/0059005 (todas as referências mencionadas são aqui incorporadas a título de referência). Identificação de microRNA, regiões-alvo de microRNA e seus padrões de expressão e papel em biologia foram relatados (Bonauer e outros, Curr Drug Targets 2010 11 :943-949; Anand e Cheresh, Curr Opin Hematol 2011, 18: 171-176; Contreras eRao Leukemia, 2012 26:404-413; Barrel, Cell, 2009 136:215-233; Landgraf e outros Cell, 2007 129: 1401-1414 todas as referências mencionadas acima são aqui incorporadas a título de referência).

Petição 870190070557, de 24/07/2019, pág. 262/401

198/306 [0342] Em geral, microRNAs (ou miRNA) são RNAs de não codificação de 19-25 nucleotídeos de comprimento. miRNAs se ligam a 3’UTR de moléculas de ácido nucleico. Isso causa sub-regulagem de expressão de gene, ou através da redução da estabilidade da molécula de ácido nudeico ou inibindo tradução. Como um módulo da presente invenção, os polinucleotídeos da presente invenção podem compreender uma sequências-alvo de microRNA, sequências de microRNA ou sementes de microRNA.

[0343] Como aqui usado, o termo sítio de microRNA refere-se a uma sequência de polinucleotídeo à qual microRNA pode se ligar ou de outro modo se associar. Ligação tipicamente ocorre através de hibridização Watson-Crick; mas qualquer outra associação estável do microRNA com a sequência-alvo no ou adjacente ao sítio de microRNA é também compreendida no conceito de sítio de microRNA de acordo com a presente invenção.

[0344] Em geral, uma sequência de microRNA compreende uma região semente, isto é, uma sequência tipicamente na região de posições 2-8 de um microRNA maduro. A sequência de região de semente tem complementaridade Waston-Crick perfeita com a sequência-alvo de miRNA. Tal semente de microRNA pode compreender posições 2-8 ou, alternativamente, 2-7 do microRNA maduro. Desta maneira, em uma modalidade, uma semente de microRNA compreende 7 nucleotídeos (por exemplo, nucleotídeos 2-8 do microRNA maduro), em que o sítio de complementaridade de semente no alvo de miRNA correspondente é flanqueado por uma adenina (A) oposto à posição 1 de microRNA. Em uma outra modalidade, uma semente de microRNA compreende 6 nucleotídeos (por exemplo, nucleotídeos 2-7 do microRNA maduro), em que o sítio de complementaridade de semente no alvo de miRNA correspondente é flanqueado por adenina (A) oposto à posição de microRNA 1. As respectivas moléculas de ácido nucleico são reveladas

Petição 870190070557, de 24/07/2019, pág. 263/401

199/306 em Grimson e outros; Mol Cell. 2007 Jul 6;27(1 ):91 -105.

[0345] Na presente invenção, uma sequência-alvo de microRNA é tipicamente projetada para ser compreendida em uma 3’-UTR ou de outro modo 3’ (a montante) de uma estrutura de leitura aberta. Em tal caso, a sequência-alvo de miRNA é pensada se direcionar à molécula para degradação ou tradução reduzida, contanto que um microRNA correspondente em questão esteja disponível. Isso permite controlar quaisquer efeitos fora do alvo indesejados quando da administração da molécula de ácido nucleico da presente invenção.

[0346] No caso de não ser desejado traduzir um mRNA no fígado, mas o mRNA é transportado para o fígado ou de outro modo termina nele, então miR-122, um microRNA abundante no fígado, pode inibir a expressão do ácido nucleico da presente invenção, se um ou múltiplos sítios-alvo de miR-122 estiverem presentes (por exemplo, projetado) na região 3’-UTR do polinucleotídeo na presente invenção. Introdução de um ou múltiplos sítios de ligação para microRNA diferente pode ser engenheirada para influenciar mais (por exemplo, diminuir) a longevidade, estabilidade e tradução de proteína de polinucleotídeos.

[0347] Em contraste, no caso de ser realmente desejado traduzir um mRNA, sítios de ligação de microRNA podem ser engenheirados a partir de (isto é, removidos de) sequências em que eles ocorrem, por exemplo, a fim de aumentar a expressão de proteína em tecidos específicos. Por exemplo, um ou mais sítios de ligação de miR-122 podem ser removidos para melhorar a expressão da proteína no fígado.

[0348] Desta maneira, regulagem de expressão em tecidos específicos pode ser realizada através de introdução ou remoção de um ou vários sítios de ligação de microRNA. Por exemplo, microRNAs são conhecidos regular mRNA, e desta maneira expressão de proteína, sem limitação no fígado (miR-122), coração (miR-ld, miR-149), células endoteliais (miR-17-92, miR-126), tecido adiposo (let-7, miR-30c), rim (miR

Petição 870190070557, de 24/07/2019, pág. 264/401

200/306

192, miR-194, miR-204), células mieloides (miR-142-3p, miR-142-5p), miR-16, mlR-21, miR223, miR-24, miR-27), músculo (mlR-133, miR206) e células epiteliais do pulmão (let-7, miR-133, miR-126). MicroRNA pode também regular processos biológicos complexos, tal como angiogênese (miR-132) (por exemplo, Anand e Cheresh, Curr. Opin. Hematol. 2011, 18: 171-176).

[0349] Desta maneira, em geral, de acordo com o princípio de projeto modular da presente invenção, sítios de ligação para microRNAs podem ser removidos ou introduzidos, a fim de adaptar a expressão da expressão de polinucleotídeo para os tipos de célula ou tecidos desejados ou ao contexto de processos biológicos relevantes. Listagens de sequências de miRNA e sítios de ligação estão disponíveis para o público. Qualquer sequência revelada na literatura discutida aqui pode ser usada no contexto da presente invenção: exemplos de microRNA que direcionam expressão de gene específica de tecido ou doença são listados em Getner e Naldini, Tissue Antigens. 2012, 80:393-403. Um exemplo de incorporação de sítios de semente de microRNA é incorporação de sítios de mlR-142 a um vetor lentiviral expressando UGT1A1, que causa expressão reduzida em células apresentando antígeno, levando à ausência de uma resposta imune contra o UGT1A1 viralmente expresso como revelado em Schmitt e outros, Gastroenterology 2010; 139:999-1007; Gonzalez-Asequinolaza e outros, Gastroenterology 2010, 139:726-729. Desta maneira, incorporação de um ou mais sítios de semente de m!R142 em mRNA é pensada ser importante no caso de tratamento de pacientes com deficiências de proteína completa (UGT1A1 tipo I, pacientes deficientes em LDLR, pacientes Pompe negativos em CRIM, etc). Desta maneira, a molécula de ácido nucleico da presente invenção pode ser projetada para se adequar a tais propósitos. Qualquer polinucleotídeo pode ser selecionado, que seja caracterizado

Petição 870190070557, de 24/07/2019, pág. 265/401

201/306 por peto menos 80% de identidade, pelo menos 85% de identidade, preferivelmente pelo menos 90% de identidade e mais preferivelmente pelo menos 95% de identidade com qualquer uma de tais sequências de miRNA.

[0350] Devido aos padrões de expressão diferentes de microRNA em tipos de células diferentes, a presente invenção permite projetar especificamente moléculas de polinucleotídeo para expressão direcionada em tipos de célula específicos ou sob condições biológicas específicas. Através de introdução de sítios de ligação de microRNA específicos de tecido, polinucleotídeos podem ser projetados para expressão de proteína em um tecido ou no contexto de uma condição biológica.

[0351] Em uma modalidade da Invenção, a molécula de ácido nucleico artificial da invenção codificando uma proteína associada a CRISPR (por exemplo, Cas9, Cpf1) da invenção compreende pelo menos uma sequência de miRNA selecionada do grupo consistindo em hsa-miR-27a-3p, hsa-miR-99b-5p, hsa-miR-21-5p, hsa-miR-142-5p, hsa-míR-27a~3p, hsa-míR-21~5p, hsa-miR-223~3p, hsa-miR-150~5p e hsa-mlR-142-5p.

Construtos [0352] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção, que compreende peto menos uma sequência de codificação como aqui definido compreende pelo menos uma 5’ UTR e peto menos uma 3’ UTR como aqui descrito, e opcionalmente pelo menos um tronco-alça de histona.

[0353] A 3’ UTR da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender ainda uma sequência de poli(A) e/ou poli(C) como aqui definido.

[0354] Os elementos únicos da 3’ UTR podem ocorrer aí em qual

Petição 870190070557, de 24/07/2019, pág. 266/401

202/306 quer ordem de 5’ a 3’ ao longo da sequência da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção.

[0355] Ainda, elementos adicionais como aqui descrito também podem estar contidos, tal como uma sequência de estabilização como definido aqui (por exemplo, derivada da UTR de um gene da globina), sequências de IRES, etc. Cada um dos elementos pode também ser repetido na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pelo menos uma vez (particularmente em construtos di- ou multicistrônicos), por exemplo, duas vezes ou mais. Como um exemplo, os elementos únicos podem estar presentes na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção na ordem que segue: 5’-sequência de codificação-tronco-alça de histona-sequência de poli(A)/(C) 3’; ou

5’-sequência de codificação-sequência de poli(A)/(C)-tronco-alça de h istona-3’; ou

5’-sequência de codificação-tronco-alça de histona-sinal de poliadenilação-3’; ou

5’-sequência de codificação-sinal de poliadenilação-tronco-alça de histona-3’; ou

5’-sequência de codificação-histona alça-tronco-alça-tronco de histonasequência de poli(A)/(C)-3’; ou

5’-sequência de codificação-tronco-alça de histona-tronco-alça de histona-sinal de poliadenilação~3’; ou

5^!-sequência de codificação-sequência de estabilização-sequência de poli(A)/(C)-tronco-alça de histona-3’; ou

5’-sequência de codificação, sequência de estabilização-sequência de poli(A)/(C)-sequência de poli-(A)/(C)-tronco-alça de histona-3’, etc.

[0356] De acordo com modalidades adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, preferivelmente compreende

Petição 870190070557, de 24/07/2019, pág. 267/401

203/306 ainda pelo menos um dos elementos estruturais que seguem: uma estrutura de histona-tronco-alça, preferivelmente uma histona-tronco-aiça na região não traduzida 3’; uma estrutura de 5’-cap; uma cauda de poliA; ou uma sequência de poli(C).

[0357] De acordo com algumas modalidades, é particularmente preferido que se, em adição a uma proteína associada a CRISPR, um peptídeo ou proteína adicional for codificado por pelo menos uma sequência de codificação como definido aqui-o peptídeo ou proteína codificado preferivelmente não é nenhuma proteína histona, nem proteína repórter (por exemplo, Luciferase, GFP e suas variantes (tal como eGFP, RFP ou BFP) e/ou nenhum marcador ou proteína de seleção, incluindo alfaglobina, galactocinase e Xantina:Guanina fosforribostil transferase (GPT), hipoxantina-guanina fosforribosiltransferase (HGPRT), beta galactosidase, galactocinase, fosfatase alcalina, fosfatase alcalina embriônica secretada (SEAP) ou um gene de resistência (tal como um gene de resistência contra neomicina, puromicina, higromicina e zeocina). Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica um gene repórter ou um gene marcador. Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica luciferase. Em outras modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica GFP ou uma variante da mesma.

[0358] Especificamente, moléculas de ácido nucleico artificiais, em particular RNAs, de acordo com a invenção podem compreender preferivelmente na direção 5’ para 3’, os elementos que seguem:

a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1

b) um elemento de 5’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como aqui definido, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com

Petição 870190070557, de 24/07/2019, pág. 268/401

204/306

SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma;

c) pelo menos uma sequência de codificação como aqui definido;

d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3^!~UTR como definido aqui, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 23; 25; 27; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,

e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nudeotídeos de adenosina,

f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nudeotídeos cisteína, e

g) opcionalmente um tronco-alça de histona.

[0359] Construtos de ácido nucleico artificias preferidos são discutidos em detalhes abaixo.

Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de GNAS [0360] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130

Petição 870190070557, de 24/07/2019, pág. 269/401

205/306

8145; 9290-9305; 10402-10408; 10554; 10599-10612, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3^! UTR derivado de GNAS:

[0361] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 414; 23462361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 93069321; 10409-10415; 10555; 10613-10626, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo

Petição 870190070557, de 24/07/2019, pág. 270/401

206/306

97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de ATP5A1 e elemento de 3’ UTR derivado de CASP1 [0362] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de ATP5A1, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 81628177; 9322-9337; 10416-10422; 10556; 10627-10640, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de NDUFA4 e elemento de 3^! UTR derivado de PSMB3:

[0363] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR

Petição 870190070557, de 24/07/2019, pág. 271/401

207/306 de urn gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nudeico artificial compreende ou consiste em uma sequência de ácido nudeico de acordo com SEQ ID NO: 416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nudeico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de PSMB3 [0364] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436: 10558; 10655-10668, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%,

Petição 870190070557, de 24/07/2019, pág. 272/401

208/306 preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de RPL32 e elemento de 3’ UTR derivado de ALB:

[0365] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de RPL32, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5^! UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de CASP1:

[0366] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo

Petição 870190070557, de 24/07/2019, pág. 273/401

209/306 menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3’ UTR derivado de CASP1 [0367] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência

Petição 870190070557, de 24/07/2019, pág. 274/401

210/306 de ácido nucleico tendo, em ordem crescente de preferência, peio menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3’ UTR derivado de PSMB3 [0368] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738, ou uma variante ou um fragmento de qualquer uma das ditas sequencais, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Petição 870190070557, de 24/07/2019, pág. 275/401

211/306

Elemento de 5’ UTR derivado de NOSIP e elemento de 3^! UTR derivado de PSMB3:

[0369] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NOSIP, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 82908305; 9459-9450; 10472-10478; 10564; 10739-10752, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de NDUFA4 e elemento de 3' UTR derivado de RPS9 [0370] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante

Petição 870190070557, de 24/07/2019, pág. 276/401

212/306 do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 83068321; 9466-9481; 10479-10485; 10565; 10753-10766, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de RPS9:

[0371] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos

Petição 870190070557, de 24/07/2019, pág. 277/401

213/306

80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.

[0372] Em outras modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento 5’ UTR e 3’ UTR como descrito aqui abaixo (ou de um homólogo, um fragmento ou variante da mesma), em que o ácido nucleico artificial compreende ou consiste em um a sequência de ácido nucleico de acordo com a SEQ ID NO: em parênteses atrás da combinação de UTR específica:

ATP5A1 / Gnas.1 (SEQ ID NO: 9498- 9609; 10493-10499; 10567; 10781-10794);

Ndufa4.1 / COX6B1.1 (SEQ ID NO: 9610-9721; 10500-10506; 10568; 10795-10808);

Ndufa4.1 / Gnas.1 (SEQ ID NO: 9722-9833; 10507-10513; 10569; 10809-10822);

Ndufa4.1 / Ndufal. 1 (SEQ ID NO: 9834-9945; 10514-10520; 10570; 10823-10836);

Nosip.1 / Ndufal.1 (SEQ ID NO: 9946-10057; 10521-10527; 10571; 10837-10850);

Rpl31.1 / Gnas.1 (SEQ ID NO: 10058-10169; 10528-10534; 10572; 10851-10864);

TUBB4B.1 ZRPS9.1 (SEQ ID NO: 10170-10281; 10535-10541; 10573; 10865-10878);

Ubqln2.1 / RPS9.1 (SEQ ID NO: 10282-10393; 10542-10548; 10574; 10879-10892).

Complexação [0373] Em modalidades preferidas, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer

Petição 870190070557, de 24/07/2019, pág. 278/401

214/306 outro ácido nucleico como aqui descrito) é provida em uma forma complexada, isto é, complexada ou associada com um ou mais compostos (poli-)catiônicos, preferivelmente com polímeros (poli-jcatiônicos, peptídeos (poli-jcatiônicos ou proteínas, por exemplo, protamina, polissacarídeos (poli)catiônicos e/ou lipídeos (poli-)catiônicos. Neste contexto, o termo complexado ou associado refere-se à combinação essencialmente estável da pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico) com um ou mais dos compostos mencionados acima em complexos ou arranjos maiores sem ligação covalente.

Lipídeos [0374] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção é complexada ou associada com lipídeos (em particular lipídeos catiônicos e/ou neutros) para formar um ou mais lipossomos, lipoplexos, nanopartículas de lipídeo ou nanolipossomas.

[0375] Desta maneira, em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é provida na forma de uma formulação à base de lipídeo, em particular na forma de lipossomas, lipoplexos e/ou nanopartículas de lipídeo compreendendo a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA).

Nanopartículas de lipídeo [0376] De acordo com algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é complexada ou associada com lipídeos (em particular lipídeos catiônicos e/ou neutros) para formar uma ou mais nanopartículas de lipídeo.

Petição 870190070557, de 24/07/2019, pág. 279/401

215/306

Em algumas modalidades, a(s) nanopartícula(s) da invenção compreende(m) pelo menos uma molécula de ácido nucleico artificial codificando uma proteína associada a CRISPR como aqui descrito, em ainda pelo menos um gRNA como aqui descrito.

[0377] Preferivelmente, nanopartículas de lipídeo (LNPs) compreendem: (a) pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), (b) um lipídeo catiônico, (c) um agente de redução de agregação (tal como lipídeo de polietileno glicol (PEG) ou lipídeo modificado com PEG), (d) opcionalmente um lipídeo não catiônico (tal como um lipídeo neutro) e (e), opcionalmente, um esterol.

[0378] Em algumas modalidades, LNPs compreendem, em adição à pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), (i) pelo menos um lipídeo catiônico; (ii) um lipídeo neutro; (iii) um esterol, por exemplo, colesterol; e (iv) um PEG-lipídeo, em uma razão molar de cerca de 20-60% de lipídeo catiônico:5-25% de lipídeo neutro:25~55% de esterol; 0,5-15% de PEG-lipídeo.

[0379] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), pode ser formulada em um aminoálcool lipidoide. Aminoálcoois lipidoides que podem ser usados na presente invenção podem ser preparados através dos métodos descritos na Patente U.S. No. 8.450.298, aqui incorporada a título de referência em sua totalidade.

(i) Lipídeos catiônicos [0380] LNPs podem incluir qualquer lipídeo catiônico adequado para formação de uma nanopartícula de lipídeo. Preferivelmente, o lipídeo catiônico carrega uma carga positiva líquida em pH mais ou menos fisiológico.

Petição 870190070557, de 24/07/2019, pág. 280/401

216/306 [0381] O lipídeo catiônico pode ser um amino lipídeo. Como aqui usado, o termo amino lipídeo pretende incluir aqueles lipídeos tendo uma ou duas cadeias alquila do ácido graxo ou graxas e um grupo amino principal (incluindo um grupo alquilamino ou dialquilamino) que pode ser protonado para formar um lipídeo catiônico em pH fisiológico.

[0382] O lipídeo catiônico pode ser, por exemplo, cloreto de N,Ndíoleil·N,Ndimetilamônio (DODAC), brometo de N,N-diestearil~N,N~dl·metilamônio (DDAB), cloreto de 1,2-dioleoiltrimetil amônio (DOTAP) (também conhecido como cloreto de N(2,3dioleoil0xi)propil)N,N,N-trimetilamônio e Sal de cloreto de 1 ^dioleiloxhS-trimetilaminopropano), cloreto de N~(1-(2,3-dioleilóxi)propil)-N,N,N-trimetilamônio (DOTMA), N,Ndimetil2,3- dioleilóxi)propilamina (DODMA), 1,2DiLinoieilóxi-N,Ndimetilaminopropano (DLinDMA), 1,2--ΟίΙίηοί©ηίΙόχΕ-Ν,N--dimetHaminopropano (DLenDMA), 1,2~dH-linolenilóxi~N,N~dimetilaminopropano (y~ DLenDMA), 1,2-Dilinolellcarbamoilóxi3 dimetilaminopropano (DLin-CDAP), UZ-DilinoleioxhS-idimetilaminojacetoxipropano (DLin-DAC), 1,2Dilinoleióxi-S-morfolinopropano (DLin-MA), 1,2~Dilinoleoil~3~ dimetilaminopropano (DLinDAP), l,2”Dilinoieiitio~3~dimetiiaminopropano (DLin-SDMA), 1 Unoleoil2linoleilóxl-3-dimetilaminopropano (DLIn-2-DMAP), Sal de cloreto de 1,2~dilinoleilóxi~3~trimetilaminopropano (DLin~TMA.CI), Sal de cloreto de 1,2-dilinoleoil-3- trimetilaminopropano (DLin-TAP.CI), 1,2-ΟΙΙΙηοΙβΙΙόχί3(Ν- metllpiperazino)propano (DLin-MPZ) ou 3-(N,NDilinoleilamino)~1,2-propanodiol (DLinAP), 3~(N,N~Dioleilamino)-1,2propanodio (DOAP), 1,2-Dilinoleiloxo~3-(2--N,N dimetilamino)etoxipro~ pano (DLin-EG-DM A), 2,2-Dilinolell-4“dlmetilaminometil-[1,3]-dloxolana (DLin-K-DMA) ou análogos dos mesmos, (3aR,5s,6aS)”N,N-dimetil2,2di((9Z, 12Z)- octadeca-9,12~dienil)tetrahidro~3aH“Ciclopenta[d][1,3]d io~ xol-5-amina, (6Z,9Z,28Z,31Z)~heptatriaconta--6,9,28,31~tetraen-19~il 4(dimetilamino)butanoato (MC3), 1,1'-(2-(4-(2-((2-(bis(2-hidroxidode

Petição 870190070557, de 24/07/2019, pág. 281/401

217/306 cn)amino)etn)(2”Mdr0xHdodecH)armno)etH)piperazin-J”H)etnaz:anediH)dk dodecan-2-ol (C12-200), 2,2“dHinoieH~4~(2~dimetnaminoetH)~[1,3]-dioxolana (DLin-K~C2~DMA), 2,2-diHnoleil-4-dimetilaminometil-[l,3]-dioxolana (DLin-K-DMA), (6Z,9Z,28Z,31 Z)-heptatriaconta-6,9,28,31 -tetraen-19-il

4-(dimetilamino) butanoato (DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-heptatriaconta-6,9,28,3 l-tetraen-W-ilóxij-N^-dimetilpropan-l-amina (MC3 Éter), 4-((6Z,9Z,28Z,31 Z)-heptatriaconta-6,9,28,31-tetraen-19-ilóxi)N,N-dimetilbutan-1-amina (MC4 Éter) ou qualquer combinação de qualquer um dos acima.

[0383] Outros Hpídeos catiônicos incluem, mas não estão limitados a, brometo de N,N-distearil~N,N~dimetilamônio (DDAB), 3P-(N-(N^s,N^s-di~ metilaminoetano)-carbamoil)colesterol (DC-Choi), trifluoracetato de N(1-(2,3-dioleilóxi)propil)-N-2-(esperminocarboxamido)etil)-N,N-dimetilamônio (DOSPA), dioctadecilamidoglicil carboxispermina (DOGS), 1,2dileoil-sn-3-fosfoetanolamina (DOPE), 1,2-dioleoH-3-dimetilarnônio propane (DODAP), brometo de N-(1,2-dimiristiloxiprop-3-il)-N,N-dimetil-Nhidroxietil amônio (DMRIE) e 2,2~Dilinoleil~4~dirnetHaminoetH~[1,3]-dio~ xolana (XTC). Ainda, preparações comerciais de Hpídeos catiônicos podem ser usadas, tais como, por exemplo, LIPOFECTIN (incluindo DOTMA e DOPE, disponíveis da GIBCO/BRL) e LIPOFECTAMINE (compreendendo DOSPA e DOPE, disponíveis da GIBCO/BRL).

[0384] Outros Hpídeos catiônicos adequados são revelados nas Publicações Internacionais Nos. WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709 e WO 2011/153493; Publicações de Patente U.S. Nos. 2011/0256175, 2012/0128760 e 2012/0027803; Patentes U.S. Nos. 8.158.601; e Love e outros, PNAS, 107(5), 1864-69, 2010.

[0385] Outros lipídeos de aminoácido adequados incluem aqueles tendo grupos de ácido graxo alternativos e outros grupos dialquilamino, incluindo aqueles em que os substituintes alquila são diferentes (por

Petição 870190070557, de 24/07/2019, pág. 282/401

218/306 exemplo, N-etil-N-metilamino e N-propil-N-etilamino). Em geral, amino lipídeos tendo menos cadeias acila saturadas são mais facilmente dimensionados, particularmente quando os complexos devem ser dimensionados abaixo de cerca de 0,3 microns, para propósitos de esterilização do filtro. Amino lipídeos contendo ácidos graxos insaturados com comprimentos de cadeia de carbono na faixa de C14 a C22 podem ser usados. Outras bases podem ser também usadas para separar o grupo amino e a porção de ácido graxo ou alquila graxa do amino lipídeo.

[0386] Em algumas modalidades, amino lipídeos ou catiônicos têm pelo menos um grupo protonável ou desprotonável, de modo que o lipídeo é positivamente carregado em um pH em ou abaixo do pH fisiológico (por exemplo, pH 7,4) e neutro em um segundo pH, preferivelmente em ou acima do pH fisiológico. Será, por certo, compreendido que a adição ou remoção de prótons como uma função de pH é um processo de equilíbrio, e que a referência a um lipídeo carregado ou neutro referese à natureza da espécie predominante e não requer que todo o lipídeo esteja presente na forma carregada ou neura. Lipídeos que têm mais de um grupo protonável ou desprotonável, ou que são zwitteriônicos, não são excluídos de uso na invenção.

[0387] Em algumas modalidades, os lipídeos protonáveis têm uma pKa do grupo protonável na faixa de cerca de 4 a cerca de 11, por exemplo, uma pKa de cerca de 5 a cerca de 7.

[0388] LNPs podem incluir dois ou mais lipídeos catiônicos. Os lipídeos catiônicos podem ser selecionados para contribuir com propriedades vantajosas diferentes. Por exemplo, lipídeos catiônicos que diferem em propriedades tais como pKa de amina, estabilidade química, meiavida em circulação, meia-vida em tecido, acúmulo líquido em tecido ou toxidez podem ser usados na LNP. Em particular, os lipídeos catiônicos podem ser escolhidos de modo que as propriedades da LNP mista são mais desejáveis do que as propriedades de uma LNP única de lipídeos

Petição 870190070557, de 24/07/2019, pág. 283/401

219/306 individuais.

[0389] Em algumas modalidades, o lipídeo catiônico está presente em uma razão de a partir de cerca de 20% em mol a cerca de 70 ou 75% em mol ou de a partir de 45 a cerca de 65% em mol ou cerca de 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 ou cerca de 70% em mol do lipídeo total presente na LNP. Em modalidades adicionais, as LNPs compreendem de a partir de cerca de 25% a cerca de 75% em uma base molar de lipídeo catiônico, por exemplo, de a partir de cerca de 20 a cerca de 70%, de a partir de cerca de 35 a cerca de 65%, de a partir de cerca de 45 a cerca de 65%, cerca de 60%, cerca de 50% ou cerca de 40% em uma base molar (com base em 100% de moles totais de lipídeo na nanopartícula de lipídeo). Em algumas modalidades, a razão de lipídeo catiônico para ácido nucleico é de a partir de cerca de 3 a cerca de 15, tal como de a partir de cerca de 5 a cerca de 13 ou de a partir de cerca de 7 a cerca de 11.

[0390] Em algumas modalidades, o lipossoma pode ter uma razão molar de átomos de nitrogênio no lipídeo catiônico para os fosfatos no RNA (razão N:P) entre 1:1 e 20:1 como descrito na Publicação Internacional No. W02013/006825A1, aqui incorporada a título de referência em sua totalidade. Em outras modalidades, o lipossoma pode ter uma razão N:P de mais de 20:1 ou menos de 1:1.

[0391] Em alguns aspectos, o lipídeo é selecionado do grupo consistindo em 98N12-5, C12-200 e CKK-E12. Em uma modalidade, os ácidos nucleicos podem ser formulados em um lipidoide aminoálcool. Lipidoides aminoálcool que podem ser usados na presente invenção podem ser preparados através dos métodos descritos na Patente U.S. No. 8.450.298, aqui incorporada a título de referência em sua totalidade.

[0392] Em uma outra modalidade, lipídeos ionizáveis podem ser compostos como revelado na Publicação Internacional No. WO2015/ 074085A1, Pedidos U.S. Nos. 61/905.724 e 15/614.499, WO2015

Petição 870190070557, de 24/07/2019, pág. 284/401

220/306

074085A1 ou Patentes ou Pedidos U.S. Nos. 9.593.077, 61/905.724, 9.593,077, 9.567.296, 15/614.499 e 9,567,296, aqui incorporados a título de referência em sua totalidade.

[0393] Lipídeos ionizáveis podem ser também os compostos como revelado nas Tabelas 1, 2 e 3 e reivindicações 1-24 da Publicação Internacional No. WO2017/075531A1, aqui incorporada a título de referência em sua totalidade. Em uma outra modalidade, lipídeos ionizáveis podem ser também os compostos como revelado na Publicação Internacional No. W02015/074085A1 (i.e. ATX-001 até ATX-032 ou os compostos como mencionado em 1-26), Pedidos U.S. Nos. 61/905.724 e 15/614,499 ou Patentes U.S. Nos. 9.593.077 e 9.567.296, aqui incorporadas a título de referência em sua totalidade.

(ii) Lipídeos neutros e não catiônicos [0394] O lipídeo não catiônico pode ser um lipídeo neutro, um lipídeo anlônlco ou um lipídeo anfifático. Lipídeos neutros, quando presentes, podem ser qualquer um de várias espécies de lipídeo que existem ou em uma forma zwitteriônica não carregada ou neutra em pH fisiológico. Tais lipídeos incluem, por exemplo, diacilfosfatidilcolina, diacilfosfatidiletanolamina, ceramica, esfingomielina, di-hidroesfingomielina, cefalina e cerebrosídeos. A seleção de lipídeos neutros para uso nas partículas descritas aqui é geralmente guiada através de consideração de, por exemplo, tamanho da LNP e estabilidade da LNP na corrente sanguínea. Preferivelmente, o lipídeo neutro é um lipídeo tendo dois grupos acila (por exemplo, diacilfosfatidilcolina e diacilfosfatidiletanolamina).

[0395] Em algumas modalidades, os lipídeos neutros contêm ácidos graxos saturados com comprimentos de cadeia de carbono na faixa de Ci0 a C20. Em outras modalidades, lipídeos neutros com ácidos graxos mono ou di-insaturados com comprimentos de cadeia de carbono na faixa de C10 a C20 são usados. Ainda, lipídeos neutros tendo misturas

Petição 870190070557, de 24/07/2019, pág. 285/401

221/306 de cadeias de ácido graxo insaturado ou não insaturado podem ser usados.

[0396] Lipídeos neutros adequados incluem, mas não estão limitados a, diestearoilfosfatidilcolina (DSPC), dioleoilfosfatidilcolina (DOPC), dípalmitoilfosfatidilcolina (DPPC), dioleoHfosfatidilglicerol (DOPG), dipalmitoilfosfatidilglicerol (DPPG), dioleoil-fosfatidiletanolamina (DOPE), palmitoiloleoilfosfatidilcolina (POPC), palmitoiloleoilfosfatidiletanolamina (POPE), 4-(N-maleimidometH)-cicloexanO1Carboxílato de dioleoil-fosfatidiletanolamina (DOPE-mal), dipalmitoil fosfatidil etanolamina (DPPE), dimiristoilfosfoetanolamina (DMPE), dimiristoil fosfatidilcolina (DMPC), distearoil-fosfatidil-etanolamina (DSPE), SM, 16~0~monometil PE, 16-0dimetil PE, 18-1-trans PE, 1-stearoil-2-oleoil-fosfatidietanolamina (SOPE), colesterol ou uma mistura dos mesmos. Lipídeos aniônicos adequados para uso em LNPs incluem, mas não estão limitados a, fosfatidilglicerol, cardiolipina, diacilfosfatidilserina, ácido diacilfosfatídico, N-dodecanoil fosfatidiletanoloamina, N-succinil fosfatidiletanolamina, N-glutaril fosfatidiletanolamina, lisilfosfatidilglicerol e outros grupos de modificação aniônicos unidos a lipídeos neutros.

[0397] Lipídeos anfífáticos referem-se a qualquer material adequado, em que a porção hidrofóbica do material de lipídeo orienta para uma fase hidrofóbica, enquanto a porção hidrofílica orienta para a fase aquosa. Tais compostos incluem, mas não estão limitados a, fosfolipídeos, aminolipídeos e esfingolipídeos. Fosfolipídeos representativos incluem esfingomielina, fosfatidilcolina, fosfatidiletanolamina, fosfatidiiserina, fosfatidilinositol, ácido fosfatídico, palmitoiloleoil fosfatdilcolina, IIsofosfatidilcolina, lisofosfatidiletanolamina, dípalmitoilfosfatidilcolina, dioleoilfosfatidilcolina, distearoilfosfatidilcolina ou dilinoleoilfosfatidilcolina. Outros compostos isentos de fósforo, tais como esfingolipídeos, famílias de glicoesfingolipídeo, diacilgliceróis e beta-aciloxiácidos, podem ser também usados.

Petição 870190070557, de 24/07/2019, pág. 286/401

222/306 [0398] Em algumas modalidades, o lipídeo não catiônico está presente em uma razão de a partir de cerca de 5% em mol a cerca de 90% em mol, cerca de 5% em mo! a cerca de 10% em mol, cerca de 5, 10,

15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85 ou cerca de 90% em mol do lipídeo total presente na LNP.

[0399] Em algumas modalidades, LNPs compreendem de a partir de cerca de 0% a cerca de 15 ou 45% em uma base molar de lipídeo neutro, por exemplo, de a partir de 3 a cerca de 12% ou de a partir de cerca de 5 a cerca de 10%. Por exemplo, LNPs podem incluir cerca de 15%, cerca de 10%, cerca de 7,5% ou cerca de 7,1% de lipídeo neutro em uma base molar (com base em 100% de moles totais de lipídeo na LNP).

[0400] O esterol é preferivelmente colesterol.

[0401] O esterol pode estar presente em uma razão de cerca de 10% em mol a cerca de 60% em mol ou cerca de 25% em mol a cerca de 40% em mol da LNP. Em algumas modalidades, o esterol está presente em uma razão de cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 ou cerca de 60% em mol do lipídeo total presente na LNP. Em outras modalidades, LNPs compreendem de a partir de cerca de 5% a cerca de 50% em uma base molar do esterol, por exemplo, cerca de 15% a cerca de 45%, cerca de 20% a cerca de 40%, cerca de 48%, cerca de 40%, cerca de 38,5%, cerca de 35%, cerca de 34,4%, cerca de 31,5% ou cerca de 31% em uma base molar (com base em 100% em moles totais na LNP).

(iv) Agentes de Redução de Agregação [0402] O agente de redução de agregação pode ser um lipídeo capaz de reduzir agregação.

[0403] Exemplos de tais lipídeos incluem, mas não estão limitados

Petição 870190070557, de 24/07/2019, pág. 287/401

223/306 a, lipídeos modificados com poiietileno glicol (PEG), monosiaiogangliosídeo Gml e oligômeros de poliamida (PAG) tais como aqueles descritos na Patente U.S. No. 6.320.017, que é aqui incorporada a titulo de referência em sua totalidade. Outros compostos com porções não carregadas, hidrofílicas, de barreira estérica, que previnem agregação durante formulação, tal como PEG, Gml ou ATTA, podem ser também acoplados a lipídeos. Lipídeos ATTA são descritos, por exemplo, na Patente U.S. No. 6.320.017, e conjugados de PEG-lipídeo são descritos, por exemplo, nas Patentes U.S. Nos. 5.820.873, 5.534.499 e 5.885.613, cada uma das quais é aqui incorporada a título de referência em sua totalidade.

[0404] O agente de redução de agregação pode ser, por exemplo, selecionado de um polietilenoglicol (PEG)-lipídeo incluindo, sem limitação, um PEG-diacilglicerol (DAG), um PEG-dialquilglicerol, um PEG-di~ alqulipropila (DAA), um PEG-fosfolipídeo, um PEG-ceramida (Cer) ou uma mistura dos mesmos (tal como PEG-Cerl4 ou PEG-Cer20). O conjugado PEG-DAA pode ser, por exemplo, um PEG-dilauriloxipropila (C12), um PEG-dimirlstiloxiproplia (C14), um PEG-dipalmltiloxipropila (C16) ou um PEG-diestearoilpropila (C18). Outros lipídeo peguilados incluem, mas não estão limitados a, poiietileno glicol-didimiristoil glicerol (C14-PEG ou PEG-C14, onde PEG tem um peso molecular médio de 2000 (Da) (PEG-DMG); (R)-2,3-bis(octadecilóxi)propil-1-(metoxi poli(etileno glicol)2000)propilcarbamato) (PEG-DSG); PEG-carbamoil~1,2-di~ miristiloxipropilamina, em que PEG tem um peso molecular médio de 2000 Da (PEG-cDMA); N-Acetilgalactosamina-((R)-2,3-bis(octadecilóxi)propil-1 -(metóxi poli(etileno glicol)2000)propilcarbamato)) (GalNAcPEG-DSG); mPEG (mw2000)-diastearoilfosfatidil-etanolamina (PEGDSPE); e poiietileno glicol-dipalmitoilglicerol (PEG-DPG).

[0405] Em algumas modalidades, o agente de redução de agrega

Petição 870190070557, de 24/07/2019, pág. 288/401

224/306 ção é PEG-DMG. Em outras modalidades, o agente de redução de agregação é PEG-c-DMA.

[0406] Em uma outra modalidade, PEG-lipídeos podem ser também os compostos como revelado na US20150376115A1 ou WO2015199952, aqui incorporados a título de referência em sua totalidade. Composição de LNP [0407] A composição de LNPs pode ser influenciada pela, inter alia, seleção do componente de lipídeo catiônico, o grau de saturação de lipídeo catiônico, a natureza da PEGuilação, a razão de todos os componentes e parâmetros biofísicos tal como seu tamanho. Em um exemplo de Semple e outros (Semple e outros, Nature Biotech. 2010 28: 172176; aqui incorporado a título de referência em sua totalidade), a composição de LNP foi composta de 57,1% de lipídeo catiônico, 7,1% de dipalmitoilfosfatidilcolina, 34,3% de colesterol e 1,4% de PEG-c-DMA (Basha e outros, Moi Ther. 2011 19:2186-2200; aqui incorporados a título de referência em sua totalidade).

[0408] Em algumas modalidades, LNPs podem compreender de a partir de cerca de 35 a cerca de 45% de lipídeo catiônico, de a partir de cerca de 40% a cerca de 50% de lipídeo catiônico, de a partir de cerca de 50% a cerca de 60% de lipídeo catiônico e/ou de a partir de cerca de 55% a cerca de 65% de lipídeo catiônico. Em algumas modalidades, a razão de lipídeo para ácido nucleico pode variar de a partir de cerca de 5:1 a cerca de 20:1, de a partir de cerca de 10:1 a cerca de 25:1, de a partir de cerca de 15:1 a cerca de 30:1 e/ou pelo menos 30:1.

[0409] O peso molecular médio da porção de PEG nos Hpídeos modificados com PEG pode variar de a partir de cerca de 500 a cerca de 8.000 Daltons (por exemplo, de a partir de cerca de 1.000 a cerca de 4.000 Daltons). Em uma modalidade preferida, o peso molecular médio da porção de PEG é cerca de 2.000 Daltons.

[0410] A concentração do agente de redução de agregação pode

Petição 870190070557, de 24/07/2019, pág. 289/401

225/306 variar de a partir de cerca de 0,1 a cerca de 15% em mol, por 100% de moles totais de lipídeo na NLP. Em algumas modalidades, LNPs incluem menos do que cerca de 3, 2 ou 1 por cento em mol de PEG ou do iipídeo modificado com PEG, com base nos moles totais de lipídeo na LNP. Em modalidades adicionais, LNPs compreendem de a partir de cerca de 0,1% a cerca de 20% do lipídeo modificado em PEG em uma base molar, por exemplo, cerca de 0,5 a cerca de 10%, cerca de 0,5 a cerca de 5%, cerca de 10%, cerca de 5%, cerca de 3,5%, cerca de 1,5%, cerca de 0,5% ou cerca de 0,3% em uma base polar (com base em 100% de moles totais de Hpídeos na LNP).

[0411] LNPs diferentes tendo razões molares variáveis de lipídeo catiônico, lipídeo não catiônico (ou neutro), esterol (por exemplo, coiesteroi) e agente de redução de agregação (tal como um lipídeo modificado com PEG) em uma base molar (com base nos moles totais de lipídeo nas nanopartículas de iipídeo) como mostrado na Tabela 5 abaixo. Em modalidades preferidas, a formulação de nanopartícula de lipídeo da invenção consiste essencialmente em uma mistura de lipídeo em razões molares de cerca de 20-70% de lipídeo catiônico:5-45% de lipídeo neutro:20-55% de colesterol, 0,5-15% de lipídeo modificado com PEG, mais preferivelmente em razões molares de cerca de 20-60% de lipídeo catiônico:5-25% de lipídeo neutro:25-55% de colesterol:0,5-15% de lipídeo modificado com PEG.

Petição 870190070557, de 24/07/2019, pág. 290/401

Tabela 5. Formulações à base de lipídeo

No.	Razão molar de lipídeo (com base em 100% de moles totais de lipídeo na nanopartícula de lipídeo)
Lipídeo catiônico	Lipídeo não catiônico (ou Neutro)	Este rol	Agente de redução de agregação (por exemplo, PEG-lipídeo)
1	de a partir de cerca de 35% a cerca de 65%	de a partir de cerca de 3% a cerca de 12% ouou 15 %	de a partir de cerca de 15% a cerca de 45 %	de a partir de cerca de 0,1% a cerca de 10% (preferivelmente de a partir de cerca de 0,5% a cerca de 2% ou 3%
2	de a partir de cerca de 20% a cerca de 70%	de a partir de cerca de 5% a cerca de 45%	de a partir de cerca de 20% a cerca de 55%	de a partir de cerca de 0,1% a cerca de 10% (preferivelmente de a partir de cerca de 0.5% a cerca de 2% ou 3%
3	de a partir de cerca de 45% a cerca de 65%	de a partir de cerca de 5% a cerca de 10%	de a partir de cerca de 5% a cerca de 45%	de a partir de cerca de 0,1% a cerca de 3%
4	de a partir de cerca de 20% a cerca de 60%	de a partir de cerca de 5% a cerca de 25%	de a partir de cerca de 25% a cerca de 40%	de a partir de cerca de 0,1% a cerca de 5% (preferivelmente de a partir de cerca de 0,1% a cerca de 3%)
5	cerca de 40%	cerca de 10%	de a partir de cerca de 25% a cerca de 55%	cerca de 10%
6	cerca de 35%	cerca de 15%		cerca de 10%
7	cerca de 52%	cerca de 13%		cerca de 5%
8	cerca de 50%	cerca de 10%		cerca de 1,5%

226/306

Petição 870190070557, de 24/07/2019, pág. 291/401

227/306 [0412] Em algumas modalidades, LNPs ocorrem como lipossomas ou lipoplexos como descrito em mais detalhes abaixo.

Tamanho da LNP [0413] Em algumas modalidades, LNPs têm um tamanho de diâmetro médio de a partir de cerca de 50 nm a cerca de 300 nm, tal como de a partir de cerca de 50 nm a cerca de 250 nm, por exemplo, de a partir de cerca de 50 nm a cerca de 200 nm.

[0414] Em algumas modalidades, LNPs menores podem ser usadas. Tais partículas podem compreender um diâmetro de abaixo de 0,1 um até 100 nm, tal como, mas não limitado a, menos de 0,1 um, menos de 1,0 um, menos de 5 um, menos de 10 um, menos de 15 um, menos de 20 um, menos de 25 um, menos de 30 um, menos de 35 um, menos de 40 um, menos de 50 um, menos de 55 um, menos de 60 um, menos de 65 um, menos de 70 um, menos de 75 um, menos de 80 um, menos de 85 um, menos de 90 um, menos de 95 um, menos de 100 um, menos de 125 um, menos de 150 um, menos de 175 um, menos de 200 um, menos de 225 um, menos de 250 um, menos de 275 um, menos de 300 um, menos de 325 um, menos de 350 um, menos de 375 um, menos de 400 um, menos de 425 um, menos de 450 um, menos de 475 um, menos de 500 um, menos de 525 um, menos de 550 um, menos de 575 um, menos de 600 um, menos de 625 um, menos de 650 um, menos de 675 um, menos de 700 um, menos de 725 um, menos de 750 um, menos de 775 um, menos de 800 um, menos de 825 um, menos de 850 um, menos de 875 um, menos de 900 um, menos de 925 um, menos de 950 um, menos de 975 um. Em uma outra modalidade, ácidos nucleicos podem ser derivados usando LNPs menores que podem compreender um diâmetro de a partir de cerca de 1 nm a cerca de 100 nm, de a partir de cerca de 1 nm a cerca de 10 nm, cerca de 1 nm a cerca de 20 nm, de a partir de cerca de 1 nm a cerca de 30 nm, de a partir de cerca de 1 nm a cerca de 40 nm, de a partir de cerca de 1 nm a cerca de 50 nm,

Petição 870190070557, de 24/07/2019, pág. 292/401

228/306 de a partir de cerca de 1 nm a cerca de 60 nm, de a partir de cerca de 1 nm a cerca de 70 nm, de a partir de cerca de 1 nm a cerca de 80 nm, de a partir de cerca de 1 nm a cerca de 90 nm, de a partir de cerca de 5 nm a cerca de 100 nm, de a partir de cerca de 5 nm a cerca de 10 nm, cerca de 5 nm a cerca de 20 nm, de a partir de cerca de 5 nm a cerca de 30 nm, de a partir de cerca de 5 nm a cerca de 40 nm, de a partir de cerca de 5 nm a cerca de 50 nm, de a partir de cerca de 5 nm a cerca de 60 nm, de a partir de cerca de 5 nm a cerca de 70 nm, de a partir de cerca de 5 nm a cerca de 80 nm, de a partir de cerca de 5 nm a cerca de 90 nm, cerca de 10 a cerca de 50 nM, de a partir de cerca de 20 a cerca de 50 nm, de a partir de cerca de 30 a cerca de 50 nm, de a partir de cerca de 40 a cerca de 50 nm, de a partir de cerca de 20 a cerca de 60 nm, de a partir de cerca de 30 a cerca de 60 nm, de a partir de cerca de 40 a cerca de 60 nm, de a partir de cerca de 20 a cerca de 70 nm, de a partir de cerca de 30 a cerca de 70 nm, de a partir de cerca de 40 a cerca de 70 nm, de a partir de cerca de 50 a cerca de 70 nm, de a partir de cerca de 60 a cerca de 70 nm, de a partir de cerca de 20 a cerca de 80 nm, de a partir de cerca de 30 a cerca de 80 nm, de a partir de cerca de 40 a cerca de 80 nm, de a partir de cerca de 50 a cerca de 80 nm, de a partir de cerca de 60 a cerca de 80 nm, de a partir de cerca de 20 a cerca de 90 nm, de a partir de cerca de 30 a cerca de 90 nm, de a partir de cerca de 40 a cerca de 90 nm, de a partir de cerca de 50 a cerca de 90 nm, de a partir de cerca de 60 a cerca de 90 nm e/ou de a partir de cerca de 70 a cerca de 90 nm.

[0415] Em algumas modalidades, a LNP pode ter um diâmetro maior do que 100 nm, maior do que 150 nm, maior do que 200 nm, maior do que 250 nm, maior do que 300 nm, maior do que 350 nm, maior do que 400 nm, maior do que 450 nm, maior do que 500 nm, maior do que 550 nm, maior do que 600 nm, maior do que 650 nm, maior do que 700 nm, maior do que 750 nm, maior do que 800 nm, maior do que 850 nm,

Petição 870190070557, de 24/07/2019, pág. 293/401

229/306 maior do que 900 nm, maior do que 950 nm ou maior do que 1000 nm. [0416] Em outras modalidades, LNPs têm uma distribuição de tamanho de partícula de modo único (isto é, elas não são nem bi- ou polimodais).

Outros componentes [0417] LNPs podem compreender ainda um ou mais Hpídeos e/ou outros componentes em adição àqueles mencionados acima.

[0418] Outros lipídeos podem ser incluídos nas composições de lipossoma para uma variedade de propósitos, tal como prevenir oxidação de lipídeo ou prender ligantes sobre a superfície do lipossoma. Qualquer número de Hpídeos pode estar presente em LNPs, incluindo lipídeos an~ fifáticos, neutros, catiônicos e aniônicos. Tais lipídeos podem ser usados sozinhos ou em combinação.

[0419] Componentes adicionais que podem estar presentes em uma LNP incluem componentes de estabilização em bicamada compreendendo tais oligômeros de poliamida (vide, por exemplo, Patente U.S. No. 6.320.017, que é aqui incorporada a título de referência em sua totalidade), peptídeos, proteínas e detergentes.

Lipossomas [0420] Em algumas modalidades, moléculas de ácido nucleico artificiais, preferivelmente RNAs da combinação da invenção (ou qualquer outro ácido nucleico como aqui definido), são formuladas como lipossomas.

[0421 ] Lipossomas à base de lipídeo catiônico são capazes de complexar com ácidos nucleicos negativamente carregados (por exemplo, RNAs) através de interações eletrostáticas, resultando em complexos que oferecem biocompatibilidade, toxidez baixa e possibilidade da produção em larga escala requerida para aplicações clínicas in vivo. Lipossomas podem fundir com a membrana piasmática para absorção; uma

Petição 870190070557, de 24/07/2019, pág. 294/401

230/306 vez dentro da célula, lipossomas são processados através da via endocítica e o ácido nucleico é então liberado do endossoma/carreador para o citoplasma. Lipossomas têm sido há muito tempo percebidos como veículos de administração de fármaco devido à sua biocompatibilidade superior, dado que os lipossomas são basicamente análogos de membranas biológicas, e podem ser preparados a partir de ambos fosfolipídeos naturais e sintéticos (Int. J. Nanomedicine. 2014; 9: 1833-1843).

[0422] Lipossomas tipicamente consistem em uma bicamada de lipídeo que pode ser composta de (fosfo)Hpídeos catiônicos, aniônicos ou neutros e colesterol, que encerra um núcleo aquoso. Ambas a bicamada de lipídeo e o espaço aquoso podem incorporar compostos hidrofóbicos ou hidrofílicos, respectivamente. Lipossomas podem ter uma ou mais membranas de lipídeo. Lipossomas podem ser de camada única, referidos como unilamelares, ou de camadas múltiplas, referidos como muitilamelares.

[0423] Características e comportamento de lipossoma in vivo podem ser modificados através da adição de um revestimento de polímero hidrofílico, por exemplo, polietileno (PEG), para a superficie do Hpossoma conferir estabilização estérica. Ainda, lipossomas podem ser usados para direcionamento específico por ligantes de anexação (por exemplo, anticorpos, peptídeos e carboidratos) à sua superficie ou à extremidade terminal das cadeias de PEG anexadas (Front. Pharmacol. 2015 Dez 1;6:286).

[0424] Lipossomas estão tipicamente presentes como vesículas esféricas e podem variar em tamanho de 20 nm a alguns microns.

[0425] Lipossomas podem ser de tamanhos diferentes tal como, mas não limitado a, uma vesícula multilamelar (MLV) que pode ser de centenas de nanômetros de diâmetro e pode conter uma série de bícamadas concêntricas separadas por compartimentos aquosos estreitos, uma veículo unicelular pequena (SUV) que pode ser menor do que 50

Petição 870190070557, de 24/07/2019, pág. 295/401

231/306 nm de diâmetro e uma vesícula unilamelar grande (LUV) que pode ser entre 50 e 500 nm de diâmetro. Projeto de lipossomas pode incluir, mas não é limitado a, opsoninas ou ligantes a fim de melhorar a anexação de Hpossomas a tecido não saudável ou ativar eventos tal como, mas não limitado a, endocitose. Lipossomas podem conter um pH baixo ou alto a fim de melhorar a administração das formulações farmacêuticas. [0426] Como um exemplo não limitante, lipossomas tais como veículos de membrana sintética podem ser preparados através dos métodos, aparelhos e dispositivos descritos nas Publicações de Patente Nos. LJS20130177638, US20130177637, US20130177636, US20130177635, US20130177634, US20130177633, US20130183375, US20130183373 e US20130183372, os conteúdos de cada uma são aqui incorporados a título de referência em sua totalidade. A molécula de ácido nucieico artificial, preferivelmente RNA, da invenção, composição (farmacêutica) ou kit (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), pode ser encapsulada pelo lipossoma ou ela pode estar contida em um núcleo aquoso que pode então ser encapsulado pelo lipossoma (vide Pub. Internacionais Nos. WO2012031046, WO2012031043, WO2012030901 e WO2012006378 e Publicações de Patente U.S. Nos. US20130189351, US20130195969 e US20130202684; os conteúdos de cada uma são aqui incorporados a título de referência em sua totalidade.

[0427] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), pode ser formulada em lipossomas tais como, mas não limitado a, lipossomas DiLa2 (Marina Biotech, Bothell, WA), SMARTICLES® (Marina Biotech, Bothell, WA), lipossomas baseados em DOPC neutra (1,2-dioleoil-sn-glicero-3-fosfocoHna) (por exemplo, administração de siRNA para câncer ovariano (Landen e outros, Cancer Biology & Therapy 2006 5(12)1708-1713); aqui incorporados a

Petição 870190070557, de 24/07/2019, pág. 296/401

232/306 título de referência em sua totalidade) e iipossomas revestidos com hialuronano (Quiet Therapeutics, Israel).

Lipoplexos [0428] Em algumas modalidades, moléculas de ácido nucleico artificial, preferivelmente RNAs (ou qualquer outro ácido nucleico como aqui definido) são formuladas como lipoplexos, isto é, bicamadas de lipídeo catiônico intercaladas entre camadas de ácido nucleico.

[0429] Lipídeos catiônicos, tais como DOTAP, (1 ,2-dloleoil-3-trimetilamônio-propano) e DOTMA metil sulfato de (N-[1-(2,3-dioleoilóxi)propil]-N,N,N-trimetil-amônio) podem formar complexos ou lipoplexos com ácidos nucleicos negativamente carregados para formar nanopartículas através de interação eletrostática, provendo eficiência de transfecção in vitro alta.

Nanolipossomas [0430] Em algumas modalidades, moléculas de ácido nucleico artificial, preferivelmente RNAs (ou qualquer outro ácido nucleico como aqui definido) são formuladas como nanolipossomas à base de lipídeo neutro tais como nanolipossomas baseados em 1,2-dioleoil-sn-glicero-

3-fosfatidilcolina (DOPC) (Adv. Drug Deliv. Rev. 2014 Fev; 66: 110116.).

Emulsões [0431] Em algumas modalidades, moléculas de ácido nucleico artificiais, preferivelmente RNAs (ou qualquer outro ácido nucleico como definido aqui) são formuladas como emulsões. Em uma outra modalidade, as ditas moléculas de ácido nucleico artificiais, preferivelmente RNAs, são formuladas em uma emulsão óleo-em-água catiônica onde a partícula da emulsão compreende um núcleo de óleo e um lipídeo catiônico que pode interagir com o(s) ácido(s) nucleico(s) ancorando a molécula à partícula da emulsão (vide Pub. Internacional No. WO2012006380; aqui

Petição 870190070557, de 24/07/2019, pág. 297/401

233/306 incorporada a título de referência em sua totalidade). Em algumas modalidades, a dita molécula de ácido nucleico artificial, preferivelmente RNA, é formulada em uma emulsão água-em-óleo compreendendo uma fase hidrofóbica contínua em que a fase hidrofílica é dispersa. Como um exemplo não limitante, a emulsão pode ser feita através dos métodos descritos na Publicação Internacional No. WO201087791, cujos conteúdos são aqui incorporados a título de referência em sua totalidade. Compostos e carreadores (poli-jcatiônicos [0432] Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada ou associada com um composto catiônico ou policatiônico (composto (poli-)catiônico) e/ou um carreador polimérico.

[0433] O termo composto (poli-)catiônico refere-se tipicamente a uma molécula carregada, que é positivamente carregada (cátion) em um valor de pH de tipicamente a partir de 1 a 9, preferivelmente em um valor de pH de ou abaixo de 9 (por exemplo, de a partir de 5 a 9) de ou abaixo de 8 (por exemplo, de a partir de 5 a 8), de ou abaixo de 7 (por exemplo, de a partir de 5 a 7), sobretudo preferivelmente em um pH fisiológico, por exemplo, de a partir de 7,3 a 7,4.

[0434] Desta maneira, um composto (poli-)catiônico pode ser qualquer composto ou polímero positivamente carregado, preferivelmente um peptídeo ou proteína catiônico, que é positivamente carregado sob condições fisiológicas, particularmente sob condições fisiológicas in vivo. Um peptídeo ou proteína (poli-)catiônico pode conter pelo menos um aminoácidos positivamente carregado ou mais de um aminoácido positivamente carregado, por exemplo, selecionado de Arg, His, Lys ou Om.

Aminoácidos, peptídeos e proteínas (poii-)catiônicos [0435] Compostos (poli-)catiônicos sendo agentes particularmente

Petição 870190070557, de 24/07/2019, pág. 298/401

234/306 preferidos para complexação ou associação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem protamina, nucleolina, espermina ou espermidina, ou outros peptídeos ou proteínas catiônicos, tais como poli-L-lisina (PLL), poli-arginina, polipeptídeos básicos, peptídeos de penetração em célula (CPPs), incluindo peptídeos de ligação a HIV, HIV-1 Tat (HIV), peptídeos derivados de TAT, Penetratina, peptídeos derivados ou análogos de VP22, HSV P22 (Herpes simplex), MAP, KALA ou domínios de transdução de proteína (PTDs), PpT620, peptídeos ricos em prolína, peptídeos ricos em arginina, peptídeos ricos em lisina, MPG-peptídeo(s), Pep-1, oligômeros L, peptídeo(s) catíôníco(s), peptídeos derivados de Antennapedia (particularmente de Drosophila antennapedia), pAntp, plsl, FGF, Lactoferrína, Transportana, Buforina2, Bac715-24, SynB, SynB(1), pVEC, peptídeos derivados de hCT, SAP ou histonas.

[0436] Mais preferivelmente, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada com um ou mais policátions, preferivelmente com protamina ou oligofectamina (discutido abaixo), sobretudo preferivelmente com protamina. Neste contexto protamina é particularmente preferida.

[0437] Ainda, proteínas ou peptídeos (poli-)catiônicos preferidos podem ser selecionados das proteínas ou peptídeos que seguem tendo a fórmula total (III) que segue:

(Arg)i;(Lys)_m;(His)n;(Orn)_o;(Xaa)x, (fórmula (III)) em que I + m + n +o + x = 8-15, e I, m, n ou o Independentemente uns dos outros podem ser qualquer número selecionado de 0, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15, contanto que o teor total de Arg, Lys, His e Orn represente pelo menos 50% de todos os aminoácidos do oli

Petição 870190070557, de 24/07/2019, pág. 299/401

235/306 gopeptídeo; e Xaa pode ser qualquer aminoácido selecionado de aminoácidos nativos (= de ocorrência natural) ou não nativos exceto por Arg, Lys, His ou Orn; e x pode ser qualquer número selecionado de 0, 1,2, 3 ou 4, contanto que o teor total de Xaa não exceda 50% de todos os aminoácidos do oligopeptídeo. Peptídeos catiônicos particularmente preferidos neste contexto são, por exemplo, Arg?, Args, Argg, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)₄, Y(RKH)₂R, etc. Neste contexto, a descrição do WO 2009/030481 é incorporada aqui a título de referência. Polissacarídeos (poli-jcatiônicos [0438] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem polissacarídeos (poH-)catiônicos, por exemplo, quitosana, polibreno, polímeros catiônicos, por exemplo, polietilenoimina (PEI).

Lipídeos (poL-)catiõnlcos [0439] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem lipídeos (poli-jcatiônicos, por exemplo, DTMA: cloreto de [1~(2,3~sioleióxi)propil)]”N,N,N-trimetilamônlo, DMRIE, di-C14-amidina, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: Dioleil fosfatidiletanol-amina, DOSPA, DODAB, DOIC, DMEPC, DOGS: Dioctadecilamidoglicilespermina, DIMRI: bromato de dimiristo-oxipropil dimetil hidroxietil amônio, DOTAP: dioleoilóxi-3-(trimetllamonlo)propano, DC-6-14: cloreto de O,O-ditetradecanoll-N”(alfatrimetilamonioacetyl)dietanolamina, CLIP1: cloreto de rac-[(2,3-dioctadeciloxipropil)(2-hidroxietil)]-dimetilam0nio, CLIP6: rac-[2(2,3-di-hexadeciloxipropil-oximetilóxi)etil]trimetilamônto, CLIP9: rac-[2(2,3”di-hexadeciloxipropil-oxisuccinilóxi)etil]-tnmetilamônio ou oligofectamina.

Petição 870190070557, de 24/07/2019, pág. 300/401

236/306

Polímeros (ooli-jcatiônicos [0440] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) inclui polímeros (poH-jcatiônicos, por exemplo, poliaminoácidos modificados, tais como polímeros de beta~aminoácido ou poliamidas reversas, etc., polietilenos modificados, tal como PVP brometo de poli(N~etH~4--vínnpíndínio)), etc., acrilatos modificados, tal como pDMAEMA (poli(dimetilaminoetil metacrilato)), etc., amidoamina modificadas tal como pAMAM (poli(amidoamina)), etc., polibeta-aminoéster modificado (PBAE), tais como polímeros de diacrilato-co-õ-amino-lpentanol de 1,4-butanodiol modificados na extremidade com diamina, etc., dendrímeros, tais como dendrímeros de polipropilamina ou dendrímeros à base de pAMA, etc., polHmina(s), tais como PEI: poli(etilenoi~ mina), poH(propilenoimina), etc., polialilaminas, polímeros à base de estrutura principal de açúcar, tais como polímeros à base de ciclodextrina, polímeros à base de dextrano, quitosana, etc., polímeros à base de estrutura principal de silano, tais como copolímeros de PMOXA-PDMS, etc., polímeros em bloco consistindo em uma combinação de um ou mais blocos catiônicos (por exemplo, selecionados de um polímero catiônico como mencionado acima) e de um ou mais blocos hidrofílicos ou hidrofóbicos (por exemplo, polietilenoglicol).

Carreadores ooliméricos [0441] De acordo com modalidades preferidas, molécula de ácido nudeico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada ou associada com um carreador polimérico.

[0442] Um carreador polimérico usado de acordo com a invenção seria um carreador polimérico formado por componentes catiônicos reticulados com dissulfeto. Os componentes catiônicos reticulados com

Petição 870190070557, de 24/07/2019, pág. 301/401

237/306 dissulfeto podem ser iguais ou diferentes uns dos outros. O carreador polimérico também pode conter componentes adicionais.

[0443] É também particularmente preferido que o carreador polimérico usado de acordo com a presente invenção compreenda misturas de peptideos, proteínas ou polímeros catiônicos e opcionalmente componentes adicionais como aqui definido, que sejam reticulados por ligações dissulfeto como descrito aqui. Neste contexto, a descrição do WO2012/013326 é aqui incorporada a título de referência.

[0444] Neste contexto, os componentes catiônicos, que formam base para o carreador polimérico através de reticulação com dissulfeto, são tipicamente selecionados de qualquer peptídeo, proteína ou polímero (poli-)catiônico adequado para este propósito, particularmente qualquer peptídeo, proteína ou polímero (poli-)catiônico capaz de complexação com, e desta maneira preferivelmente condensação, da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido). O peptídeo, proteína ou polímero (poli-)catiônico é preferivelmente uma molécula linear, no entanto, peptideos, proteínas ou polímeros (poli-)catiônicos ramificados podem também ser usados.

[0445] Cada proteína, peptídeo ou polímero (poli-)catiônico de reticulação com dissulfeto do carreador polimérico, que pode ser usado para complexar a molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido) contém pelo menos uma porção -SH, sobretudo preferivelmente pelo menos um resíduo cisteína ou qualquer grupo químico adicional exibindo uma porção -SH, capaz de formação de uma ligação dissulfeto quando da condensação com pelo menos uma proteína, peptídeo ou polímero (poli-)catiônico adicional como componente catiônico do carreador polimérico como mencionado aqui.

[0446] Como definido acima, o carreador polimérico, que pode ser

Petição 870190070557, de 24/07/2019, pág. 302/401

238/306 usado para complexar a molécula de ácido nucleico artificial, preferivelmente RNA, da Invenção (ou qualquer outro ácido nucleico como aqui definido) pode ser formado por componentes catiônicos (ou policatiônicos) reticulados com dissulfeto. Preferivelmente, tais peptídeos ou proteínas ou polímeros (poli-)catiônicos do carreador pollmérico, que compreendem ou são adicionalmente modificados para compreender pelo menos uma porção --SH, são selecionados de proteínas, peptídeos e polímeros como aqui definido.

[0447] Em algumas modalidades, o carreador polimérico pode ser selecionado de uma molécula carreadora polimérica de acordo com a fórmula (IV) genérica:

L-P¹S-[S-P²-S]n-S-P³-L fórmula (IV) em que

P¹ e P³ são diferentes ou idênticos um ao outro e representam uma cadeia de polímero hidrofílico linear ou ramificada, cada P¹e P³ exibindo pelo menos uma porção -SH capaz de formar uma ligação dissulfeto quando da condensação com componente P², ou alternativamente com (AA), (AA)x ou [(AAx)]z, se tais componentes forem usados como um ligante entre P¹ e P²e P²) e/ou com componentes adicionais (por exemplo, (AA), (AA)X, [(AA_X]_Z ou L), a cadeia de polímero hidrofílico linear ou ramificada selecionada independentemente uma da outra de polietileno glicol (PEG), poli-A/-(2-hidroxípropil)metacrílamida, poli-2(metacriloilóxi)etil fosforilcolinas, po!i(hidroxialquil L-asparagina), poli(2~ (metacriloilóxi)etil fosforilcolina), hidroxietilamido ou poli(hidroxialquil Lglutamina), em que a cadeia de polímero hidrofílico exibe um peso molecular de cerca de 1 kDa a cerca de 100 kDa, preferivelmente de cerca de 2 kDa a cerca de 25 kDa; ou mais preferivelmente de cerca de 2 kDa a cerca de 10 kDa, por exemplo, cerca de 5 kDa a cerca de 25 kDa ou kDa a cerca de 10 kDa;

P² é um peptídeo ou proteína (poli-)catiônico, por exemplo,

Petição 870190070557, de 24/07/2019, pág. 303/401

239/306 como definido acima para o carreador poHmérico formado por componentes catiônicos reticulados com dissulfeto, e preferivelmente tendo um comprimento de cerca de 3 a cerca de 100 aminoácidos, mais preferivelmente tendo um comprimento de cerca de 3 a cerca de 50 aminoácidos, ainda mais preferivelmente tendo um comprimento de cerca de 3 a cerca de 25 aminoácidos, por exemplo, um comprimento de cerca de 3 a 10, 5 a 15, 10 a 20 ou 15 a 25 aminoácidos, mais preferivelmente um comprimento de cerca de 5 a cerca de 20 e ainda mais preferivelmente um comprimento de cerca de 10 a cerca de 20; ou é um polímero (poli-)catiônico, por exemplo, como definido acima para o carreador polimérico formado por componentes catiônicos reticulados com dissulfeto, tipicamente tendo um peso molecular de cerca de 0,5 kDa a cerca de 30 kDa, incluindo um peso molecular de cerca de 1 kDa a cerca de 20 kDa, ainda mais preferivelmente de cerca de 1,5 kDa a cerca de 10 kDa ou tendo um peso molecular de cerca de 0,5 kDa a cerca de 100 kDa, incluindo um peso molecular de cerca de 10 kDa a cerca de 50 kDa, ainda mais preferivelmente de cerca de 10 kDa a cerca de 30 kDa;

cada P² exibindo peto menos duas porções -SH capazes de formar uma ligação dissulfeto quando da condensação com componentes P2 adicionais ou componentes(s) P¹ e/ou P³ ou alternativamente com componentes adicionais (por exemplo, (AA), (AA)_X ou [(AA_X]_Z);

-S-S- é uma ligação dissulfeto (reversível) (os parênteses são omitidos para uma melhor capacidade de leitura), em que S representa preferivelmente enxofre ou uma porção de carreamento -SH, que formou uma ligação dissulfeto (reversível). A ligação dissulfeto (reversível) é preferivelmente formada através da condensação de porções SH de qualquer um dos componentes P¹ e P², P² e P² ou P² e P³, ou opcionalmente de componentes adicionais como aqui definido (por exemplo, L, (AA), (AA)_X, [(AA)_X]_Z, etc). A porção -SH pode ser parte da estrutura desses componentes ou adicionada por uma modificação

Petição 870190070557, de 24/07/2019, pág. 304/401

240/306 como definido abaixo;

L é um ligante ótimo, que pode estar presente ou não, e pode ser selecionado independente dos outros de RGD, Transferrina, Folato, um peptídeo de sinal ou sequência de sinal, um sinal ou sequência de localização, um sinal ou sequência de localização nuclear (NLS), um anticorpo, um peptídeo de penetração celular (por exemplo, TAT ou KALA), um ligante de um receptor (por exemplo, citocinas, hormônios, fatores de crescimento, etc.), moléculas pequenas (por exemplo, carboidratos tipo manose ou galactose ou ligantes sintéticos), agonistas de molécula pequena, inibidores ou antagonistas de receptores (por exemplo, análogos peptidomiméticos de RGD) ou qualquer proteína adicional como aqui definido, etc.;

n é um inteiro tipicamente selecionado de uma faixa de cerca de 1 a 50, preferivelmente de a uma faixa de cerca de 1,2 ou 3 a 30, mais preferivelmente de uma faixa de cerca de 1,2, 3, 4 ou 5 a 25 ou uma faixa de cerca de 1, 2, 3, 4, ou 5 a 20 ou uma faixa de cerca de 1, 2, 3, 4 ou 5 a 15 ou uma faixa de cerca de 1, 2, 3, 4 ou 5 a 10, incluindo, por exemplo, uma faixa de cerca de 4 a 9, 4 a 10, 3 a 20, 4 a 20, 5 a 20 ou 10 a 20 ou uma faixa de cerca de 3 a 15, 4 a 15, 5 a 15 ou 10 a 15 ou uma faixa de cerca de 6 a 11 ou 7 a 10. Sobretudo preferivelmente, n está em uma faixa de cerca de 1, 2, 3, 4, ou 5 a 10, mais preferivelmente em uma faixa de cerca de 1,2, 3 ou 4 a 9, em uma faixa de cerca de 1,2, 3 ou 4 a 8 ou em uma faixa de cerca de 1, 2 ou 3 a 7. [0448] Neste contexto, a descrição do WO2011/026641 é incorporada aqui a título de referência. Cada um dos polímeros hidrofílicos P¹e P³ exibe tipicamente pelo menos uma porção -SH, em que a pelo menos uma porção -SH é capaz de formar uma ligação dissulfeto quando da reação com componente P² ou com componente (AA) ou (AA)x, se usada como um ligante entre P¹ e P² ou P³ e P² como definido abaixo e opcionalmente com um componente adicional, por exemplo, L

Petição 870190070557, de 24/07/2019, pág. 305/401

241/306 e/ou (AA) ou (AA)x, por exemplo, se duas ou mais porções -SH estiverem contidas. As subfórmulas que seguem P¹-S-S-P² e P²-S-S-P³ dentro da fórmula genérica (IV) acima (os parênteses são omitidos para melhor capacidade de leitura), em que qualquer um de S, P¹ e P³ é como aqui definido, tipicamente representam uma situação em que uma porção -SH de polímeros hidrofílicos P¹ e P³ foi condensada com uma porção -SH de componente P² de fórmula genérica (IV) acima, em que ambos enxofres dessas porções -SH formam uma ligação dissulfeto S-S- como aqui definido na fórmula (IV). Essas porções -SH são tipicamente providas por cada um dos polímeros hidrofílicos P1 e P3, por exemplo, através de uma cisteína interna ou qualquer aminoácido ou composto (modificado) adicional que carregue uma porção -SH. Desta maneira, as subfórmulas P¹-S-S-P² e P²-S-S-P³ podem ser também escritas como P¹-Cys-Cys-P² e P²~Cys~Cys~P³, se a porção -SH for provida por uma cisteína, em que o termo Cys-Cys representa duas cisternas acopladas através de uma ligação dissulfeto, não através de uma ligação peptídica. Neste caso, o termo -S-S- nessas fórmulas também podem ser escritos como -S-Cys, como -Cys-S ou como -Cys-Cys. Neste contexto, o termo -Cys-Cys- não representa uma ligação peptídica, mas uma ligação de duas cisteínas através de suas porções -SH para formar uma ligação dissulfeto. Desta maneira, o termo -Cys-Cys também pode ser compreendido geralmente como -(Cys-S)-(S-Cys), em que neste caso específico S indica o enxofre da porção -SH de cisteína. Da mesma maneira, os termos -S-Cys e -Cys-S indicam uma ligação dissulfeto entre uma porção contendo -SH e uma cisteína, que pode ser também escrita como -S-(S-Cys) e -(Cys-S)-S. Alternativamente, os polímeros hidrofílicos P1 e P3 podem ser modificados com uma porção -SH, preferivelmente através de uma reação química com um composto carregando uma porção -SH, de modo que cada um dos polímeros hidrofílicos P¹ e P³ carrega pelo menos uma tal porção -SH.

Petição 870190070557, de 24/07/2019, pág. 306/401

242/306

Tal composto carregando uma porção -SH pode ser, por exemplo, uma cisteína (adicional) ou qualquer aminoácido adicional (modificado), que carregue uma porção -SH. Tal composto pode também ser qualquer composto ou porção nâo amino, que contenha ou permita introduzir uma porção -SH nos polímeros hidrofílicos P¹ e P³ como aqui definido. Tais compostos não amino podem ser anexados aos polímeros hidrofílicos P1 e P3 de fórmula (IV) do carreador polimérico de acordo com a presente invenção através de reações químicas ou ligação de compostos, por exemplo, através de ligação de um ácido 3-tio propiônico ou tioimolano, através de formação de amida (por exemplo, ácidos carboxílicos, ácidos sulfônicos, aminas, etc.), através de adição Michael (por exemplo, porções de maleinimida, carbonilas α,β-insaturadas, etc.) através de química click (por exemplo, azidas ou alcinas), através de metátese de alceno/alcina (por exemplo, alcenos ou alcinas), formação de imina ou hidrozona (aldeídos ou cetonas, hidrazinas, hidroxilaminas, aminas), reações de complexação (avidina, biotina, proteína G) ou componentes que permitam reações de substituição do tipo S_n (por exemplo, halogenoalcanos, tióis, álcoois, aminas, hidrazinas, hidrazidas, ésteres de ácido sulfônico, sais de oxifosfônio) ou outras porções químicas que podem ser utilizadas na anexação de componentes adicionais. Um derivado de PEG particularmente preferido neste contexto é alfa-Metóxiomega-mercapto poli(etileno glicol). Em cada caso, a porção -SH, por exemplo, de uma cisteína ou de qualquer aminoácido ou composto adicional (modificado), pode estar presente nas extremidades terminais ou internamente em qualquer posição de polímeros hidrofílicos P¹ e P³. Como definido aqui, cada um de polímeros hidrofílicos P¹ e P³ tipicamente exibe pelo menos uma porção -SH preferivelmente em uma extremidade terminal, mas pode também conter duas ou até mesmo mais porções -SH, que podem ser usadas para adicionalmente anexar componentes adicionais como aqui definido, preferivelmente peptídeos ou

Petição 870190070557, de 24/07/2019, pág. 307/401

243/306 proteínas funcionais adicionais, por exemplo, um ligante, um componente de aminoácido (AA) ou (AA)_X, anticorpos, peptídeos de penetração celular ou peptídeos aumentadores (por exemplo, TAT, KALA), etc. Razão em peso e razão N/P [0449] Em algumas modalidades da invenção, a molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico), está associada com ou complexada com um composto (poli-)catiônico ou um carreador polimérico, opcionalmente em uma razão em peso selecionada de uma faixa de cerca de 6:1 (p/p) a cerca de 0,25:1 (p/p), mais preferivelmente de a partir de cerca de 5:1 (p/p) a cerca de 0,5:1 (p/p), ainda mais preferivelmente de cerca de 4:1 (p/p) a cerca de 1:1 (p/p) ou cerca de 3:1 (p/p) a cerca de 1:1 (p/p) e sobretudo preferivelmente uma razão de cerca de 3:1 (p/p) a cerca de 2:1 (p/p) de ácido nucleico para composto (poli)-catiônico e/ou carreador polimérico, ou opcionalmente em uma razão de nitrogenio/fosfato (N/P) de ácido nucleico para composto (poii-)catiônico e/ou carreador polimérico na faixa de cerca de 0,1-10, preferivelmente em uma faixa de cerca de 0,3-4 ou 0,3-1 e sobretudo preferivelmente na faixa de cerca de 0,5-1 ou 0,7-1 e ainda mais preferivelmente em uma faixa de cerca de 0,3-0,9 ou 0,50,9. Mais preferivelmente, a razão N/P da pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais policátlons está na faixa de cerca de 0,1 a 10, Incluindo uma faixa de cerca de 0,3 a 4, de cerca de 0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5. [0450] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) pode ser também associada com um veículo, agente de transfecção ou complexação para aumento da eficiência de transfecção da dita molécula de ácido nucleico artificial, preferivelmente RNA.

[0451] Neste contexto, é particularmente preferido que a composi

Petição 870190070557, de 24/07/2019, pág. 308/401

244/306 ção (farmacêutica) da invenção compreenda a molécula de ácido nucleico artificial, preferivelmente RNA, que é complexada pelo menos parcialmente com um composto (poli-)catiônico e/ou um carreador poll· mérico, preferivelmente proteínas ou peptídeos catiônicos. Neste contexto, a descrição do WO 2010/037539 e WO 2012/113513 é incorporada aqui a título de referência. Parcialmente significa que apenas uma parte da dita molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um composto (poli-)catiônico e/ou carreador polimérico, enquanto o resto da dita molécula de ácido nucleico artificial, preferivelmente RNA, está presente em forma não complexada (livre).

[0452] Preferivelmente, a razão molar da molécula de ácido nucleico artificial complexada, preferivelmente RNA, para a molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma razão molar de cerca de 0,001:1 a cerca de 1:0,001, incluindo uma razão de cerca de 1:1. Mais preferivelmente a razão de molécula de ácido nucleico artificial complexada, preferivelmente RNA, para molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma faixa de cerca de 5:1 (p;p) a cerca de 1:10 (p/p), mais preferivelmente de uma faixa de cerca de 4:1 (p/p) a cerca de 1:8 (p/p), a inda mais preferivelmente de uma faixa de cerca de 3:1 (p/p) a cerca de 1:5 (p/p) ou 1:3 (p/p) e sobretudo preferivelmente a razão de molécula de ácido nucleico artificial complexada, preferivelmente RNA, para a molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma razão de cerca de 1:1 (p/p).

[0453] A molécula de ácido nucleico artificial complexada, preferivelmente RNA, da invenção é preferivelmente preparada de acordo com uma primeira etapa através da complexação da molécula de ácido nucleico artificial, preferivelmente RNA, com um composto (poli-)catiônico e/ou com um carreador polimérico, preferivelmente como aqui definido,

Petição 870190070557, de 24/07/2019, pág. 309/401

245/306 em uma razão específica para formar um complexo estável. Neste contexto, é altamente preferível que nenhum composto (poli-)catiônico livre ou carreador polimérico ou apenas uma quantidade insignificantemente pequena does mesmos permaneça na fração da molécula de ácido nucleico artificial complexada, preferivelmente RNA, após complexação da dita molécula de ácido nucleico artificial, preferivelmente RNA. Desta maneira, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, e o composto (poli-)catiônico e/ou o carreador polimérico na fração do RNA complexado é tipicamente selecionada em uma faixa de modo que a molécula de ácido nucleico artificial, preferivelmente RNA, é totalmente complexada e nenhum composto (polijcatiônico livre ou carreador polimérico ou apenas uma quantidade insignificantemente pequena permanece na dita fração.

[0454] Preferivelmente, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, para o composto (poli-)catiônico e/ou carreador polimérico, preferivelmente como aqui definido, é selecionada de uma faixa de cerca de 6:1 (p/p) a cerca de 0,25:1 (p/p), mais preferivelmente de a partir de cerca de 5:1 (p/p) a cerca de 0,5:1 (p/p), ainda mais preferivelmente de cerca de 4:1 (p/p) a cerca de 1:1 (p/p) ou de cerca de 3:1 (p/p) a cerca de 1:1 (p/p), e sobretudo preferivelmente uma razão de cerca de 3:1 (p/p) a cerca de 2:1 (p/p).

[0455] Alternativamente, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, para o composto (poli-)catiônico e/ou o carreador polimérico pode ser também calculada com base na razão de nitrogênio/fosfato (razão N/P) do complexo inteiro. No contexto da presente invenção, uma razão N/P está preferivelmente na faixa de cerca de 0,1-10, preferivelmente na faixa de cerca de 0,3-4 e sobretudo preferivelmente em uma faixa de cerca de 0,5-2 ou 0,7-2 com relação à razão de molécula de ácido nucleico artificial, preferivelmente RNA, para composto (poli-)catiônico e/ou carreador polimérico, preferivelmente

Petição 870190070557, de 24/07/2019, pág. 310/401

246/306 como definido aqui, no complexo, e sobretudo preferivelmente em uma faixa de cerca de 0,7-1,5, 0,5-1 ou 0,7-1, e ainda mais preferivelmente em uma faixa de cerca de 0,3-0,9 ou 0,5-0,9, preferivelmente contanto que o composto (poli-)catiônico no complexo seja uma proteína ou peptídeo (poli-)catiônico e/ou o carreador polimérico como definido acima.

[0456] Em outras modalidades, molécula de ácido nucleico artificial, preferivelmente RNA, pode ser provida e usada em forma livre ou nua sem estar associada com qualquer veículo, agente de transfecção ou complexação adicional.

Administração direcionada [0457] Em aigumas modalidades, compostos (poli-)catiônicos, carreadores, lipossomas ou LNPs podem ser formulados para administração direcionada para atingir diversos órgãos e/ou tipos de célula. Como um exemplo não limitante, o composto (poli-jcatiônico, carreador, lipossoma ou LNP pode ser formulado para administração direcionada ao fígado. O composto (poH-)catiônico, carreador, lipossoma ou LNP usado para administração direcionada pode incluir, mas não é limitado a, composto (poli-)catiônico, carreador, lipossomas ou LNPs descritos aqui. Os RNAs da invenção podem codificar conjugados, por exemplo, proteínas terapêuticas ou fragmentos ou variantes das mesmas, covalentemente ligados a um carreador ou grupo de direcionamento.

[0458] Grupos de direcionamento podem ser proteínas, por exemplo, glicoproteínas, ou peptídeos, por exemplo, moléculas tendo uma afinidade específica com um coligante, ou anticorpo, por exemplo, um anticorpo que se liga a um tipo de célula especificado tal como uma célula epitelial, queratinócitos ou similar. Grupos de direcionamento podem também incluir hormônios e receptores de hormônio. Eles podem também incluir espécies não peptídicas, tais como lipídeos, lectinas, carboidratos, vitaminas, cofatores, lactose multivalente, galactose mul

Petição 870190070557, de 24/07/2019, pág. 311/401

247/306 tivalente, N-acetil-galactosamina, N-actil-glucosamina manose multivalente, fucose multivalente ou aptâmeros. O grupo de direcionamento pode ser qualquer ligante que seja capaz de direcionamento a um receptor específico.

[0459] Em algumas modalidades, as moléculas de ácido nucleico artificiais, preferivelmente RNA, e opcionalmente composições (farmacêuticas) ou kits compreendendo as mesmas, são adaptadas para direcionamento ao(para dentro do) fígado. Tais moléculas de ácido nucleico artificiais, preferivelmente RNAs, e opcionalmente composições (farmacêuticas) ou kits compreendendo as mesmas, podem ser particularmente adequados para tratamento, prevenção ou atenuação de doenças metabólicas, por exemplo, doença metabólica causada por erros genéticos inatos, por exemplo, doenças relacionadas à deficiência de ornitina transcarbamilase.

Composição (farmacêutica) [0460] Em um aspecto adicional, a presente invenção provê uma composição compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com a invenção, e pelo menos um carreador ou excipiente farmaceuticamente aceitável. A composição de acordo com a invenção é preferivelmente provida como uma composição farmacêutica.

[0461] A molécula de ácido nucleico artificial, preferivelmente RNA, pode ser provida como parte da composição (farmacêutica) em forma complexada ou livre como descrito em qualquer outro ponto aqui ou uma mistura das mesmas.

[0462] A composição (farmacêutica) de acordo com a invenção pode compreender ainda pelo menos um gRNA, ou um vetor provendo o mesmo, como definido em qualquer outro ponto aqui.

[0463] A composição (farmacêutica) de acordo com a invenção pode compreender ainda pelo menos um agente ativo adicional útil para

Petição 870190070557, de 24/07/2019, pág. 312/401

248/306 tratamento da doença ou condição que é submetida à terapia com a molécula de ácido nucleico artificial, preferivelmente RNA, ou composição (farmacêutica) compreendendo a mesma.

Excipientes e carreadores farmaceuticamente aceitáveis [0464] Preferivelmente, a composição (farmacêutica) de acordo com a invenção compreende pelo menos um carreador e/ou excipiente farmaceuticamente aceitável. O termo farmaceuticamente aceitável refere-se a um composto ou agente que é compatível com um ou mais agente(s) ativo(s) (aqui: molécula de ácido nucleico artificial, preferivelmente RNA) e não interfere com e/ou substancialmente reduz suas atividades farmacêuticas. Carreadores farmaceuticamente aceitáveis têm preferivelmente pureza suficientemente alta e toxidez suficientemente baixa para torna-los adequados para administração a um indivíduo a ser tratado.

Excipientes [0465] Excipientes farmaceuticamente aceitáveis podem exibir papéis funcionais diferentes e incluem, sem limitação, diluentes, cargas, agentes de volume, carreadores, deslntegrantes, ligantes, lubrificantes, glídantes, revestimentos, solventes e cossolventes, agentes de tamponamento, conservantes, adjuvantes, antioxidantes, agentes umectantes, agentes antiespumantes, agentes de espessamento, agentes adoçantes, agentes saborizantes e umectantes.

[0466] Para composições (farmacêuticas) em forma líquida, excipientes farmaceuticamente aceitáveis úteis em geral incluem solventes, diluentes ou carreadores tais como água (livre de pírógeno), soluções salinas (isotônicas) tal como solução salina tamponada com fosfato ou citrato, óleos fixos, óleos vegetais, tais como, por exemplo, óleo de amendoim, óleo de semente de algodão, óleo de sésamo, óleo de oliva, óleo de milho, etanol, polióis (por exemplo, glicerol, propileno glicol, polietileno glicol e similar); lecítina; tensoativos; conservantes tais como

Petição 870190070557, de 24/07/2019, pág. 313/401

249/306 álcool de benzila, parabenos, clorobutanol, fenol, ácido ascórbico, timerosal e similar; agentes isotônicos tais como açúcares, poliálcoois tal como manitol, sorbitol ou cloreto de sódio; monoestearato de alumínio ou gelatina; antioxidantes tal como ácido ascórbico ou bissulfito de sódio; agentes de quelaçâo tal como ácido etilenodiaminotetraacético (EDTA); tampões tais como acetatos, citratos ou fosfatos e agentes para o ajuste de tonicidade tal como cloreto de sódio ou dextrose. O pH pode ser ajustado com ácidos ou bases, tal como ácido clorídrico ou hidróxido de sódio. Tampões podem ser hipertônicos, isotônicos ou hipotônicos com referência ao meio de referência específico, isto é, o tampão pode ter um teor de sal maior, idêntico ou menor com referência ao meio de referência específico, em que preferivelmente tais concentrações dos sais mencionados acima podem ser usadas, que nâo levam a dano de células devido à osmose ou outros efeitos de concentração. Meios de referência são, por exemplo, líquidos ocorrendo em métodos in vivo, tais como sangue, linfa, líquidos citosólicos ou outros líquidos corporais ou, por exemplo, líquidos que podem ser usados como meios de referência em métodos in vitro, tais como tampões ou líquidos comuns. Tais tampões ou líquidos comuns são conhecidos de um versado na técnica. Solução de Ringer com lactato é particularmente preferida como uma base líquida.

[0467] Para composições (farmacêuticas) em forma (semi-)sólida, excipientes farmaceuticamente aceitáveis úteis incluem ligantes tais como celulose microcristalina, goma tragacanto ou gelatina; amido ou lactose; açúcares, tais como, por exemplo, lactose, glicose e sacarose; amidos, tais como, por exemplo, amido de milho ou amido de batata; celuloses e seus derivados, tais como, por exemplo, carboximetilcelulose de sódio, etilcelulose, acetato de celulose; desintegrantes tais como ácido algínico; lubrificantes tais como estearato de magnésio; glidantes

Petição 870190070557, de 24/07/2019, pág. 314/401

250/306 tais como ácido esteárico, estearato de magnésio; sulfato de cálcio, dióxido de silício coloidal e similar; agentes adoçantes tais como sacarose ou sacarina; e/ou agentes saborizantes tais como hortelã-pimenta, salioilato de metila ou aromatizante de laranja.

Carreadores [0468] Carreadores farmaceuticamente aceitáveis adequados são tipicamente escolhidos com base na formulação da composição (farmacêutica).

[0469] Composições (farmacêuticas) líquidas administradas através de injeção e em particular através de injeção i.v. devem ser estéreis e estáveis sob as condições de fabricação e armazenamento. Tais composições são tipicamente formuladas como soluções aquosas parenteralmente aceitáveis que são livres de pirógeno, têm pH aceitável, são isotônicas e mantêm estabilidade do(s) ingrediente(s) ativo(s).

[0470] Carreadores farmaceuticamente aceitáveis particularmente úteis para composições (farmacêuticas) líquidas de acordo com a invenção incluem água, tipicamente água livre de pirógeno; solução salina isotônica ou soluções (aquosas) tamponadas, por exemplo, fosfato, citrato, etc., soluções tamponadas. Particularmente para injeção das composições (farmacêuticas) da invenção, água ou preferivelmente um tampão, mais preferivelmente um tampão aquoso, pode ser usado, contendo um sal de sódio, preferivelmente pelo menos 50 mM de um sal de sódio, sal de cálcio, preferivelmente pelo menos 0,01 mM de um sal de cálcio, e opcionalmente um sal de potássio, preferivelmente pelo menos 3 mM de um sal de potássio.

[0471] De acordo com modalidades preferidas, os sais de sódio, cálcio e, opcionalmente, potássio, podem ocorrer na forma de suas halogenidas, por exemplo, cloretos, iodetos ou brometos, na forma de seus hidróxidos, carbonates, hidrogeno carbonates ou sulfates, etc. Sem ser limitado aos mesmos, exemplos de sais de sódio incluem, por exemplo,

Petição 870190070557, de 24/07/2019, pág. 315/401

251/306

NaCI, Nal, NaBr, Na2CO3, NaHCOs, NazSCri, exemplos dos sais de potássio opcionais incluem, por exemplo, KCI, Kl, KBr, K2CO3, KHCO3, K2SO4, e exemplos de sais de cálcio incluem, por exemplo, CaCb, Cab, CaBf2, CaCCh, CaSCu, Ca(OH)2. Ainda, ânions orgânicos dos cátions mencionados acima podem estar contidos no tampão.

[0472] De acordo com modalidades mais preferidas, o tampão adequado para propósitos de injeção como acima definido pode conter sais selecionados de cloreto de sódio (NaCI), cloreto de cálcio (CaCb) e opcionalmente cloreto de potássio (KCI), em que ânions adicionais podem estar presentes em adição aos cloretos. CaCb pode também ser substituído por um outro sal tal como KCI. Tipicamente, os sais no tampão de injeção estão presentes em uma concentração de pelo menos 50 mM de cloreto de sódio (NaCI), pelo menos 3 mM de cloreto de potássio (KCI) e pelo menos 0,01 mM de cloreto de cálcio (CaCb). O tampão de injeção pode ser hipertrófico, isotônico ou hipotônico com referência ao meio de referência específico, isto é, o tampão pode ter um teor de sal maior, idêntico ou menor com referência ao meio de referência específico, em que preferivelmente tais concentrações dos sais mencionados acima podem ser usadas, as quais não levem a dano de células devido à osmose e outros efeitos de concentração. Meios de referência são, por exemplo, líquidos de ocorrência em métodos in vivo” tais como sangue, linfa, líquidos citosóllcos ou outros líquidos corporais ou, por exemplo, líquidos que podem ser usados como meios de referência em métodos ’7n vitro, tais como tampões ou líquidos comuns. Tais tampões ou líquidos comuns são conhecidos de um versado na técnica. Solução de Ringer com Lactato é particularmente preferida como uma base líquida. Formulação [0473] Em geral, composições (farmacêuticas) para administração tópica podem ser formuladas como cremes, unguentos, géis, pastas ou pós. Composições (farmacêuticas) para administração oral podem ser

Petição 870190070557, de 24/07/2019, pág. 316/401

252/306 formuladas como comprimidos, cápsulas, líquidos, pós ou em um formato de liberação sustentada. No entanto, de acordo com modalidades preferidas, a composição (farmacêutica) da invenção é administrada parenteralmente, em particular através de injeção intradermal ou intramuscular, e é desta maneira formulada em forma líquida ou liofilizada para administração parenteral como discutido em um outro ponto aqui. Formulações parenterais são tipicamente armazenadas em frascos, bolsas IV, ampolas, cartuchos e seringas pré-cheias e podem ser administradas como injeções, Inalantes ou aerossóis, com injeções sendo preferidas.

Formulações liofilizadas [0474] Em modalidades preferidas adicionais, a composição (farmacêutica) é provida em forma liofilizada. Preferivelmente, a composição (farmacêutica) liofilizada é reconstituída em um tampão adequado, vantajosamente baseado em um carreador aquoso, antes da administração, por exemplo, solução de Ringer com Lactato, que é preferida, solução de Ringer, uma solução tampão de fosfato. Em algumas modalidades, a composição (farmacêutica) de acordo com a invenção contém pelo menos duas, três, quatro, cinco, seis ou mais moléculas de ácido nucleico artificiais, preferivelmente RNAs, que são providas separadamente em forma liofilizada (opcionalmente junto com pelo menos um aditivo adicional) e que são preferivelmente reconstituídas separadamente em um tampão adequado (tal como solução de Ringer com Lactato) antes do seu uso de modo a permitir administração individual de cada uma da dita molécula de ácido nucleico artificial, preferivelmente RNAs.

Formulações líquidas [0475] Em modalidades preferidas adicionais, a composição (farmacêutica) é provida na forma de uma solução salina ou uma formulação à base de lipídeo. Formulações à base de lipídeo podem compreender

Petição 870190070557, de 24/07/2019, pág. 317/401

253/306 lipossomas, Hpoptexos, nanolipossomas e nanopartículas de lipídeo que sâo descritos acima na seção intitulada Complexação.

Kit [0476] Em um aspecto adicional, a presente invenção refere-se a um kit de kit de partes compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, e/ou a composição (farmacêutica). O kit pode compreender ainda pelo menos um gRNA (ou vetor provendo o mesmo).

[0477] Os componentes mencionados acima podem ser, cada um, providos na forma de uma composição farmacêutica no kit de partes. Até agora, as definições e explicações providas acima para a composição (farmacêutica) são igualmente aplicáveis aos componentes individuais do kit de partes, mutatis mutandis.

[0478] Por exemplo, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, e opcionalmente o pelo menos um gRNA ou ácido nucleico codificando o mesmo, podem ser providos independentemente um do outro - em forma liofilizada ou líquida, opcionalmente junto com um ou mais carreador(es), excipientes ou agentes adicionais farmaceuticamente aceitáveis como descrito acima no contexto da composição farmacêutica.

[0479] Opcionalmente, o kit de partes pode compreender pelo menos um agente adicional como aqui definido no contexto da composição farmacêutica, agentes antimicrobianos, inibidores de RNase, agentes de solubilização ou similar.

[0480] O kit de partes pode ser um kit de duas ou mais partes e compreende tipicamente os componentes em recipientes adequados. Por exemplo, cada recipiente pode estar na forma de frascos, garrafas, garrafas para apertar, jarras, mangas vedadas, envelopes ou bolsas, tubos ou embalagens de blister ou qualquer outra forma adequada con

Petição 870190070557, de 24/07/2019, pág. 318/401

254/306 tanto que o recipiente seja configurado de modo a prevenir mistura imatura de componentes. Cada um dos componentes diferentes pode ser provido separadamente, ou alguns dos componentes diferentes podem ser providos juntos (isto é, no mesmo recipiente). Um recipiente pode ser também um compartimento ou uma câmara dentro de um frasco, um tubo, uma jarra ou um envelope ou uma manga ou uma embalagem de blister ou uma garrafa, contanto que os teores de um compartimento não sejam capazes de se associar fisicamente com os teores de um outro compartimento antes de sua mistura deliberada pelo farmacêutico ou médico.

[0481] O kit de partes pode conter ainda instruções técnicas com informação sobre a administração e dosagem de quaisquer um de seus componentes.

Uso médico e tratamento [0482] A molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes definido aqui pode ser usado para propósitos médicos humanos e também para veterinários, preferivelmente para propósitos médicos humanos.

[0483] De acordo com um aspecto adicional, a invenção refere-se então à molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes para uso como um medicamento.

[0484] A molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes sâo inter alia úteis para tratamento e/ou profilaxia de doenças condescendentes a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse. [0485] De acordo com um aspecto adicional, a invenção refere-se então à molécula de ácido nucleico artificial, preferivelmente RNA, ou à

Petição 870190070557, de 24/07/2019, pág. 319/401

255/306 composição (farmacêutica) ou kit de partes para uso em um método de terapia de gene e/ou para tratamento de uma doença condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse. Tais doenças podem ser selecionadas de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias, doenças infecciosas, doenças metabólicas, doenças neurais, doenças cardlovasculares ou outras doenças ou condições.

[0486] Terapia de gene envolve preferivelmente maturação (isto é, restauração, aumento, diminuição ou inibição) de expressão de gene em um indivíduo a fim de obter um efeito terapêutico. Para esta finalidade, terapia de gene tipicamente compreende a introdução de ácidos nucleicos em células. O termo refere-se em geral à manipulação de um genoma para propósitos terapêuticos e inclui o uso de tecnologias de edição de genoma para correção de mutações que podem causar doença, a adição de genes terapêuticos ao genoma, a remoção de genes ou sequências de genoma prejudiciais e a modulação de expressão de gene. Terapia de gene pode envolver transformação /n vivo ou ex vivo das células hospedeiras.

[0487] O termo tratamento ou tratando” de uma doença inclui prevenção ou proteção contra a doença (isto é, fazendo com que os sintomas clínicos não se desenvolvam); inibição da doença (isto é, parando ou suprimindo o desenvolvimento de sintomas clínicos; e/ou aliviando a doença (isto é, causando a regressão de sintomas clínicos). Como será compreendido, não é sempre possível distinguir entre prevenção e supressão de uma doença ou distúrbio uma vez que o evento ou eventos indutor(es) finais podem ser desconhecidos ou latentes. Desta maneira, o termo profilaxia será compreendido constituir um tipo de tratamento que compreende ambos prevenção e supressão. O termo

Petição 870190070557, de 24/07/2019, pág. 320/401

256/306 tratamento então inclui profilaxia.

[0488] O termo indivíduo ou paciente como aqui usado geralmente inclui humanos e animais não humanos e preferivelmente mamíferos (por exemplo, primatas não humanos, incluindo marmotas, micos, macacos-aranha, macacos-coruja, macacos-vervet, macacos-esquilo e babuínos, macacas, chimpanzés, orangotangos, gorilas; vacas; cavalos: ovelha; porcos; galinha; gatos; cachorros; camundongos; rato; coelhos; porquinhos-da-índia; etc.), incluindo animais e modelos de doença quiméricos e transgênicos. No contexto da presente invenção, o termo indivíduo refere-se preferivelmente a um primata não humano ou um humano, sobretudo preferivelmente um humano.

[0489] Desta maneira, a presente invenção provê ainda métodos de tratamento de doenças condescendentes a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse, através da administração a um indivíduo com necessidade de uma quantidade farmaceuticamente eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes. Tais métodos podem compreender uma primeira etapa opcional de preparação da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes, e uma segunda etapa compreendendo administração (de uma quantidade farmaceuticamente e/ou terapeuticamente eficaz da) dita molécula de ácido nucleico artificial, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes a um paciente/indivíduo com necessidade do mesmo.

[0490] Administração é preferivelmente realizada parenteralmente, por exemplo, através de injeção subcutânea, intramuscular ou intradermal, preferivelmente através de injeção intramuscular ou intradermal, mais preferivelmente através de injeção intradermal. Preferivelmente,

Petição 870190070557, de 24/07/2019, pág. 321/401

257/306 injeção é realizada usando injeção com agulha convenciona ou injeção de jato (sem agulha), preferivelmente usando injeção de jato (sem agulha).

[0491 ] A invenção refere-se também ao uso da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes, preferivelmente para ativação, inativação, manipulação ou modulação, preferivelmente para indução ou aumento, da expressão de um gene de interesse.

Vias de administração [0492] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes pode ser administrado, por exemplo, sistemicamente ou localmente.

[0493] Vias para administração sistêmica em geral incluem, por exemplo, vias transdermal, oral, parenteral, incluindo injeções subcutâneas, intravenosas, intramusculares, intra-arteriais, intradermais e intraperitoneais e/ou vias de administração intranasal.

[0494] Vias para administração local em geral incluem, por exemplo, vias de administração tópica, mas também injeções intradermais, transdermais, subcutâneas ou intramusculares ou injeções intralesionais, intratumorais, intracraniais, intrapulmonares, intracardiais e sublinguais.

[0495] É ainda concebível usar vias de administração diferentes para componentes diferentes da molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes, por exemplo, no caso da dita composição (farmacêutica) ou kit de partes compreender vários ácidos nucleicos diferentes (tal como pelo menos um ácido nucleico artificial codificando uma proteína associada a CRISPR e pelo menos um gRNA ou um vetor provendo o mesmo).

[0496] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica)

Petição 870190070557, de 24/07/2019, pág. 322/401

258/306 ou kit de partes é administrada através de uma via parenteral, preferivelmente através de vias intradermal, subcutânea ou intramuscular. Preferivelmente, a dita molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes é administrada através de injeção, por exemplo, injeção subcutânea, intramuscular ou intradermal, que pode ser injeção sem agulha e/ou com agulha. Desta maneira, em modalidades preferidas, o uso médico e/ou método de tratamento de acordo com a presente invenção envolve administração da dita molécula de ácido nucleico artificial, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes através de injeção subcutânea, intramuscular ou intradermal, preferivelmente através de injeção intramuscular ou intradermal, mais preferivelmente através de injeção intradermal. Tal injeção pode ser dada usando injeção com agulha convencional ou injeção de jato (sem agulha), preferivelmente usando injeção de jato (sem agulha).

Regime de administração [0497] Os componentes da composição (farmacêutica) ou kit de partes da invenção, isto é, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, e opcionalmente pelo menos um outro ácido nucleico (por exemplo, gRNA ou vetor provendo o mesmo) podem ser administrados a um indivíduo com necessidade do mesmo várias vezes por dia, diariamente, dia sim dia não, semanalmente ou mensalmente; e pode ser administrada sequencialmente ou simultaneamente. Os ditos componentes podem ser administrados a um indivíduo com necessidade dos mesmos através de vias de administração diferentes como definido acima.

[0498] De acordo com algumas modalidades preferidas, os componentes da composição (farmacêutica) da invenção são administrados simultaneamente (isto é, ao mesmo tempo a traves das mesmas vias de administração ou diferentes).

Petição 870190070557, de 24/07/2019, pág. 323/401

259/306 [0499] De acordo com outras modalidades preferidas, os componentes da composição da invenção (farmacêutica) ou kits de parte são administrados separadamente (isto é, sequencialmente em pontos de tempo diferentes e/ou através de vias de administração diferentes). Tal esquema de administração sequencial é também referido como administração “escalonada no tempo. Administração escalonada no tempo pode significar que a molécula de ácido nucleico artificial, preferivelmente RNA, é administrada, por exemplo, antes, concomitante ou subsequente ao gRNA ou vetor provendo o mesmo, ou vice-versa.

Dose [0500] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit é preferivelmente administrado em uma quantidade segura e terapeuticamente eficaz.

[0501] Como aqui usado, quantidade segura e terapeuticamente eficaz significa uma quantidade do(s) agente(s) ativo(s) que é suficiente para elicitar uma resposta biológica ou medicinal desejada em um tecido, sistema, animal ou humano que está sendo acompanhado. Uma quantidade segura e terapeuticamente eficaz é preferivelmente suficiente para a indução de uma modificação positiva da doença a ser tratada, isto é, para alivio dos sintomas da doença sendo tratada, redução de progressão de doença ou profilaxia dos sintomas da doença sendo prevenida. Ao mesmo tempo, no entanto, uma quantidade segura e terapeuticamente eficaz é pequena o suficiente para evitar efeitos colaterais sérios, quer dizer permitir uma relação sensível entre vantagem e risco.

[0502] Uma quantidade segura e terapeuticamente eficaz variará ainda mais em relação à condição particular sendo tratada e também com a idade, condição física, peso corporal, sexo e dieta do paciente a ser tratado, a severidade da condição, a duração do tratamento, a natu

Petição 870190070557, de 24/07/2019, pág. 324/401

260/306 reza da terapia acompanhante, do carreador ou excipiente farmaceuticamente aceitável particular, do regime de tratamento e fatores similares. Uma quantidade segura e (terapeuticamente) eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, pode ser ainda selecionada dependendo do tipo de molécula de ácido nucleico artificial, preferivelmente RNA, por exemplo, RNA monocistrônico, bl·- ou até mesmo multicistrônico, uma vez que um RNA bi- ou até mesmo multicistrônico pode levar a uma expressão significantemente maior da(s) proteína(s) associada(s) a CRISPR codificada(s) do que o uso de uma quantidade igual de um RNA monocistrônico.

[0503] Eficácia terapêutica e toxidez da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes podem ser determinadas através de procedimentos farmacêuticos padrão em culturas de célula ou animais experimentais, por exemplo, para determinação da LD50 (a dose ietai para 50% da população) e da ED50 (a dose terapeuticamente eficaz em 50% da população). A razão de dose entre efeitos tóxicos e terapêuticos é o índice terapêutico e pode ser expressa como a razão LD50/ED50. Ácidos nucleicos artificiais, preferivelmente RNAs, composições (farmacêuticas) ou kits de partes que exibem índices terapêuticos grandes são geralmente preferidos. Os dados obtidos a partir dos ensaios de cultura de célula e estudos animais podem ser usados na formulação de uma faixa de dosagem para uso em humanos. A dosagem de tais compostos se encontra preferivelmente dentro de uma faixa de concentrações em circulação que incluem a ED50 com pouca ou nenhuma toxidez.

[0504] Por exemplo, doses terapeuticamente eficazes da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes descritos aqui podem variar de a partir de cerca de 0,001 mg a 10 mg, preferivelmente de a partir de cerca de 0,01 mg a 5 mg, mais preferivelmente de a partir de cerca de 0,1 mg

Petição 870190070557, de 24/07/2019, pág. 325/401

261/306 a 2 mg por unidade de dose ou de a partir de cerca de 0,01 nmol a 1 mmol por unidade de dose, em particular de a partir de 1 nmol a 1 mmol por unidade de dosagem, preferivelmente de a partir de 1 pmol a 1 mmol por unidade de dosagem. É também compreendido que a dose terapeuticamente eficaz da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode variar (por kg de peso corporal) de a partir de cerca de 0,01 mg/kg a 10 g/kg, preferivelmente de a partir de 0,05 mg/kg a 5 g/kg, mais preferivelmente de a partir de cerca de 0,1 mg/kg a 2,5 g/kg.

[0505] Quantidades seguras e terapeuticamente eficazes da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes a serem administradas podem ser determinadas através de experimentos de rotina, por exemplo, usando modelos animais. Tais modelos incluem, sem implicar nenhuma limitação, modelos de coelho, ovelha, camundongo, rato, cachorro e primata não humano.

Doenças [0506] Tecnologias CRISPR podem ser empregadas para uma variedade de propósitos, incluindo ínativação ou ativação funcional de genes, edição de gene ou ativação ou inibição de transcrição. A molécula de ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção pode então ser usada para tratamento de uma variedade de doenças. Ela é particularmente compreendida para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de uma proteína associada a CRISPR codificada por pelo menos uma sequência de codificação da molécula de ácido nucleico artificial.

[0507] Preferivelmente, a doença a ser tratada é condescendente a tratamento através de ativação, ínativação ou manipulação (por exemplo, introdução ou remoção de uma mutação) de um gene de interesse,

Petição 870190070557, de 24/07/2019, pág. 326/401

262/306 ou através da modulação (isto é, alteração, indução, aumento, redução, prevenção ou rompimento) de sua expressão.

[0508] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para induzir inativações de gene (isto é, tornar genes não funcionais ou remover genes do genoma). Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando proteínas associadas a CRISPR exibindo atividade de endonuclease podem ser utilizadas, as quais são capazes de introduzir DSBs no DNA genômico. Os ditos DSBs podem induzir união de extremidade não homologa (NHEJ), resultando na inserção ou deleção aleatória de extensões curtas de nudeotídeos levando ao rompimento da estrutura de leitura de códon (frameshifts), resultando em transcritos errôneos e ablação de expressão de gene (perda de função). Esta estratégia pode, por exemplo, ser útil para inativação de genes que fazem a mediação de proliferação e sobrevivência de célula de tumor ou para remoção viral integrada do genoma da célula hospedeira.

[0509] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para induzir ativações de gene (isto é, introduzir genes novos ou modificados no genoma). Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando proteínas associadas a CRISPR exibindo atividade de nickase podem ser utilizadas, as quais são então capazes de introduzir Nicks (isto é, hidrolise das ligações fosfodiéster de um filamento do DNA genômico de filamento duplo) no DNA genômico. Tais nicks preferivelmente induzem reparo direcionado à homologia (HDR), resultando na incorporação de um segmento de DNA com regiões tendo homologia com as sequências flanqueando ambos os lados da quebra de

Petição 870190070557, de 24/07/2019, pág. 327/401

263/306 filamento duplo de DNA. Usando HDR, qualquer sequência de DNA desejada pode ser inserida no DNA genômico para induzir, por exemplo, perda de função, ganho de função ou função (neomórfica) alterada ou para investigar variantes de estado funcional desconhecido. Para utilizar HDR para editar o genoma, o modelo de reparo de DNA com a sequência desejada é tipicamente provido junto com o ácido nucleico artificial da invenção (e o gRNA). Esta estratégia pode ser, por exemplo, útil para inativação de genes terapêuticos.

[0510] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para modular expressão de gene, e em particular transcrição de gene. Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando derivados de proteína associada a CRISPR compreendendo domínios efetores adequados podem ser utilizadas. Os domínios efetores podem interagir com um gene-alvo (ou uma sequência reguladora operavelmente ligada ao mesmo) para modular sua expressão. Esta abordagem pode ser útil para qualquer doença que esteja associada com uma expressão indesejada (presente ou ausente, aumentada ou diminuída) de um gene-alvo de interesse.

Câncer [0511] Em modalidades preferidas, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit é usado para tratamento ou profilaxia de câncer.

[0512] Como aqui usado, o termo câncer refere-se a um neoplasma caracterizado pela proliferação descontrolada e geralmente rápida de células que tendem a invadir tecido circundante e metastatizar para sítios distantes no corpo. O termo compreende neoplasmas benignos e malignos. Malignidade em câncer é tipicamente caracterizada por

Petição 870190070557, de 24/07/2019, pág. 328/401

264/306 anaplasia, invasividade e metástase; enquanto males benignos tipicamente não tem nenhuma dessas propriedades. Os termos incluem neoplasmas caracterizados por crescimento de tumor bem como cânceres do sangue e sistema linfático.

[0513] Em algumas modalidades, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção pode ser usado como um medicamento, em particular para tratamento de tumor ou doenças de câncer. Neste contexto, tratamento envolve preferivelmente aplicação intratumoral, especialmente através de injeção intratumoral. Desta maneira, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção podem ser usados para preparação de um medicamento para tratamento de tumor ou doenças de câncer, o dito medicamento sendo particularmente adequado para aplicação intratumoral (administração) para tratamento de tumor ou doenças de câncer.

[0514] Preferivelmente, tumor e doenças de câncer como mencionado aqui são selecionados de tumor e doenças de câncer que incluem preferivelmente, por exemplo, Leucemia linfoblástica aguda, Leucemia mieloide aguda, Carcinoma adrenocortical, Cânceres relacionados à AIDS, Linfoma relacionado à AIDS, Câncer anal, Câncer de apêndice, Astrocitoma, Carcinoma de célula basal, Câncer do duto da bile, Câncer de bexiga, Câncer ósseo, Osteossarcoma/Histiocitoma fibroso maligno, Glioma do tronco cerebral, Tumor cerebral, Astrocitoma cerebelar, Astrocitoma cerebral/Glioma maligno, Ependimoma, Meduloblastoma, Tumores neuroectodermais primitivos supratentoriais, Glioma da via visual e hipotalâmico, Câncer de mama, Adenomas/carcinoides brônquicos, Linfoma de Burkitt, Tumor carcinoide da infância, Tumor carcinoide gastrintestinal, Carcinoma de primário desconhecido, Linfoma do sistema nervoso central primário, Astrocitoma cerebelar da infância, Astrocitoma

Petição 870190070557, de 24/07/2019, pág. 329/401

265/306 cerebral da infância/Glioma maligno, Câncer cervical, Cânceres da infância, Leucemia linfocítica crônica, Leucemia mielógena crônica, Distúrbios mieloproliferativos crônicos, Câncer de cólon, Linfoma cutâneo de célula T, Tumor desmoplástico de pequenas células redondas, Câncer endometrial, Ependimoma, Câncer esofageal, Sarcoma de Ewing na família Ewlng de tumores, Tumor de célula germinativa extracraniano da infância, Tumor de célula germinativa extragonadal, Câncer do duto da bile extraepático, Melanoma intraocular, Retinoblastoma, Câncer da vesícula biliar, Câncer gástrico (Estômago), Tumor carcinoide gastrintestinal, Tumor estromal gastrintestinal (GIST), Tumor de célula germinativa extracraniano, extragonadal ou ovariano, Tumor trofoblástlco gestacional, Glioma do tronco cerebral, Astrocitoma Cerebral da infância, Glioma da Via Visual da Infância e Hipotalâmico, Carcinoide gástrico, Lecemia de célula pilosa, Câncer de cabeça e pescoço, Câncer do coração, Câncer hepatocelular (fígado), Linfoma de Hodgkin, Câncer hipofaringeal, Glioma hipotalâmico e da via visual da infância, Melanoma intraocular, Carcinoma de célula ilhota (Pâncreas endócrino), Sarcoma de Kaposi, Câncer renal (câncer de célula renal), Câncer Laringeal, Leucemias, Leucemia linfoblástica aguda, Leucemia mieloide aguda, Leucemia linfocítica aguda, Leucemia mielógena crônica, Leucemia de célula pilosa, Câncer de Lábios e Cavidade Oral, Lipossarcoma, Câncer de Fígado, Câncer de Pulmão de não Pequenas Células, Câncer de Pulmão de Pequenas Células, Linfomas, Linfoma relacionada à AIDS, Linfoma de Burkitt, Linfoma de célula T cutâneo, Linfoma de Hodgkin, Linfomas não Hodgkin, Linfoma do Sistema Nervoso Central Primário, Macroglobulinemia de Waldenstrõn, Histiocitoma Fibroso Maligno de Osso/Osteossarooma, Meduloblastoma da Infância, Melanoma, Melanoma Intraocular (Olho), Carcinoma de célula de Merkel, Mesotelioma Maligno Adulto, Mesotelioma da Infância, Câncer de Pescoço Escamoso Metastático com Primário Oculto, Câncer de Boca, Síndrome da

Petição 870190070557, de 24/07/2019, pág. 330/401

266/306

Neoplasia Endócrina Múltipla da Infância, Mieloma Múltiplo/Neoplasma de Célula do Plasma, Micose Fungoide, Síndromes Mlelodisplásticas, Doenças Mielodisplásticas/Mieloproliferativas, Leucemia Mielógena Crônica, Leucemia Mieloide Aguda do Adulto, Leucemia Mieloide Aguda da Infância, Mieloma Múltiplo (Câncer da Medula-óssea), Distúrbios Mieloproliferativos Crônicos, Câncer da cavidade nasal e seio paranasal, Carcinoma nasofaringeal, Neuroblastoma, Câncer oral, Câncer orofaringeal, Osteossarcoma/histiocitoma fibroso maligno de osso, Câncer ovariano, Câncer epitelial ovariano (Tumores epiteliais-estromais da superficie), Tumor de célula germinativa ovariano, Tumor ovariano de potencial maligno baixo, Câncer pancreático, Câncer pancreático de célula ilhota, Câncer do seio paranasal e cavidade nasal, Câncer da paratireoide, Câncer de pênis, Câncer faringeal, Feocromocitoma, Astrocitoma pineal, Germinoma pineal, Pineoblastoma da infância e tumores neuroectodermais primitivos supratentoriais, Adenoma da pituitária, Neoplasia de célula do plasma/Mieloma múltiplo, Blastoma pleuropulmonar, Linfoma do sistema nervoso central primário, Câncer de próstata, Câncer retal, Carcinoma de célula renal (câncer de rim), Câncer da pélvis renal e ureter, Retinoblastoma, Rabdomiossarcoma da infância, Câncer da glândula salivar, Sarcoma da família Ewing de tumores, Sarcoma de Kaposi, Sarcoma de tecido mole, Sarcoma uterino, Sindrome de Sézary, Câncer de pele (não melanoma), câncer de pele (melanoma), Carcinoma de pele de célula de Merkel, Câncer do intestino delgado, Carcinoma de célula escamosa, Câncer de pescoço escamoso metastático com primário oculto, Tumor neuroectodermal primitivo supratentorial da infância, Câncer testicular, Câncer de garganta, Tlmoma da infância, Timoma e Câncer tímico, Câncer da tíreoide, Câncer da tireoide da infância, Câncer de célula transitório da pélvis renal e ureter, Tumor trofoblástico gestacional, Câncer uretral, Câncer uterino endometrial, Sarcoma uterino, Câncer vaginal, Glioma da via visual e hipotalâmico da

Petição 870190070557, de 24/07/2019, pág. 331/401

267/306 infância, Câncer vulvar, macroglobulinemia de Waldenstrom e tumor de Wilms da infância (câncer de rim).

[0515] Exemplos especialmente preferidos de tumores ou cânceres que são adequados para administração intratumoral são câncer de próstata, câncer de pulmão, câncer de mama, câncer de cérebro, câncer de cabeça e pescoço, câncer da tireoide, câncer de cólon, câncer de estômago, câncer de fígado, câncer de pâncreas, câncer ovariano, câncer de pele, bexiga urinária, útero e cérvice.

Doenças infecciosas [0516] A combinação da invenção, composição farmacêutica ou kit pode ser usado para tratamento de doenças infecciosas. O termo infecção ou doença infecciosa refere-se à invasão e multiplicação de micro-organismos tais como bactérias, vírus e parasitas que não estão normalmente presentes dentro do corpo. Uma infecção pode não causar quaisquer sintomas e ser subclínica ou ela pode causar sintomas e ser clinicamente aparente. Uma infecção pode permanecer localizada ou ela pode se espalhar através do sangue ou sistema linfático para se tomar sistêmica. Doenças infecciosas neste contexto incluem, preferivelmente, doenças Infecciosas virais, bacterianas, fúngicas ou protozoológicas.

[0517] Os ácidos nucleicos artificiais da invenção, preferivelmente RNAs, são considerados particularmente úteis para remoção de genomas virais integrados ao genoma da célula hospedeira. Erradicação de vírus das células hospedeiras por proteínas associadas a CRISPR codificadas pelos ácidos nucleicos artificiais, preferivelmente RNAs, da invenção é preferivelmente aplicável a qualquer vírus de DNA ou vírus de RNA que tenha um intermediário do e DNA em seu ciclo de vida. Desta maneira, os ácidos nucleicos artificiais, preferivelmente RNAs, composições (farmacêuticas) e kits de acordo com a invenção são particularmente compreendidos para tratamento de infeção por Papilomavírus

Petição 870190070557, de 24/07/2019, pág. 332/401

268/306

HPV16 e HPV18, infecção pelo vírus da Hepatite B (HBV), vírus EpsteinBarr (EBV), Infecção por HIV-1, infecção por Herpesvirus (incluindo infecção por herpesvirus associado a sarcoma de Kaposi (KSHV, HHV8)) e infecção por Poliomavirus (incluindo vírus de carcinoma de célula de Merkel (MCV), poliomavirus JC (JCV) e Infecção por poliomavirus BK (BKV) e doenças infecciosas associadas.

Terapia de combinação [0518] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser também usada em terapia de combinação. Qualquer outra terapia útil para tratamento ou prevenção das doenças e distúrbios definidos aqui pode ser combinada com os usos e métodos revelados aqui.

[0519] Por exemplo, o indivíduo recebendo a molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser um paciente com câncer, preferivelmente como definido aqui, ou uma condição relacionada, recebendo quimioterapia (por exemplo, quimioterapia de primeira linha ou segunda linha), radioterapia, quimiorradiação (combinação de quimioterapia e radioterapia), inibidores de tirosina cinase (por exemplo, inibidores de tirosina cinase EGFR), terapia de anticorpo e/ou moléculas de ponto de checagem inibidoras e/ou estimuladoras (por exemplo, inibidores de CTLA4) ou um paciente, que obteve resposta parcial ou doença estável após ter recebido um ou mais dos tratamentos especificados acima. Ou o indivíduo recebendo a molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser um paciente com uma doença infecciosa, preferivelmente como definido aqui, recebendo terapia com antibiótico, antifúngica ou antiviral.

[0520] Em um aspecto adicional, a presente invenção então referese também ao uso da molécula de ácido nucleico artificial da invenção,

Petição 870190070557, de 24/07/2019, pág. 333/401

269/306 preferivelmente RNA, composição (farmacêutica) ou kit de partes para suporte de uma outra terapia de câncer, uma doença infecciosa ou qualquer outra doença condescendente a tratamento com a dita molécula de ácido nucleico artificial, composição (farmacêutica) ou kit.

[0521 ] Apoio do tratamento ou profilaxia de câncer pode ser qualquer combinação de um método de terapia para câncer convencional tal como cirurgia, terapia de radiação, quimioterapia (por exemplo, quimioterapia de primeira linha ou segunda linha), quimiorradiação, tratamento com inibidores de tirosina cinase, tratamento com moléculas de ponto de checagem inibidoras e/ou estimuladoras, preferivelmente inibidores de CTLA4, terapia de anticorpo ou qualquer combinação dessas, e uma terapia usando uma molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes como aqui definido.

[0522] Administração da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser realizada antes da, simultaneamente e/ou subsequentemente à administração de um outro agente terapêutico ou submetendo o paciente a uma outra terapia que seja útil para tratamento da doença ou condição particular a ser tratada.

ITENS [0523] Em vista do acima, a invenção pode ser caracterizada pelos itens que seguem:

1. Uma molécula de ácido nucleico artificial compreendendo

a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISP;

b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 e NDUFA4; e

Petição 870190070557, de 24/07/2019, pág. 334/401

270/306

c. peto menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 e RPS9.

2. A molécula de ácido nucleico artificial, de acordo com o item 1, em que cada um dos ditos genes compreende a sequência de DNA de ocorrência natural e homólogos, variantes, fragmentos e sequências de RNA correspondentes da mesma.

3. A molécula de ácido nucleico artificial, de acordo com o item 1 ou 2, compreendendo

a. pelo menos um elemento de 5’ UTR derivado de um gene HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene GNAS ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo;

b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo; ou

c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e peto menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3

Petição 870190070557, de 24/07/2019, pág. 335/401

271/306 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3

Petição 870190070557, de 24/07/2019, pág. 336/401

272/306 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1, ou de um homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, fragmento ou variante do mesmo; ou

n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1, ou de um homólogo, um fragmento ou variante da mesma; ou

Petição 870190070557, de 24/07/2019, pág. 337/401

273/306

n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou

o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo; ou

p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo; ou

q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou

r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante do mesmo; ou

s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante do mesmo;

Petição 870190070557, de 24/07/2019, pág. 338/401

274/306

t. peto menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene, ou de um homólogo, fragmento ou uma variante do mesmo, e peto menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou

u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo.

4. A molécula de ácido nucleico artificial, de acordo com o item 3, compreendendo elementos de UTR de acordo com d, e, g ou I.

5. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 4, em que

- o dito elemento de 5’ UTR derivado de um gene de HSD17B4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 1 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou um fragmento ou uma variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 2, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 2 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de um gene de RPL32 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 21 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%,

Petição 870190070557, de 24/07/2019, pág. 339/401

275/306

97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 21, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 22, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 22 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de um gene de NDUFA4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 9, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 9 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 10, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de um gene de SLC7A3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 15, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 16, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico

Petição 870190070557, de 24/07/2019, pág. 340/401

276/306 de acordo com SEQ ID NO: 16 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de urn gene de NOSIP compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 11, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 12, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de um gene de ATP5A1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 5, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 6, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de ASAH1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 3, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de

Petição 870190070557, de 24/07/2019, pág. 341/401

277/306 ácido nucleico de acordo com SEQ ID NO: 3 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 4, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de Mp68 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 7, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 7 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 8, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de Rpl31 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 13, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 14, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de TUBB4B

Petição 870190070557, de 24/07/2019, pág. 342/401

278/306 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 17, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 18, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de Ubqln2 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 19, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 19 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 20, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20 ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de GNAS compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29 ou um fragmento ou variante da mesma; uma sequência de RNA de acordo SEQ ID NO: 30, ou

Petição 870190070557, de 24/07/2019, pág. 343/401

279/306 uma sequência de RNA tendo, em ordem crescente de preferência, peto menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucieico de acordo com SEQ ID NO: 30 ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de CASP1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25, ou uma sequência de DNA tendo, em ordem crescente de preferência, peto menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nudeico de acordo com SEQ ID NO: 25 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 26, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26 ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de PSMB3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 23, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 24, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24, ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de ALB compreende ou consiste em uma sequência de DNA de acordo com

Petição 870190070557, de 24/07/2019, pág. 344/401

280/306

SEQ ID NO: 35, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 35 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 36, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36 ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de RPS9 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 33, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 33 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 34, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34 ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de COX6B1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 27, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO:

Petição 870190070557, de 24/07/2019, pág. 345/401

281/306

28, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28, ou um fragmento ou uma variante da mesma; ou

- o dito elemento de 3’ UTR derivado de um gene de Ndufal compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 31, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 32, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 32 ou um fragmento ou uma variante da mesma.

6. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 5, em que a proteína associada a CRISPR compreende proteínas do tipo selvagem associadas a CRISPR, homólogos, variantes, fragmentos e derivados das mesmas.

7. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 6, em que a dita proteína associada a CRISPR é selecionada de

Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX ou CasY.

8. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 7, em que o dito ácido nucleico artificial compreendendo uma sequência de ácido nucleico codificando uma proteína associada a CRISPR compreendendo ou consistindo em uma sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441;

Petição 870190070557, de 24/07/2019, pág. 346/401

282/306

10999-11001; 442-1345, ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% identidade de sequência com a sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma variante ou fragmento de qualquer uma dessas sequências.

9. A molécula de ácido nucleico artificial, de acordo com o item 8, em que os ditos derivados da proteína associada a CRISPR compreendem pelo menos um domínio efetor adicional, opcionalmente selecionado de KRAB, CSD, WRPW, VP64, p65AD e Mxi.

10. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 9, em que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS), opcionalmente selecionado de um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964, e um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382: 384; 11957: 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou um NLS tendo uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de

Petição 870190070557, de 24/07/2019, pág. 347/401

283/306 acordo com: 12021-14274.

11. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 10, em que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando uma proteína ou marcador de peptídeo.

12. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 11, em que a pelo menos uma região de codificação da dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NO: 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 11591-11593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714-4617; 4874-5777; 60346937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 46344647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 35063519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 36023615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 95149527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 23782391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 24742487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 97229735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-1028210295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 58105823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 59065919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 60026015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999;

Petição 870190070557, de 24/07/2019, pág. 348/401

284/306

7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066-7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 81788191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 82748287' 8290-8302' 8306-8319' 8322-8335' 9678-9591'9690-9703' 98029815; 9914-9927; 10026-10039; 10138-10151; 10250 -10263; 1036210375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.

13. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 12, em que a dita molécula de ácido nucleico artificial compreende uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 10552; 3458-3459; 3460-3473; 22982299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259; 23002313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 34883489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 35203521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 36163617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 95289529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 23602361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456

Petição 870190070557, de 24/07/2019, pág. 349/401

285/306

2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 95129513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 46804681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 47764777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 95449545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 58405841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 59365937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 95609561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 1057910580; 10585-10586; 10588-10589; 10591-10592; 10594-10595;

Petição 870190070557, de 24/07/2019, pág. 350/401

286/306

10597-·	10598;	10554-10574; 10601;	10602;	10615;	10616;	10629;
10630;	10643;	10644; 10657; 10658;	10671;	10672;	10685;	10686;
10699;	10700;	10713; 10714; 10727;	10728;	10741;	10742;	10755;
10756;	10769;	10770; 10783; 10784;	10797;	10798;	10811;	10812;
10825;	10826;	10839; 10840; 10853;	10854;	10867;	10868;	10881;
10882;	10603;	10604; 10617; 10618;	10631;	10632;	10645;	10646;
10659;	10660;	10673; 10674; 10687;	10688;	10701;	10702;	10715;
10716;	10729;	10730; 10743; 10744;	10757;	10758;	10771;	10772;
10785;	10786;	10799; 10800; 10813;	10814;	10827;	10828;	10841;
10842;	10855;	10856; 10869; 10870;	10883;	10884;	10605;	10606;
10619;	10620;	10633; 10634; 10647;	10648;	10661;	10662;	10675;
10676;	10689;	10690; 10703; 10704;	10717;	10718;	10731;	10732;
10745;	10746;	10759; 10760; 10773;	10774;	10787;	10788;	10801;
10802;	10815;	10816; 10829; 10830;	10843;	10844;	10857;	10858;
10871;	10872;	10885; 10886; 10607;	10608;	10621;	10622;	10635;
10636;	10649;	10650; 10663; 10664;	10677;	10678;	10691;	10692;
10705;	10706;	10719; 10720; 10733;	10734;	10747;	10748;	10761;
10762;	10775;	10776; 10789; 10790;	10803;	10804;	10817;	10818;
10831;	10832;	10845; 10846; 10859;	10860;	10873;	10874;	10887;
10888;	10609;	10610; 10623; 10624;	10637;	10638;	10651;	10652;
10665;	10666;	10679; 10680; 10693;	10694;	10707;	10708;	10721;
10722;	10735;	10736; 10749; 10750;	10763;	10764;	10777;	10778;
10791;	10792;	10805; 10806; 10819;	10820;	10833;	10834;	10847;
10848;	10861;	10862; 10875; 10876;	10889;	10890;	10611;	10612;
10625;	10626;	10639; 10640; 10653;	10654;	10667;	10668;	10681;
10682;	10695;	10696; 10709; 10710;	10723;	10724;	10737;	10738;
10751;	10752;	10765; 10766; 10779;	10780;	10793;	10794;	10807;
10808;	10821;	10822; 10835; 10836;	10849;	10850;	10863;	10864;

10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448

Petição 870190070557, de 24/07/2019, pág. 351/401

287/306

9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450: 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.

14. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 13, em que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 11011-11042; 112491128011131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 11044-11116; 11282-11354: 1116411236; 11400-11472; 11518-11590; 11636-11708; 11754-11826;

11872-11944; 11011-11042; 11249-11280; 11044-11116; 1128211354; 11131-11162; 11367-11398; 11485-11516; 11603-11634;

11721-11752; 11839-11870; 11164-11236; 11400-11472; 1151811590; 11636-11708; 11754-11826; 11872-11944; 11120-11122;

11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712;

11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366; 11242-11248; 11478-11484; 11596-11602; 11714-11720; 1183211838; 11950-11956 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.

15. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 14, em que a dita molécula de ácido nucleico artificial é um RNA.

16. O RNA, de acordo com o item 15, em que o RNA é mono-, bí

Petição 870190070557, de 24/07/2019, pág. 352/401

288/306 ou multicistrônico.

17. O RNA, de acordo com o item 14 ou 15, em que o RNA é um mRNA, um RNA viral ou um RNA de replicou.

18. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 17, em que o dito ácido nucleico artificial é um ácido nucleico modificado, preferivelmente um ácido nucleico estabilizado.

19. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 18, em que

- o teor de G/C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que

- o teor de C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que

- os códons na pelo menos uma região de codificação do ácido nucleico artificial são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação do dito aácido nucleico artificial,

- em que a sequência de aminoácido codificada pelo ácido nucleico artificial preferivelmente não está sendo modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico artificial do tipo selvagem correspondente.

20. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 19, que compreende uma estrutura de 5’-CAP, preferivelmente m7GpppN ou Cap1.

21. O ácido nucleico artificial, preferivelmente RNA, de

Petição 870190070557, de 24/07/2019, pág. 353/401

289/306 acordo com qualquer um de 1 a 20, que compreende pelo menos um tronco-alça de histona.

22. O ácido nucleico artificial, preferivelmente RNA, de acordo com o item 21, em que o pelo menos um tronco-alça de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (I) ou (II) abaixo:

fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) [NÜ-2GN3-5] [No-4(U/T)No-4] [N3.5CN0.2J '-------_v<----------V----------tronco 1 _aj_ça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):

Ni-₆ [N0-2GN3-5] [N_O-₄(U/T)No-4] [N3-5CN0-2] Ni-₆

------V------^y *—r—^; * ¥ troncol troncol tronco2 tronco2 elemento limítrofe elemento limítrofe em que:

elementos Hmítrofes de troncol ou tronco2 Ni-s é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de 2 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C, ou um análogo de nucleotídeo do mesmo, troncol [N0-2GN3-5] é reverso complementar ou parcialmente reverso complementar com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotídeos;

em que Nwé uma sequência consecutiva de 0 a 2, preferi

Petição 870190070557, de 24/07/2019, pág. 354/401

290/306 velmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucieotídeo selecionado de A, U, T, G e C ou um análogo de nucieotídeo do mesmo;

em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucieotídeo selecionado de A, U, T, GeC ou um análogo de nucieotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma, contanto que sua nucieotídeo citidina complementar no tronco2 seja substituída por guanosina;

sequência de alça [No-4(U/T)No-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nudeotídeos;

em que cada No-4 é independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucieotídeo selecionada de A, U, T, G e C ou um análogo de nudeotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva de entre 5 a 7 nudeotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro seledonado de um nudeotídeo selecionado de A, U, T, G e C ou um análogo de nucieotídeo do mesmo;

em que No-zé uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nudeotídeo selecionado de

Petição 870190070557, de 24/07/2019, pág. 355/401

291/306

A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contendo que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;

em que o troncol e o tronco2 são capazes de emparelhamento de base um com o outro formando uma sequência reversa complementar, em que o emparelhamento de base pode ocorrer entre o troncol e o tronco2, ou formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre o troncol e tronco2.

24. O ácido nucleico artificial, preferivelmente RNA, de acordo com o item 19 ou 20, em que a pelo menos uma histona alçatronco compreende uma sequência de ácido nucleico de acordo com a fórmula (Ia) ou (Ha) abaixo:

fórmula (Ia) (sequência de alça-tronco sem elementos limítrofes de tronco) [N0.1GN3-5] [Ni-3(U/T)No-2] [N3-5CN0-1] <_____________________________/ X K, troncol _a;ç_:3 tronco2 fórmula (Ha) (sequência de tronco-alça com elementos limítrofes de tronco):

N2-5 [N₍mGN₃-₅] [NiXU/T)No-2] [N3-5CN0-1] N2-5 '—r'·' ''..............>·-.............' -----------^{yl y J} ’V>

troncol troncol _a|ç_a tronco2 tronco2 efements limítrofe elemento limítrofe

25. O ácido nucleico artificial, preferivelmente RNA, de

Petição 870190070557, de 24/07/2019, pág. 356/401

292/306 acordo com qualquer um dos itens 1 a 24, compreendendo opcionalmente uma sequência de poli(A), compreendendo preferivelmente 10 a 200, 10 a 11,40 a 80 ou 50 a 70 nucleotídeos de adenosina.

26. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 25, compreendendo opcionalmente uma sequência de poli(C), compreendendo preferivelmente 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos de citosina.

27. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 26, o qual compreende, preferivelmente na direção 5’ para 3^!, os elementos que seguem:

a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1,

b) um elemento de 5^!-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como definido em qualquer um dos itens 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma,

c) pelo menos uma sequência de codificação como definido em qualquer um dos itens 7 a 13,

d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3’-UTR como definido em qualquer um dos itens 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 15; 17; 19; 21; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,

e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina,

f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos

Petição 870190070557, de 24/07/2019, pág. 357/401

293/306 cisteína, e

g) opcionalmente um tronco-alça de histona (HSL).

28. Composição compreendendo a molécula de ácido nucleico artificial, preferivelmente um RNA, de acordo com qualquer um dos itens 1 a 26, e um carreador e/ou excipiente farmaceuticamente aceitável.

29. A composição, de acordo com o item 28, em que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais compostos catiônicos ou policatiônicos, preferivelmente com polímeros catiônicos ou policatiônicos, peptídeos ou proteínas catiônicos ou policatiônicos, por exemplo, protamina, polissacarídeos catiônicos ou policatiônicos e/ou lipídeos catiônicos ou policatiônicos.

30. A composição, de acordo com o item 29, em que a razão N/P da molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais peptídeos ou proteínas catiônicos ou policatiônicos está na faixa de cerca de 0,1 a 10, incluindo uma faixa de cerca de 0,3 a 4, de cerca de0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5.

31. A composição, de acordo com qualquer um dos itens 28 a 30, em que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais lipídeos, desta maneira formando lipossomas, nanopartículas de lipídeo e/ou lipoplexos.

32. A composição, de acordo com qualquer um dos itens 28 a 31, compreendendo ainda pelo menos um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionar a proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.

33. Kit, preferivelmente kit de partes, compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27 ou a composição de acordo com qualquer

Petição 870190070557, de 24/07/2019, pág. 358/401

294/306 um dos itens 28 a 32, e opcionalmente um veículo líquido e/ou opcionalmente instruções técnicas com informação sobre a administração e dosagem da molécula de ácido nucleico artificial ou da composição.

34. O kit, de acordo com o item 33, em que o kit contém como uma parte solução de Ringer com Lactato.

35. O kit, de acordo com o item 33 ou 34, compreendendo ainda um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligada à mesma.

36. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso como um medicamento.

37. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com o item 33 a 35 para uso em terapia de gene.

38. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso em um método de modulação da expressão de um gene de interesse, compreendendo administração a um paciente com necessidade da mesma (a) a dita molécula de ácido nucleico artificial, preferivelmente RNA, a dita composição ou dito kit e (b) um RNAguia (gRNA) ou um ácido nucleico codificando o mesmo, o dito sgRNA sendo capaz de direcionar a proteína associada a CRISPR a um gene de interesse ou um elemento regulador operavelmente ligado ao mesmo.

39. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de

Petição 870190070557, de 24/07/2019, pág. 359/401

295/306 acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de proteína associada a CRISPR codificada por pelo menos uma sequência de codificação.

40. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com o item 33 a 35 para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente à ativação, inativação ou manipulação de um gene de interesse ou através da modulação da expressão de um gene de interesse.

41. A molécula de ácido nucleico artificial, preferivelmente RNA, composição ou kit para uso de acordo com o item 40, em que a dita doença, distúrbio ou condição é selecionado de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias e doenças infecciosas.

42. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para aumento da expressão da dita proteína associada a CRISPR, opcionalmente em terapia de gene.

43. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR codificada.

44. Um método para modulação da expressão de um gene de interesse compreendendo as etapas de:

Petição 870190070557, de 24/07/2019, pág. 360/401

296/306

a) provisão de uma molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27;

b) provisão de um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma,

c) contato de uma célula, tecido ou organismo com a dita molécula de ácido nucleico artificial, preferivelmente RNA, e dita gRNA ou ácido nucleico codificando o mesmo sob condições adequadas para modular eficácia de expressão do dito gene de interesse.

45. Um método de tratamento ou prevenção de um distúrbio, em que o método compreende administração a um indivíduo com necessidade do mesmo de uma quantidade eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, da composição de acordo com qualquer um dos itens 28 a 32 ou do kit de acordo com os itens 33 a 35, e um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.

46. O método, de acordo com o item 45, em que o distúrbio é uma doença, distúrbio ou condição condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através da modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR.

47. O método, de acordo com o item 45 ou 46, em que o distúrbio é uma doença, distúrbio ou condição condescendente através da ativação, inativação ou através da mutação de um gene de interesse ou através da alteração da expressão de um gene de interesse.

48. Um método para aumento da eficácia de expressão de

Petição 870190070557, de 24/07/2019, pág. 361/401

297/306 uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo uma região de codificação codificando uma proteína associada a CRISPR, o dito método compreendendo (a) associação da dita região de codificação com pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP ou NDUFA4 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante da mesma;

(b) associação da dita região de codificação com pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB ou RPS9 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou uma variante da mesma; e (c) obtenção de uma molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 47. DESCRIÇÃO DAS FIGURAS [0524] A Figura 1 mostra o efeito de combinação de UTR diferentes sobre o nível de expressão de Cas9 em células HeLa como detalhado no Exemplo 1 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1.

[0525] A Figura 2 mostra o efeito de combinações de UTR diferentes sobre o nível de expressão de Cas9 em células Hek293T como detalhado no Exemplo 2 (ln~Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1.

[0526] A Figura 3 mostra o efeito de combinações de UTR diferentes sobre o nível de expressão de Cas9 em células HepG2 como detalhado no Exemplo 1 (Western blot). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0527] A Figura 4 mostra o nível de expressão de construtos de

Petição 870190070557, de 24/07/2019, pág. 362/401

298/306 mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 2 (Western blot). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0528] A Figura 5 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 2 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0529] A Figura 6 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 1 (In-Cell Western) em comparação com um mRNA de Cas9 comercialmente disponível. O eixo y é normalizado para mostrar um nível de expressão de 100% para o mRNA de Cas9 comercial.

[0530] A Figura 7 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 1 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0531] A Figura 8 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células Hek293T como detalhado no Exemplo 2 (In-Cell Western) em comparação com um mRNA de Cas9 comercialmente disponível.

[0532] A Figura 9 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HepG2 como detalhado no Exemplo 2 (Western blot) em comparação com um mRNA de Cas9 comercialmente disponível. O eixo y é normalizado para mostrar um nível de expressão de 100% para o mRNA de Cas9 comercial.

[0533] A Figura 10 mostra atividade de edição de DNA de spCas9 expressa a partir de construtos de mRNA como detalhado no Exemplo 3 através do ensaio de nuclease de incompatibilidade/ensaio de detecção de incompatibilidade. A: amplificação por PCR, B: ensaio de detecção de incompatibilidade.

Petição 870190070557, de 24/07/2019, pág. 363/401

299/306 [0534] A Figura 11 mostra um nível de expressão de construtos de mRNA de Cpf1 otimizados em HepG2 em relação a RPL32/ALB7 em %. O eixo y é normalizado para mostrar um nível de expressão de 100% para mRNA de Cpf1 da combinação de UTR RPL32/ALB7.

[0535] A Figura 12 mostra o nível de expressão de construtos de mRNA de Cpf1 otimizados em HeLa em relação a RPL32/ALB7 em %. O eixo y é normalizado para mostrar um nível de expressão de 100% para mRNA de Cpf1 da combinação de UTR RPL32/ALB7.

Exemplos [0536] Abaixo são apresentados exemplos particulares ilustrando várias modalidades e aspectos da invenção. No entanto, a presente invenção não deve ser limitada em escopo pelas modalidades específicas descritas aqui. As preparações e exemplos que seguem são dados para permitir que aqueles versados na técnica compreendam mais claramente e pratiquem a presente invenção. A presente invenção, no entanto, não é limitada em escopo pelas modalidades exemplificadas, que são pretendidas como ilustração de aspectos únicos da invenção apenas, e métodos que são funcionalmente equivalentes estão dentro do escopo da invenção. Na verdade, várias modificações da invenção em adição àquelas descritas aqui se tornarão prontamente aparentes àqueles versados na técnica a partir da descrição acima, figuras acompanhantes e exemplos abaixo. Todas tais modificações se encaixam no escopo das reivindicações apensas.

Exemplo 1: detecção de expressão de Cas9 em células HeLa, Hek293T e HepG2 usando Análises In-Cell Western e Western Blot [0537] As células foram semeadas em placas de 96 poços (Microplaca Nunc Preta c/ Fundo Óptico Transparente; Thermo Fisher) com uma densidade de 10.000 células/poço para HeLa; 20.000 células/poço para Hek293T e HEPG2) em um meio celular completo compatível (200 μΙ). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da

Petição 870190070557, de 24/07/2019, pág. 364/401

300/306 transfecção, o meio completo foi substituído com 50 μΙ de meio Opti-MEM livre de soro (Thermo Físher). 100 ng de cada mRNA, isto é, SEQ ID NO: 14274 (RPL32/ALB7.1), SEQ ID NO: 14275 (HSD17B4/CASP1.1), SEQ ID NO: 14276 (SLC7A3.1/PSMB3.1), SEQ ID NO: 14277 (SLC7A3.1/CASP1.1), SEQ ID NO: 14278 (NOSIP.1/PSMB3.1), SEQ ID NO: 14279 (NDUFA4.1/RPS9.1), SEQ ID NO: 14280 (NDUFA4.1Z PSMB3.1), SEQ ID NO: 14281 (HSD17B4/PSMB3.1) e SEQ ID NO: 14282 (HSD17B4/RPS9.1) foram lipocomplexados usando Lipofectamine 3000 em 50 μί de Opti-MEM com uma razão de mRNA:Upofectamina 3000 de 1:1,5. mRNAs Hpocomplexados foram então adicionados a placas de 96 poços correspondentes. Três horas após a transfecção, o meio completo foi substituído com 100 μί de meio celular completo. As células foram mantidas ainda por 24 horas a 37° C, CO2 5% antes da realização de ln~Cell Western.

[0538] Para análise In-Cell Western (HeLa e Hek293T), as células foram lavadas duas vezes com PBS1X e fixadas com uma solução de metanol/acetona (1:1) por 10 minutos. Após a fixação, as células foram subsequentemente lavadas três vezes com PBS1X por 5 minutos cada uma. Para evitar ligações não específicas, as células foram bloqueadas por 1 hora em temperatura ambiente com tampão de bloqueio Odyssey (PBS, LI-COR) suplementado com Triton X100 0,01% e então incubadas por 1 hora e meia com anticorpos primários, isto é, anticorpos de coelho policlonais contra spCas9 (1/1000; #632606; Clontech/Takara). As células foram então lavadas 4 vezes com Tween-20 0,1 % em PBS1X por 5 minutos sob agitação suave (80 rpm).

[0539] Subsequentemente, anticorpos secundários, isto é, anticorpos policlonais anticoelho de cabra infrared dye® 800 CW (1/250; LICOR), foram misturados com Cell-Tag 700 Stain (1/5000; LI-COR) em tampão de bloqueio Odyssey e incubados no escuro por uma hora em temperatura ambiente. Uma etapa de lavagem foi realizada como acima

Petição 870190070557, de 24/07/2019, pág. 365/401

301/306 descrito antes da varredura usando o sistema de imagem Odyssey® CLx (LI-COR). Quantificação relativa (800/700) foi obtida usando Image Studio™ Life Software. Fluorescência de base obtida a partir de poços lipofectados com mRNA foi subtraída para medição e os resultados comparados com a expressão de um RNA de codificação de Cas9 comercialmente disponível (TriLink BioTechnologies, LLC, No. Cat. L-6125).

[0540] Para células HepG2, a análise foi realizada usando Western blot. As placas foram lavadas duas vezes em PBS1X e incubadas diretamente com 50 μί de tampão de carregamento de amostra 1X (Biorad) contendo Endonuclease de Benzonase (Mlllipore) por 20 minutos em temperatura ambiente. As placas foram então incubadas a 95° C por 5 minutos e centrifugadas.

[0541] 15 μΙ de lisatos foram processados em 10% de géis MiniProtean TGX (Biorad) e transferidos para membranas de nitrocelulose (100V; 90 minutos). As membranas foram lavadas três vezes com Triton X100 0,1 em PBS por dez minutos cada uma e saturadas com 100% de leite em PBS1C de um dia para o outro a 4^o C.

[0542] Anticorpos de coelho policlonais spCas9 (1/1000; #632606; Clontech/Takara) e um anticorpo Anti-beta Actina monoclonal de camundongo controle (1/10000; ab6276; Abeam) em 5% de leite em PBS1X foram incubados por uma hora em temperatura ambiente. As membranas foram subsequentemente lavadas três vezes em Tween-20 0,1% em TBS1X. Anticorpos policlonal anticoelho de cabra Infrared dye® 800 CW e anticamundongo de cabra Infrared dye® (1/7500 e 1/10000, respectivamente, foram usados para detecção). A etapa de lavagem como descrito abaixo foi repetida três vezes antes da varredura usando sistema de imagem Odyssey® CLx (LI-COR). Intensidade da faixa e quantificação relativa foram realizadas usando Studio™ Lite Software (LI-COR).

[0543] mRNAs codificando Cas9 compreendendo as combinações

Petição 870190070557, de 24/07/2019, pág. 366/401

302/306 de UTR de acordo com a invenção exibem expressão aumentada (Figura 1, Figura 3, Figura 7) que é altamente superior comparado com mRNA de Cas9 comercialmente disponível (Figura 6).

Exemplo 2: detecção de expressão de Cas9 em células HeLa usando análise Western blot [0544] Células HeLa foram semeadas em placas de 12 poços (Nunc; Thermo Fisher) com uma densidade final de 200.000 células/poço para HeLa em meio celular completo (RPMI; Soro bovino fetal 10%; penicilina/estreptomicina 1% e L-Glutamina 1%; Lonza). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da transfecção, 0 meio completo foi substituído com 750 μΙ de meio Opti-MEM sem soro (Thermo Fisher). Um pg de mRNA codificando Cas9, isto é, SEQ ID NO: 14274 (RPL32/ALB7.1), SEQ ID NO: 14275 (HSD17B4/CASP1.1), SEQ ID NO: 14276 (SLC7A3.1/PSMB3.1), SEQ ID NO: 14277 (SLC7A3.1Z CASP1.1), SEQ ID NO: 14278 (NOSIP.1/PSMB3.1), SEQ ID NO: 14279 (NDUFA4.1/RPS9.1), SEQ ID NO: 14280 (NDUFA4.1/PSMB3.1), SEQ ID NO: 14281 (HSD17B4/PSIVIB3.1) e SEQ ID NO: 14282 (HSD17B4Z RPS9.1), compreendendo a combinação de UTR da invenção (cf. Legendas na Figura) foi Hpocomplexado usando Lipofectamina 3000 em 250 μΙ de Opti-MEM com uma razão de mRNA:Lipofectamina 3000 de 1:1,5. mRNAs lipocomplexados foram então adicionados a cada poço. Três horas após transfecção, 0 meio completo foi substituído com 1 ml de meio celular completo. As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização da extração de proteína.

[0545] Os poços foram lavados duas vezes em PBS1X e incubados diretamente com 100 μΙ de tampão de carregamento de amostra 1X (Biorad) contendo Endonuclease de Benzonase (Millipore) por 20 minutos em temperatura ambiente. As células foram raspadas e os lisatos transferidos para tubos Eppendorf. As amostras foram então desnaturadas a 95° C por 5 minutos, esfriadas em gelo por cinco minutos e centrifugadas em

Petição 870190070557, de 24/07/2019, pág. 367/401

303/306 uma velocidade máxima por dois minutos antes do carregamento.

[0546] 15 μΙ de lisatos foram processados em 10% de géis MiniProtean TGX (Biorad) e transferidos para membranas de nitrocelulose (100V; 90 minutos). As membranas foram lavadas três vezes com Triton X100 0,1 em PBS por dez minutos cada uma e saturadas com 100% de leite em PBS1C de um dia para o outro a 4^o C.

[0542] Anticorpos de coelho policlonais spCas9 (1/1000; #632606; Clon-tech/Takara) e um anticorpo Anti-beta Actina monoclonal de camundongo (1/10000; ab6276; Abeam) em 5% de leite em PBS1X foram incubados por uma hora em temperatura ambiente. As membranas foram subsequentemente lavadas três vezes em Tween-20 0,1% em TBS1X. Anticorpos policlonal anticoelho de cabra Infrared dye® 800 CW e anticamundongo de cabra Infrared dye® (1/7500 e 1/10000, respectivamente, foram usados para detecção). A etapa de lavagem como descrito abaixo foi repetida três vezes antes da varredura usando sistema de imagem Odyssey® CLx (LI-COR). Intensidade da faixa e quantificação relativa foram realizadas usando Studio™ Lite Software (LI-COR).

[0543] Expressão de Cas9 a partir dos mRNAs da invenção foi comparada com a expressão a partir de um RNA codificando Cas9 comercialmente disponível (TriLink BioTechnologies, LLC, No. Cat. L-6125). mRNAs codificando Cas9 compreendendo as combinações de UTR de acordo com a invenção exibem expressão aumentada (Figura 2, Figura 4, Figura 5) que é altamente superior comparado com mRNA de Cas9 comercialmente disponível (Figuras 8, Figura 9).

Exemplo 3: determinação de atividade de spCas9 in vitro usando ensaio de detecção de incompatibilidade [0547] As células foram semeadas em placas de 96 poços com uma densidade de 50.000 células/poço para HeLa em um meio celular completo (200 μΙ de RPMI; soro bovino fetal 10%; penicilina/estreptomicina 1% e L-Glutamina 1%; Lonza). As células foram mantidas a 37° C, CO2

Petição 870190070557, de 24/07/2019, pág. 368/401

304/306

5% por 24 horas, No dia da transfecção, cem ng de mRNA de spCas9 (SEQ ID NO: 14274 = RPL32/ALB7.1, SEQ ID NO: 14281 = HSD17B4/PSMB3.1 - cada mRNA uma vez sem adição de poliadenilação enzimática e uma vez com poliadenilaçâo enzimática adicional; como referência RNA codificando Cas9 comercialmente disponível TriLink BioTechnologies, LLC, No. Cat. L-6125 foi usado) foram lipocomplexados com uma mistura de crRNA contra peptidilpropil isomerase B humana (PPIB, isto é, Ciclofilina B; Dharmacon; SO-2544646G) (25nM) e tracrRNA (25nM; Dharmacon; U-002000-20) usando transfecção de mRNA TranslT® (Mirus Bio). Como controles negativos mRNA de spCas9 ou RNAs-guia ou ambos foram omitidos na mistura de transfecção. Um volume final de 10 μΙ foi adicionado ao meio na placa de 96 poços. Três horas após a transfecção, o meio complexo foi substituído com 100 μΙ de meio celular completo. As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização da extração de células.

[0548] As cavidades foram lavadas uma vez com PBS1X e as células Usadas a 56° C por 30 minutos usando 100 μΙ de tampão Phusion HF 1X contendo 1 mg/ml de Proteinase K e 0,5 mg/ml de RNAse A (Thermo Fisher). Uma etapa de desnaturação a 95° C por 5 minutos foi adicionada no final da lise.

[0549] Cinco μΙ de lisatos de célula foram usados para amplificação por PCR de fragmento hPPIB usando primers específicos contra PPIB humano (Edit~R PPIB crRNA Control Kit; UK-007060; Dharmacon) e po~ limerase de DNA de alta fidelidade Phusion hot-start II (Thermo Fisher). Condições de PCR para amplificação foram 0 que segue:

1) etapa de desnaturação: 98° C por 3 min;

2) Reação cíclica de PCR touchdown 10x (desnaturação 98° C por 10 seg; anelamento de tochdown 72° C-1° C/ciclo por 15 seg; extensão 72° C por 30 seg);

3) reação cíclica de PCR normal 25x (desnaturação 98° C

Petição 870190070557, de 24/07/2019, pág. 369/401

305/306 por 10 seg; anelamento 62° C por 15 seg: extensão 72° C por 30 seg):

4) extensão final 72° C por 10 minutos.

[0550] Amostras de PCR foram então aquecidas a 95° C por 10 minutos e lentamente resfriadas para temperatura ambiente por mais de 15 minutos.

[0551] O ensaio de detecção de incompatibilidade foi feito usando 10 μΙ de reação de PCR, Tampão NEB 2 e endonuclease T7 (New Englang BioLabs) durante um período de incubação de 25 min a 37° C. O volume de reação todo foi imediatamente processado em gel de agarose 2%. A faixa esperada foi 505 pb (nenhuma edição) ou respectivamente 330 pb e 174 pb (com edição).

[0552] spCas9 expressa a partir dos mRNAs compreendendo a combinação de LJTR da invenção foi capaz de editar DNA-alvo e então funcional (Figuras 10A, B).

Exemplo 4: detecção de expressão de Cpf1 em células HeLa, Hek293T e HepG2 usando In-Cell Western [0553] As células foram semeadas em placas de 96 poços (Microplaca Nunc Preta c/ Fundo Óptico Transparente; Thermo Fisher) com uma densidade de 10.000 células/poço para HeLa; 20.000 células/poço para HEPG2 e Hek293T) em um meio celular completo compatível como usado antes (200 μΙ). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da transfecção, 100 ng de mRNA, isto é, SEQ ID NO: 10549 (RPL32/ALB7), SEQ ID NO: 14289 (Mp68/Gnas.1), SEQ ID NO: 14290 (Ndufa4.1/PSMB3.1), SEQ ID NO: 14291 (HSD17B4/Gnas.1), SEQ ID NO: 14292 (HSD17B4/PSMB3.1) e SEQ ID NO: 14293 (Ndufa4.1/Alb7) (para transfecção de células HeLa e Hek293T) e 500 ng de mRNA, isto é, a SEQ ID NO idêntica (HepG2) foram lipocomplexados usando Lipofectamine Messenger Max em 50 ui de Opti-MEM com uma razão de mRNA:Lipofectamine Messenger Max de 1:1,5. mRNAs lipocomplexados foram então adicionados às placas de 96 poços correspondentes.

Petição 870190070557, de 24/07/2019, pág. 370/401

306/306

As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização de In-Cell Western.

[0554] Para análise In-Cell Western (HeLa, HepG2 e Hek293T), as células foram lavadas três vezes com PBS1X e fixadas com paraformaldeído 4% por 10 minutos. Após a fixação, as células foram subsequentemente lavadas três vezes com PBS1X por 5 minutos cada uma e permeabilizadas com Triton X100 2% em PBS por 15 minutos. Para evitar ligações não específicas, as células foram bloqueadas por 1 hora em temperatura ambiente com tampão de bloqueio Odyssey (PBS, LI-COR) e então incubadas por 1 hora e meia com anticorpos primários, isto é, anticorpos de coelho policlonais contra HA9 (1/1000; H6808; Sigma Aldrich). As células foram então lavadas 4 vezes com Tween-20 0,1% em PBS1X por 5 minutos sob agitação suave (80 rpm).

[0539] Subsequentemente, anticorpos secundários, isto é, anticorpos policlonais anticoelho de cabra Infrared dye® 800 CW (1/500; LICOR), foram misturados com Cell-Tag 700 Stain (1/5000; LI-COR) em tampão de bloqueio Odyssey e incubados no escuro por uma hora em temperatura ambiente. Uma etapa de lavagem foi realizada como acima descrito antes da varredura usando o sistema de imagem Odyssey® CLx (LI-COR). Quantificação relativa (800/700) foi obtida usando Image Studio™ Life Software. Fluorescência de base obtida a partir de poços lipofectados com mRNA foi subtraída para medição e os resultados comparados com a expressão de mRNA padrão da requerente.

[0555] mRNAs codificando Cpf1 compreendendo as combinações de UTR de acordo com a invenção exibem expressão fortemente aumentada que foi altamente superior comparado com um mRNA de Cpf1 de referência RPL32/Alb7. Expressão é dada com relação à RPL32/ALB7 em % como aparente a partir da Figura 11 e da Figura 12 (células HepG2 e HeLa).

Claims

REIVINDICAÇÕES

1. Molécula de ácido nucleico artificial caracterizada pelo fato de que compreende

a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISPR;

b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em SLC7A3, ATP5A1, RPL32, HSD17B4, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 e NDUFA4; e

c. pelo menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 e RPS9.
2. Molécula de ácido nucleico artificial, de acordo com a reivindicação 1, caracterizada pelo fato de que cada um dos ditos genes compreende a sequência de DNA de ocorrência natural e homólogos, variantes, fragmentos e sequências de RNA correspondentes da mesma.
3. Molécula de ácido nucleico artificial, de acordo com a reivindicação 1 ou 2, caracterizada pelo fato de que compreende

a. pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene GNAS ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo;

b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS,

Petição 870190070557, de 24/07/2019, pág. 23/401

2/29 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo; ou

c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1

Petição 870190070557, de 24/07/2019, pág. 24/401

3/29 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9

Petição 870190070557, de 24/07/2019, pág. 25/401
4/29 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou

m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou uma variante do mesmo; ou

n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1, ou de um homólogo, um fragmento ou variante do mesmo; ou

n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou

o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou uma variante do mesmo; ou

p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou uma variante do mesmo; ou

q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado

Petição 870190070557, de 24/07/2019, pág. 26/401
5/29 de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou uma variante do mesmo; ou

r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou uma variante do mesmo; ou

s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou uma variante do mesmo;

t. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou

u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo.

4. Molécula de ácido nucleico artificial, de acordo com a reivindicação 3, caracterizada pelo fato de que compreendendo elementos de UTR de acordo com d, e, g ou I.

5. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 4, caracterizada pelo fato de que

-o dito elemento de 5’ UTR derivado de um gene de HSD17B4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 1 ou uma sequência de DNA tendo, em ordem

Petição 870190070557, de 24/07/2019, pág. 27/401
6/29 crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou um fragmento ou uma variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 2, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 2 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de um gene de RPL32 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 21 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 21 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 22 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 22 ou um fragmento ou uma variante da mesma;

-o dito elemento de 5’ UTR derivado de um gene de NDUFA4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 9 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 9 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 10 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%

Petição 870190070557, de 24/07/2019, pág. 28/401
7/29 ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de urn gene de SLC7A3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 15 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 16 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 16 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de um gene de NOSIP compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 11 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 12 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12 ou um fragmento ou uma variante da mesma;

- o dito elemento de 5’ UTR derivado de um gene de ATP5A1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 5 ou uma sequência de DNA tendo, em ordem crescente

Petição 870190070557, de 24/07/2019, pág. 29/401
8/29 de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 6 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de ASAH1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 3 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 3 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 4 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de Mp68 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 7 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 7 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 8 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8 ou um fragmento ou uma variante da mesma;

Petição 870190070557, de 24/07/2019, pág. 30/401
9/29 o dito elemento de 5’ UTR derivado de um gene de Rpl31 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 13 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 14 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de TUBB4B compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 17 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 18 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18 ou um fragmento ou uma variante da mesma;

o dito elemento de 5’ UTR derivado de um gene de Ubqln2 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 19 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de

Petição 870190070557, de 24/07/2019, pág. 31/401
10/29 ácido nucleico de acordo com SEQ ID NO: 19 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 20 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20 ou um fragmento ou uma variante da mesma;

-o dito elemento de 3’ UTR derivado de um gene de GNAS compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29 ou um fragmento ou variante da mesma; uma sequência de RNA de acordo SEQ ID NO: 30 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 30 ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de CASP1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 25 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 26 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26 ou um fragmento ou uma variante da mesma;

Petição 870190070557, de 24/07/2019, pág. 32/401
11/29

- o dito elemento de 3’ UTR derivado de um gene de PSMB3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 23 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 24 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24, ou um fragmento ou uma variante da mesma;

-o dito elemento de 3’ UTR derivado de um gene de ALB compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 35 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 35 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 36 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36 ou um fragmento ou uma variante da mesma;

-o dito elemento de 3’ UTR derivado de um gene de RPS9 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 33 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de

Petição 870190070557, de 24/07/2019, pág. 33/401
12/29 ácido nucleico de acordo com SEQ ID NO: 33 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 34 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34 ou um fragmento ou uma variante da mesma;

- o dito elemento de 3’ UTR derivado de um gene de COX6B1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 27 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 28 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28 ou um fragmento ou uma variante da mesma; ou

- o dito elemento de 3’ UTR derivado de um gene de Ndufal compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 31 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 32 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 32 ou um fragmento ou uma variante da

Petição 870190070557, de 24/07/2019, pág. 34/401
13/29 mesma.

6. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 5, caracterizada pelo fato de que a proteína associada a CRISPR compreende proteínas do tipo selvagem associadas a CRISPR, homólogos, variantes, fragmentos e derivados das mesmas.

7. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 6, caracterizada pelo fato de que a dita proteína associada a CRISPR é selecionada de Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX ou CasY.

8. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 7, caracterizada pelo fato de que o dito ácido nucleico artificial compreende uma sequência de ácido nucleico codificando uma proteína associada a CRISPR compreendendo ou consistindo em uma sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma variante ou fragmento de qualquer uma dessas sequências.

9. Molécula de ácido nucleico artificial, de acordo com a reivindicação 8, caracterizada pelo fato de que os ditos derivados da proteína associada a CRISPR compreendem pelo menos um domínio efetor adicional, opcionalmente selecionado de KRAB, CSD, WRPW, VP64, p65AD e Mxi.

10. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 9, caracterizada pelo fato de que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS),

Petição 870190070557, de 24/07/2019, pág. 35/401
14/29 opcionalmente selecionado de um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964, e um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 1195811964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou um NLS tendo uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com: 12021-14274.

11. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 10, caracterizada pelo fato de que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando uma proteína ou marcador de peptídeo.

12. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 11, caracterizada pelo fato de que a pelo menos uma região de codificação da dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 60206033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 1159111593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714

Petição 870190070557, de 24/07/2019, pág. 36/401
15/29

4617; 4874-5777; 6034-6937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10ΠΟΙ 0183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 999410007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 69866999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 1012210135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 81628175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 82588271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 96909703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%

Petição 870190070557, de 24/07/2019, pág. 37/401
16/29 ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.

13. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 12, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial compreende uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 46484649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985;

Petição 870190070557, de 24/07/2019, pág. 38/401
17/29

6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 81608160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 82568257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 1015210153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 10579-10580; 10585-10586; 1058810589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657;

10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714;

10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783;

10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840;

10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617;

10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674;

10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743;

10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800;

10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869;

10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634;

10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703;

10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760;

Petição 870190070557, de 24/07/2019, pág. 39/401
18/29

10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829;

10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886;

10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663;

10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720;

10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789;

10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846;

10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623;

10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680;

10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749;

10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806;

10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875;

10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640;

10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709;

10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766;

10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835;

10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892;

9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 1005610057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.

14. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 13, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ

Petição 870190070557, de 24/07/2019, pág. 40/401
19/29

ID NOs: 11011-11042; 11249-1128011131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 1104411116; 11282-11354; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11011-11042; 1124911280; 11044-11116; 11282-11354; 11131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 1116411236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11120-11122; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366; 11242-11248; 11478-11484; 1159611602; 11714-11720; 11832-11838; 11950-11956 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.

15. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 14, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial é um RNA.

16. RNA, de acordo com a reivindicação 15, caracterizado pelo fato de que o RNA é mono-, bi- ou multicistrônico.

17. RNA, de acordo com a reivindicação 14 ou 15, caracterizado pelo fato de que o RNA é um mRNA, um RNA viral ou um RNA de replicon.

18. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 17, caracterizado pelo fato de que o dito ácido nucleico artificial é um ácido nucleico modificado, preferivelmente um ácido nucleico estabilizado.

19. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 18, caracterizado pelo fato de que

Petição 870190070557, de 24/07/2019, pág. 41/401
20/29

- o teor de G/C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que

- o teor de C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que

- os códons na pelo menos uma região de codificação do ácido nucleico artificial são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação do dito ácido nucleico artificial,

-em que a sequência de aminoácido codificada pelo ácido nucleico artificial preferivelmente não está sendo modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico artificial do tipo selvagem correspondente.

20. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 19, caracterizado pelo fato de que compreende uma estrutura de 5’-CAP, preferivelmente m7GpppN ou Cap1.
21. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 20, caracterizado pelo fato de que compreende pelo menos um tronco-alça de histona.
22. Ácido nucleico artificial, preferivelmente RNA, de acordo com a reivindicação 21, caracterizado pelo fato de que o pelo menos um tronco-alça de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (I) ou (II) abaixo:

fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco)

Petição 870190070557, de 24/07/2019, pág. 42/401

21/29 [N0.2GN3-5] [N₀-4(U/T)hM [N₃-5CN₀.₂] ^tronco1 alça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):

Ni-6 [N0-2GN3-5] [N₍m(U/T)N(m] [N -.sCNg-,·] Ni-b troncoi troncoí gjça tronco2 tronco2 elemento limítrofe elemento limítrofe em que elementos limítrofes de troncoí ou tronco2 N1-6 é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de 2 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, troncoí [N0-2GN3-5] é reverso complementar ou parcialmente reverso complementar com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotideos;

em que Νο-2θ uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;

em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma,

Petição 870190070557, de 24/07/2019, pág. 43/401

22/29 contanto que sua nucleotídeo citidina complementar no tronco2 seja substituída por guanosina;

sequência de alça [No-4(U/T)No-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nucleotídeos;

em que cada Νο-4θ independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucleotídeo selecionada de A, U, T, G e C ou um análogo de nucleotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva de entre 5 a 7 nucleotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;

em que Νο-2θ uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contanto que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;

em que

0 troncol e 0 tronco2 são capazes de emparelhamento de base um com 0 outro formando uma sequência reversa complementar, em que 0 emparelhamento de base pode ocorrer entre 0 troncol e 0

Petição 870190070557, de 24/07/2019, pág. 44/401
23/29 tronco2, ou formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre o troncol e tronco2.

23. Ácido nucleico artificial, preferivelmente RNA, de acordo com a reivindicação 21 ou 22, caracterizado pelo fato de que a pelo menos uma alça-tronco de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (Ia) ou (IIa) abaixo:

fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) [No-iGNm] [Ni-₃(U/T)No-2] [Nj-sCNo-i] v

troncol alça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):

N2-5 [N0-1GN3-5] [Ni-₃(U/T)N₀-₂] [N₃-5CN₀-i] N₂-s troncol tfOnCOl aiça tronco2 troncoZ elemento limítrofe elemento hmrtrofe
24. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 23, caracterizado pelo fato de que compreende opcionalmente uma sequência de poli(A), preferivelmente compreendendo 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina.
25. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 24, caracterizado pelo fato de que compreende opcionalmente uma sequência de poli(C), compreendendo preferivelmente 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos de citosina.

Petição 870190070557, de 24/07/2019, pág. 45/401

24/29
26. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 25, caracterizado pelo fato de que compreende, preferivelmente na direção 5’ para 3’, os elementos que seguem:

a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1,

b) um elemento de 5’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como definida em qualquer uma das reivindicações 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma,

c) pelo menos uma sequência de codificação como definida em qualquer uma das reivindicações 7 a 13,

d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3’-UTR como definida em qualquer uma das reivindicações 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 15; 17; 19; 21; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,

e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina,

f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos cisteína, e

g) opcionalmente um tronco-alça de histona (HSL).
27. Composição caracterizada pelo fato de que compreende a molécula de ácido nucleico artificial, preferivelmente um RNA, como

Petição 870190070557, de 24/07/2019, pág. 46/401

25/29 definida em qualquer uma das reivindicações 1 a 26, e um carreador e/ou excipiente farmaceuticamente aceitável.
28. Composição, de acordo com a reivindicação 27, caracterizada pelo fato de que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais compostos catiônicos ou policatiônicos, preferivelmente com polímeros catiônicos ou policatiônicos, peptídeos ou proteínas catiônicos ou policatiônicos, por exemplo, protamina, polissacarídeos catiônicos ou policatiônicos e/ou lipídeos catiônicos ou policatiônicos.
29. Composição, de acordo com a reivindicação 28, caracterizada pelo fato de que a razão N/P da molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais peptídeos ou proteínas catiônicos ou policatiônicos está na faixa de cerca de 0,1 a 10, incluindo uma faixa de cerca de 0,3 a 4, de cerca de0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5.
30. Composição, de acordo com qualquer uma das reivindicações 27 a 29, caracterizada pelo fato de que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais lipídeos, desta maneira formando lipossomas, nanopartículas de lipídeo e/ou lipoplexos.
31. Composição, de acordo com qualquer uma das reivindicações 27 a 30, caracterizada pelo fato de que compreende ainda pelo menos um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionar a proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
32. Kit, preferivelmente kit de partes, caracterizado pelo fato de que compreende a molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, ou composição como definida em qualquer uma das reivindicações 27

Petição 870190070557, de 24/07/2019, pág. 47/401

26/29 a 31, e opcionalmente um veículo líquido e/ou opcionalmente instruções técnicas com informação sobre a administração e dosagem da molécula de ácido nucleico artificial ou da composição.
33. Kit, de acordo com a reivindicação 32, caracterizado pelo fato de que o kit contém como uma parte solução de Ringer com Lactato.
34. Kit, de acordo com a reivindicação 32 ou 33, caracterizado pelo fato de que compreende ainda um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNAalvo de interesse ou um elemento regulador operavelmente ligada à mesma.
35. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento.
36. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso em terapia de gene.
37. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso em um método de modulação da expressão de um gene de interesse, compreendendo administração a um paciente com necessidade da mesma (a) a dita molécula de ácido nucleico artificial, preferivelmente RNA, a dita composição ou dito kit e (b) um RNA-guia (gRNA)

Petição 870190070557, de 24/07/2019, pág. 48/401

27/29 ou um ácido nucleico codificando o mesmo, o dito sgRNA sendo capaz de direcionar a proteína associada a CRISPR a um gene de interesse ou um elemento regulador operavelmente ligado ao mesmo.
38. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, a composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de proteína associada a CRISPR codificada pela pelo menos uma sequência de codificação.
39. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente à ativação, inativação ou manipulação de um gene de interesse ou através da modulação da expressão de um gene de interesse.
40. Molécula de ácido nucleico artificial, preferivelmente RNA, composição ou kit para uso de acordo com a reivindicação 39, caracterizados pelo fato de que a dita doença, distúrbio ou condição é selecionado de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias e doenças infecciosas.
41. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, composição como definida em qualquer uma das reivindicações 27 a 31, ou kit como definido nas reivindicações 32 a 34, caracterizados pelo fato de serem para aumento da expressão da dita proteína associada a CRISPR, opcionalmente em terapia de gene.

Petição 870190070557, de 24/07/2019, pág. 49/401

28/29
42. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, composição como definida em qualquer uma das reivindicações 27 a 31, ou kit como definida nas reivindicações 32 a 34, caracterizados pelo fato de serem para modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR codificada.
43. Método para modulação da expressão de um gene de interesse caracterizado pelo fato de que compreende as etapas de:

a) prover uma molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26;

b) prover um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma,

c) contatar uma célula, tecido ou organismo com a dita molécula de ácido nucleico artificial, preferivelmente RNA, e dito gRNA ou ácido nucleico codificando o mesmo sob condições adequadas para modular eficácia de expressão do dito gene de interesse.
44. Método de tratamento ou prevenção de um distúrbio caracterizado pelo fato de que compreende administração a um indivíduo com necessidade do mesmo de uma quantidade eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, da composição como definida em qualquer uma das reivindicações 27 a 31, ou do kit como definido nas reivindicações 32 a 34, e um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
45. Método, de acordo com a reivindicação 44, caracterizado

Petição 870190070557, de 24/07/2019, pág. 50/401

29/29 pelo fato de que o distúrbio é uma doença, distúrbio ou condição condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através da modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR.
46. Método, de acordo com a reivindicação 44 ou 45, caracterizado pelo fato de que o distúrbio é uma doença, distúrbio ou condição condescendente através da ativação, inativação ou através da mutação de um gene de interesse ou através da alteração da expressão de um gene de interesse.
47. Método para aumento da eficácia de expressão de uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo uma região de codificação codificando uma proteína associada a CRISPR, caracterizado pelo fato de que compreende (a) associar a dita região de codificação com pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP ou NDUFA4 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante da mesma;

(b) associar a dita região de codificação com pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB ou RPS9 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou uma variante da mesma; e (c) obter uma molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 46.