BR112019015244A2 - ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos - Google Patents

ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos Download PDF

Info

Publication number
BR112019015244A2
BR112019015244A2 BR112019015244A BR112019015244A BR112019015244A2 BR 112019015244 A2 BR112019015244 A2 BR 112019015244A2 BR 112019015244 A BR112019015244 A BR 112019015244A BR 112019015244 A BR112019015244 A BR 112019015244A BR 112019015244 A2 BR112019015244 A2 BR 112019015244A2
Authority
BR
Brazil
Prior art keywords
nucleic acid
sequence
fragment
variant
gene
Prior art date
Application number
BR112019015244A
Other languages
English (en)
Inventor
Chevessier-Tünnesen Frédéric
Poenisch Marion
Schlake Thomas
Original Assignee
Curevac Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Curevac Ag filed Critical Curevac Ag
Publication of BR112019015244A2 publication Critical patent/BR112019015244A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/50Physical structure
    • C12N2310/53Physical structure partially self-complementary or closed
    • C12N2310/531Stem-loop; Hairpin

Abstract

a presente invenção refere-se ao campo de biomedicina e, em particular, ao campo de ácidos nucleicos terapêuticos. a presente invenção provê ácidos nucleicos artificiais, em particular rnas, codificando proteínas associadas a crispr. uma composição (farmacêutica) e kit de partes compreendendo a mesma são também providos. ainda, a presente invenção refere-se ao ácido nucleico artificial, composição (farmacêutica) ou kit de partes para uso em medicina, e em particular no tratamento e/ou profilaxia de doenças condescendentes a tratamento com proteínas associadas de crispr.

Description

Relatório Descritivo da Patente de Invenção para ’’ÁCIDOS NUCLEICOS CODIFICANDO PROTEÍNAS ASSOCIADAS Â CRISPR E USOS DOS MESMOS.
[0001] A presente invenção refere-se a ácidos nucleicos artificiais, em particular RNAs, codificando proteínas associadas a CRISPR, e composições (farmacêuticas) e kit de partes compreendendo os mesmos. Os ditos ácidos nucleicos artificiais, em particular RNAs, composições (farmacêuticas) e kits são inter alia compreendidos para uso em medicina, por exemplo, em terapia de gene, e em particular no tratamento e/ou profilaxia de doenças condescendentes a tratamento com proteínas associadas a CRISPR, por exemplo, através de edição, ativação, inativação de gene ou modulação da expressão de genes-alvo de interesse.
[0002] Sistemas CRISPR (Repetições Palindrômicas Curtas Agrupadas e Regularmente lnterespaçadas)-Cas conferem proteção imune adaptativa a bactérias e arqueas contra elementos de DNA invasores (por exemplo, vírus, plasmídeos) usando RNAs de antissenso para reconhecer e clivar DNA estranho de uma maneira específica de sequência. Na classificação mais recente, os sistemas CRISPR-Cas diversos são divididos em duas classes de acordo com a configuração de seus efetores: sistemas CRISPR Classe 1 utilizam várias proteínas associadas a Cas (associadas a CRISPR) e CRISPR-RNA (crRNA) como um RNA-guia (gRNA) para formar um complexo efetor, enquanto sistemas CRISPR Classe 2 empregam uma proteína Cas de componente único grande em conjunto com crRNAs para mediar interferência com elementos de DNA estranhos. Sistemas CRISPR-Cas Classe 1 múltiplos, que incluem os sistemas tipo I e tipo III, foram identificados e funcionalmente caracterizados em detalhes. A maioria dos sistemas CRISPR-Cas Classe 2 que foram identificados e experimentalmente caracterizados até agora empregam endonucleases guiadas por RNA homólogas da
Petição 870190070557, de 24/07/2019, pág. 66/401
2/306 família Cas9 como efetores, que funcionam com endonucleases de multidomínio, junto com crRNA e crRNA de transativação (tracrRNA) ou, alternativamente, com um RNA-guia único sintético (sgRNA), para clivar ambos os filamentos do DNA-alvo invasor (Sander e Joung, Nat. Biotechnol. 2014 Abr; 32(4): 347-355, Boettcher e McManus, Mol. Cell. 2015 Maio 21; 58(4): 575-585).
[0003] O sistema CRISPR/Cas9 tipo II nativo funciona essencial· mente em três etapas. Quando da exposição a DNA estranho, uma sequência de DNA estranho curta (protoespaçador) é incorporada ao genoma bacteriano entre repetições palindrômicas curtas no loci de CRISPR. Uma extensão curta de nucleotídeos conservados proximais ao protoespaçador (motivo adjacente de protoespaçador (PAM)) é usada para adquirir o protoespaçador (fase de aquisição ou adaptação). Subsequentemente, o organismo procariótico hospedeiro transcreve e processa loci de CRISPR para gerar RNA de CRISP maduro (crRNA) contendo ambos elementos de repetição de CRISP e o segmento genético espaçador integrado do DNA estranho correspondendo ao elemento de DNA não próprio prévio, junto com RNA de CRISP de transativação (tracrRNA) (etapa de expressão ou maturação). Finalmente, crRNA e Cas9 se associam com o tracrRNA provendo um complexo crRNA:tracrRNA:Cas9 que se associa com a sequência complementar no DNA invasor. As endonucleases Cas9 então introduzem uma quebra de filamento duplo de DNA (DSB) no DNA-alvo (fase de interferência) (Sander e Joung, Nat. BiotechnoL 2014 Abr; 32(4): 347-355).
[0004] Células de mamífero respondem a DSBs ou através do método de união de extremidade não homóloga (NHEJ) ou reparo direcionado à homologia (HDR). NHEJ pode introduzir inserção ou deleção aleatória de extensões curtas de bases de nucleotídeo, levando a mutações de gene, e efeitos de perda de função. Em HDR, introdução de um segmento de DNA com regiões tendo homologia com as sequências
Petição 870190070557, de 24/07/2019, pág. 67/401
3/306 flanqueando ambos os lados da quebra de filamento duplo de DNA levará a reparo pelo maquinário da célula hospedeira (Sander e Joung, Nat. Biotechnol. 2014 Abr; 32(4): 347-355).
[0005] Um segundo sistema CRISPR Classe 2, putativo, tentativamente atribuído tipo V, foi recentemente identificado em vários genomas bacterianos. Os sistemas CRISPR-Cas do tipo V putativos contêm uma proteína de -1.300 aminoácidos, grande, chamada Cpf1 ou Cas12 (CRISPR de Prevotella, Francisella 1, Acidaminococcus sp BV3L6 (AsCpf1) e Lachnospiraceae bacterium ND2006 (LbCpfl)). Cpf1 requer apenas um crRNA curto para reconhecer e ligar à sua sequência de DNA-alvo, ao invés do RNA-guia de '-100-nt (crRNA e tracrRNA) para Cas9. Isto é, Cpf1 geralmente mostra um 42nt único que tem um 23 nt em sua extremidade 3’ que é complementar ao protoespaçador da sequência de DNA-alvo, PAMs TTTN 5’ do protoespaçador e gera como DSB projeções 5’ comparado com extremidades cegas para scCas9. Cpf1 ciiva eficientemente DNA-alvo seguido por um motivo adjacente de protoespaçador (PAM) rico em T curto, em contraste com o PAM rico em G seguindo o DNA-alvo para sistemas Cas9. Terceiro, Cpf1 introduz uma quebra de filamento duplo de DNA escalonado com uma projeção 5’ de 4 ou 5-nt (Zetsche e outros. Cell. 2015 Out 22; 163(3): 759-771). Eficiências no alvo de Cpf1 em células humanas são comparáveis a spCas9 e Cpf1 não mostra nenhuma divagem fora do alvo ou reduzida. [0006] Desde a aplicação de sistemas CRISPR/Cas em genomas de mamífero, a tecnologia se desenvolveu rapidamente: Cas9 cataliticamente inativa ou morta (dCas9), que não exibe nenhuma atividade de endonuclease, pode ser especificamente recrutada por gRNAs adequados para sequências de DNA-alvo de interesse. Tais proteínas Cas e suas variantes e derivados são de interesse particular como ferramentas de regulagem de gene versáteis, específicas de sequência e não mutagênicas. Por exemplo, gRNAs apropriados podem ser usados para
Petição 870190070557, de 24/07/2019, pág. 68/401
4/306 direcionar derivados de dCas9 com domínios de repressão ou ativação de transcrição a genes-alvo, resultando em repressão de transcrição (chamada interferência de CRISPR, CRISPRi) ou ativação (chamada ativação de CRISPR, CRISPRa).
[0007] Com essas inovações sucessivas, sistemas CRISPR-Cas foram amplamente adaptados para engenharia de genoma. Sistemas CRISPR-Cas são versáteis e prontamente customizáveis, uma vez que gRNAs específicos para um gene-alvo de interesse podem ser facilmente preparados, enquanto a proteína Cas não requer nenhuma modificação. Loci múltiplos podem ser facilmente direcionados através da introdução de vários gRNAs (multiplexação).
[0008] O sistema CRISPR/Cas foi adotado com sucesso como uma ferramenta robusta, versátil e precisa para ativação/repressão de edição e transcrição de genoma em organismos bacterianos e eucarióticos, e desencadeou o desenvolvimento de novas abordagens promissoras para propósitos de pesquisa e terapêuticos. No entanto, apesar de suas várias vantagens, aplicação do sistema CRISP/Cas é frequentemente dificultada por expressão pobre da proteína Cas.
[0009] É um objetivo da presente invenção satisfazer essas necessidades e prover novas abordagens terapêuticas melhoradas para tratamento de cânceres, doenças infecciosas e outras doenças e condições definidas aqui. O objetivo de base da presente invenção é atingido pela matéria-objeto reivindicada.
[0010] Embora a presente invenção seja descrita em detalhes abaixo, deve ser compreendido que a presente invenção não é limitada às metodologias, protocolos e reagentes particulares descritos aqui uma vez que esses podem variar. Deve ser também compreendido que a terminologia usada aqui não pretende limitar o escopo da presente invenção que será limitado apenas pelas reivindicações apensas. A menos que de outro modo definido, todos os termos técnicos e científicos
Petição 870190070557, de 24/07/2019, pág. 69/401
5/306 usados aqui têm os mesmos significados como comumente compreendido por um versado comum na técnica.
[0011] A seguir, os elementos da presente invenção serão descritos. Esses elementos são listados com modalidades específicas, no entanto, deve ser compreendido que eles podem ser combinados de qualquer maneira e em qualquer número para criar modalidades adicionais. Os exemplos e modalidades preferidos descritos de várias maneiras não devem ser considerados limitar a presente invenção apenas às modalidades explicitamente descritas. A presente descrição deve ser compreendida apoiar e compreender modalidades que combinam as modalidades explicitamente descritas com qualquer número dos elementos revelados e/ou preferidos. Ainda, quaisquer permutas e combinações de todos os elementos descritos no presente pedido devem ser consideradas reveladas pela descrição do presente pedido a menos que o contexto indique de outro modo.
[0012] Em todo o presente relatório e reivindicações que seguem, a menos que o contexto dite de outro modo, o termo compreendem e variações tais como compreende e compreendendo serão compreendidos implicar a inclusão de um membro, inteiro ou etapa declarado, mas não a exclusão de qualquer outro membro, inteiro ou etapa não declarado. O termo consiste em é uma modalidade particular do termo compreendem, em que qualquer um do membro, inteiro ou etapa não declarado é excluído. No contexto da presente invenção, o termo compreendem engloba o termo consistem em. O termo compreendendo então engloba incluindo bem como consistindo, por exemplo, uma composição compreendendo X pode consistir exclusivamente em X ou pode incluir algo adicional, por exemplo, X + Y.
[0013] Os termos um e uma e o, a e referência similar usados no contexto de descrição da invenção (especialmente no contexto das reivindicações) devem ser considerados compreender ambos o singular
Petição 870190070557, de 24/07/2019, pág. 70/401
6/306 e o plural, a menos que de outro modo indicado aqui ou claramente contradito pelo contexto. Menção de faixas de valores aqui pretende apenas servir como um método de abreviação de referência individualmente a cada valor separado que se encaixe dentro da faixa. A menos que de outro modo indicado aqui, cada valor individual é incorporado ao relatório como se fosse individualmente mencionado aqui. Nenhuma linguagem no relatório deve ser interpretada como indicando qualquer elemento não reivindicado essencial para a prática da invenção.
[0014] A palavra substancialmente não exclui completamente, por exemplo, uma composição que é substancialmente livre de Y pode ser completamente livre de Y. Onde necessário, a palavra substancialmente pode ser omitida da definição da invenção.
[0015] O termo cerca de em relação a um valor numérico x significa x ± 10%.
[0016] Na presente invenção, se não indicado de outro modo, características diferentes de alternativas e modalidades podem ser combinadas umas com as outras.
[0017] Para questão de clareza e legibilidade as definições que seguem são providas. Qualquer característica técnica mencionada para essas definições pode ser lida em cada e toda modalidade da invenção. Definições e explicações adicionais podem ser especificamente providas no contexto dessas modalidades.
Definições [0018] Molécula de ácido nucleico artificial: uma molécula de ácido nucleico artificial pode ser tipicamente compreendida ser uma molécula de ácido nucleico, por exemplo, um DNA ou RNA, que não ocorre naturalmente. Em outras palavras, uma molécula de ácido nucleico artificial pode ser compreendida como uma molécula de ácido nucleico não natural. Tal molécula de ácido nucleico pode ser não natural devido à sua sequência individual (que não ocorre naturalmente) e/ou devido a outras
Petição 870190070557, de 24/07/2019, pág. 71/401
7/306 modificações, por exemplo, modificações estruturais de nucleotídeos, que não ocorrem naturalmente. Uma molécula de ácido nucleico artificial pode ser uma molécula de DNA, uma molécula de RNA ou uma molécula híbrida compreendendo porções de DNA e RNA. Tipicamente, moléculas de ácido nucleico artificiais podem ser projetadas e/ou geradas através de métodos de engenharia genética para corresponder a uma sequência artificial desejada de nucleotídeos (sequência heteróloga). Neste contexto uma sequência artificial é geralmente uma sequência que pode não ocorrer naturalmente, isto é, ela difere da sequência do tipo selvagem em pelo menos um nucleotídeo. O termo tipo selvagem pode ser compreendido como uma sequência ocorrendo na natureza. Ainda, o termo molécula de ácido nucleico artificial” não é restrito significar uma molécula única mas é, tipicamente, entendido compreender um conjunto de moléculas idênticas. Desta maneira, ele pode se relacionara uma pluralidade de moléculas idênticas contidas em uma alíquota.
[0019] DNA: DNA é a abreviação comum para ácido desóxi-ribonucleico. Ela é uma molécula de ácido nucleico, isto é, um polímero consistindo em nucleotídeos. Esses nucleotídeos são geralmente monômeros de desóxi-adenosina-monofosfato, desóxi-timidina-monofosfato, desóxi-guanosina-monofosfato e desóxi-citidina-monofosfato que são em si compostos de uma porção açúcar (desoxirribose), uma porção base e uma porção fosfato, e polimerizam por uma estrutura de estrutura principal característica. A estrutura da estrutura principal é, tipicamente, formada por ligações fosfodiéster entre a porção açúcar do nucleotídeo, isto é, desoxirribose, de um primeiro monômero e uma porção fosfato de um segundo monômero, adjacente. A ordem especifica dos monômeros, isto é, a ordem das bases ligadas à estrutura principal do açúcar/fosfato, é chamada a sequência de DNA. DNA pode ser de filamento
Petição 870190070557, de 24/07/2019, pág. 72/401
8/306 simples ou filamento duplo. Na forma de filamento duplo, os nucleotideos do primeiro filamento tipicamente hibridizam com os nucleotideos do segundo filamento, por exemplo, através de emparelhamento de base A/T e emparelhamento de base G/C.
[0020] Sequência heteróloqa: duas sequências são tipicamente compreendidas ser ‘heterólogas’ se elas não forem deriváveis do mesmo gene. Isto é, embora sequências heterólogas possam ser deriváveis do mesmo organismo, elas naturalmente (na natureza) não ocorrem na mesma molécula de ácido nucleico, tal como no mesmo mRNA. [0021] Sítio de clonagem: um sítio de clonagem é tipicamente compreendido ser um segmento de uma molécula de ácido nucleico que é adequada para inserção de uma sequência de ácido nucleico, por exemplo, uma sequência de ácido nucleico compreendendo uma estrutura de leitura aberta. Inserção pode ser realizada através de qualquer método biológico molecular conhecido do versado na técnica, por exemplo, através de restrição e ligação. Um sítio de clonagem compreende tipicamente um ou mais sítios de reconhecimento de enzima de restrição (sítios de restrição). Esses um ou mais sítios de restrição podem ser reconhecidos por enzimas de restrição que clivam o DNA nesses sítios. Um sítio de clonagem que compreende mais de um sítio de restrição pode ser também chamado um sítio de clonagem múltiplo (MCS) ou um poliligante.
[0022] Molécula de ácido nucleico: uma molécula de ácido nucleico é uma molécula compreendendo, preferivelmente consistindo em componentes de ácido nucleico. O termo molécula de ácido nucleico referese preferivelmente a moléculas de DNA ou RNA. Ele é preferivelmente usado sinonimamente com o termo polinucleotídeo. Preferivelmente, uma molécula de ácido nucleico é um polímero compreendendo ou consistindo em monômeros de nucleotídeo, que são ligados covalente
Petição 870190070557, de 24/07/2019, pág. 73/401
9/306 mente uns aos outros por ligações fosfodiéster de uma estrutura principal de açúcar/fosfato. O termo molécula de ácido nucleico também compreende moléculas de ácido nucleico modificadas, tais como moléculas de DNA ou RNA modificadas na base, modificadas no açúcar ou modificadas na estrutura principal.
[0023] Estrutura de leitura aberta: uma estrutura de leitura aberta (ORF) no contexto da invenção pode ser tipicamente uma sequência de vários tripletos de nucleotídeo, que podem ser traduzidos em um peptídeo ou proteína. Uma estrutura de leitura aberta contém preferivelmente um códon de partida, isto é, uma combinação de três nucleotídeos subsequentes codificando geralmente o aminoácido metionina (ATG), em sua extremidade 5’ e uma região subsequente, que geralmente exibe um comprimento que é um múltiplo de 3 nucleotídeos. Uma ORF é preferivelmente terminada por um códon de parada (por exemplo, TAA, TAG, TGA). Tipicamente, este é o único códon de parada da estrutura de leitura aberta. Desta maneira, uma estrutura de leitura aberta no contexto da presente invenção é preferivelmente uma sequência de nucleotídeo, consistido em vários nucleotídeos que podem ser divididos por três, que começa com um códon de início (por exemplo, ATG) e que preferivelmente termina com um códon de parada (por exemplo, TAA, TGA ou TAG). A estrutura de leitura aberta pode ser isolada ou ela pode ser incorporada em uma sequência de ácido nucleico mais longa, por exemplo, em um vetor ou um mRNA. Uma estrutura de leitura aberta pode ser também chamada sequência de codificação de (proteína) ou, preferivelmente, sequência de codificação.
[0024] Peptídeo: um peptídeo ou polipeptídeo é tipicamente um polímero de monômeros de aminoácido, ligado por ligações peptídicas. Ele contém tipicamente menos de 50 unidades de monômero. Não obstante, o termo peptídeo não é uma renúncia a moléculas tendo mais de 50 unidades de monômero. Peptídeos longos são também chamados
Petição 870190070557, de 24/07/2019, pág. 74/401
10/306 polipeptídeos, tipicamente tendo entre 50 e 600 unidades monoméricas. [0025] Proteína: uma proteína compreende tipicamente um ou mais peptídeos ou polipeptídeos. Uma proteína é tipicamente dobrada em forma 3-dimensional, que pode ser necessária para a proteína exercer sua função biológica.
[0026] Sítio de restrição: um sítio de restrição, também chamado sítio de reconhecimento de enzima de restrição, é uma sequência de nucleotídeo reconhecida por uma enzima de restrição. Um sítio de restrição é tipicamente uma sequência de nucleotídeo preferivelmente palindrômica, curta, por exemplo, uma sequência compreendendo 4 a 8 nucleotídeos. Um sítio de restrição é preferivelmente especificamente reconhecido por uma enzima de restrição. A enzima de restrição tipicamente cliva uma sequência de nucleotídeo compreendendo um sítio de restrição neste sítio. Em uma sequência de nucleotídeo de filamento duplo, tal como uma sequência de DNA de filamento duplo, a enzima de restrição tipicamente corta ambos os filamentos da sequência de nucleotídeo.
[0027] RNA, mRNA: RNA é a abreviação comum para ácido ribonucleico. Ele é uma molécula de ácido nucleico, isto é, um polímero consistindo em nucleotídeos. Esses nucleotídeos são geralmente monômeros de adenosina-monofosfato, uridina-monofosfato, guanosina-monofosfato e citidina-monofosfato que são conectados uns aos outros ao longo de uma chapa estrutura principal. A estrutura principal é formada por ligações fosfodiéster entre o açúcar, isto é, ribose, de um primeiro monômero e uma porção fosfato de um segundo monômero, adjacente. A sucessão específica do monômero é chamada a sequência de RNA. Geralmente RNA pode ser obtenível através de transcrição de uma sequência de DNA, por exemplo, dentro de uma célula. Em células eucarióticas, transcrição é tipicamente realizada dentro do núcleo ou da mitocôndria. In vivo, transcrição de DNA geralmente resulta no chamado
Petição 870190070557, de 24/07/2019, pág. 75/401
11/306
RNA prematuro que tem que ser processado no chamado RNA mensageiro, geralmente abreviado como mRNA. Processamento do DNA prematuro, por exemplo, em organismos eucarióticos, compreende uma variedade de modificações pós-transcripcionais diferentes tais como união, capeamento de 5’, poliadenilação, exportação a partir do núcleo ou da mitocôndria e similar. A soma desses processos é também chamada maturação de RNA. O RNA mensageiro maduro geralmente provê a sequência de nucleotídeo que pode ser traduzida em uma sequência de aminoácido de um peptídeo ou proteína particular. Tipicamente, um mRNA maduro compreende um 5!-cap, um 5!-LJTR, uma estrutura de leitura aberta, uma 3!~UTR e uma sequência poli(A). Além do RNA mensageiro, vários tipos de não codificação de RNA existem, os quais podem estar envolvidos em regulagem de transcrição e/ou tradução.
[0028] Sequência de uma molécula de ácido nucleico: a sequência de uma molécula de ácido nucleico é tipicamente compreendida ser a ordem particular e individual, isto é, a sucessão de seus nucleotídeos. A sequência de uma proteína ou peptídeo é tipicamente compreendida ser a ordem, isto é, a sucessão de seus aminoácidos.
[0029] Identidade de sequência: duas ou mais sequências são idênticas se elas exibirem o mesmo comprimento e ordem de nucleotídeos ou aminoácidos. A porcentagem de identidade tipicamente descreve o grau ao qual duas sequências são idênticas, isto é, ela descreve tipicamente a porcentagem de nucleotídeos que corresponde em sua posição na sequência a nucleotídeos idênticos de uma sequência de referência. Para determinação do grau de identidade (identidade %), as sequências a serem comparadas são tipicamente consideradas exibir o mesmo comprimento, isto é, o comprimento da sequência mais longa das sequências a ser comparada. Isso significa que uma primeira sequência consistindo em 8 nucleotídeos é 80% idêntica a uma segunda sequência consistindo em 10 nucleotídeos compreendendo a primeira sequência.
Petição 870190070557, de 24/07/2019, pág. 76/401
12/306
Em outras palavras, no contexto da presente invenção, identidade de sequências refere-se preferivelmente à porcentagem de nucleotídeos ou aminoácidos de uma sequência que têm a mesma posição em duas ou mais sequências tendo o mesmo comprimento. Especificamente, a identidade % das duas sequências de aminoácido ou duas sequências de ácido nucleico pode ser determinada alinhando as sequências para propósitos de comparação ótima (por exemplo, lacunas podem ser introduzidas em quaisquer sequências para melhora alinhamento com as outras sequências) e comparando os aminoácidos ou nucleotídeos em posições correspondentes. Lacunas são geralmente consideradas posições não idênticas, sem importar sua posição atual em um alinhamento. O melhor alinhamento é tipicamente um alinhamento de duas sequências que resulta na identidade percentual mais alta. A identidade percentual é determinada pelo número de nucleotídeos idênticos nas sequências sendo comparadas (isto é, identidade % · no. de posições idênticas/no. total de posições x 100). A determinação de identidade percentual entre duas sequências pode ser obtida usando um algoritmo matemático conhecido daqueles de habilidade na técnica.
[0030] Molécula de ácido nucleico estabilizada: uma molécula de ácido nucleico estabilizada é uma molécula de ácido nucleico, preferivelmente uma molécula de DNA ou RNA, que é modificada de modo que ela é mais estável à desintegração ou degradação, por exemplo, por fatores ambientais ou digestão enzimática, tal como por uma degradação de exo- ou endonuclease, do que a molécula de ácido nucleico sem a modificação. Preferivelmente, uma molécula de ácido nucleico estabilizada no contexto da presente invenção é estabilizada em uma célula, tal como uma célula procariótica ou eucariótica, preferivelmente em uma célula de mamífero, tal como uma célula humana. O efeito de estabilização pode ser também exercido fora de células, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 77/401
13/306 em uma solução tampão, etc., por exemplo, em um processo de fabricação para uma composição farmacêutica compreendendo a molécula de ácido nucleico estabilizada.
[0031 ] Transfecção: o termo transfecção refere-se à introdução de moléculas de ácido nucleico, tais como moléculas de DNA ou RNA (por exemplo, mRNA), em células, preferivelmente em células eucarióticas. No contexto da presente invenção, o termo transfecção compreende qualquer método conhecido do versado na técnica para introdução de moléculas de ácido nucleico em células, preferivelmente em células eucarióticas, tais como em células de mamífero. Tais métodos compreendem, por exemplo, eletroporação, lipofecção, por exemplo, com base em lipídeos catiônicos e/ou Hpossomas, precipitação de fosfato de cálcio, transfecção baseada em nanopartículas, transfecção baseada em vírus ou transfecção baseada em polímeros catiônicos, tal como DEAEdextrano ou polietilenoimina, etc. Preferivelmente, a introdução é não viral.
[0032] Vetor: o termo vetor refere-se a uma molécula de ácido nucleico, preferivelmente a uma molécula de ácido nucleico artificial. Um vetor no contexto da presente invenção é adequado para incorporação ou carregamento de uma sequência de ácido nucleico desejada, tal como uma sequência de ácido nucleico compreendendo uma estrutura de leitura aberta. Tais vetores podem ser vetores de armazenamento, vetores de expressão, vetores de clonagem, vetores de transferência, etc. Um vetor de armazenamento é um vetor que permite o armazenamento conveniente de uma molécula de ácido nucleico, por exemplo, de uma molécula de mRNA. Desta maneira, o vetor pode compreender uma sequência correspondendo, por exemplo, a uma sequência de mRNA desejada ou uma parte da mesma, tal como uma sequência correspondendo à sequência de codificação e a 3’-UTR de um mRNA. Um
Petição 870190070557, de 24/07/2019, pág. 78/401
14/306 vetor de expressão pode ser usado para produção de produtos de expressão tal como RNA, por exemplo, mRNA, ou peptídeos, polipeptídeos ou proteínas. Por exemplo, um vetor de expressão pode compreender sequências necessárias para transcrição de uma extensão de sequência do vetor, tal como uma sequência de promotor, por exemplo, uma sequência de promotor de polimerase de RNA. Um vetor de clonagem é tipicamente um vetor que contém um sítio de clonagem, que pode ser usado para incorporar sequências de ácido nucleico ao vetor. Um vetor de clonagem pode ser, por exemplo, um vetor de plasmídeo ou um vetor de bacteriófago. Um vetor de transferência pode ser um vetor que é adequado para transferência de moléculas de ácido nucleico para células ou organismos, por exemplo, vetores virais. Um vetor no contexto da presente invenção pode ser, por exemplo, um vetor de RNA ou um vetor de DNA. Preferivelmente, um vetor é uma molécula de DNA. Preferivelmente, um vetor no senso do presente pedido compreende um sítio de clonagem, um marcador de seleção, tal como um fator de resistência a antibiótico e uma sequência adequados para multiplicação do vetor, tal como uma origem de replicação.
[0033] Veículo: um veículo é tipicamente compreendido ser um material que é adequado para armazenamento, transporte e/ou administração de um composto, tal como um composto farmaceuticamente ativo. Por exemplo, ele pode ser um líquido fisiologicamente aceitável, que é adequado para armazenamento, transporte e/ou administração de um composto farmaceuticamente ativo.
[0034] A presente invenção é baseada em parte na surpreendente constatação que elementos de 3’ e/ou 5’ UTR particulares podem mediar uma expressão aumentada de sequências de codificação, especificamente aquelas codificando proteínas associadas a CRISPR (Cas), tal como Cas9 ou Cpf1. Os presentes inventores constataram especifica
Petição 870190070557, de 24/07/2019, pág. 79/401
15/306 mente que certas combinações de elementos de 3’ e 5’ UTR são particularmente vantajosos para provisão de um perfil de expressão desejado e quantidades de proteína expressa. Em particular, expressão alta de proteína Cas por um período de tempo curto (mais ou menos 24 horas, expressão de pulso) pode ser desejada para muitas aplicações, por exemplo, a fim de minimizar exposição de DNA genômico para reduzir efeitos fora do alvo (isto é, quaisquer defeitos não intencionais sobre qualquer um ou mais alvo, gene ou transcrito celular). A ação sinergística de tais elementos 3’ e 5’ UTR em um ácido nucleico artificial codificando proteína associada a CRISP é particularmente benéfica quando expressão transiente de quantidades grandes de tais proteínas é desejada in vitro ou in vivo. Tais ácidos nucleicos artificiais então inter alia se prestam a várias aplicações terapêuticas que são condescendentes a tratamento através da introdução de mutações, inativações ou ativações de gene ou modulação da expressão de genes de interesse. [0035] Desta maneira, em um primeiro aspecto, a presente invenção refere-se então a uma molécula de ácido nucleico artificial compreendendo
a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISP; b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4; e c. pelo menos um elemento de região não traduzida 3’ derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9.
[0036] O termo UTR refere-se a uma região não traduzida flanqueando a sequência de codificação de um ácido nucleico artificial como aqui definido. Neste contexto, um elemento de UTR compreende ou consiste em uma sequência de ácido nucleico que é derivada da UTR
Petição 870190070557, de 24/07/2019, pág. 80/401
16/306 (de ocorrência natural, tipo selvagem) de um gene particular, preferivelmente como exemplificado aqui.
[0037] Quando se referindo a elementos de UTR derivados de uma UTR particular, referência é feita a sequências de ácido nucleico correspondendo à sequência da dita UTR (UTR parental) ou um homólogo, variante ou fragmento da dita UTR. O termo inclui sequências correspondendo à sequência do tipo selvagem inteira (comprimento integral) da dita UTR, ou um homólogo, variante ou fragmento da mesma, incluindo homólogos e variantes de comprimento integral, bem como fragmentos das ditas sequências do tipo selvagem de comprimento integral, homólogos e variantes, e variantes dos ditos fragmentos. O termo corresponde a significa que a sequência de ácido nucleico derivada da UTR parental pode ser uma sequência de RNA (por exemplo, igual à sequência de RNA usada para definição da dita sequência de UTR parental), ou uma sequência de DNA (de ambos filamentos de senso e antissenso e ambas madura e imatura), que corresponde a tal sequência de RNA.
[0038] Quando se referindo a um elemento de UTR derivado de uma UTR de um gene, ou um homólogo, fragmento ou variante da mesma, a expressão ou um homólogo, fragmento ou variante da mesma pode se referir ao gene, ou à UTR, ou ambos.
[0039] O termo homólogo no contexto de genes (ou sequências de ácido nucleico derivadas dos mesmos ou compreendidas pelo dito gene, tal como uma UTR) refere-se a um gene (ou uma sequência de ácido nucleico derivada do mesmo ou compreendida pelo dito gene) relacionado a um segundo gene (portal sequência de ácido nucleico) por descendente de uma sequência de DNA ancestral comum. O termo homólogo inclui genes separados pelo evento de especiação (ortólogo) e genes separados pelo evento de duplicação genética (parálogos).
Petição 870190070557, de 24/07/2019, pág. 81/401
17/306 [0040] O termo variante no contexto de sequências de ácido nucleico de genes refere-se a variantes de sequência de ácido nucleico, isto é, sequências de ácido nucleico ou genes compreendendo uma sequência de ácido nucleico que difere em pelo menos um ácido nucleico de uma sequência de ácido nucleico de referência (ou parental) de um ácido nucleico ou gene de referência (ou parental). Ácidos nucleicos ou genes variantes podem então compreender preferivelmente, em sua sequência de ácido nucleico, pelo menos uma mutação, substituição, inserção ou deleção comparado com sua respectiva sequência de referência. Preferivelmente, o termo variante como aqui usado inclui variantes de ocorrência natural e variantes engenheiradas de sequências de ácido nucleico ou genes. Desta maneira, uma variante como definido aqui pode ser derivada, de isolada de, relacionada à, baseada em ou homóloga à sequência de ácido nucleico de referência. Variantes podem ter preferivelmente uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente de pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97%, a uma sequência de ácido nucleico da respectiva sequência de ácido nucleico de ocorrência natural (tipo selvagem) ou gene, ou um homólogo, fragmento ou derivado do mesmo.
[0041 ] O termo fragmento no contexto de sequências de ácido nucleico ou genes refere-se a uma subsequência contínua da sequência de ácido nucleico de referência de comprimento integral (ou parental) ou gene. Em outras palavras, um fragmento pode ser tipicamente uma porção mais curta de uma sequência de ácido nucleico de comprimento integral ou gene. Desta maneira, um fragmento consiste, tipicamente, em uma sequência que é idêntica à extensão correspondente dentro da
Petição 870190070557, de 24/07/2019, pág. 82/401
18/306 sequência de ácido nucleico de comprimento integral ou gene. O termo inclui fragmentos de ocorrência natural bem como fragmentos engenheirados. Um fragmento preferido de uma sequência no contexto da presente invenção consiste em uma extensão contínua de ácidos nucleicos correspondendo a uma extensão contínua de entidades no ácido nucleico ou gene cujo fragmento é derivado que presenta pelo menos 20%, preferivelmente pelo menos 30%, mais preferivelmente pelo menos 40%, mais preferivelmente pelo menos 50%, ainda mais preferivelmente pelo menos 60%, ainda mais preferivelmente pelo menos 70% e sobretudo preferivelmente pelo menos 80% da sequência de ácido nucleico total (isto é, comprimento integral) ou gene a partir do qual o fragmento é derivado. Uma identidade de sequência indicada com relação a tal fragmento refere-se preferivelmente à sequência de ácido nucleico inteira ou gene. Preferivelmente, um fragmento pode compreender uma sequência de ácido nucleico tendo uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente de pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97% com uma sequência de ácido nucleico ou gene de referência do qual ela é derivada.
[0042] Elementos de UTR usados no contexto da presente invenção são preferivelmente funcionais, isto é, capazes de elicitar o mesmo efeito biológico desejado que as UTRs de ocorrência natural (tipo selvagem) das quais eles são derivados, isto é, em particular de controle da expressão (isto é, regulagem, preferivelmente aumento) da expressão de uma sequência de codificação operavelmente ligada. O termo operavelmente ligado” como aqui usado significa que sendo posto em uma relação funcional com uma sequência de codificação. Elementos de
Petição 870190070557, de 24/07/2019, pág. 83/401
19/306
UTR definidos aqui são preferivelmente operavelmente ligados, isto é, postos em uma relação funcional, à sequência de codificação do ácido nucleico artificial da invenção, preferivelmente de uma maneira que permite que eles controlem (isto é, regulem, preferivelmente aumentem) a expressão da dita sequência de codificação. O termo expressão como aqui usado inclui em geral todas as etapas de biossíntese de proteína, transcrição inter alia, processamento e tradução de mRNA. Os elementos de UTR especificados aqui, em particular nas combinações descritas, são particularmente pretendidos aumentar a transcrição de sequência de codificação codificando a proteína associada à CRISPR descrita aqui.
[0043] O ácido nucleico artificial da invenção compreende então vantajosamente um elemento de 5’ UTR e um elemento de 3’ UTR, cada um derivado de um gene selecionado daqueles indicados aqui. Elementos de 5’ UTR adequados são selecionados de elementos de 5’-UTR derivados de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4, preferivelmente como definido aqui. Elementos de 3’ UTR adequados são selecionados de elementos de 3’ UTR derivados de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9, preferivelmente como definido aqui.
[0044] Tipicamente, elementos de 5’- ou 3’-UTR das moléculas de ácido nucleico artificiais da invenção são heterólogos para a pelo menos uma sequência de codificação.
[0045] Preferivelmente, as UTRs (servindo como UTRs parentals para os elementos de UTR do ácido nucleico artificial da invenção) indicadas aqui compreendem as UTRs de ocorrência natural (tipo selvagem), bem como homólogos, fragmentos, variantes e sequências de RNA correspondentes das mesmas.
Petição 870190070557, de 24/07/2019, pág. 84/401
20/306 [0046] Em outras palavras, o ácido nucleico artificial pode compreender preferivelmente a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISPR; b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP e NDUFA4 ou um homólogo, fragmento, variante ou sequência de RNA correspondente de qualquer uma das ditas 5’ UTRs; e c. pelo menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB e RPS9 ou um homólogo, fragmento, variante ou sequência de RNA correspondente de qualquer uma das ditas 3’ UTRs.
[0047] As 5’ UTRs e 3’ UTRs são preferivelmente operavelmente ligadas à sequência de codificação do ácido nucleico artificial da invenção.
UTRs
5’ UTR [0048] O ácido nucleico artificial descrito aqui compreende pelo menos um elemento de 5’-UTR derivado de uma 5’ UTR de um gene como aqui indicado ou um homólogo, variante ou fragmento do mesmo.
[0049] O termo 5’-UTR refere-se a uma parte de uma molécula de ácido nucleico que está localizada 5’ (isto é, a montante) de uma estrutura de leitura aberta e que não é traduzida em proteína. No contexto da presente invenção, uma 5’-UTR começa com o sítio de início de transcrição e termina um nucieotídeo antes do códon de parada da estrutura de leitura aberta. A 5’-UTR pode compreender elementos para controle de expressão de gene, também chamados elementos reguladores. Tais elementos reguladores podem ser, por exemplo, sítios de ligação ribossomal. A 5’-UTR pode ser pós-transcripcionalmente modificada, por exemplo, pela adição de um 5’-Cap. Desta maneira, 5’-UTRs
Petição 870190070557, de 24/07/2019, pág. 85/401
21/306 podem correspondem preferivelmente à sequência de um ácido nucleico, em particular um mRNA maduro, que está localizada entre o 5’Cap e o códon de início, e mais especificamente a uma sequência, que se estende a partir de um nucleotídeo localizado 3’ para o 5’-Cap, preferivelmente a partir do nucleotídeo localizado imediatamente 3’ para o 5’~Cap, a um nucleotídeo localizado 5’ para o códon de início da sequência de codificação de proteína (sítio de início de transcrição), preferivelmente ao nucleotídeo localizado imediatamente 5’ para o códon de início da sequência de codificação de proteína (sítio de início de transcrição). O nucleotídeo localizado imediatamente 3’ para a 5’-Cap de um mRNA maduro corresponde tipicamente ao sítio de início de transcrição. 5’ UTRs têm tipicamente um comprimento de menos do que 500, 400, 300, 250 ou menos de 200 nucleotídeos. Em algumas modalidades, seu comprimento pode estar na faixa de pelo menos 10, 20, 30 ou 40, preferivelmente até 100 ou 150, nucleotídeos.
[0050] Preferivelmente, o pelo menos um elemento de 5’ UTR compreende ou consiste em uma sequência de ácido nucleico derivada da 5’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano, ou de uma variante da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano. [0051] Os nomes das UTRs compreendendo a extensão .1 ou var são idênticas à UTR sem a dita extensão.
Elementos de 5’ UTR derivados de gene TOP [0052] Alguns dos elementos de 5’ UTR especificados aqui podem ser derivados da 5’ UTR de um gene TOP ou de um homólogo, variante ou fragmento do mesmo.
[0053] Genes TOP são então tipicamente caracterizados pela pre
Petição 870190070557, de 24/07/2019, pág. 86/401
22/306 sença de um trato de oligopirimidina 5’ terminal (TOP) e, ainda, tipicamente por uma regulagem traducíonal associada a crescimento. No entanto, genes TOP com uma regulagem traducional específica de tecido são também conhecidos. mRNA que contém um 5’ TOP é frequentemente referido como mRNA de TOP. Desta maneira, genes que proveem tais RNAs mensageiros são referidos como genes TOP. Sequências TOP foram exemplo, encontradas em genes e mRNA codificando fatores de alongamento de peptídeo e proteínas ribossomais.
[0054] O trato de oligopirimidina 5’ terminal (5’ TOP ou TOP) é tipicamente uma extensão de nucleotídeos de pirimidina localizados na região 5’ terminal de uma molécula de ácido nucleico, tal como a região 5’ terminal de certas moléculas de mRNA ou a região 5’ terminal de uma entidade funcional, por exemplo, a região transcrita, de certos genes.
[0055] A 5’ UTR de um gene de TOP corresponde à sequência de uma 5’ UTR de um mRNA maduro derivado de um gene de TOP, que se estende preferivelmente a partir do nucleotídeo localizado 3’ até o 5’CAP para o nucleotídeo localizado 5’ até o códon de início. A sequência de TOP começa tipicamente com uma citidina, que geralmente corresponde ao sítio de início de transcrição, e é seguida por uma extensão de geralmente cerca de 3 a 30 nucleotídeos de pirimidina. A extensão de pirimidina e então a 5’ TOP termina um nucleotídeo 5’ para o primeiro nucleotídeo de purina localizado a jusante da TOP.
[0056] Uma 5'UTR de um gene de TOP tipicamente não compreende quaisquer códons de início, preferivelmente quaisquer AUGs a montante (uAUGs) ou estruturas de leitura aberta a montante (uORFs). Nela, AUGs a montante e estruturas de leitura aberta a montante são tipicamente compreendidas ser AUGs e estruturas de leitura aberta que ocorrem 5’ do códon de início (AUG) da estrutura de leitura aberta que deve ser traduzida. As 5’ UTRs de genes de TOP são geralmente bem curtas. Os comprimentos das 5’ UTRs de genes de TOP podem variar
Petição 870190070557, de 24/07/2019, pág. 87/401
23/306 entre 20 nucleotídeos até 500 nucleotídeos, e são tipicamente menos do que cerca de 200 nucleotídeos, preferivelmente menos do que cerca de 150 nucleotídeos, mais preferivelmente menos do que cerca de 100 nucleotídeos. Por exemplo, uma TOP pode compreender 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30 ou ainda mais nucleotídeos.
[0057] No contexto da presente invenção, um motivo de TOP é uma sequência de ácido nucleico que corresponde a uma 5’ TOP como acima definido. Desta maneira, um motivo de TOP no contexto da presente invenção é preferivelmente uma extensão de nucleotídeos de pirimidina tendo um comprimento de 3-30 nucleotídeos. Preferivelmente, o motivo de TOP consiste em pelo menos 3, preferivelmente pelo menos 4, mais preferivelmente pelo menos 6, mais preferivelmente pelo menos 7 e sobretudo preferivelmente pelo menos 8 nucleotídeos de pirimidina, em que a extensão de nucleotídeos de pirimidina começa preferivelmente em sua extremidade 5’ com um nucleotídeo de citosina. Nos genes de TOP e mRNAs de TOP, o motivo de TOP começa preferivelmente em sua extremidade 5’ com o sítio de início de transcrição e termina um nucleotídeo 5’ para o primeiro resíduo purina no dito gene ou mRNA. Um motivo TOP no senso da presente invenção está preferivelmente localizado na extremidade 5’ de uma sequência, que representa uma 5’ UTR, ou na extremidade 5’ de uma sequência, que codifica uma 5’ UTR. Desta maneira, preferivelmente, uma extensão de 3 ou mais nucleotídeos de pirimidina é chamada motivo de TOP no senso da presente invenção se esta extensão estiver localizada na extremidade 5’ de uma respectiva sequência, tal como a molécula de ácido nucleico artificial, o elemento 5’ UTR da molécula de ácido nucleico artificial ou a sequência de ácido nucleico que é derivada da 5’ UTR de um gene de TOP como descrito aqui. Em outras palavras, uma extensão de
Petição 870190070557, de 24/07/2019, pág. 88/401
24/306 ou mais nucleotídeos de pirimidina, que não está localizada na extremidade 5’ de uma 5’ UTR ou um elemento de 5’ UTR, mas em qualquer lugar dentro de uma 5’ UTR ou um elemento de 5’ UTR, preferivelmente nâo é referida como motivo de TOP.
[0058] Em modalidades particularmente preferidas, os elementos de 5’ UTR derivados de 5’ UTRs de genes de TOP exemplificados aqui nâo compreendem um motivo de TOP ou uma 5’ TOP, como acima definido. Desta maneira, a sequência de ácido nucleico do elemento de 5’ UTR, que é derivada de uma 5’ UTR de um gene de TOP, pode terminar em sua extremidade 3’ com um nucleotídeo localizado na posição 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 a montante do códon de início (por exemplo, A(U/T)G) do gene ou mRNA do qual ele é derivado. Desta maneira, o elemento de 5’ UTR não compreende qualquer parte da sequência de codificação de proteína. Desta maneira, preferivelmente, a única parte de codificação de aminoácido do ácido nucleico artificial é provida pela sequência de codificação codificando a proteína associada a CRISPR (e opcionalmente sequências de aminoácido adicionais como descrito aqui).
[0059] Elementos de 5’ UTR específicos previstos de acordo com a presente invenção são descritos em detalhes abaixo.
Elementos de 5’ UTR derivados de HSD17B4 [0060] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma 17-beta-hídroxiesteroíde desidrogenase 4 ou um homólogo, variante ou fragmento da mesma, preferivelmente sem o motivo de 5’ TOP.
[0061] Tais elementos de 5’ UTR compreende ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da 17-beta-hidroxiesteroide desidrogenase 4 (HSD17B4,
Petição 870190070557, de 24/07/2019, pág. 89/401
25/306 também referida como enzima multifuncional peroxissomal tipo 2), preferivelmente de um gene da 17-beta-hidroxlesteroide desidrogenase 4 (HSD17B4) de vertebrado, mais preferivelmente de um gene da 17beta-hidroxiesteroide desidrogenase 4 (HSD17B4) de mamífero, sobretudo preferivelmente de um gene da 17-beta-hidroxlesteroide desidrogenase 4 (HSD17B4) humana ou um homólogo, variante ou fragmento de qualquer uma das ditas 5’ UTRs, em que preferivelmente o elemento de 5’ UTR não compreende a 5’ TOP do dito gene.
[0062] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de HSD17B4, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 1 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente de pelo menos 90% e sobretudo preferivelmente de pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 2 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos de pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou ainda 97%,
Petição 870190070557, de 24/07/2019, pág. 90/401
26/306 de identidade de sequência com a sequência de ácido nucleico de acordo com a SEQ ID NO: 2.
Elementos de 5-UTR derivados de RPL32 [0063] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma proteína Grande ribossomal (RPL), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento de 5’ UTR preferivelmente não tem o motivo de 5’ TOP (trato de oligopirimidina terminal).
[0064] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da proteína ribossomal Large 32 (RPL32), preferivelmente de um gene da proteína ribossomal Large 32 (L32) de vertebrado, mais preferivelmente de um gene da proteína ribossomal de mamífero Large 32 (L32), sobretudo preferivelmente de um gene da proteína ribossomal Large 32 (L32) humana ou um homólogo, variante ou fragmento de qualquer uma das ditas 5’ UTRs, em que o elemento 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene. O termo SiRPL32!' inclui também variantes e fragmentos das mesmas, que são aqui também referidos como RPL32var ou 32L4.
[0065] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de RPL21, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 21 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%,
Petição 870190070557, de 24/07/2019, pág. 91/401
27/306 ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO:21, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 22 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO:22.
Elementos de 5’~UTR derivados de NDUFA4 [0066] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico que é derivada de uma 5’ UTR de um gene codificando uma subunidade de Citocroma c oxidase (NDUFA4) ou um homólogo, fragmento ou variante da mesma.
[0067] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da subunidade de Citocroma c oxidase (NDUFA4 ou Ndufa4.1), preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) de vertebrado, mais preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) de mamífero, sobre preferivelmente de um gene da subunidade de Citocroma c oxidase (NDUFA4) humana ou um homólogo, variante ou fragmento da mesma. [0068] Desta maneira, ácidos nucleicos artificiais de acordo com a
Petição 870190070557, de 24/07/2019, pág. 92/401
28/306 invenção podem compreender um elemento de 5’ UTR derivado de um gene de NDUFA4, onde o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 9 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ iD NO:9 ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 10 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10.
Elementos de 5’-UTR derivados de SLC7A3 [0069] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando um membro 3 da família de veículo de soluto 7 (SLC7A3), ou um homólogo, fragmento ou variantes da mesma.
[0070] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’
Petição 870190070557, de 24/07/2019, pág. 93/401
29/306
UTR de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3 ou Slc7a3.1), preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) de vertebrado, mais preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) de mamífero, sobretudo preferivelmente de um gene do membro 3 da família de veículo de soluto 7 (SLC7A3) humano, ou um homologo, variante ou fragmento da mesma.
[0071 ] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de SLC7A3, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 15 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 16, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID
Petição 870190070557, de 24/07/2019, pág. 94/401
30/306
NO:16.
Elementos de 5’ UTR derivados de NOSIP [0072] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 5’ UTR de um gene codificando uma proteína de interação com Óxido nítrico sintase ou um homólogo, variante ou fragmento da mesma.
[0073] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR de um gene da proteína de interação com Óxido nítrico sintase (NOSIP ou Nosip.T'), preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) de vertebrado, mais preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) de mamífero, sobretudo preferivelmente de um gene da proteína de interação com Óxido nítrico sintase (NOSIP) humana ou um homólogo, variante ou fragmento da mesma.
[0074] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de NOSIP, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 11 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA
Petição 870190070557, de 24/07/2019, pág. 95/401
31/306 de acordo com a SEQ ID NO: 12, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12.
Elementos de 5-UTR derivados de ATP5A1 [0075] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma subunidade alfa de ATP sintase mitocondrial (ATP5A1), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0076] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa da ATP sintase mitocondrial (ATP5A1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) de mamífero, mais preferivelmente ainda de um gene da subunidade alfa de ATP sintase mitocondrial (ATP5A1) humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0077] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de ATP5A1, em que o dito elemento de 5’ UTR compreende ou
Petição 870190070557, de 24/07/2019, pág. 96/401
32/306 consiste em uma sequência de DNA de acordo com a SEQ ID NO: 5 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 6, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6. Elementos de 5’~UTR derivados de ASAH1 [0078] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando a subunidade alfa de ATP sintase mitocondrial (ASAH1), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0079] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa da ATP
Petição 870190070557, de 24/07/2019, pág. 97/401
33/306 sintase mitocondrial (ASAHI), preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de vertebrado, mais preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa da ATP sintase mitocondrial (ASAH1) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0080] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de ASAH1, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 3 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 3, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 4, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4.
Petição 870190070557, de 24/07/2019, pág. 98/401
34/306
Elementos de 5’~UTR derivados de MP68 [0081] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (MP68), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0082] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (MP68 ou ,!Mp68), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de mamífero, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (MP68) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0083] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de Mp68, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 7 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de
Petição 870190070557, de 24/07/2019, pág. 99/401
35/306 acordo com SEQ ID NO: 7, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 8, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8.
Elementos de 5- UTR derivados de RPL31 [0084] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (RPL31), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0085] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (RPL31 ou Rpl31.T), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (RPL31) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial de (RPL31) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa de ATP sintase de mitocondrial (RPL31) humana, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0086] Desta maneira, ácidos nucleicos artificiais de acordo com a
Petição 870190070557, de 24/07/2019, pág. 100/401
36/306 invenção podem compreender um elemento de 5’ UTR derivado de um gene de RPL31, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 13 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 14, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14.
Elementos de 5’ UTR derivados de TUBB4B [0087] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando uma subunidade alfa de ATP sintase mitocondrial (TUBB4B), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
Petição 870190070557, de 24/07/2019, pág. 101/401
37/306 [0088] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B ou TUBB4B.1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de mamífero, sobretudo preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (TUBB4B) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0089] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de TUBB4B, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 17 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 18, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos
Petição 870190070557, de 24/07/2019, pág. 102/401
38/306
70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18.
Elementos de 5‘ UTR derivados de UBQLN2 [0090] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’-UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’ UTR de um gene codificando subunidade alfa de ATP sintase mitocondrial (UBQLN2), ou um homólogo, variante ou fragmento da mesma, em que o dito elemento 5’ UTR preferivelmente não tem o motivo 5’ TOP.
[0091] Tais elementos de 5’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 5’ UTR que é derivada da 5’ UTR de gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2 ou Ubqln2.1), preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2) de vertebrado, mais preferivelmente de um gene da subunidade alfa de ATP sintase mitocondrial de mamífero (UBQLN2) de mamífero, sobretudo preferivelmente um gene da subunidade alfa de ATP sintase mitocondrial (UBQLN2) de humano, ou um homólogo, variante ou fragmento da mesma, em que o elemento de 5’ UTR preferivelmente não compreende a 5’ TOP do dito gene.
[0092] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 5’ UTR derivado de um gene de UBQLN2, em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 19ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tem, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%,
Petição 870190070557, de 24/07/2019, pág. 103/401
39/306
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 19, ou em que o dito elemento de 5’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 20, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20.
3’ UTR [0093] O ácido nucleico artificial descrito aqui compreende ainda pelo menos um elemento de 3’-UTR derivado de uma 3’-UTR de um gene como aqui indicado, ou um homólogo, variante, fragmento do dito gene. O termo 3’-UTR refere-se a uma parte de uma molécula de ácido nucleico, que está localizada 3’ (isto é, a jusante) de uma estrutura de leitura aberta e que não é traduzida em proteína. No contexto da presente invenção, uma 3’-UTR corresponde a uma sequência que está localizada entre o códon de parada da sequência de codificação de proteína, preferivelmente imediatamente 3’ para o códon de parada da sequência de codificação de proteína, e a sequência de poli(A) da molécula de ácido nucleico artificial, preferivelmente RNA.
Petição 870190070557, de 24/07/2019, pág. 104/401
40/306 [0094] Preferivelmente, o pelo menos um elemento de 3’ UTR compreende ou consiste em uma sequência de ácido nucleico derivada da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano, ou de uma variante da 3’ UTR de um gene de cordado, preferivelmente um gene de vertebrado, mais preferivelmente um gene de mamífero, sobretudo preferivelmente um gene de humano. Elementos de 3-UTR derivados de GNAS [0095] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma proteína de ligação ao nucleotídeo Guanina G(s) curto das isoformas de subunidade alfa (GNAS) ou um homólogo, variante ou fragmento do mesmo.
[0096] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS ou Gnas.1), preferivelmente de um gene curto das Isoformas de subunidade alfa da proteína de ligação ao nucleotídeo Guanina G(s) (GNAS) de vertebrado, mais preferivelmente de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS) de mamífero, sobretudo preferivelmente de um gene curto das isoformas de subunidade alfa da proteína de ligação ao nucleotídeo guanina G(s) (GNAS) de humano ou um homólogo, variante ou fragmento do mesmo.
[0097] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de GNAS, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29 ou um
Petição 870190070557, de 24/07/2019, pág. 105/401
41/306 homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29, ou em que o dito elemento de 3’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 30, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 30.
Elementos de 3’ UTR derivados de CASP1 [0098] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma Caspase-1 (CASP1) ou um homólogo, variante ou fragmento da mesma.
[0099] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da Caspase-1 (CASPT' ou CASP1.1), preferivel
Petição 870190070557, de 24/07/2019, pág. 106/401
42/306 mente de um gene da Caspase-1 (CASP1) de vertebrado, mais preferivelmente de urn gene da Caspase-1 (CASP1) de mamífero, sobretudo preferivelmente de um gene da Caspase-1 (CASP1) de humano ou urn homólogo, variante ou fragmento da mesma.
[0100] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de CASP1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 25, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com SEQ ID NO: 26, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26.
Elementos de 3’ UTR derivados de PSMB3 [0101] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’-UTR que compreende ou consiste em
Petição 870190070557, de 24/07/2019, pág. 107/401
43/306 uma sequência de ácido nucleico derivada de uma 3’ UTR de um gene codificando uma subunidade beta tipo-3 de Proteassoma (PSMB3) ou um homólogo, variante ou fragmento da mesma.
[0102] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de vertebrado, mais preferivelmente de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de mamífero, sobretudo preferivelmente de um gene da subunidade beta tipo-3 de Proteassoma (PSMB3) de humano ou um homólogo, variante ou fragmento da mesma.
[0103] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de PSMB3, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 23 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 24, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente
Petição 870190070557, de 24/07/2019, pág. 108/401
44/306 pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24.
Elementos de 3’ UTR derivados de ALB [0104] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene codificando Albumina de soro (ALB) ou um homólogo, variante ou fragmento da mesma.
[0105] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da Albumina do soro (ALB ou Albumina 7), preferivelmente de um gene da Albumina do Soro (ALB) de vertebrado, mais preferivelmente de um gene de Albumina do soro (ALB) de mamífero, sobretudo preferivelmente de um gene da Albumina do soro (ALB) de humano ou um homólogo, variante ou fragmento da mesma.
[0106] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de ALB, onde o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 35 ou um homólogo, variante ou fragmento da mesma, em particular de uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de
Petição 870190070557, de 24/07/2019, pág. 109/401
45/306 ácido nucleico de acordo com SEQ ID NO: 35, ou em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 36, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36.
Elementos de 3’-UTR derivados de RPS9 [0107] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene codificando a proteína ribossomal 40S S9 (RPS9)) ou um homólogo, variante ou fragmento da mesma.
[0108] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene da proteína ribossomal 40S S9 (RSPG ou RSP9.T), preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de vertebrado, mais preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de mamífero, sobretudo preferivelmente de um gene da proteína ribossomal 40S S9 (RPS9) de humano ou um homólogo, variante ou fragmento da mesma.
[0109] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de RPS9, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 33 ou
Petição 870190070557, de 24/07/2019, pág. 110/401
46/306 um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 33, ou em que o dito elemento de 5’ LJTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 34, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34.
Elementos de 3!-UTR derivados de COX6B1 [0110] Ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico que é derivada de uma 3’ UTR de um gene de COX6B1 ou um homólogo, variante ou fragmento da mesma. [0111] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de gene de COX6B1 (ou COX6B1.1), preferivelmente de um gene de COX6B1 de vertebrado, mais preferivelmente de um gene de COX6B1 de mamífero, sobretudo preferivelmente de um gene de COX6B1
Petição 870190070557, de 24/07/2019, pág. 111/401
47/306 humano ou um homólogo, variante ou fragmento da mesma.
[0112] Desta maneira, ácidos nuclelcos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de COX6B1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 27 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 28, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28.
Elementos de 3’~UTR derivados de NDUFA1 [0113] Ácidos nuclelcos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 3’ UTR de um gene de NDUFA1 ou um homólogo, variante ou fragmento da mesma.
Petição 870190070557, de 24/07/2019, pág. 112/401
48/306 [0114] Tais elementos de 3’ UTR compreendem ou consistem preferivelmente em uma sequência de ácido nucleico que é derivada da 3’ UTR de um gene de NDUFAL1 (ou Ndufa1.1), preferivelmente de um gene de NDUFA1 de vertebrado, mais preferivelmente de um gene de NDUFA1 de mamífero, sobretudo preferivelmente de um gene de NDUFA1 de humano ou um homólogo, variante ou fragmento da mesma.
[0115] Desta maneira, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de um gene de NDUFA1, em que o dito elemento de 3’ UTR compreende ou consiste em uma sequência de DNA de acordo com a SEQ ID NO: 31 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31, ou em que o dito elemento de 5’ UTR compreende ou consiste em uma sequência de RNA de acordo com a SEQ ID NO: 32, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ
Petição 870190070557, de 24/07/2019, pág. 113/401
49/306
ID NO: 32.
Combinações de UTR [0116] Preferivelmente, o pelo menos um elemento de 5’ UTR e o pelo menos um elemento de 3’ UTR agem sinergisticamente para aumentar a expressão da pelo menos uma sequência de codificação operavelmente ligada às ditas UTRs. É pretendido aqui utilizar as 5’-UTRs e 3’-UTRs mencionadas em qualquer combinação útil. 5’ e 3’-UTRs particularmente úteis são listadas na Tabela 1A abaixo. Combinações particularmente úteis de 5’ UTRs e 3’-UTRs são listadas na Tabela 1B abaixo. Modalidades particularmente preferidas da invenção compreendem a combinação das CDS de escolha, isto é, Cas9, Cpf1, CasX, CasY ou Cas13 com uma combinação de UTR selecionada do grupo de HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var/ albumina7; 32L4 / albumina7; HSD17B4/CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 /PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufa1.1; Nosip.1 / Ndufa1.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1; e Ubqln2.1 /RPS9.1.
Tabela 1A
Descrição Tipo de Sequência SEQ ID NO
HSD17B45-UTR DNA SEQ ID NO: 1
HSD17B45-UTR RNA SEQ ID NO: 2
ASAH1 5-UTR DNA SEQ ID NO: 3
ASAH1 5-UTR RNA SEQ ID NO: 4
ATP5A15-UTR DNA SEQ ID NO: 5
TP5A15-UTR RNA SEQ ID NO: 6
Mp68 5'-UTR DNA SEQ ID NO: 7
Mp68 5'-UTR RNA SEQ ID NO: 8
Ndufa4 5-UTR DNA SEQ ID NO: 9
Ndufa4 5-UTR RNA SEQ ID NO: 10
Petição 870190070557, de 24/07/2019, pág. 114/401
50/306
Tabela 1A -continuação-
Descrição Tipo de Sequência SEQ ID NO
Nosip 5’-UTR DNA SEQ ID NO: 11
Nosip 5’-UTR RNA SEQ ID NO: 12
Rpl31 5'-UTR DNA SEQ ID NO: 13
Rpl31 5'-UTR RNA SEQ ID NO: 14
Slc7a3 5-UTR DNA SEQ ID NO: 15
Slc7a3 5-UTR RNA SEQ ID NO: 16
TUBB4B 5-UTR DNA SEQ ID NO: 17
TUBB4B 5-UTR RNA SEQ ID NO: 18
Ubqln2 5S-UTR DNA SEQ ID NO: 19
Ubqln2 5S-UTR RNA SEQ ID NO: 20
RPL32 (32L4) 5'-UTR DNA SEQ ID NO: 21
RPL32 (32L4) 5'-UTR RNA SEQ ID NO: 22
PSMB3 3!-UTR DNA SEQ ID NO: 23
PSMB3 3-UTR RNA SEQ ID NO: 24
CASP13-UTR DNA SEQ ID NO: 25
CASP13-UTR RNA SEQ ID NO: 26
COX6B13-UTR DNA SEQ ID NO: 27
COX6B13-UTR RNA SEQ ID NO: 28
Gnas 3'-UTR DNA SEQ ID NO: 29
Gnas 3'-UTR RNA SEQ ID NO: 30
Ndufal 3-UTR DNA SEQ ID NO: 31
Ndufal 3-UTR RNA SEQ ID NO: 32
RPS9 3’-UTR DNA SEQ ID NO: 33
RPS9 3’-UTR RNA SEQ ID NO: 34
ALB7 3S-UTR DNA SEQ ID NO: 35
ALB7 3S-UTR RNA SEQ ID NO: 36
Petição 870190070557, de 24/07/2019, pág. 115/401
51/306
Tabela 1B: combinações de UTR úteis e construtos correspondentes
Combinação de UTR SEQ ID NOs
HSD17B4 / Gnas 413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 10402-10408; 10554; 10599-10612
Slc7a3/Gnas 414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626
ATP5A1 / CASP 415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640
Ndufa4 / PSMB3 416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654
HSD17B4 / PSMB3 417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436; 10558; 10655-10668
RPL32 / albumina 7 418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682
32L4 / aibumina 7 (Gen5, HSL PoliC) 419; 2426-2441; 3586-3601; 4746-4761; 5906-5921; 7066-7081; 8226-8241; 9386-9401; 10444-10450; 10560; 10683-10696
HSD17B4 / CASP1 420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710
Slc7a3 / CASP1 421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724
Slc7a3 / PSMB3 422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738
Nosip / PSMB3 423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 10472-10478; 10564; 10739-10752
Ndufa4 / RPS9 424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766
HSD17B4/RPS9 425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780
ATP5A1 / Gnas 9498- 9609; 10493-10499; 10567; 10781-10794
Ndufa4 / COX6B1 9610-9721; 10500-10506; 10568; 10795-10808
Ndufa4 / Gnas 9722-9833; 10507-10513; 10569; 10809-10822
Ndufa4 / Ndufal 9834-9945; 10514-10520; 10570; 10823-10836
Nosip / Ndufal 9946-10057; 10521-10527; 10571; 10837-10850
Rpl31 / Gnas 10058-10169; 10528-10534; 10572; 10851-10864
TUBB4B/RPS9 10170-10281; 10535-10541; 10573; 10865-10878
Ubqln2 / RPS9 10282-10393; 10542-10548; 10574; 10879-10892
Mp68 / Gnasl 14526;14533; 14540
Mp68 / Ndufal 14527;14534; 14541
Petição 870190070557, de 24/07/2019, pág. 116/401
52/306 [0117] Em algumas modalidades, o ácido nucleico artificial codificando uma proteína associada a CRISPR da invenção compreende pelo menos uma combinação de UTR selecionada do grupo consistindo em HSD17B4 / Gnas.1; Slc7a3.1 / Gnas.1; ATP5A1 / CASP.1; Ndufa4.1 / PSMB3.1; HSD17B4 / PSMB3.1; RPL32var / albumina7; 32L4 / albumina7; HSD17B4 / CASP1.1; Slc7a3.1 / CASP1.1; Slc7a3.1 /PSMB3.1; Nosip.1 / PSMB3.1; Ndufa4.1 / RPS9.1; HSD17B4 / RPS9.1; ATP5A1 / Gnas.1; Ndufa4.1 / COX6B1.1; Ndufa4.1 / Gnas.1; Ndufa4.1 / Ndufal .1; Nosip.1 / Ndufal.1; Rpl31.1 / Gnas.1; TUBB4B.1 / RPS9.1 ;Ubqln2.1 / RPS9.1; MP68 / Gnasl .1 e IVIP68 / Ndufal .1.
[0118] Em algumas modalidades, os ácidos nucleicos artificiais de acordo com a invenção compreendem pelo menos uma combinação de UTR selecionada das combinações de UTR reveladas no PCT/EP/2017/ 076775 em conexão com ácidos nucleicos artificiais codificando proteínas associadas a CRISPR, que é incorporado aqui a título de referência em sua totalidade. Desta maneira, em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem compreender pelo menos uma combinação de UTR selecionada do grupo consistindo em SLC7A3 / GNAS; ATP5A1 / CASP1; HSD17B4 / GNAS; NDUFA4 / COX6B1; NOSIP / NDUFA1, NDUFA4 / NDUFA1; ATP5A1 / GNAS; MP68 / NDUFA1; NDUFA4 / RPS9; NDUFA4 / GNAS; NDUFA4 / PSMB3; TUBB4B / RPS9.1; UQBLN2 / RPS9; RPL31 / GNAS) ou HSD17B4 / PSMB3.
[0119] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem então compreender ou consistir em uma sequência de ácido nucieico como revelado no PCT/EP2017/076775 em conexão com ácidos nucleicos artificiais codificando proteínas associadas a CRISPR.
[0120] Cada um dos elementos de UTR definidos na Tabela 1 em
Petição 870190070557, de 24/07/2019, pág. 117/401
53/306 referência a uma SEQ ID NO específica pode incluir variantes ou fragmentos das mesmas, exibindo pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com a respectiva sequência de ácido nucleico definida por referência à sua SEQ ID NO específica. A última coluna da Tabela 1 revela claramente todas as possíveis cds Cas9 e Cpf1 que podem ser combinadas com as combinações de UTR vantajosas específicas mostradas na coluna ”5’ UTR incl. SEQ ID NO: e coluna 3’ UTR incl. SEQ ID NO., isto é, as combinações como revelado são modalidades preferidas da invenção para um versado na técnica. Uma modalidade especificamente preferida assemelha uma sequência de Cas9 ou Cpf1 da invenção com 5’UTR SLC7A3 (SEQ ID NO: 15/16) ou uma sequência derivada da mesma e com 3’UTR GNAS (SEQ ID NO: 29/30) ou uma sequência derivada da mesma.
[0121] Para facilidade de referência, a Tabela A1 descreve combinações de CDS e UTR particularmente preferidas e vantajosas.
[0122] Cada uma das sequências identificadas na Tabela 1 com referência à sua SEQ ID NO específica pode ser também definida por sua sequência de DNA correspondente, como indicado aqui.
[0123] Cada uma das sequências identificadas na Tabela 1 com referência à sua SEQ ID NO específica pode ser modificada (opcionalmente independentemente uma da outra) como descrito abaixo.
[0124] Ácidos nucleicos artificiais preferidos de acordo com a invenção podem compreender
a. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou
Petição 870190070557, de 24/07/2019, pág. 118/401
54/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou
d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSSLC7A3MB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de um homólogo, um fragmento ou variante do mesmo; ou
g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou
Petição 870190070557, de 24/07/2019, pág. 119/401
55/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou
h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de um homólogo, um fragmento ou variante do mesmo; ou
i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de um homólogo, um fragmento ou variante do mesmo; ou
k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou
l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou
m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, fragmento ou uma
Petição 870190070557, de 24/07/2019, pág. 120/401
56/306 variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1 ou de um homólogo, um fragmento ou variante do mesmo; ou
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo; ou
p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo; ou
q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31 ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B ou de um homólogo, um fragmento ou
Petição 870190070557, de 24/07/2019, pág. 121/401
57/306 uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo; ou
s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou variante do mesmo;
t. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene ou de um homólogo, fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou variante do mesmo.
[0125] Ácidos nucleicos artificiais particularmente preferidos podem compreender uma combinação de UTRs de acordo com d, e, g ou I.
[0126] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção podem compreender um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de um homólogo, um fragmento ou uma variante do mesmo.
Sequência de codificação
Proteínas associadas a CRISPR [0127] O ácido nucleico artificial de acordo com a invenção compreende pelo menos uma sequência de codificação codificando uma proteína associada a CRISPR.
Petição 870190070557, de 24/07/2019, pág. 122/401
58/306 [0128] O termo proteína associada a CRISPR refere-se a endonucleases guiadas por RNA que são parte de um sistema CRISPR (Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas) (e seus homólogos, variantes, fragmentos ou derivados), que é usado por procarlontes para conferir imunidade adaptatlva contra elementos de DNA estranho. Proteínas associadas a CRISPR incluem, sem limitação, Cas9, Cpf1 (Cas12), C2c1, C2c3, C2c2, Cas13, CasX e CasY. Como aqui usado, o termo proteína associada a CRISPR inclui proteínas do tipo selvagem bem como homólogos, variantes, fragmentos e derivados dos mesmos. Desta maneira, quando se referindo a moléculas de ácido nucleico artificiais codificando Cas9, Cpf1 (Cas12), C2c1, C2c3, e C2c2, Cas13, CasX e CasY, as ditas moléculas de ácido nucleico artificiais podem codificar as respectivas proteínas do tipo selvagem ou homólogos, variantes, fragmentos e derivados das mesmas. [0129] Proteínas associadas a CRISPR podem ser codificadas por qualquer gene ou um homólogo, variante ou fragmento do mesmo. Quando se referindo a genes, o termo homólogo ou gene homólogo inclui genes ortólogos ou genes parálogos.
[0130] Proteínas associadas a CRISPR (e seus homólogos, variantes, fragmentos ou derivados) são preferivelmente funcionais, isto é, exibem propriedades biológicas desejadas, e/ou exercem funções biológicas desejadas. As ditas propriedades biológicas ou funções biológicas podem ser comparáveis ou até mesmo melhoradas comparado com a proteína de referência correspondente (ou parental). Proteínas associadas a CRISPR funcionais, e homólogos, variantes, fragmentos ou derivados das mesmas, preferivelmente retêm a habilidade em ser direcionadas por um RNA-gula para sequências de DNA de interesse de uma maneira específica de sequência. No entanto, a atividade de endonuclease (isto é, habilidade em introduzir DSBs na sequência de DNA de interesse) tipicamente exercida por proteínas associadas a CRISP do
Petição 870190070557, de 24/07/2019, pág. 123/401
59/306 tipo selvagem pode ser, mas não é necessariamente, retida em todos os homólogos, variantes, fragmentos e derivados funcionais de proteínas associadas a CRISPR como descrito aqui.
[0131] Especificamente, homólogos, variantes, fragmentos ou derivados funcionais são preferivelmente capazes de (1) interagir especificamente com uma sequência de DNA-alvo, (2) associação com um RNA-guia adequado e opcionalmente (3) reconhecimento de um motivo adjacente protoespaçador (PAM) que é justaposto à sequência de DNAalvo. Neste contexto, interagir com preferivelmente significa se ligar a, e opcionalmente (ainda) clivar (através de atividade de endonuclease ou nickase), ativar ou reprimir expressão e/ou recrutamento de efetores. Especificamente significa que a proteína associada a CRISPR interage com a sequência de DNA-alvo mais prontamente do que ela interage com outras sequências de DNA não alvo.
[0132] Quando se referindo a uma proteína associada a CRISP particular (tais como Casp9, Cpf1) aqui, a respectiva proteína deve ser entendida compreender todas as formas pós-traducionalmente modificadas da mesma. Modificações pós-traducionais (PTMs) podem resultar em modificações covalentes ou não covalentes de uma dada proteína. Modificações pós-traducionais comuns incluem glicosilação, fosforilação, ubiquitinação, S-nitrosiiação, metilação, N-acetilação, lipidação, formação de ligação dissulfeto, sulfação, acilação, desaminação, etc. PTMs diferentes pode resultar, por exemplo, em químicas, atividades, localizações, interações ou conformações diferentes. No entanto, todas proteínas associadas a CRISPR pós-traducionalmente modificadas previstas dentro do contexto da presente invenção preferivelmente permanecem funcionais, como definido acima.
Homólogos [0133] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente homólogos da
Petição 870190070557, de 24/07/2019, pág. 124/401
60/306 mesma. Quando se referindo a proteínas, o termo homólogo compreende ortólogos (ou proteínas hortólogas) e parálogos (ou proteínas parálogas). Neste contexto, ortólogos são proteínas codificadas por genes em espécies diferentes que se desenvolveram a partir de um gene ancestral comum através de especiação. Ortólogos frequentemente retêm a(s) mesma(s) função(ões) no curso de evolução. Desta maneira, funções podem ser perdidas ou ganhas quando comparando um par de ortólogos. No entanto, no contexto da presente invenção, proteínas associadas a CRISPR ortólogas preferivelmente retêm sua habilidade em se associar com um RNA-guia adequado para especificamente interagir com uma sequência de DNA de interesse (isto é, são funcionais). Parálogos são genes produzidos através de duplicação de gene dentro de um genoma. Parálogos tipicamente desenvolvem novas funções ou podem eventualmente se tornar pseudogenes. No contexto da presente invenção, proteínas associadas a CRISPR parálogas são preferivelmente funcionais, como acima definido.
Variantes [0134] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente variantes da mesma.
[0135] O termo variante como aqui usado com referência a proteínas preferivelmente refere-se a variantes de sequência, isto é, proteínas compreendendo uma sequência de aminoácido que difere em pelo menos um resíduo de aminoácido de uma sequência de aminoácido referência (ou de origem) de uma proteína de referência (ou de origem).
[0136] Proteínas variantes podem então preferivelmente compreender, em sua sequência de aminoácido, pelo menos uma mutação, substituição, inserção ou deleção de aminoácido comparado com sua respectiva sequência de referência. Substituições podem ser selecionadas
Petição 870190070557, de 24/07/2019, pág. 125/401
61/306 de substituições conservatives ou não conservatives. Em algumas modalidades, é preferido que uma variante de proteína codificada por pelo menos uma sequência de codificação do ácido nucleico artificial da invenção compreenda pelo menos uma substituição de aminoácido conservative, em que aminoácidos, tendo originado a partir da mesma classe, são trocados por outros. Em particular, esses são aminoácidos tendo cadeias laterais alifáticas, cadeias laterais positivamente ou negativamente carregadas, grupos aromáticos nas cadeias laterais ou aminoácidos, cujas cadeias laterais podem formar pontes de hidrogênio, por exemplo, cadeias laterais que têm uma função hidroxila. Através de constituição conservative, por exemplo, um aminoácido tendo uma cadeia lateral polar pode ser substituído por um outro aminoácido tendo uma cadeia lateral polar correspondente ou, por exemplo, um aminoácido caracterizado por uma cadeia lateral hidrofóbica pode ser substituído por um outro aminoácido tendo uma cadeia lateral hidrofóbica correspondente (por exemplo, serina (treonina) portreonina (serina) ou leucina (isoleucina) por isoleucina (leucina)).
[0137] Preferivelmente, o termo variante como usado aqui inclui variantes de ocorrência natural, por exemplo, preproteínas, proproteínas e proteínas associadas a CRISPR que foram submetidas a processamento proteolítico pós-traducional (isso pode envolver remoção da metionina N-terminal, peptídeo de sinal e/ou a conversão de uma proteína inativa ou não funcional em uma ativa ou funcional), e proteínas mutantes de ocorrência natural. O termo variante compreende ainda variantes engenheiradas de proteínas associadas a CRISPR, que podem ser modificadas (na sequência) para introduzir ou abolir uma certa propriedade e/ou funcionalidade biológica. Variantes de Cas9 engenheiradas são discutidas em detalhes abaixo. Os termos variantes de transcrito ou variantes unidas no contexto de proteína referem-se a variantes produzidas a partir de RNAs mensageiros que são inicialmente
Petição 870190070557, de 24/07/2019, pág. 126/401
62/306 transcritos a partir do mesmo gene, mas são subsequentemente submetidas à união alternativa (ou diferencial), em que exons particulares de um gene podem ser incluídos ou excluídos do mRNA mensageiro processado, final (mRNA). Variantes de transcrito de proteínas associadas a CRISPR, no entanto, preferivelmente retêm sua funcionalidade biológica desejada, como definido acima. Será notado que o termo variante pode ser essencialmente definido por meio de um grau mínimo de identidade de sequência (e preferivelmente também uma função/propriedades biológicas desejadas) comparado com uma proteína de referência. Desta maneira, homólogos, fragmentos ou certos derivados (que também diferem em termos de sua sequência de aminoácido da proteína de referência) podem ser classificados como variante também. Desta maneira, uma variante como definido aqui pode ser derivada de, isolada de, relacionada a, baseada em ou homóloga a uma proteína de referência, que pode ser uma proteína associada a CRISPR (tais como Cas9, Cpf1) como aqui definido ou um homólogo, fragmento, variante ou derivado da mesma.
[0138] Variantes de proteína associada a CRISPR (tais como Cas9, Cpf1) de acordo com a invenção têm preferivelmente uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, com uma sequência de aminoácido da respectiva proteína associada a CRISPR de ocorrência natural (tipo selvagem) (tais como Cas9, Cpf1) ou um homólogo, fragmento ou derivado da mesma.
Fragmentos [0139] Cada proteína associada a CRISPR exemplificada aqui (tais
Petição 870190070557, de 24/07/2019, pág. 127/401
63/306 como Cas9, Cpf1) compreende também preferivelmente fragmentos da mesma.
[0140] O termo fragmento refere-se a uma proteína ou poHpeptídeo que consiste em uma subsequência contínua da sequência de aminoácido de comprimento integral de uma proteína de referência (ou de origem) ou (poli) peptídeo, que é, com relação a esta sequência de aminoácido, N-terminalmente, C-terminalmente e/ou intrassequencialmente truncada comparado com a sequência de aminoácido da dita proteína de referência. Tal truncamento pode ocorrer ou no nível de aminoácido ou no nível de ácido nucleico, respectivamente. Em outras palavras, um fragmento pode tipicamente ser uma porção mais curta de uma sequência de comprimento integral de uma sequência de aminoácido. Desta maneira, um fragmento tipicamente consiste em uma sequência que é idêntica à extensão correspondente dentro da sequência de aminoácido de comprimento integral. O termo inclui fragmentos de ocorrência natural (tais fragmentos resultando de atividade de protease /n vivo de ocorrência natural) bem como fragmentos engenheirados.
[0141] O termo fragmento como aqui usado pode se referir a um peptídeo ou polipeptídeo compreendendo uma sequência de aminoácido de pelo menos 5 resíduos de aminoácido contíguos, pelo menos 10 resíduos de aminoácido contíguos, pelo menos 15 resíduos de aminoácido contíguos, pelo menos 20 resíduos de aminoácido contíguos, pelo menos 25 resíduos de aminoácido contíguos, pelo menos 40 resíduos de aminoácido contíguos, pelo menos 50 resíduos de aminoácido contíguos, pelo menos 60 resíduos de aminoácido contíguos, pelo menos 70 resíduos de aminoácido contíguos, pelo menos 80 resíduos de aminoácido contíguos, pelo menos 90 resíduos de aminoácido contíguos, pelo menos 100 resíduos de aminoácido contíguos, pelo menos 125 resíduos de aminoácido contíguos, pelo menos 150 resíduos de
Petição 870190070557, de 24/07/2019, pág. 128/401
64/306 aminoácido contíguos, pelo menos 175 resíduos de aminoácido contíguos, pelo menos 200 resíduos de aminoácido contíguo ou pelo menos 250 resíduos de aminoácido contíguos da sequência de aminoácido de uma proteína associada a CRISPR como aqui definido ou um homólogo, variante ou derivado da mesma.
[0142] Um fragmento preferido de uma sequência no contexto da presente invenção consiste em uma extensão contínua de aminoácidos correspondendo a uma extensão contínua de entidades na proteína cujo fragmento é derivado, que representa pelo menos 20%, preferivelmente pelo menos 30%, mais preferivelmente pelo menos 40%, mais preferivelmente pelo menos 50%, ainda mais preferivelmente pelo menos 60%, ainda mais preferivelmente pelo menos 70% e sobretudo preferivelmente pelo menos 80% da proteína total (isto é, comprimento total) ou (poli-)peptídeo do qual o fragmento é derivado.
[0143] Uma identidade de sequência indicada com relação a tal fragmento refere-se preferivelmente à sequência de aminoácido inteira da proteína de referência ou à sequência de ácido nucleico inteira codificando a dita proteína de referência. Preferivelmente, um fragmento de uma proteína associada a CRISPR (tais como Cas9 ou Cpf1), ou um homólogo, variante ou derivado da mesma, pode compreender tipicamente uma sequência de aminoácido tendo uma identidade de sequência de pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, com a sequência de aminoácido da dita proteína associada a CRISPR (por exemplo, Cas9, Cpf1) ou dito homólogo, variante ou derivado.
Petição 870190070557, de 24/07/2019, pág. 129/401
65/306
Derivados [0144] Cada proteína associada a CRISPR exemplificada aqui (tais como Cas9, Cpf1) compreende também preferivelmente derivados da mesma.
[0145] O termo derivado, quando se referindo a proteínas, deve ser compreendido como uma proteína que foi modificada com relação a uma proteína de referência (ou parental) para incluir uma propriedade ou funcionalidade nova ou adicional. Derivados podem ser modificados para compreender funcionalidades biológicas desejadas (por exemplo, através da introdução ou remoção de porções ou domínios que conferem, melhoram, reduzem ou abolem afinidade ou especificidade de ligação-alvo ou atividades enzimáticas), propriedades de fabricação (por exemplo, através da introdução de porções que conferem uma solubiiidade aumentada ou excreção melhorada ou permitem purificação) ou propriedades farmacocinéticas/farmacodinâmicas para uso médico (por exemplo, através da introdução de porções que conferem estabilidade, biodisponibilidade, absorção aumentadas; distribuição e/ou eliminação reduzida). Derivados podem ser preparados através da introdução ou remoção de uma porção ou domínio que confere uma propriedade ou funcionalidade biológica de interesse. Tais porções ou domínios podem ser introduzidos na sequência de aminoácido (por exemplo, nos resíduos amino e/ou carboxila terminais) pós-traducionalmente ou no nível de sequência de ácido nucleico usando técnicas de engenharia genética padrão (cf. Sambrook, J. e outros, 2012 (4a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York). Um derivado pode ser derivado de (e então opcionalmente inclui) a sequência de proteína associada a CRISPR de ocorrência natural (tipo selvagem) ou uma variante ou segmento da mesma.
[0146] Será compreendido que derivados de proteína associada a
Petição 870190070557, de 24/07/2019, pág. 130/401
66/306
CRISPR podem diferir (por exemplo, por meio de introdução ou remoção de porções de (poli)peptídeo e/ou domínios de proteína) em sua sequência de aminoácido da proteína de referência da qual eles são derivados, e então podem se qualificar como variantes também. No entanto, embora variantes de sequência sejam principalmente definidas em termos de sua identidade de sequência com uma sequência de aminoácido de referência, derivados são preferivelmente caracterizados pela presença ou ausência de uma propriedade ou funcionalidade biológica específica comparado com a proteína de referência.
[0147] Muitos derivados de proteína associada a CRISPR são baseados em variantes, fragmentos, variantes de fragmento ou fragmentos variantes das respectivas proteínas associadas a CRISPR de ocorrência natural (tipo selvagem). Por exemplo, derivados de proteína associada a CRISPR de acordo com a invenção podem incluir derivados baseados em variantes de proteína engenheirados compreendendo mutações que abolem atividade de endonuclease e/ou nickase, que foram engenheirados mais para incluir domínios efetores e adaptadores conferindo propriedades ou funcionalidades biológicas novas ou adicionais. [0148] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção então codifica um derivado de proteína associada a CRISPR (por exemplo, Cas9, Cpf1) como aqui definido, em que o dito derivado compreende pelo menos um domínio efetor adicional.
[0149] Um domínio efetor deve ser compreendido como uma porção de proteína que confere uma propriedade e/ou funcionalidade biológica adicional e/ou nova. No contexto da presente invenção, domínios efetores podem ser selecionados com base em sua capacidade de conferir uma função biológica (nova ou adicional) à proteína associada a CRISPR, preferivelmente sem interferir com sua habilidade em se associar com um RNA-guia adequado para especificamente interagir com uma sequência de DNA-alvo. A função biológica nova ou adicional pode
Petição 870190070557, de 24/07/2019, pág. 131/401
67/306 ser, por exemplo, repressão (indução de interferência de CRISPR, CRISPRi) ou ativação transcripcional (indução de ativação de CRISPR, CRISPRa). Domínios efetores de interesse no contexto da presente invenção podem então ser selecionados para domínios repressores transcripcionais, domínios box associados a Krüppel (KRAB), domínios de proteína de interação MAX 1 (MXI1), quatro domínios mSin3 concatenados (SID4X) ou domínios de ativação de transcrição, incluindo domínios de ativação VP16 do herpes simplex (VP64 ou VP160), domínio de ativação de subunidade de transativação de fator-κΒ (NF-κΒ) (p65AD). Tal(ais) domínio(s) efetor(es) pode(m) serfundido(s) a qualquer terminal amino (N-) ou carboxila (C-) da proteína associada a CRISP, ou ambos. Com domínios efetores adequados, transcrição pode ser também regulada no nível epigenético. Histona desmetilase LSD1 remove a marca de desmetilação de histona 3 em Lys4 (H3K4me2) dos potencializadores distais direcionados, levando à repressão de transcrição. O núcleo catalítico da histona acetiltransferase p300 (p300Núcleo) pode acetilar H3K27 (H3K27ac) em potencializadores proximais e distais direcionados, o que leva à ativação de transcrição. A funcionalidade biológica nova ou adicional pode, ainda ou alternativamente, ser o recrutamento de domínios efetores de interesse. Para esta finalidade, o domínio efetor pode ser um domínio de recrutamento”, preferivelmente um domínio ou motivo de interação proteína-proteína, tais como motivos WRPW (TrpArg-Pro-Trp) (Fisher e outros. Mol Cell Biol. 1996 Jun; 16(6):2670-7). A função biológica nova ou adicional pode, ainda ou alternativamente, ser o recrutamento de outras entidades de interesse, tais como RNAs. Para esta finalidade, o domínio efetor pode ser selecionado de domínios de interação de proteína-RNA, tal como domínio de choque térmico (CSD). [0150] Derivados de proteína associada a CRISPR compreendendo um domínio efetor então incluem (a) proteínas associadas a CRISPR
Petição 870190070557, de 24/07/2019, pág. 132/401
68/306 (ou homólogos, variantes, fragmentos das mesmas) que são diretamente fundidas (opcionalmente através de um ligante adequado) domínios efetores capazes de interagir com a sequência de DNA-alvo (ou elementos reguladores operavelmente ligados à mesma) e (b) proteínas associadas a CRISPR (ou homólogos, variantes, fragmentos das mesmas) que são fundidas a (opcionalmente através de um ligante adequado) domínios efetores que recrutam efetores adicionais (domínios, proteínas ou ácidos nucleicos) de interesse, que são, por sua vez, capazes de interagir com a sequência de DNA-alvo (ou elementos reguladores operavelmente ligados à mesma).
[0151] Domínios efetores podem ser fundidos a proteínas associadas a CRISPR (ou variantes ou fragmentos das mesmas), opcionalmente através de um ligante adequado (peptídeo), usando técnicas padrão de engenharia genética (cf. Sambrook, J. e outros., 2012 (4a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York).
[0152] Ligantes peptídicos de interesse são geralmente conhecidos na técnica e podem ser classificados em três tipos: ligantes flexíveis, ligantes rígidos e ligantes clivávels. Ligantes flexíveis são geralmente aplicados quando os domínios unidos requerem um certo grau de movimento ou interação, e são então de interesse particular no contexto de derivados de proteína associada a CRISPR da presente invenção. Eles são geralmente ricos em aminoácidos pequenos, não polares (por exemplo, Gly) ou polares (por exemplo, Ser ou Thr) para prover flexibilidade e solubilidade bodas, e permitir a mobilidade dos domínios de proteína conectados. A incorporação de Ser ou Thr pode manter a estabilidade do ligante em soluções aquosas através de formação de ligações hidrogênio com moléculas de água, e então reduzir interações desfavoráveis entre o ligante e as porções de proteína.
Petição 870190070557, de 24/07/2019, pág. 133/401
69/306 [0153] Os ligantes flexíveis mais comumente usados têm sequências consistindo principalmente em extensões de resíduos Gly e Ser (ligante !'GS). Um exemplo do ligante flexível mais amplamente usado tem a sequência de (Gly-Gly-Gly-Gly-Ser)n. Ao ajustar o número de cópia η, o comprimento deste ligante GS pode ser otimizado para obter separação apropriada dos domínios de proteína, ou manter as interações interdomínio necessárias. Além dos ligantes GS, muitos outros ligantes flexíveis foram projetados para proteínas de fusão recombinantes. Esses ligantes flexíveis são também ricos em aminoácidos pequenos ou polares tais como Gly e Ser, mas podem conter aminoácidos adicionais tais como Thr e Ala para manter flexibilidade, bem como aminoácidos polares tais como Lys e Glu para melhorar a solubilidade.
[0154] Vários outros tipos de ligantes flexíveis, incluindo KESGSVSSEQLAQFRSLD, EGKSSGSGSESKST e GSAGSAAGSGEF, foram aplicados para a construção de proteínas de fusão. Outros ligantes flexíveis incluem ligantes apenas de glicina (Gly)s ou (Gly)e.
[0155] Ligantes rígidos podem ser empregados quando separação dos domínios de proteína e redução de sua interferência tiverem que ser assegurados. Ligantes cliváveis, por outro lado, podem ser introduzidos para liberar domínios funcionais livres in vivo. Chen e outros, Adv Drug Deliv Rev. 2013 Out 15; 65(10): 1357-1369, revisam os ligantes peptídicos mais comumente usados e suas aplicações, e é aqui incorporado a título de referência em sua totalidade.
[0156] Além da fusão dos domínios efetores desejados à proteína associada a CRISP, há várias abordagens alternativas para mediação de um efeito biológico desejado sobre uma sequência-alvo de interesse. Essas abordagens utilizam essencialmente proteínas associadas a CRISPR (ou RNAs-guia) que são capazes de recrutar domínios efetores de interesse para a sequência de DNA-alvo. Essas abordagens podem prover opções adicionais e flexibilidade para recrutamento multiplex de
Petição 870190070557, de 24/07/2019, pág. 134/401
70/306 domínios efetores para uma sequência de DNA-aivo específica de interesse (tal como um promotor ou potencializador).
[0157] O método de ativação SunTag usa uma disposição de marcadores de epítopo de peptídeo pequenos fundidos a uma proteína associada a CRISP (por exemplo, dCas9) para recrutar cópias múltiplas de fragmento variável de cadeia simples (scFv) fundido à GFP super dobradora (sfGFP); para melhoria da dobra de proteína), fundido a (um) domínio(s) efetor(es), por exemplo, VP64. O método de ativação tripartido sinérgico (VPR) usa uma fusão em tandem de três domínios efetores (por exemplo, ativadores de transcrição, VP64, p65 e o transativador R do vírus Epstein-Barr (Rta)), para conferir a funcionalidade biológica desejada. O sistema de recrutamento à base de aptâmero (mediador de ativação sinérgico (SAM)) utiliza uma proteína associada a CRISPR (por exemplo, dCas9) com um RNA-guia com dois sítios de ligação (por exemplo, aptâmeros de RNA no tetraloop e o segundo tronco-aiça) para recrutar a proteína de revestimento MS2 de fago (MCP) que é fundida aos domínios efetores (por exemplo, ativadores transcripcionais, tais como p65 e fator de choque térmico 1 (HSF1)). Ainda, domínios efetores adicionais (por exemplo, VP64) podem ser fundidos à proteína associada a CRISPR, provendo um derivado de acordo com a presente invenção.
[0158] Os métodos de ativação descritos acima podem ser prontamente adaptados para conferir função de repressão transcripcional, ou outras funcionalidades biológicas desejadas, às proteínas associadas a CRISPR ou seus homólogos, variantes, fragmentos ou derivados como descrito aqui. Derivados de proteína associada a CRISPR e várias abordagens para mediação de CRISPRa e CRISPR! são revistos em Dominguez e outros, Nat Rev Mol Ceil Biol. 2016 Jan;17(1):5-15, que é aqui incorporado a título de referência em sua totalidade.
Petição 870190070557, de 24/07/2019, pág. 135/401
71/306
Peptídeos de Sinal [0159] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção compreende pelo menos uma sequência de ácido nucleico codificando peptídeo de sinal. A dita sequência de ácido nucleico está preferivelmente localizada dentro da região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos um peptídeo de sinal.
[0160] Um peptídeo de sinal (algumas vezes referido como sequência de sinal, sinal de direcionamento, sinal de localização, sequência de localização, peptídeo de trânsito, sequência líder ou peptídeo líder) é tipicamente um peptídeo curto (5-30 aminoácidos de comprimento) preferivelmente localizado no terminal N da proteína associada a CRISPR codificada (ou um homólogo, variante, fragmento ou um derivado da mesma).
[0161] Peptídeos de sinal preferivelmente fazem a mediação do transporte da proteína associada a CRISPR codificada (ou um homólogo, variante, fragmento ou derivado da mesma) para um compartimento celular definido, por exemplo, a superfície celular, o retículo en~ doplásmico (ER) ou o compartimento endossomal-lisossomal. Peptídeos de sinal são então inter alia úteis a fim de facilitar a excreção de proteínas expressas de uma linhagem de célula de produção.
[0162] Peptídeos de sinal exemplares compreendidos no contexto da presente invenção incluem, sem ser limitado aos mesmos, sequências de sinal de moléculas do MHC clássicas ou não classificas (por exemplo, sequências de sinal de moléculas do MHC I e II, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 136/401
72/306 da molécula do MHC classe I HLA-A*0201), sequências de sinal de citocinas ou imunoglobulinas, sequências de sinal da cadeia invariante de imunoglobulinas ou anticorpos, sequências de sinal de Lampl, Tapasina, Erp57, Calreticulina, Calnexina, PLAT, EPO ou albumina e ainda proteínas associadas à membrana ou de proteínas associadas com o retículo endoplásmico (ER) ou o compartimento endossomal-lisossomal. Sobretudo preferivelmente, sequências de sinal são derivadas de HLA-A2 (humana), PLAT (humana), sEPO (humana), ALB (humana), IgE-líder (humana), CD5 (humana), IL 2 (humana), CTRB2 (humana), IgG-HC (humana), Ig-HC (humana), Ig-LC (humana), GpLuc, Igkappa (humana) ou um fragmento ou variante de qualquer uma das proteínas mencionadas acima, em particular HLA-A2, HsPLAT, sHsEPO, HsALB, HsPLAT(aa1-21), HsPLAT(aa1-22), IgE-líder, HsCD5(aa1-24), HslL2 (aa1-20), HsCTRB2(aa1-18), lgG-HC(aa1-19), lg-HC(aa1-19), Ig-LC (aa1-19), GpLuc(1-17) ou Mmlgkappa. A presente invenção compreende o uso das sequências de sinal mencionadas acima, ou variantes ou fragmentos das mesmas, contanto que essas variantes ou fragmentos sejam funcionais, isto é, capazes de direcionamento da proteína associada a CRISPR a um local (intra- ou extra)celular de interesse.
[0163] A sequência de ácido nucleico codificando o dito peptídeo de sinal é preferivelmente fundida à sequência de ácido nucleico codificando a proteína associada à CRISPR (ou seu homólogo, variante, fragmento ou derivado) na região de codificação do ácido nucleico artificial da invenção através de técnicas de engenharia genética padrão (cf. Sambrook, J. e outros, 2012 (4a ed.), Molecular cloning: a laboratory manual. Cold Spring Harbor Laboratory, Cold Spring Harbor, Nova York). Expressão da dita região de codificação fornece preferivelmente uma proteína associada a CRISPR compreendendo (preferivelmente em seu terminal N, terminal C ou ambos), o peptídeo de sinal codificado.
Petição 870190070557, de 24/07/2019, pág. 137/401
73/306
Sequência de localização nuclear (NLS) [0164] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender ainda preferivelmente uma sequência de ácido nucleico codificando pelo menos uma sequência de localização nuclear (NLS). A dita sequência de ácido nucleico está preferivelmente localizada na região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos uma sequência de localização nuclear (NLS).
[0165] Um sinal ou sequência de localização nuclear (NLS) é uma extensão curta de aminoácidos que faz a mediação do transporte de proteínas nucleares para o núcleo. Uma proteína associada a CRISPR codificada pelo ácido nucleico artificial da invenção é particularmente pretendida para terapia e pesquisa em células de mamífero, elas podem ser dotadas de pelo menos uma NLS a fim de permitir sua importação para o núcleo onde elas podem exercer seus efeitos sobre DNA genômico, a NLS preferivelmente interage com complexos de poro nuclear (NPCs) no envelope do núcleo, desta maneira facilitando o transporte da proteína associada a CRISPR para o núcleo.
[0166] Uma variedade de sequências de NLS é conhecida na técnica, e seu uso (ou adaptação para uso) de acordo com a presente invenção está dentro das habilidades e conhecimentos comuns do versado na técnica. O melhor sinal de transporte caracterizado é a NLS clássica (cNLS) para importação de proteína nuclear, que consiste em ou uma (monopartida) ou duas (bipartidas) extensões de aminoácidos básicos. Tipicamente, o motivo monopartido é caracterizado por um agrupamento de resíduos básicos precedidos por um resíduo de quebra
Petição 870190070557, de 24/07/2019, pág. 138/401
74/306 de hélice. Similarmente, o motivo bipartido consiste em dois agrupamentos de resíduos básicos separados por 9-12 resíduos. cNLSs monopartidas são exemplificadas pela NLS de antígeno T grande SV40 (126PKKKRRV132; SEQ ID NO: 381) e cNLSs bipartidas são exemplificadas pela NLS de nucleoplasmina (155KRPAATKKAGQAKKKK170; SEQ ID NO: 382). Resíduos consecutivos da lisina N~terminal da NLS monopartida são referidos como P1, P2, etc. cNLS monopartidas requerem tipicamente uma lisina na posição P1, seguido por resíduos básicos nas posições P2 e P4 para prover uma sequência de consenso livre K(K/R)X(K/R) (SEQ ID NO: 384; Lange e outros, J. Biol. Chem. 2007 Fev 23; 282(8): 5101-5105).
[0167] É desta maneira pretendido, de acordo com modalidades preferidas, que a molécula de ácido nucleico artificial compreenda ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS). A molécula de ácido nucleico artificial de acordo com a invenção pode então codificar 1, 2, 3, 4, 5 ou mais NLS, que são opcionalmente selecionadas da NLS exemplificada aqui. A dita sequência de ácido nucleico de codificação de NLS está preferivelmente localizada na região de codificação do ácido nucleico artificial da invenção e é preferivelmente fundido à sequência de ácido nucleico codificando a proteína associada a CRISPR, de modo que expressão da dita região de codificação provê uma proteína associada a CRISPR compreendendo a dita pelo menos uma NLS, preferivelmente em seu terminal N, terminal C ou ambos. Em outras palavras, a molécula de ácido nucleico artificial de acordo com a invenção pode preferivelmente codificar uma proteína associada a CRISPR compreendendo pelo menos uma NLS, preferivelmente em seu terminal N, terminal C ou ambos.
[0168] Uma NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de
Petição 870190070557, de 24/07/2019, pág. 139/401
75/306 acordo com a SEQ ID NO: 426 (MAPKKKRKVGIHGVPAA), também referida aqui como NLS2, que pode ser codificada por uma sequência de ácido nucleico de acordo com qualquer uma da SEQ ID NOs: 409; 2538, 1378; 3698; 4858; 6018; 7178; ou 8338, ou uma variante ou fragmento (funcional) de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende o uso de variantes ou fragmentos de NSL2, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com a SEQ ID NO: 426.
[0169] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 427 (KRPAATKKAGQAKKKK), também referida aqui como NLS4, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539; 1379; 3699; 4859;
Petição 870190070557, de 24/07/2019, pág. 140/401
76/306
6019; 7179; 8339, ou uma variante ou fragmento (funcional) de quaiquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende ainda o uso de variantes ou fragmentos de NSL4, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com SEQ ID NO: 427.
[0170] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 427 (KRPAATKKAGQAKKKK), também referida aqui como NLS4, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539; 1379; 3699; 4859; 6019; 7179; 8339, ou uma variante ou fragmento (funcional) de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%,
Petição 870190070557, de 24/07/2019, pág. 141/401
77/306
30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende ainda o uso de variantes ou fragmentos de NSL4, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com SEQ ID NO: 427.
[0171] É ainda compreendido aqui equipar a proteína associada a CRISPR com duas ou mais NLSs, e essas NLSs podem, por exemplo, ser selecionadas de NLS2 (caracterizada por SEQ ID NO: 426) e NLS4 (caracterizada por SEQ ID NO: 427) ou uma variante ou fragmento funcional de um ou ambos esses sinais de localização nuclear.
[0172] Uma outra NLS adequada de acordo com a presente invenção pode compreender ou consistir em uma sequência de aminoácido de acordo com SEQ ID NO: 10575 (KRPAATKKAGQAKKKK), também referida aqui como NLS3, que pode ser codificada por uma sequência de ácido nucleico de acordo com SEQ ID NO: 410; 2539 1379; 3699; 4859; 6019; 7179; 8339, 10551; 10581, 10593; 10584; 10587; 10590;
Petição 870190070557, de 24/07/2019, pág. 142/401
78/306
10593; 10596, ou uma variante ou fragmento (funcional) da mesma de qualquer uma dessas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. A presente invenção compreende o uso de variantes ou fragmentos de NLS3, contanto que essas variantes e fragmentos sejam preferivelmente funcionais, isto é, capazes de mediar importação da proteína associada a CRISPR para o núcleo. Tais variantes ou fragmentos funcionais podem compreender ou consistir em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com uma sequência de aminoácido de acordo com a SEQ ID NO: 427.
[0173] Desta maneira, sequências de NLS preferidas podem compreender ou consistir em uma sequência de aminoácido de acordo com as SEQ ID NO:426; 427; 10575; 381; 382; 384; 11957; 11958-11964 que podem ser codificadas por uma sequência de ácido nucleico de acordo com 409; 2538; 410; 2539: 10551; 10581; 11973; 11974-1198, 1378; 3698; 4858; 6018; 7178; 8338: 1379; 3699; 4859; 6019: 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005: 12013; 11966-11972; 11982-11988; 11990
Petição 870190070557, de 24/07/2019, pág. 143/401
79/306
11996; 11998-12004; 12006-12012; ou 12014-12020.
[0174] NLS preferidas adicionais podem compreender ou consistir em uma sequência de aminoácido de acordo com as SEQ ID NOs: 12021-14274.
[0175] As sequências de NLS como acima descrito são uma lista não iimitante de NLS geralmente usadas e aceitas. É compreendido que qualquer uma das enzimas de edição de gene mencionadas aqui, por exemplo, Cas9 ou Cpf1, pode ser combinada com qualquer outra NLS como conhecido na técnica e com qualquer número de sequências de NLS em uma sequência. Também combinações de sequências de NLS diferentes são convertidas pela descrição da invenção acima.
[0176] Também estão compreendidas no ensinamento da invenção sequências codificando uma proteína de edição de gene como revelado aqui ou na listagem de sequências compreendendo qualquer NLS como aqui revelado ou conhecido na técnica em qualquer número e/ou combinação de NLS (isto é, 573’ NLS).
Marcadores de proteína e peptídeo [0177] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção compreende ainda pelo menos uma sequência de ácido nucleico codificando marcador de proteína ou peptídeo. A dita sequência de ácido nucleico está preferivelmente localizada dentro da região de codificação (codificando a proteína associada a CRISPR) da molécula de ácido nucleico artificial da invenção. Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode compreender preferivelmente uma região de codificação codificando uma proteína associada a CRISPR como aqui definido, ou um homólogo, variante, fragmento ou derivado da mesma, compreendendo pelo menos um marcador de proteína ou peptídeo.
[0178] Marcadores de proteína e peptídeo são sequências de ami
Petição 870190070557, de 24/07/2019, pág. 144/401
80/306 noácido que podem ser introduzidas em proteínas de interesse para permitir purificação, detecção, localização ou para outros propósitos. Marcadores de proteína e peptídeo podem ser classificados com base em sua função e incluem, sem limitação, marcadores de afinidade (tal como proteína de ligação à quitina (CBP), proteína de ligação à maltose (MBP), glutationa-S-transferase (GST), marcadores de poli(His), marcadores de Fc, marcadores de Strep), marcadores de solubílização (tais como tiorredoxina (TRX) e poli(NANP)), marcadores de cromatografia (tais como marcadores de FLAG), marcadores de epítopo (marcador de V5, marcador de Myc, marcador de HA e marcador de NE), marcadores fluorescentes (tais como marcadores de GFP) ou outros (marcador de Av, permite biotinilação e subsequente isolamento).
[0179] A molécula de ácido nucleico artificial de acordo com a invenção pode então codificar 1,2, 3,4,5 ou mais marcadores de proteína ou peptídeo, que são opcionalmente selecionados dos marcadores de proteína exemplificados aqui. A dita sequência de ácido nucleico codificando marcador de proteína ou peptídeo está preferivelmente localizada na região de codificação da molécula de ácido nucleico artificial da invenção, e é preferivelmente fundida à sequência de ácido nucleico codificando a proteína associada a CRISPR, de modo que expressão da dita região de codificação provê uma proteína associada a CRISPR compreendendo o dito pelo menos um marcador de proteína ou peptídeo. Em outras palavras, a molécula de ácido nucleico artificial de acordo com a invenção pode preferivelmente codificar uma proteína associada a CRISPR compreendendo pelo menos um marcador de proteína ou peptídeo. Meios e métodos para introdução de ácidos nucleicos codificando tais marcadores de proteína ou peptídeo estão dentro das habilidades e conhecimento comum do versado na técnica.
[0180] A molécula de ácido nucleico artificial, preferivelmente RNA, da presente invenção pode codificar uma proteína associada a CRISPR
Petição 870190070557, de 24/07/2019, pág. 145/401
81/306 (tal como cas9, Cpf1) exibindo qualquer um dos traços ou características acima, se adequado ou necessário, em qualquer combinação umas com as outras, contanto que os traços ou características não interfiram uns com os outros. Desta maneira, a molécula de ácido nucleico artificial, em particular RNA, pode codificar qualquer proteína associada a CRISPR exemplificada aqui, ou um homólogo, variante, fragmento ou derivado da mesma, como aqui definido, que pode compreender uma ou mais NLSs, e opcionalmente uma ou mais sequências de sinal e/ou marcadores de proteína ou peptídeo, contanto que a proteína associada a CRISPR codificada (e a NLS, sequência de sinal, marcador de proteína/peptídeo) preferivelmente retenha sua função ou propriedade biológica desejada, como acima definido.
[0181] Também estão compreendidas nos ensinamentos da invenção todas as sequências tendo um marcador de proteína ou peptídeo sem a(s) dita(s) sequência(s) de marcador que foi(foram) introduzida(s) para purificação, detecção, localização ou para outros propósitos. Em outras palavras, uma sequência que é revelada na listagem de sequência com um marcador de proteína ou peptídeo é também claramente compreendida nos ensinamentos da invenção quando a sequência de marcador é removida. Um versado na técnica é prontamente capaz de remover qualquer sequência de marcador de uma sequência de proteína marcada, isto é, usar também as sequências da invenção em uma forma não marcada. O mesmo é verdadeiro para sequências de troncoalça de PolyC e histona que poderíam ser facilmente removidas da ou também adicionadas à proteína, se desejado.
Cas9 [0182] Cas9 refere-se a endonucleases de DNA CRISPR-Cas Tipo II guiadas por RNA, que podem ser codificadas pelo gene cas9 de Streptococcus pyogenes sorotipo M1 (Sequência de Referência NCBI: NCJ002737.2, SPy1046; S. pyogenes) i.e. spCas9, ou um homólogo,
Petição 870190070557, de 24/07/2019, pág. 146/401
82/306 variante ou fragmento da mesma. Cas9 pode ser preferivelmente recrutada por um RNA-guia (gRNA) para clivar, especificamente de sítio, uma sequência de DNA-alvo usando dois domínios de endonuclease distintos (domínios tipo H de HNH e RuVC/RNase), um para cada filamento da hélice dupla do DNA. RuvC e HNH juntos produzem quebras de filamento duplo (DSBs), e podem produzir separadamente quebras de filamento simples (Pedido de Patente Publicado U.S. No.2014-0068797 e Jinek M. e outros, Science. 2012 Ago 17;337(6096):816-21). Cas9 é preferivelmente capaz de reconhecer especificamente (e preferivelmente se ligar a) um motivo adjacente protoespaçador (RAM) justaposto à sequência de DNA-alvo. O RAM está tipicamente localizado na 3’ do DNAalvo e pode compreender ou consistir na sequência de três nucleotídeos NGG. Ele é tipicamente reconhecido pelo domínio de interação de PAM (domínio PI) localizado próximo do terminal C de Cas9.
[0183] Um grande número de proteínas Cas9 é conhecido na técnica e compreendido como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cas9 adequadas são listadas na Tabela 2 abaixo. Nela, cada fileira corresponde a uma proteína Cas9 como identificado pelo número de acesso do banco de dados da proteína correspondente (primeira coluna, A, No. Ac). A segunda coluna na Tabela 2 (B) indica a SEQ ID NO: correspondendo à respectiva sequência de aminoácido como provido aqui. Proteínas Cas9 preferidas são mostradas na listagem de sequência sob SEQ ID NO:428-441; SEQ ID NO: 10999-11001; e SEQ ID NO:442-1345. As sequências de mRNA otimizadas correspondentes que são modalidade preferida da invenção são mostradas na listagem de sequência sob SEQ ID NO:411; 25402553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 1147311475; 11591-11593; 11709-11711; 11827-11829: 11945-11947; 13942297; 3714-4617; 4874-5777; 6034-6937; 7194-8097; e 8354-9257.
Petição 870190070557, de 24/07/2019, pág. 147/401
83/306
Sequências de Aminoácido
Tabela 2. Proteínas Cas9 da invenção
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
1 Q99ZW2 Cas9_Q99ZW2_prot 428
2 A0Q5Y3 Cas9_A0Q5Y3__prot 429
3 J7RUA5 Cas9_J7RLJA5_prot 430
4 G3ECR1 Cas9j33ECR1_prot 431
5 J3F2B0 Cas9_J3F2B0__prot 432
6 Q03JI6 Cas9__Q03JI6___prot 433
7 C9X1G5 Cas9__C9X1 G5_prot 434
8 Q927P4 Cas9__Q927P4__prot 435
9 Q8DTE3 Cas9_Q8DTE3__prot 436
10 Q9CLT2 Cas9___Q9CLT2___prot 437
11 A1IQ68 Cas9_A1 IQ68__prot 438
12 Q6NKI3 Cas9_Q6NKI3__prot 439
13 Q0P897 Cas9__Q0P897_prot 440
14 Q03LF7 Cas9__Q03LF7___prot 441
15 T0TDV9 Cas9__T0TDV9_prot 442
16 A0A0D8BYB2 Cas9__A0A0D8BYB2__prot 443
17 A0A0M4TTU2 Cas9_A0A0M4TTU2„prot 444
18 A7H5P1 Cas9_A7H5P1__prot 445
19 A0A0W8KZ82 Cas9_A0A0W8KZ82_prot 446
20 A0A0E1ZMQ3 Cas9_A0A0E1ZMQ3_prot 447
21 W8KE67 Cas9_W8KE67_prot 448
22 A0A0B6V308 Cas9__A0A0B6V308_prot 449
23 A0A1E7PM50 Cas9_A0A1 E7PM50_prot 450
24 A0A1E7P6J5 Cas9_A0A1 E7P6J5...prot 451
25 A0A1D9BML5 Cas9_A0A1 D9BML5_prot 452
26 A5KEK9 Cas9_A5KEK9__prot 453
27 D2MWB9 Cas9__D2MWB9__prot 454
28 A0A0H4KTI1 Cas9_A0A0H4KTI 1„.prot 455
29 A0A0D7V4T2 Cas9..A0A0D7V4T2....prot 456
30 A0A059HXJ1 Cas9_A0A059HXJ1_prot 457
Petição 870190070557, de 24/07/2019, pág. 148/401
84/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
31 A0A1E7NYV5 Cas9__A0A1 E7NYV5„prot 458
32 A0A1E7P943 Cas9„ A0A1 E7P943_prot 459
33 A0A0E2UY67 Cas9__A0A0E2UY67_prot 460
34 A0A1B3X857 Cas9__A0A1 B3X857__prot 461
35 A0A0E9LLC5 Cas9.,A0A0E9LLC5....prot 462
36 A0A125S8M1 Cas9_A0A125S8M1__prot 463
37 A0A0S8HUJ8 Cas9_A0A0S8HUJ8__prot 464
38 A0A0A8GXC3 Cas9_A0A0A8GXC3_prot 465
39 A0A0A8GU36 Cas9_A0A0A8GU36_prot 466
40 A0A139BVD9 Cas9_A0A 139B VD9_prot 467
41 A3VED0 Cas9__A3VED0__prot 468
42 A0A0A8HTA3 Cas9..,A0A0A8HTA3...prot 469
43 A0A125S8L7 Cas9_A0A125S8L7mprot 470
44 T2LKS6 Cas9_T2LKS6__prot 471
45 A0A0A8H849 Cas9_A0A0A8H849_prot 472
46 F5S4M8 Cas9...F5S4M8...prot 473
47 G1UFN3 Cas9__G 1U F N 3__prot 474
48 B5ZLK9 Cas9__B5ZLK9__prot 475
49 C5ZYI3 Cas9_C5ZYI3__prot 476
50 A0A0G3EK96 Cas9___.A0.A0G3EK9S___prot 477
51 A0A125S8M5 Cas9_A0A125S8M5__prot 478
52 A0A0L6CQ85 Cas9__A0A0L6CQ85__prot 479
53 A0A0L8B0U9 Cas9..AOAOL8BOU9..jorot 480
54 A0A178N1Y8 Cas9_A0A178N1 Y8__prot 481
55 A0A125S8I0 Cas9__AOA125S8IO__prot 482
56 A0A0A1PPJ7 Cas9__A0A0A1 PPJ7__prot 483
57 B8I085 Cas9__B8l085__prot 484
58 A0A1B8J9V3 Cas9_A0A1 B8J9V3_prot 485
59 I7GTK8 Cas9J7GTK8_prot 486
60 D3UFL8 Cas9__D3UFL8_prot 487
61 E1VQA3 Cas9__E1VQA3_prot 488
62 M4V7E7 Cas9__M4V7E7__prot 489
63 F4GDP9 Cas9__F4GDP9__prot 490
Petição 870190070557, de 24/07/2019, pág. 149/401
85/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
64 A0A0Q6WIJ3 Cas9__A0A0Q6WIJ3__prot 491
65 A0A0E9L8G0 Cas9._A0A0E9L8G0.prot 492
66 A0A0A1VBC9 Cas9_A0A0A 1 VBC9_prot 493
67 B1GZM3 Cas9__B1GZM3__prot 494
68 A0A1C0W3U5 Cas9_A0A1C0W3U5„prot 495
69 D5BR51 Cas9_.D5BR51_.prot 496
70 A0A1A7NZJ6 Cas9_A0A1A7NZJ6__prot 497
71 A0A125S8J2 Cas9_A0A125S8J2_prot 498
72 A0A0A2YBT2 Cas9_A0A0A2YBT2_.prot 499
73 A0A099UFG2 Cas9_A0A099UFG2_prot 500
74 A0A0C5JLX1 Cas9__A0A0C5JLX1_prot 501
75 A7HP89 Cas9_.A7HP89_.prot 502
76 A0A0J6BUV9 Cas9_A0A0J6BUV9_prot 503
77 A0A1C9ZTA2 Cas9_A0A 1C9ZT A2__prot 504
78 A0A087N7M8 Cas9_A0A087N7M8__prot 505
79 A0A0Q9CTQ5 Cas9_A0A0Q9CTQ5_prot 506
80 A0A101I188 Cas9_A0A 1011188_prot 507
81 V2Q0I9 Cas9_V2QOI9_prot 508
82 F9ZKQ5 Cas9_F9ZK.Q5_.prot 509
83 F0Q2T1 Cas9...F0Q2T1...prot 510
84 M4R7E0 Cas9__M4R7E0_prot 511
85 T1DV82 Cas9_T 1 DV82_prot 512
86 W0Q6X6 Cas9__W0Q6X6_prot 513
87 A0A0E9MLX9 Cas9.A0A0E9MLX9.prot 514
88 A0A0D6MWC5 Cas9_A0A0D6MWC5__prot 515
89 A0A087MCH0 Cas9_A0A087MCH0_prot 516
90 I3TWJ0 Cas9_.l3TWJ0_.prot 517
91 A0A011P7F8 Cas9__A0A011 P7F8...prot 518
92 A0A163RXL7 Cas9_A0A163RXL7_prot 519
93 A9HKP2 Cas9_A9HKP2_prot 520
94 A0A0N1EBR4 Cas9_A0A0N1 EBR4_prot 521
95 A0A0A8HLU7 Cas9__A0A0A8HLU7__prot 522
96 E1W6G3 Cas9_E1W6G3__prot 523
Petição 870190070557, de 24/07/2019, pág. 150/401
86/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
97 J4KDT3 Cas9_J4KDT3_prot 524
98 E3CY56 Cas9_E3CY56_prot 525
99 J7RUA5 Cas9__J7RUA5_prot 526
100 A0A151A3A4 Cas9_A0A 151 A3A4__prot 527
101 A0A1E5TL62 Cas9_A0A1 E5TL62...prot 528
102 M4S2X5 Cas9_M4S2X5__prot 529
103 E0F2V7 Cas9__E0F2V7__prot 530
104 A0A0N7KBI5 Cas9_A0A0N7KBI5_prot 531
105 A0A133QCR3 Cas9__A0A133QCR3_prot 532
106 K0G350 Cas9__K0G350_prot 533
107 U5ULJ7 Cas9__U5ULJ7__prot 534
108 F0ET08 Cas9_F0ET08_prot 535
109 A0A0S2F228 Cas9_A0A0S2F228_prot 536
110 A0A060QC50 Cas9_A0A060QC50__prot 537
111 C5S1N0 Cas9__C5S1 NO_prot 538
112 A0A0K1NCD0 Cas9_A0A0K1 NCD0...prot 539
113 A0A099TTS6 Cas9__A0A099TTS6__prot 540
114 A0A0D2SXK1 Cas9__A0A0D2SXK1__prot 541
115 A0A1E4MWW9 Cas9__A0A1 E4MWW9_prot 542
116 A0A0M3VQX7 Cas9_A0A0M3VQX7„prot 543
117 A0A0T0PVC7 Cas9_A0A0T0PVC7_prot 544
118 Q7MRD3 Cas9_Q7MRD3_prot 545
119 A0A160JE60 Cas9„ A0A 160J E60...prot 546
120 J6LE60 Cas9__J6LE60__prot 547
121 A0A0P1D4L3 Cas9_A0A0P1 D4L3__prot 548
122 A0A176I8B4 Cas9__A0A176l8B4__prot 549
123 A0A143DGZ8 Cas9.,A0A143DGZ8...prot 550
124 G2ZYP2 Cas9_G2ZYP2__prot 551
125 A6VLA7 Cas9_A6VLA7__prot 552
126 A0A151APJ0 Cas9..A0A151APJ0....prot 553
127 V9H606 Cas9__V9H606_prot 554
128 A0A0D6XNZ8 Cas9__A0A0D6XNZ8__prot 555
129 Q13CC2 Cas9__Q13CC2__prot 556
Petição 870190070557, de 24/07/2019, pág. 151/401
87/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
130 A5EIM8 Cas9__A5EIM8__prot 557
131 B1UZL4 Cas9_B1UZL4_prot 558
132 B1BJM3 Cas9__B1 BJM3_prot 559
133 Q20XX4 Cas9__Q20XX4__prot 560
134 A0A125S8L3 Cas9___A0A125S8L3___prot 561
135 A0A0B8Z713 Cas9_A0A0B8Z713_prot 562
136 A0A150D6Y2 Cas9__A0A150D6Y2__prot 563
137 A1WH93 Cas9_A1WH93_prot 564
138 R8LDU5 Cas9_R8LDU5_prot 565
139 A0A0F7K1T5 Cas9_A0A0F7K1T5_prot 566
140 R8NC81 Cas9__R8NC81__prot 567
141 A0A0P7L7M3 Cas9_A0A0P7L7M3„prot 568
142 F0PZE9 Cas9_F0PZE9__prot 569
143 C2UN05 Cas9__C2UN05__prot 570
144 T0HC86 Cas9__T0HC86__prot 571
145 R5QL13 Cas9_R5QL.13_.prot 572
146 A0A0J0YQ19 Cas9_A0A0J0YQ19_prot 573
147 A0A196P6K7 Cas9_A0A196P6K7_prot 574
148 R6QL84 Cas9_R6QL84__prot 575
149 A0A0J5QZM1 Cas9...A0A0J5QZM1...prot 576
150 A0A0P1ETF1 Cas9_A0A0P1 ETF1_prot 577
151 A0A125S8J5 Cas9_A0A125S8J5__prot 578
152 A0A1C6WUG4 Cas9_A0A1C6WUG4_prot 579
153 A0A1D3QUT4 Cas9_A0A1 D3QUT4_prot 580
154 F2B8K0 Cas9__F2B8K0__prot 581
155 A0A1D3PTA0 Cas9_A0A1 D3PTA0__prot 582
156 A0A0P7LDT0 Cas9.„A0A0P7LDT0...prot 583
157 A0A0R1LQW1 Cas9_A0A0R1 LQW1_prot 584
158 A0A159Z911 Cas9__A0A159Z911_prot 585
159 R5Y7W7 Cas9„R5Y7W7_prot 586
160 A8LN05 Cas9__A8LN05__prot 587
161 S0RVL7 Cas9__S0RVL7_prot 588
162 W1K9F9 Cas9__W1 K9F9__prot 589
Petição 870190070557, de 24/07/2019, pág. 152/401
88/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
163 A0A1E4DUI9 Cas9_A0A1E4DUI9_prot 590
164 A0A1E4F4V8 Cas9_A0A1 E4F4V8_prot 591
165 J8W240 Cas9_J8W240__prot 592
166 C6SFU3 Cas9_C6SFU3_prot 593
167 C5TLV5 Cas9_.C5TLV5_.prot 594
168 A0A0Y5JFG8 Cas9_A0A0Y5JFG8_prot 595
169 A0A125S8I7 Cas9__A0A125S8l7_prot 596
170 E4ZF34 Cas9_E4ZF34_prot 597
171 A0A0Y6L5Q1 Cas9._A0A0Y6L5Q1_.prot 598
172 A0A0T7L299 Cas9_A0A0T7L299_prot 599
173 X5EPV9 Cas9_X5EPV9_prot 600
174 C6SH44 Cas9._C6SH44_.prot 601
175 E0NB23 Cas9__E0N B23_prot 602
176 A9M1K5 Cas9__A9M 1 K5_prot 603
177 D0W2Z9 Cas9_D0W2Z9_prot 604
178 R0TXT9 Cas9_.R0TXT9_.prot 605
179 C6S593 Cas9_C6S593_prot 606
180 A0A1A6FJT6 Cas9__A0A1A6FJT6_prot 607
181 A0A0D8IYR9 Cas9_A0A0D8IYR9_prot 608
182 A0A0W7TPK7 Cas9_.A0A0W7TPK7_.prot 609
183 G9RUL1 Cas9_.G9RUL1_.prot 610
184 A0A0N8K819 Cas9_A0A0N8K819_prot 611
185 A0A0Q7HTH3 Cas9._A0A0Q7HTH3_.prot 612
186 A0A0Q0YQ33 Cas9._A0A0Q0YQ33_.prot 613
187 E8LGQ1 Cas9_E8LGQ1_prot 614
188 A0A0K1KC97 Cas9_A0A0K1 KC97_prot 615
189 A0A150MM34 Cas9_.A0A150MM34_.prot 616
190 H7F839 Cas9_.H7F839_.prot 617
191 A0A178TEJ9 Cas9__A0A178TEJ9__prot 618
192 A0A150MP45 Cas9_.A0A150MP45_.prot 619
193 A0A164FEH7 Cas9...A0A164FEH7_..prot 620
194 V6VHM9 Cas9_.V6VHM9_.prot 621
195 A0A096BCZ5 Cas9_A0A096BCZ5_prot 622
Petição 870190070557, de 24/07/2019, pág. 153/401
89/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
196 A0A0J8GDE4 Cas9_A0A0J8GDE4_prot 623
197 G9QLF2 Cas9._G9QLF2_.prot 624
198 D7N2B0 Cas9_.D7N2B0_.prot 625
199 S5ZZV3 Cas9_S5ZZV3_prot 626
200 A0A0N1BZF2 Cas9__A0A0N 1 BZF2_prot 627
201 A0A0C9MY24 Cas9...A0A0C9MY24_prot 628
202 A0A1C7NZW8 Cas9_A0A1C7NZW8_prot 629
203 H0UDA8 Cas9_H0UDA8__prot 630
204 E3HCA8 Cas9_.E3HCA8_.prot 631
205 A0A073IJU3 Cas9_.A0A073IJU3_.prot 632
206 W3RQ02 Cas9_W3RQ02_prot 633
207 A0A0U2W148 Cas9__A0A0U2W148_prot 634
208 G4CMU0 Cas9_.G4CMU0_.prot 635
209 A0A0H1A177 Cas9_A0A0H 1A177_prot 636
210 A0A125S8L4 Cas9_A0A125S8L4_prot 637
211 A0A0T2NHL9 Cas9_A0A0T2N H L9__prot 638
212 A0A1A9FXI0 Cas9_A0A1A9FXI0_prot 639
213 A0A139DPY2 Cas9_A0A139DPY2_prot 640
214 A0A1A7V637 Cas9_A0A 1 A7V637_prot 641
215 R5KSL2 Cas9_.R5KSL2_.prot 642
216 R7B4M2 Cas9_.R7B4M2_.prot 643
217 A0A143X3E0 Cas9_A0A143X3E0__prot 644
218 R6DVD3 Cas9...R6DVD3...prot 645
219 W0A9N2 Cas9_W0A9N2_prot 646
220 R5UJK1 Cas9_R5UJK1_prot 647
221 A5Z395 Cas9_A5Z395__prot 648
222 A0A0X1TKX4 Cas9_A0A0X1TKX4_prot 649
223 R7A6L3 Cas9_.R7A6L3_.prot 650
224 J2WFY6 Cas9_J2WFY6_prot 651
225 W1SA26 Cas9 _W1 SA26_prot 652
226 A0A099UAI1 Cas9_A0A099UAI 1_.prot 653
227 U2XW20 Cas9_U2XW20_prot 654
228 R6ACK8 Cas9_R6ACK8_prot 655
Petição 870190070557, de 24/07/2019, pág. 154/401
90/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
229 C4ZA16 Cas9__C4ZA16__prot 656
230 A0A133XDM2 Cas9_A0A133?<DM2...prot 657
231 V8C5L2 Cas9_V8C5L2_prot 658
232 E4MSY6 Cas9_E4MSY6_prot 659
233 A0A0A1H768 Cas9_A0A0A1 H768 ..pro t 660
234 A0A0Q7WLY8 Cas9_A0A0Q7WLY8_prot 661
235 A0A0R1JQF2 Cas9_A0A0R1 JQF2__prot 662
236 A0A142LIG4 Cas9_A0A 142LI G4_prot 663
237 R2S872 Cas9..R2S872...prot 664
238 A0A0E2RF34 Cas9_A0A0E2RF34_prot 665
239 A0A0R1IXU4 Cas9_A0A0R1 IXU4_prot 666
240 A0A0E2Q4M6 Cas9..,A0A0E2Q4M6....prot 667
241 A0A139MDP4 Cas9...A0A 139M D P4...prot 668
242 X8HGN9 Cas9_X8HGN9_prot 669
243 A0A1C3YEE6 Cas9_A0A1C3YEE6_prot 670
244 A0A0P6UEB3 Cas9_A0A0P6UEB3_prot 671
245 A0A0M3RT06 Cas9_A0A0M3RT06_prot 672
246 K0ZVL9 Cas9__K0ZVL9_prot 673
247 R0P7Y6 Cas9_R0P7Y6_prot 674
248 S0KIG9 Cas9...S0KIG9...prot 675
249 A0A081Q0Q9 Cas9...A0A081 Q0Q9...prot 676
250 F8LWC5 Cas9_F8LWC5_prot 677
251 I0SS54 Cas9J0SS54_prot 678
252 A0A125S8J6 Cas9_A0A 125S8J6_.prot 679
253 V8LWT4 Cas9__.V8L.WT 4_prot 680
254 A0A111NJ61 Cas9__A0A111NJ61_prot 681
255 A0A0A0DHL5 Cas9..,A0A0A0DHL5...prot 682
256 Q5M542 Cas9_.Q5M542_.prot 683
257 A0A0Z8LKF1 Cas9_A0A0Z8LKF1_prot 684
258 A0A126UMM8 Cas9_A0A126UMM8_prot 685
259 A0A0N8VNG6 Cas9_A0A0N8VNG6_prot 686
260 A0A081PRN2 Cas9_A0A081 PRN2_prot 687
261 T1ZF93 Cas9_T1ZF93_prot 688
Petição 870190070557, de 24/07/2019, pág. 155/401
91/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
262 A0A125S8J9 Cas9_A0A125S8J9_prot 689
263 A0A0H4LAU6 Cas9..A0A0H4L.AU6...prot 690
264 A0A0P0N7J4 Cas9_A0A0P0N7J4_prot 691
265 A0A1G0BAB7 Cas9_A0A1 G0BAB7__prot 692
266 F8LNX0 Cas9...F8LNX0...prot 693
267 U5P749 Cas9...U5P749...prat 694
268 K6QJ37 Cas9__K6QJ37_prot 695
269 D4KTZ0 Cas9_D4KTZ0_prot 696
270 U1GXL8 Cas9JJ1GXL8...prot 697
271 E8KVY4 Cas9..E8KVY4...prot 698
272 A0A173V977 Cas9_A0A173V977_prot 699
273 W3XZF8 Cas9...VV3XZF8...prot 700
274 A0A0X8G6A4 Cas9...A0A0X8G6A4...prot 701
275 A0A139RFX7 Cas9__A0A139RFX7_prot 702
276 A0A0R1M5J7 Cas9_A0A0R1 M5J7_prot 703
277 A0A0U3F8P4 Cas9_A0A0U3F8P4_prot 704
278 B1SGF4 Cas9_B 1SG F4_prot 705
279 A0A0U3EY47 Cas9__A0A0U3EY47__prot 706
280 A0A176T602 Cas9_A0A 176T602_prot 707
281 A0A1C3SQ53 Cas9..,A0A1C3SQ53...prot 708
282 F5WVI4 Cas9_F5WVI4_prot 709
283 H2A7K0 Cas9_H2A7K0__prot 710
284 A0A091BWC6 Cas9_A0A091 BWC6_prot 711
285 F5X275 Cas9..F5X275...prot 712
286 A0A081JGI6 Cas9_A0A081JGI6_prot 713
287 B9M9X8 Cas9_B9M9X8_prot 714
288 A0A1D2U437 Cas9_A0A1 D2U437...prot 715
289 E6WZS9 Cas9...E6WZS9...prot 716
290 S0J9K5 Cas9_S0J9K5_prot 717
291 A0A0R1J9U0 Cas9...A0A0R1J9U0....prot 718
292 X8KGX3 Cas9..X8KGX3...prot 719
293 A0A081R6F9 Cas9_A0A081 R6F9__prot 720
294 A0A139QZ91 Cas9__A0A 139QZ91 __prot 721
Petição 870190070557, de 24/07/2019, pág. 156/401
92/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
295 S1RM25 Cas9__.S1RM25_.prot 722
296 E0PQK3 Cas9_.E0PQK3_.prot 723
297 I0QHG7 Cas9.J0QHG7...prot 724
298 A0A0R1XK13 Cas9_A0A0R1XK13_prot 725
299 A0A1E9DYC7 Cas9__A0A1 E9DYC7...prot 726
300 A0A139NS17 Cas9_A0A139NS17_prot 727
301 A8AY02 Cas9_A8AY02_prot 728
302 E9DN79 Cas9_E9DN79_prot 729
303 A0A125S8J4 Cas9._A0A125S8J4_.prot 730
304 K8Z8F3 Cas9_.K8Z8F3_.prot 731
305 C7G697 Cas9_C7G697_prot 732
306 A0A0F2E4R3 Cas9_.A0A0F2E4R3_.prot /33
307 I2NMF2 Cas9J2NMF2_prot 734
308 A0A173WZ1 Cas9__A0A 173VVZ1 __prot 735
309 A0A1F0FMT7 Cas9_A0A1 F0FMT7_prot 736
310 K1LQN8 Cas9_K1LQN8_prot 737
311 A0A125S8K1 Cas9_A0A 125S8K1__prot 738
312 A0A125S8K3 Cas9_A0A125S8K3_prot 739
313 H8MA21 Cas9_H8MA21_prot 740
314 W0SDH6 Cas9_.W0SDH6_.prot 741
315 J9E534 Cas9_.J9E534_.prot 742
316 A0A0V0PNI8 Cas9_A0A0V0PNI8_prot 743
317 A0A171J711 Cas9_A0A 171J 711 _prot 744
318 Q1WVK1 Cas9_Q 1WVK1 _prot 745
319 C0FXH5 Cas9_C0FXH5_prot 746
320 K0XCK7 Cas9_K0XCK7_prot 747
321 A0A125S8J8 Cas9_.A0A125S8J8_.prot 748
322 A0A060RE66 Cas9_.A0A060RE66_.prot 749
323 Q1QGC9 Cas9_Q1 QGC9_prot 750
324 D3NT09 Cas9_.D3NT09_.prot 751
325 A0A0R1MEF5 Cas9_.A0A0R1MEF5_.prot 752
326 A0A0R2CKA0 Cas9_.A0A0R2CKA0_.prot 753
327 V4Q7N5 Cas9_V4Q7N5_prot 754
Petição 870190070557, de 24/07/2019, pág. 157/401
93/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
328 Q2RX87 Cas9__Q2RX87__prot 755
329 A0A0R2FKF9 Cas9_A0A0R2FKF9_prot 756
330 R7BDB6 Cas9__R7BDB6mprot 757
331 A0A1C9ZUE2 Cas9_A0A 1C9ZU E2__prot 758
332 S2WQ18 Cas9_S2WQ18„prot 759
333 A0A1C9ZTA0 Cas9_A0A1 C9ZTA0__prot 760
334 F0RSV0 Cas9_F0RSV0__prot 761
335 A0A0N0IXQ9 Cas9_A0A0N0IXQ9_prot 762
336 A0A0R1X611 Cas9_A0A0R1X611_ prof 763
337 B2KB46 Cas9_B2KB46_prot 764
338 U2KF13 Cas9__U2KF13__prot 765
339 D5ESN1 Cas9..D5ESN1....prot 766
340 R7HI23 Cas9_R7HI23__prot 767
341 I9J7D5 Cas9J9J7D5__prot 768
342 A0A0B0BZE8 Cas9__A0A0B0BZE8__prot 769
343 R5W806 Cas9„R5W806_prot 770
344 G6B158 Cas9__G6B158_prot 771
345 U2IU08 Cas9__U2IU08__prot 772
346 A0A096AT21 Cas9__A0A096AT21__prot 773
347 R6ZCR1 Cas9_R6ZCR 1_ prof 774
348 D1W6R4 Cas9_D1W6R4__prot 775
349 D1VXP4 Cas9__D 1 VXP4__prot 776
350 U7USL1 Cas9JJ7USL1...prot 777
351 E2N8V1 Cas9__E2N8V1_prot 778
352 R6D2P4 Cas9__R6D2P4__prot 779
353 A0A134BD56 Cas9__A0A134BD56__prot 780
354 A0A099BT78 Cas9..,A0A099BT78...prot 781
355 R7CVK2 Cas9mR7CVK2_prot 782
356 D2EJF1 Cas9_D2 E J F1 __prot 783
357 A0A069QG82 Cas9..A0A06SQG82....prot 784
358 R5LWG1 Cas9_R5LWG1_prot 785
359 C9LGP5 Cas9__C9LGP5__prot 786
360 Q6KIQ7 Cas9__Q6KIQ7__prot 787
Petição 870190070557, de 24/07/2019, pág. 158/401
94/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
361 A0A180F6C8 Cas9._A0A180F6C8_.prot 788
362 C0WRP7 Cas9_C0WRP7_prot 789
363 A0A174NKB5 Cas9_A0A 174N KB5_.prot 790
364 U2Y346 Cas9_U2Y346_prot 791
365 A0A125S8I5 Cas9__A0A125S8i5_prot 792
366 R7CG17 Cas9_.R7CG17_.prot 793
367 F3A050 Cas9_F3A050_prot 794
368 D1AUW6 Cas9_D1AUW6_prot 795
369 A0A0X8KN88 Cas9._A0A0X8KN88_.prot 796
370 A0A0D5BKQ5 Cas9._A0A0D5BKQ5_.prot 797
371 A0A0N1DVV7 Cas9_A0A0N 1 DW7_prot 798
372 A0A085Z0I3 Cas9_.AOAO85ZOI3_.prot 799
373 J3TRJ9 Cas9_.J3TRJ9_.prot 800
374 A0A0F6CLF2 Cas9_A0A0F6CLF2_prot 801
375 A0A199XSD8 Cas9_A0A199XSD8_prot 802
376 A0A0B8YC59 Cas9_.A0A0B8YC59_.prot 803
377 K2M2X7 Cas9_K2M2X7_prot 804
378 A0A1B9Y472 Cas9_A0A1 B9Y472_prot 805
379 A0A0Q4DTQ9 Cas9_A0A0Q4DTQ9_prot 806
380 S4EM46 Cas9_.S4EM46_.prot 807
381 A0A1D2JYF3 Cas9_A0A1 D2JYF3_.prot 808
382 A0A0R2FVI8 Cas9_A0A0R2FVI8_prot 809
383 A0A174LFF7 Cas9..A0A174LFF7_prot 810
384 A0A173SPI3 Cas9_A0A173SPI3_prot 811
385 D0DRL9 Cas9__D0DRL9__prot 812
386 A0A175A1Y1 Cas9_A0A 175A1Y1 __prot 813
387 A0A062XBE5 Cas9_.A0A062XBE5_.prot 814
388 A0A0K8MIK7 Cas9_.A0A0K8MIK7_.prot 815
389 A0A0R1TV35 Cas9_A0A0R1TV35_prot 816
390 A0A125S8J7 Cas9..A0A125S8J7...prot 817
391 A0A0R1ZP43 Cas9_A0A0R1ZP43_prot 818
392 W4T7U3 Cas9_W4T7U3_prot 819
393 A0A0J5P9G6 Cas9_A0A0J5P9G6_prot 820
Petição 870190070557, de 24/07/2019, pág. 159/401
95/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
394 A0A0R2CL57 Cas9__A0A0R2CL57__prot 821
395 R6U7U5 Cas9__R6U7U5__prot 822
396 A0A0R2AFH9 Cas9_A0A0R2AFH9_prot 823
397 E7MR72 Cas9__E7M R72__prot 824
398 A0A1C0YPC7 Cas9.,A0A1C0YPC7...prot 825
399 A0A179EQS1 Cas9_A0A179EQS1_prot 826
400 W9EE99 Cas9_W9EE99_prot 827
401 A0A0R2BKJ5 Cas9_A0A0R2BKJ5_prot 828
402 E6LI02 Cas9...E6Li02....prot 829
403 V5XLV7 Cas9..V5XLV7..prot 830
404 G2KVM6 Cas9__G2KVM6__prot 831
405 A0A1C5TF27 Cas9.,A0A1C5TF27..prot 832
406 H3NFH0 Cas9_H3NFH0_prot 833
407 A0A081BKX9 Cas9_A0A081 BKX9__prot 834
408 A0A1C7DHH3 Cas9__A0A1C7DHH3__prot 835
409 R7GMQ9 Cas9...R7GMQ9...prot 836
410 R6QHH1 Cas9__R6QHH1mprot 837
411 A0A174HSW2 Cas9_A0A174HSW2_prot 838
412 A0A0R2HIR8 Cas9__A0A0R2 ΗI R8_prot 839
413 A0A0H3GNI1 Cas9..,A0A0H3GNI1....prot 840
414 A0A0F5ZHG0 Cas9_A0A0F5ZHG0__prot 841
415 A0A0H3J2A7 Cas9_A0A0H3J2A7__prot 842
416 A0A166RWM5 Cas9_A0A166RWM5_prot 843
417 A0A1E6FAD7 Cas9_A0A1 E6FAD7_prot 844
418 A0A1E8EQS5 Cas9__A0A1 E8EQS5_prot 845
419 A0A1E7DWS8 Cas9__A0A1 E7DWS8_prot 846
420 A0A1E5ZAU0 Cas9_A0A1 E5ZAU0...prot 847
421 A0A1E8EI75 Cas9_A0A1 E8EI75_prot 848
422 R3WHR8 Cas9_R3WH R8__prot 849
423 A0A097B8A9 Cas9__A0A097B8A9_prot 850
424 A0A095XEU7 Cas9__A0A095XEU7_prot 851
425 A0A0R1RFJ4 Cas9_A0A0R1 RFJ4__prot 852
426 A0A160NBB3 Cas9__A0A 160N BB3_prot 853
Petição 870190070557, de 24/07/2019, pág. 160/401
96/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
427 I6T669 Cas9J6T669_prot 854
428 H1GG18 Cas9_H 1GG18_prot 855
429 A0A017H668 Cas9_A0A017H668_.prot 856
430 A0A121IZ21 Cas9_A0A121IZ21_prot 857
431 A0A1B4XLG6 Cas9__A0A1 B4XLG6 ..prot 858
432 U6S081 Cas9_.U6S081_.prot 859
433 E6GPD8 Cas9_E6GPD8_prot 860
434 H3NQF8 Cas9_H3NQF8__prot 861
435 D4J3S7 Cas9_.D4J3S7_.prot 862
436 G5JVJ9 Cas9_G5JVJ9_prot 863
437 R9MHT9 Cas9_R9M HT9__prot 864
438 R2SDC4 Cas9_.R2SDC4_.prot 865
439 H7FYD8 Cas9_.H7FYD8_.prot 866
440 A0A1D2JQJ5 Cas9_A0A1 D2JQJ5_prot 867
441 A0A1D2LU44 Cas9_A0A1 D2LU44_prot 868
442 C9BHR2 Cas9...C9BHR2...prot 869
443 L2LBP5 Cas9__L2L.BP5_.prot 870
444 R6ZAM8 Cas9_R6ZAM8_prot 871
445 A6BJV4 Cas9_A6BJV4_prot 872
446 A0A174GDD3 Cas9_A0A 174G D D3_prot 873
447 C9BWE2 Cas9_.C9BWE2_.prot 874
448 A0A173UVP4 Cas9_A0A173UVP4__prot 875
449 R5BQB0 Cas9_.R5BQB0_.prot 876
450 D7N6R3 Cas9__D7N6R3_prot 877
451 A0A1C5P2V8 Cas9.__A0A1C5P2V8_.prot 878
452 B5CL59 Cas9_B5CL59_prot 879
453 A0A0R2JSC5 Cas9_.A0A0R2JSC5_.prot 880
454 A0A1C6BK34 Cas9_.A0A1C6BK34_.prot 881
455 R7KBA0 Cas9_R7KBA0_prot 882
456 A0A0R2HM97 Cas9_A0A0R2HMS7_prot 883
457 U7PCQ1 Cas9_U7PCQ1_prot 884
458 R5V4T4 Cas9_R5V4T 4_prot 885
459 A0A133QT10 Cas9_A0A 133QT1O_prot 886
Petição 870190070557, de 24/07/2019, pág. 161/401
97/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
460 A0A0E2EP65 Cas9_A0A0E2EP65_prot 887
461 R5MT23 Cas9_R5MT23_prot 888
462 A0A0R2DR00 Cas9_A0A0R2DR00_prot 889
463 R5N3I1 Cas9__R5N3l1__prot 890
464 I0SF74 Cas9J0SF74_prot 891
465 E6J3R0 Cas9_E6J3R0__prot 892
466 U2YFI6 Cas9__U2YFI6__prot 893
467 A0A0R2DIR3 Cas9__A0A0R2DIR3__prot 894
468 U2U1P0 Cas9JJ2U1PO.jorot 895
469 A0A134CKK1 Cas9_A0A134CKK1_prot 896
470 A0A0R2N0I6 Cas9__AOAOR2NOI6__prot 897
471 A0A125S8I2 Cas9__A0A125S8i2_prot 898
472 A0A0R1ZCI7 Cas9_A0A0R 1ZC17_prot 899
473 A0A0R1SCA3 Cas9__A0A0R1 SCA3_prot 900
474 D9PRA6 Cas9__D9PRA6__prot 901
475 A0A0D0ZAW2 Cas9_A0A0D0ZAW2_prot 902
476 F9N0W8 Cas9_F9N0W8_prot 903
477 B0RZQ7 Cas9__B0RZQ7_prot 904
478 R6XMN7 Cas9__R6XMN7__prot 905
479 U2SSY7 Cas9 JJ2SSY7...prot 906
480 S4NUM0 Cas9_S4N U MO_prot 907
481 A0A072ETA7 Cas9_A0A072ETA7__prot 908
482 R5RU71 Cas9_R5RU71_prot 909
483 A0A174FD97 Cas9__A0A174FD97_prot 910
484 A0A0A8K7X7 Cas9__A0A0A8K7X7__prot 911
485 R5Z6B4 Cas9__R5Z6B4__prot 912
486 S1NSG8 Cas9.S1NSG8..prot 913
487 A0A1D8P523 Cas9_A0A1 D8P523_prot 914
488 A0A1C6IPF7 Cas9__A0A1 C6I PF7__prot 915
489 A0A0R1MNC7 Cas9„ A0A0R1 MNC7...prot 916
490 A0A132HQM8 Cas9_A0A132HQM8_prot 917
491 A0A0M9VGT5 Cas9__A0A0M9VGT5__prot 918
492 F9MP31 Cas9__F9MP31__prot 919
Petição 870190070557, de 24/07/2019, pág. 162/401
98/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
493 A0A0R1V7X0 Cas9__A0A0R1 V7X0__prot 920
494 A0A0X7BAB3 Cas9__A0A0X7BAB3_prot 921
495 R7K435 Cas9__R7K435__prot 922
496 I3Z8Z5 Cas9J3Z8Z5__prot 923
497 A0A173YKH0 Cas9_A0A173YKH0„prot 924
498 A0A174PI34 Cas9_A0A174PI34_prot 925
499 A0A1C6E673 Cas9__A0A1C6E673__prot 926
500 R5YGP2 Cas9__R5YGP2__prot 927
501 A0A076P3F6 Cas9..A0A076P3F6....prot 928
502 A0A176Y372 Cas9__A0A176Y372_prot 929
503 D3I574 Cas9__D3l574__prot 930
504 S2D876 Cas9.S2D87S„.prot 931
505 A0A0R1F6R4 Cas9_A0A0R1 F6R4__prot 932
506 J9YH95 Cas9_J9YH95__prot 933
507 R5SXF4 Cas9_R5SXF4_prot 934
508 R6P3Z6 Cas9_R6P3Z6_prot 935
509 A0A0R1IS26 Cas9_A0A0R1 IS26_prot 936
510 A0A0H4LAX2 Cas9__A0A0H4LAX2__prot 937
511 A0A0K2LF21 Cas9__A0A0K2LF21__prot 938
512 A0A0R1QGB6 Cas9_A0A0R1QGB6„prot 939
513 A0A143W8R3 Cas9_A0A 143W8R3_prot 940
514 M4KKI8 Cas9__M4KKI8__prot 941
515 A0A0R1FUZ5 Cas9_A0A0R1 FUZ5 ..prot 942
516 F6ITQ2 Cas9_F6ITQ2_prot 943
517 A0A1E3KQ44 Cas9_A0A1 E3KQ44__prot 944
518 A0A173WIE2 Cas9__A0A173WI E2_prot 945
519 G4Q6A5 Cas9_G4Q6A5„prot 946
520 A0A0K1MWW2 Cas9_A0A0K1 MWW2_prot 947
521 A0A0H0YP06 Cas9_A0A0H0YP06__prot 948
522 A0A0C9QP69 Cas9_A0A0C9QP69_prot 949
523 A0A0E4H4H8 Cas9__A0A0E4H4H8_prot 950
524 C2CKI6 Cas9_C2CKI6_prot 951
525 A0A0M2FYH7 Cas9_A0A0M2FYH7„prot 952
Petição 870190070557, de 24/07/2019, pág. 163/401
99/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
526 R6TGN6 Cas9__R6TGN6__prot 953
527 I9L4B5 Cas9J9L4B5___prot 954
528 A0A133KEN0 Cas9__A0A133KEN0_prot 955
529 A0A139NKI7 Cas9_A0A 139N Kl 7__prot 956
530 T5JDL4 Cas9.T5JDL4..prot 957
531 C5F8S2 Cas9_.C5F8S2_.prot 958
532 S4ZP66 Cas9__S4ZP66__prot 959
533 S2LEI5 Cas9__.S2LEI5__.prot 960
534 A0A0R1UKG9 Cas9„ AQAQR1 UKG9....prot 961
535 A0A174P7Q9 Cas9_A0A174P7Q9__prot 962
536 K6R5Z8 Cas9__K6R5Z8__prot 963
537 A0A0R1S2S1 Cas9...A0A0R1S2S1...prot 964
538 A0A0R1MEL8 Cas9...A0A0R1 MEL8__prot 965
539 A0A0C9Q7U6 Cas9__A0A0C9Q7U6__prot 966
540 A0A179YJ40 Cas9_A0A179YJ40_prot 967
541 C7TEQ6 Cas9_C7TEQ6_prot 968
542 E0NI75 Cas9_E0NI75__prot 969
543 A0A133ZK65 Cas9_A0A 133ZK65_prot 970
544 A0A0R1RRH5 Cas9__.A0.A0R1 RRH5_prot 971
545 E0NJ84 Cas9_E0NJ84„prot 972
546 A0A0R2HZC9 Cas9...A0A0R2HZC9...prot 973
547 A0A180AER3 Cas9__A0A180AER3__prot 974
548 D6GRK4 Cas9_D6GRK4_prot 975
549 A0A1B3WEM9 Cas9_A0A1 B3WEM9_prot 976
550 A0A116L128 Cas9__A0A116L128__prot 977
551 A0A127TRM8 Cas9__A0A127TRM8__prot 978
552 A0A0R1W1T1 Cas9_A0A0R 1W1T1 ...prot 979
553 A0A1A5VIM0 Cas9_A0A1A5VIM0_prot 980
554 K6RXS8 Cas9_K6RXS8__prot 981
555 X0QNI0 Cas9...XQQNI0...prot 982
556 R5WWQ0 Cas9_R5WWQ0_prot 983
557 C7XMU0 Cas9_C7XMU0_prot 984
558 D6LEV9 Cas9__D6LEV9__prot 985
Petição 870190070557, de 24/07/2019, pág. 164/401
100/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
559 A0A128ECZ8 Cas9_A0A128ECZ8_prot 986
560 A0A133NAH6 Cas9..A0A133NAH6...prot 987
561 A0A0X3Y1U5 Cas9_A0A0X3Y1 U5_prot 988
562 A0A116M370 Cas9_A0A116M370__prot 989
563 A0A116KLL2 Cas9...A0AT16KLL2...prot 990
564 A0A1B2IXP8 Cas9...A0A1 B2IXP8__prot 991
565 A0A0R1LCE0 Cas9__A0A0R1 LCEO__prot 992
566 A0A0R1WWN2 Cas9_A0A0R1WWN2_prot 993
567 A0A0C6FZC2 Cas9..A0A0C6FZC2...prot 994
568 A0A127X7N0 Cas9. A0A127X7N0...prot 995
569 A0A1B4Z6K5 Cas9__A0A1 B4Z6K5__prot 996
570 R9LW52 Cas9_R9LW52„prot 997
571 A0A0B2XHU2 Cas9_A0A0B2XH U2_prot 998
572 A0A1B2A6P4 Cas9__A0A1 B2A6P4__prot 999
573 A0A0P6SHS4 Cas9_A0A0P6SHS4_prot 1000
574 A0A0H3BZZ0 Cas9_A0A0H3BZZ0_prot 1001
575 A0A0R1TGJ3 Cas9_A0A0R1TGJ3_prot 1002
576 Q1JLZ6 Cas9_Q 1J LZ6__prot 1003
577 Q48TU5 Cas9__Q48TU5__prot 1004
578 G6CGE4 Cas9_G6CGE4„prot 1005
579 Q1JH43 Cas9_Q 1J H43...prot 1006
580 R5C8N0 Cas9_R5C8N0__prot 1007
581 A0A0R1SN52 Cas9...A0A0R 1 SN52...prot 1008
582 A0A0R2DGS6 Cas9_A0A0R2DGS6_prot 1009
583 A0A0R1SDU2 Cas9_A0A0R1 SDU2_prot 1010
584 A0A0D0YUU5 Cas9__A0A0D0YUU5__prot 1011
585 S9AZZ0 Cas9..S9AZZ0...prot 1012
586 A0A0E1XG84 Cas9.A0A0E1XG84.prot 1013
587 R6ET93 Cas9_R6 ET 93_prot 1014
588 S9BFF6 Cas9_S9BFF6_prot 1015
589 A0A1B3PSQ7 Cas9...A0A1 B3PSQ7...prot 1016
590 A0A137PP63 Cas9_A0A137PP63__prot 1017
591 S9KSN8 Cas9__S9KSN8__prot 1018
Petição 870190070557, de 24/07/2019, pág. 165/401
101/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
592 Q8E042 Cas9__Q8E042__prot 1019
593 S8HGI0 Cas9....S8HGI0...prot 1020
594 S8H4C8 Cas9__S8H4C8_prot 1021
595 F0FD37 Cas9__F0FD37__prot 1022
596 J3JPT0 Cas9_J3JPT0_prot 1023
597 F8Y040 Cas9_F8Y040_prot 1024
598 A0A0R2JE56 Cas9__A0A0R2 J E56__prot 1025
599 A0A1A9E0X4 Cas9__A0A1A9E0X4__prot 1026
600 A0A0E1EMN2 Cas9_A0A0E1 EMN2_prot 1027
601 A0A1C0BC24 Cas9__A0A 1 C0BC24_prot 1028
602 A0A1E2WAR5 Cas9__A0A1 E2WAR5__prot 1029
603 S8FJS0 Cas9_S8FJS0„prot 1030
604 F4FTI2 Cas9_F4FTI2__prot 1031
605 K4Q9P5 Cas9_K4Q9P5__prot 1032
606 M4YX12 Cas9_M4YX12_prot 1033
607 F9HIG7 Cas9__F9HIG7_prot 1034
608 F5WVJ4 Cas9__F5WVJ4__prot 1035
609 D6E761 Cas9__D6E761__prot 1036
610 I0Q2W2 Cas9J0Q2W2__prot 1037
611 C5WH61 Cas9_C5WH61„prot 1038
612 A0A1C2CVQ9 Cas9_A0A1C2CVQ9_prot 1039
613 K8MQ90 Cas9__K8MQ90__prot 1040
614 A0A0R1JG51 Cas9..A0A0R1JG51....prot 1041
615 J9W3C2 Cas9__J9W3C2_prot 1042
616 Q1J6W2 Cas9_Q1 J6W2_prot 1043
617 R5GJ26 Cas9__R5GJ26__prot 1044
618 A0A172Q7S3 Cas9 ,,ΑΟ.ΑΙ 72Q7S3...prot 1045
619 A0A060RIR3 Cas9_A0A060R 1 R3__prot 1046
620 A0A1C5U497 Cas9_A0A1C5U497__prot 1047
621 S5R5C8 Cas9....S5R5C8...prot 1048
622 A0A0W7V6X6 Cas9_A0A0W7V6X6_prot 1049
623 A0A1C5S579 Cas9_A0A1 C5S579__prot 1050
624 A0A125S8J0 Cas9__A0A125S8J0__prot 1051
Petição 870190070557, de 24/07/2019, pág. 166/401
102/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
625 E0PEL3 Cas9_E0PEL3_prot 1052
626 J4K985 Cas9...J4K985...prot 1053
627 U2PI18 Cas9_.U2PI18_.prot 1054
628 G5KAN2 Cas9_G5KAN2_prot 1055
629 Q7P7J1 Cas9_Q7P7J 1_prot 1056
630 A0A0F2D9H7 Cas9_A0A0F2D9H7_prot 1057
631 A0A1D7ZZ65 Cas9_A0A1 D7ZZ65_prot 1058
632 E7FPD8 Cas9_E7FPD8_prot 1059
633 A0A176TM67 Cas9_A0A176TM67_prot 1060
634 G6AFY6 Cas9_G6AFY6_prot 1061
635 E9FPR9 Cas9_E9FPR9_prot 1062
636 I7QXF2 Cas9_.l7QXF2_.prot 1063
637 I0TCL1 Cas9_.IOTCL1_.prot 1064
638 A0A173R3H4 Cas9_A0A173R3H4_prot 1065
639 A0A178KKP5 Cas9_A0A178KKP5_prot 1066
640 H6PBR9 Cas9_.H6PBR9_.prot 1067
641 F4AF10 Cas9_F4AF 10__prot 1068
642 A0A134C7A8 Cas9_A0A134C7A8_prot 1069
643 A0A0R1SG79 Cas9_A0A0R1 SG79_prot 1070
644 A0A0F2DWP8 Cas9_.A0A0F2DWP8_.prot 1071
645 A0A0R1K630 Cas9__A0A0R1 K630_prot 1072
646 A0A135YMA6 Cas9_A0A135YMA6_prot 1073
647 F0I6Z8 Cas9_.FOI6Z8_.prot 1074
648 E9FJ16 Cas9_E9FJ 16..prot 1075
649 C2D302 Cas9_C2 D302_prot 1076
650 Q8E5R9 Cas9_Q8E5R9_prot 1077
651 E8JP81 Cas9_.E8JP81_.prot 1078
652 A0A0R1RHH9 Cas9__A0A0R1 RHH9_prot 1079
653 A0A0F3FWK9 Cas9_A0A0F3FWK9_prot 1080
654 A0A0R2I8Q5 Cas9_A0A0R2l8Q5_prot 1081
655 A0A150NPH1 Cas9_.A0A150NPH1_.prot 1082
656 E7S4M3 Cas9_E7S4M3_prot 1083
657 A0A143ASS0 Cas9_A0A 143ASS0_prot 1084
Petição 870190070557, de 24/07/2019, pág. 167/401
103/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
658 A0A0R2HDR9 Cas9_A0A0R2HDR9_prot 1085
659 A0A0B2JE32 Cas9„-A0A0B2 J E32... prot 1086
660 A0A0R2KUQ3 Cas9_A0A0R2KUQ3__prot 1087
661 A0A0W7V0H0 Cas9_A0A0W7V0H0_prot 1088
662 R6TGA0 Cas9_.R6TGA0_.prot 1089
663 A0A0H5B4T2 Cas9_.A0A0H5B4T2_.prot 1090
664 U2J559 Cas9__U2J559__prot 1091
665 A0A075SSB9 Cas9_A0A075SSB9__prot 1092
666 A0A096B7Z5 Cas9_.A0A096B7Z5.prot 1093
667 L9PS87 Cas9_.L9PS87_.prot 1094
668 A0A134D9V8 Cas9_A0A134D9V8_prot 1095
669 F7UWL3 Cas9_.F7UWL3_.prot 1096
670 G7SP82 Cas9_.G7SP82_.prot 1097
671 A0A0R2E213 Cas9_A0A0R2 E213_prot 1098
672 R7I2K1 Cas9_R7l2K1_prot 1099
673 C0WXA2 Cas9_.C0WXA2_.prot 1100
674 A0A0Z8GCN2 Cas9_.A0A0Z8GCN2_.prot 1101
675 R5GUN8 Cas9_R5G U N 8_prot 1102
676 A0A116RA22 Cas9_A0A116RA22_prot 1103
677 A0A0Z8JWB5 Cas9_.A0A0Z8JWB5_.prot 1104
678 A0A116KAQ7 Cas9__A0A116KAQ7_prot 1105
679 G0M2Gi Cas9_G0M2G7_prot 1106
680 A0A1C5P5Q5 Cas9_A0A1C5P5Q5_prot 1107
681 A0A0H1TNR9 Cas9_A0A0H 1TN R9__prot 1108
682 F2NB82 Cas9_F2NB82__prot 1109
683 J7TMY5 Cas9_J7TMY5_prot 1110
684 A0A125S8I1 Cas9_.A0A125S8H_.prot 1111
685 A0A078RYQ2 Cas9_.A0A078RYQ2_.prot 1112
686 A0A0F3H9Z9 Cas9_A0A0F3H9Z9_prot 1113
687 E5V117 Cas9_.E5V117_.prot 1114
688 J4TM44 Cas9_J4TM44_prot 1115
689 I7L6U4 Cas9J7L6U4_prot 1116
690 R5J5B2 Cas9_R5J5B2_prot 1117
Petição 870190070557, de 24/07/2019, pág. 168/401
104/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
691 A0A1B2ULM2 Cas9_A0A1 B2ULM2_prot 1118
692 A0A0P6UDU2 Cas9..A0A0P6UDU2...prot 1119
693 V8LSG7 Cas9_V8L.SG7_prot 1120
694 D5BC98 Cas9_D5BC98_prot 1121
695 K0MXA7 Cas9..K0MXA7...prot 1122
696 G9WGU4 Cas9_.G9WGU4_.prot 1123
697 A0A1C2D810 Cas9_A0A 1C2 D810_prot 1124
698 A0A087BJ94 Cas9_A0A087BJ94_prot 1125
699 A0A0R1S4R8 Cas9_.A0A0R1S4R8_.prot 1126
700 E0QLT3 Cas9_.E0QLT3_.prot 1127
701 C4VKS7 Cas9_C4VKS7_prot 1128
702 A9DTN2 Cas9_.A9DTN2_.prot 1129
703 K2PT21 Cas9_.K2PT21_.prot 1130
704 E7RR33 Cas9_E7RR33_prot 1131
705 A0A0N0CU60 Cas9_A0A0N0CU60_prot 1132
706 A0A0P7LUX3 Cas9_.A0A0P7LUX3_.prot 1133
707 R7D1C6 Cas9_R7D1C6_prot 1134
708 V8BZU1 Cas9_V8BZU 1_prot 1135
709 A0A0F4LG72 Cas9_A0A0F4LG72_prot 1136
710 J4KB57 Cas9_.J4KB57_.prot 1137
711 W1U735 Cas9_W1 U735_prot 1138
712 A0A095ZV18 Cas9_A0A095ZV 18_prot 1139
713 R5BUB1 Cas9_.R5BUB1_.prot 1140
714 F2C4I5 Cas9_F2C4l5_prot 1141
715 E1LI65 Cas9_E1LI65_prot 1142
716 A0A0N0UTU1 Cas9._A0A0N0UTU1_.prot 1143
717 C5NZ04 Cas9_.C5NZ04_.prot 1144
718 A0A081Q742 Cas9_.A0A081Q742_.prot 1145
719 A0A0F2DF30 Cas9_A0A0F2DF30_prot 1146
720 A0A0F4LMR6 Cas9_A0A0F4LMR6_prot 1147
721 A0A0E2EBU7 Cas9_A0A0E2EBU7_prot 1148
722 A0A0E2EGB1 Cas9_A0A0E2EGB1_prot 1149
723 A0A0C3A2P0 Cas9_A0A0C3A2P0_prot 1150
Petição 870190070557, de 24/07/2019, pág. 169/401
105/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
724 M2CG59 Cas9_M2CG59_prot 1151
725 R5R3T7 Cas9...R5R3T7..prot 1152
726 D6KPM9 Cas9_D6KPM9_prot 1153
727 U2VD49 Cas9_U2VD49_prot 1154
728 D6S374 Cas9_.D6S374_.prot 1155
729 A0A0R2KGU9 Cas9_A0A0R2 KG U9_prot 1156
730 A0A0F6MNW4 Cas9_A0A0F6M N W4__prot 1157
731 A0A0X3ARL2 Cas9_A0A0X3ARL2_prot 1158
732 A0A088RCP8 Cas9_.A0A088RCP8_.prot 1159
733 S3KPV3 Cas9_.S3KPV3_.prot 1160
734 M2CIC2 Cas9_M2CIC2_prot 1161
735 M2SLU3 Cas9_.M2SLU3_.prot 1162
736 A0A0D4CLL6 Cas9_.A0A0D4CLL6_.prot 1163
737 R6I3U9 Cas9_R6l3U9_prot 1164
738 F5U0T2 Cas9_F5U0T2_prot 1165
739 A0A0F4LIJ0 Cas9_.A0A0F4LIJ0_.prot 1166
740 A0A0N0CQ86 Cas9_.A0A0N0CQ86_.prot 1167
741 I3C2S4 Cas9_l 3C2S4_prot 1168
742 U2QKG2 Cas9_U2QKG2_prot 1169
743 D1YP75 Cas9_.D1YP75_.prot 1170
744 A0A091BLA4 Cas9_A0A091 BLA4_prot 1171
745 A0A100YPE0 Cas9_A0A100YPE0_prot 1172
746 E1LBR5 Cas9_.E1LBR5_.prot 1173
747 R5BD80 Cas9_.R5BD80_.prot 1174
748 W3Y2C1 Cas9_.W3Y2C1_.prot 1175
749 E1QW44 Cas9_E1QW44_prot 1176
750 A0A134A1I6 Cas9_.A0A134A1l6_.prot 1177
751 A0A0F4M7Y5 Cas9_.A0A0F4M7Y5_.prot 1178
752 A0A133YSB7 Cas9_A0A133YSB7_prot 1179
753 A0A089Y508 Cas9_A0A089Y508_prot 1180
754 A0A162CL99 Cas9_A0A 162CL99_.prot 1181
755 A0A133YDF1 Cas9_A0A133YDF1_prot 1182
756 A0A133YY65 Cas9_A0A 133Y Y65_prot 1183
Petição 870190070557, de 24/07/2019, pág. 170/401
106/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
757 A0A0B4S2L0 Cas9_A0A0B4S2L0_prot 1184
758 A0A0R2DLB6 Cas9._A0A0R2DLB6_.piOt 1185
759 A0A0G3MB19 Cas9_A0A0G3MB19_prot 1186
760 A0A0Q3K6A2 Cas9_A0A0Q3K6A2_prot 1187
761 A0A134AG29 Cas9_A0A134AG29_.prot 1188
762 A0A0N1DXX4 Cas9_A0A0N 1 DXX4_prot 1189
763 A0A1E4DZC0 Cas9_A0A1 E4DZC0_prot 1190
764 J9R1Q7 Cas9_J9R1Q7_prot 1191
765 A0A1C4DJV4 Cas9_A0A1 C4DJV4_prot 1192
766 A0A077KK20 Cas9_A0A077KK20_prot 1193
767 A0A085ZZC2 Cas9_A0A085ZZC2_prot 1194
768 W1V0U5 Cas9_W1V0U5_prot 1195
769 A0A0K9XVX7 Cas9_.A0A0K9XVX7_.prot 1196
770 A0A1H5RY71 Cas9_A0A1 H5RY71__prot 1197
771 A0A0J7IGI6 Cas9_A0A0J7IGI6_prot 1198
772 A0A086AYB7 Cas9_A0A086AYB7_prot 1199
773 A0A125S8K4 Cas9_A0A 125S8K4__prot 1200
774 M3INT0 Cas9_M3INT0_prot 1201
775 R5FLM1 Cas9_R5FLM1_prot 1202
776 U5Q7L9 Cas9_U5Q7L9_prot 1203
777 A0A1E3DW10 Cas9_A0A1 E3DW10__prot 1204
778 K0NQV3 Cas9_K0NQV3_prot 1205
779 J2KJ07 Cas9._J2KJ07_.prot 1206
780 A0A0U5KB17 Cas9_A0A0U5KB17_prot 1207
781 A0A0D6ZH65 Cas9_A0A0D6ZH65_prot 1208
782 A0A139PB46 Cas9_A0A139PB46_prot 1209
783 A0A139NVJ1 Cas9_A0A139N VJ 1_prot 1210
784 A0A139NSX3 Cas9_A0A139NSX3_prot 1211
785 E0Q490 Cas9_E0Q490_prot 1212
786 E3ELL7 Cas9_E3EL.L7_.prot 1213
787 A0A061CF22 Cas9_A0A061CF22_prot 1214
788 F3UXG6 Cas9_F3UXG6_prot 1215
789 A0A125S8K2 Cas9_A0A125S8K2_prot 1216
Petição 870190070557, de 24/07/2019, pág. 171/401
107/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
790 A0A0B7IR20 Cas9_A0A0B7l R20_prot 1217
791 A0A174J8H3 Cas9_A0A174J8H3_prot 1218
792 D7IW96 Cas9_D7IW96_prot 1219
793 A0A1A9I5Z1 Cas9_A0A1A9l5Z1_prot 1220
794 W0EYD8 Cas9_W0EYD8_.prot 1221
795 E2N1F9 Cas9__E2N 1 F9__prot 1222
796 D7VKD0 Cas9_D7VKD0_prot 1223
797 R7N9S8 Cas9_R7N9S8_prot 1224
798 C7M7G9 Cas9_C7M7G9_prot 1225
799 J0WLS6 Cas9_J0WLS6_prot 1226
800 A0A174L7S6 Cas9_A0A174L7S6_prot 1227
801 S2KA46 Cas9_.S2KA46_.prot 1228
802 A0A0A2F4C3 Cas9_.A0A0A2F4C3_.prot 1229
803 U2JCC9 Cas9_U2JCC9_prot 1230
804 A0A136MV65 Cas9_A0A136MV65_prot 1231
805 K1M8Y6 Cas9_K1M8Y6_prot 1232
806 F9YQX1 Cas9_.F9YQX1_.prot 1233
807 A0A0B7IQ14 Cas9_A0A0B7IQ14_prot 1234
808 A0A0B7IB79 Cas9_A0A0B7l B79_prot 1235
809 A0A0A2EHM8 Cas9_A0A0A2EHM8_prot 1236
810 A0A173V1H2 Cas9_A0A173V1 H2_.prot 1237
811 R7DKC0 Cas9_R7DKC0_prot 1238
812 U5CHH4 Cas9_U5CHH4_prot 1239
813 L1NKM1 Cas9_.L1NKM1_.prot 1240
814 A0A127VAB0 Cas9_A0A127VAB0__prot 1241
815 D7JGI6 Cas9_D7JGI6_prot 1242
816 A0A0U3BTM1 Cas9_A0.A0U3BTM1_.prot 1243
817 A0A0M4G8J7 Cas9_.A0A0M4G8J7_.prot 1244
818 A0A0A6Y3B0 Cas9_A0A0A6Y3B0_prot 1245
819 A0A015SZB2 Cas9_A0A015SZB2_prot 1246
820 A0A0E2RG29 Cas9_A0A0E2RG29_prot 1247
821 A0A0E2A7Q9 Cas9_A0A0E2A7Q9_prot 1248
822 A0A015Y7X0 Cas9_A0A015Y7X0_prot 1249
Petição 870190070557, de 24/07/2019, pág. 172/401
108/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
823 A0A0E2SQU9 Cas9__A0A0E2SQU9__prot 1250
824 A0A0E2T2C8 Cas9..A0A0E2T2C8..prot 1251
825 A0A017N289 Cas9_A0A017N289__prot 1252
826 A0A015UHU2 Cas9_A0A015U H U2__prot 1253
827 E5C8Y3 Cas9.E5C8Y3.prot 1254
828 C2M5N8 Cas9_.C2M5N8_.prot 1255
829 J4XAP6 Cas9_J4XAP6_prot 1256
830 A0A1B8ZVU5 Cas9_A0A1 B8ZVU5_prot 1257
831 A0A1E5KUU0 Cas9_A0A1 E5KUU0_prot 1258
832 A0A1E9S993 Cas9_.A0A1E9S993_.prot 1259
833 F0P0P2 Cas9_F0 P0 P2_prot 1260
834 B7B6H7 Cas9_.B7B6H7_.prot 1261
835 W1R7X2 Cas9__W1 R7X2_.prot 1262
836 X5KBF9 Cas9_X5KBF9_prot 1263
837 A0A0B7HB18 Cas9_A0A0B7H B18_prot 1264
838 I8UMX3 Cas9_J 8 U MX3_prot 1265
839 L1PRF6 Cas9_L1 PRF6_prot 1266
840 S3CB04 Cas9_S3CB04_prot 1267
841 A0A098LI38 Cas9_A0A098LI38_prot 1268
842 A0A125S8K9 Cas9__A0A125S8K9_prot 1269
843 E6K6M2 Cas9_.E6K6M2_.prot 1270
844 A0A1E5UGK6 Cas9_A0A1 E5UGK6_prot 1271
845 F2IKJ5 Cas9_.F2IKJ5_.prot 1272
846 A0A150XH78 Cas9_A0A150XH78_prot 1273
847 G8X9H3 Cas9_G8X9H3_prot 1274
848 A0A109Q6P7 Cas9_A0A109Q6P7_prot 1275
849 A0A101CFI9 Cas9_.A0A101CFI9_.prot 1276
850 A0A0T0M2G2 Cas9_.A0A0T0M2G2_.prot 1277
851 K1I305 Cas9_K1l305_prot 1278
852 L1P954 Cas9_L1P954_prot 1279
853 J0DFD8 Cas9_J0DFD8_prot 1280
854 H1YII5 Cas9_H1YII5_prot 1281
855 G2Z1C1 Cas9_G2Z1C1_prot 1282
Petição 870190070557, de 24/07/2019, pág. 173/401
109/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
856 A0A1E5TBF5 Cas9_A0A1 E5TBF5_prot 1283
857 A0A0K1NMP1 Cas9_A0A0K1NMP1„prot 1284
858 A0A0E3VRY2 Cas9_A0A0E3VRY2_prot 1285
859 A0A133Q212 Cas9_A0A 133Q212_prot 1286
860 A0A1E4APC4 Cas9__A0A1 E4APC4_.pr ot 1287
861 U2QLH7 Cas9_.U2QLH7_.prot 1288
862 A0A1D3UU01 Cas9__A0A1D3UU01_prot 1289
863 A0A096CIC5 Cas9_A0A096CIC5_prot 1290
864 I4ZCD3 Cas9_J4ZCD3_prot 1291
865 A0A137SV51 Cas9_.A0A137SV51_.prot 1292
866 A0A0X8BZ89 Cas9__A0A0X8BZ89_prot 1293
867 A0A096D253 Cas9..,A0A096D253...prot 1294
868 A0A134B2X0 Cas9__A0A 134B2X0__prot 1295
869 D1W1M7 Cas9_D1W1M7_prot 1296
870 U2LB41 Cas9_U2LB41_prot 1297
871 C9MPM6 Cas9_C9MPM6_prot 1298
872 R7D4J2 Cas9_R7D4J2_prot 1299
873 A0A1C5L2R1 Cas9__A0A1C5L2R1__prot 1300
874 A0A1D3UYE2 Cas9_A0A1 D3UYE2„prot 1301
875 R9I6A5 Cas9_.R9l6A5_.prot 1302
876 A0A0M1W3D2 Cas9__A0A0M 1 W3D2_prot 1303
877 R7NZZ9 Cas9__R7NZZ9_prot 1304
878 A0A0P7AYC1 Cas9..A0A0P7AYC1....prot 1305
879 F3ZS64 Cas9_.F3ZS64_.prot 1306
880 B6W3J8 Cas9_B6W3J8_prot 1307
881 I9UHX4 Cas9_l9UHX4_prot 1308
882 F9DDR2 Cas9_.F9DDR2_.prot 1309
883 A0A069SLB0 Cas9_.A0A069SLB0_.prot 1310
884 K4I9M9 Cas9__K4l9M9__prot 1311
885 F3PY63 Cas9_F3PY63_prot 1312
886 E5WV33 Cas9_E5VW33_prot 1313
887 R5MDQ9 Cas9_R5M DQ9_prot 1314
888 R5K6G6 Cas9_R5K6G6_prot 1315
Petição 870190070557, de 24/07/2019, pág. 174/401
110/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
889 S0FEG1 Cas9__S0FEG1__prot 1316
890 A0A078PYN7 Cas9_A0A078PYN7__prot 1317
891 E5CB73 Cas9_E5CB73_.prot 1318
892 U6RJS5 Cas9_U6RJS5_prot 1319
893 A0A1B7ZF33 Cas9_A0A1 B7ZF33_prot 1320
894 C9RJP1 Cas9_.C9RJP1__prot 1321
895 I8X6S1 Cas9 J 8X6S 1_prot 1322
896 A0A0D0IUN5 Cas9__A0A0D0IUN5_prot 1323
897 E1Z024 Cas9._E1Z024.prot 1324
898 A0A173UDH4 Cas9.. A0A173U DH4_prot 1325
899 A0A0J9G920 Cas9__A0A0J9G920_prot 1326
900 A0A1C2BS21 Cas9_A0A 1C2 BS21 _prot 1327
901 A0A174HS76 Cas9_.A0A174HS76_.prot 1328
902 R6V444 Cas9_R6V444_prot 1329
903 A0A167Y4I1 Cas9__A0A167Y4H__prot 1330
904 R7ZSP8 Cas9._R7ZSP8_.prot 1331
905 W4PXW0 Cas9_W4PXW0_prot 1332
906 U2DMI6 Cas9__U2DMI6__prot 1333
907 W4PHU4 Cas9_W4PHU4_prot 1334
908 I4A2W8 Cas9J4A2W8__prot 1335
909 G8XA12 Cas9_.G8XA 12_.prot 1336
910 A0A1B9E9Q0 Cas9_A0A1 B9E9Q0_prot 1337
911 R5CLM1 Cas9_R5CLM1_prot 1338
912 A0A180FK19 Cas9_A0A 180FK19...prot 1339
913 R6E3D1 Cas9_R6E3D1_prot 1340
914 A0A101CN94 Cas9_A0A101CN94_prot 1341
915 A0A0K8QW18 Cas9_A0A0K8QW18_prot 1342
916 A0A1H6BLP7 Cas9_A0A1 H6BLP7_prot 1343
917 R5ZG15 Cas9_R5ZG 15_prot 1344
918 I0AP30 Cas9J0AP30_prot 1345
935 Q99ZW2 NLS2_STRP1 (SF370)cas9_Q99Z W2_NLS4_prot 1362
936 A0Q5Y3 N LS2_cas9_A0Q5Y3_N LS4_.prot 1363
Petição 870190070557, de 24/07/2019, pág. 175/401
111/306
Fileira Coluna A No. Ac. Da Proteína Proteína (Cas9/Cpf1) Coluna B SEQ ID NO
937 J7RUA5 NLS2__cas9__J7RUA5__NLS4__prot 1364
938 G3ECR1 N LS2...cas9-G3ECR 1 ... N LS4__prot 1365
939 J3F2B0 NL.S2...cas9...J3F2B0...NLS4...prot 1366
940 Q03JI6 N LS2_cas9_Q03J I ©__ N LS4_prot 1367
941 C9X1G5 N LS2_.cas9_.C9X1 G5_N LS4_.prot 1368
942 Q927P4 N LS2_cas9_.Q927P4__N LS4_prot 1369
943 Q8DTE3 NLS2_cas9_Q8DTE3_NLS4_prot 1370
944 Q9CLT2 N LS2_cas9_Q9CLT2_N LS4_prot 1371
945 A1IQ68 NLS2_cas9_A1 IQ68_.NLS4_.prot 1372
946 Q6NKI3 N LS2 ,.cas9.. Q6N Kl 3_N L.S4...prat 1373
947 Q0P897 N LS2_cas9_Q0P897_N LS4_prot 1374
948 Q03LF7 NLS2_cas9_.Q03LF7_.NLS4._.prot 1375
[0184] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção que compreende uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 como definido pelo número de acesso do banco de dados provido sob a respectiva coluna na Tabela 2 ou um homólogo, variante, fragmento ou derivado da mesma. Em particular, a proteína Cas9 codificada pode compreender ou consistir preferivelmente em uma sequência de aminoácido como indicado sob a respectiva coluna na Tabela 2 ou um homólogo, variante, fragmento ou derivado da mesma.
[0185] Especificamente, em modalidades preferidas da invenção a molécula de ácido nucleico artificial pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma das SEQ ID NOs: 428-1375, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo
Petição 870190070557, de 24/07/2019, pág. 176/401
112/306 menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0186] Em particular, a proteínas Cas9 codificada pode compreender preferivelmente pelo menos um sinal de localização nuclear (NLS), mais preferivelmente dois NLS selecionados de NLS2 e NLS4 como acima definido. Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 com sinais de localização nucleares, compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma das SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou SEQ ID NOs: 12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0187] Variantes de Cas9 funcionais preferidas compreendidas aqui incluem inter alia, mortaCas9 (dCas9) e nickases de Cas9.
[0188] O termo dCas9 refere-se a uma Cas9 com nuclease desa
Petição 870190070557, de 24/07/2019, pág. 177/401
113/306 tivada, também chamada cataliticamente inativa, Cas9 cataliticamente morta ou cas9 morta. Tais nucleases são isentas de toda ou uma porção de atividade de endonuclease e podem então ser usadas para regular genes de uma maneira guiada por RNA (Jinek, M. e outros. Science. 2012 Ago 17;337(6096):816-21). Nucleases dCas9 compreendem mutações que inativam atividade de endonuclease de Cas9, tipicamente em ambos os resíduos catalíticos (D10A no domínio RuvC-1 e H840A no domínio HNH, numeradas com relação à Cas9 de S. pyogenes, isto é, spCas9). Outros resíduos catalíticos podem, no entanto, ser mutados a fim de reduzir a atividade de um ou ambos os domínios de nuclease, dCas9 é preferivelmente incapaz de clivar dsDNA, mas retém sua habilidade em se associar com gRNAs adequados e especificamente se ligar a DNA-alvo. O mutante duplo de Cas9 com mudanças em posições de aminoácido D10A e H840A inativa completamente ambas as atividades de nuclease e nickase. Derivados de Cas9 baseados em dCas9 podem ser usados para transportar domínios efetores adicionais para uma sequência de DNA-alvo, desta maneira induzindo, por exemplo, CRISPRa ou CRISPR! (como discutido em algum outro ponto aqui).
[0189] O termo nickase de Cas9 refere-se a variantes de Cas9 que não retêm a habilidade de introduzir quebras de filamento duplo em uma sequência de ácido nucleico-alvo, mas mantêm a habilidade de se ligar a e introduzir uma quebra de filamento simples em um sítio-alvo. Tais variantes incluirão tipicamente uma mutação em um, mas não em ambos, os domínios de endonuclease Cas9 (HNH e RuvC). Desta maneira, uma mutação de aminoácido na posição D10A ou H840A em Cas, numerada em relação à Cas9 de S. pyogenes), isto é, spCas9, pode resultar na inativação da atividade catalítica de nuclease e converte Cas9 em uma nickase.
[0190] Variantes de Cas9 adicionais são conhecidas na técnica e
Petição 870190070557, de 24/07/2019, pág. 178/401
114/306 compreendidas como variantes de acordo com a presente invenção. O Pedido de Patente U.S. No. 20140273226 discute o gene Cas9 de S. pyogenes, proteína Cas9 e variantes da proteína Cas9 incluindo sequências de codificação de Cas9 otimizadas no códon específicas de hospedeiro e proteínas de fusão Cas9. O Pedido de Patente U.S. 20140315985 ensina um número grande de polipeptídeos Cas9 do tipo selvagem exemplares (por exemplo, SEQ ID NO: 1-256, SEQ ID NOS: 795-1346 do Pedido de Patente U.S> No. 20140273226) incluindo a sequência de Cas9 de S. pyogenes (SEQ ID NO: 8 do Pedido de Patente U.S. No. 20140273226). Modificações e variantes de proteínas Cas9 são também discutidas. A descrição das presentes referências é incorporada aqui em sua totalidade.
[0191] Em modalidades adicionais, ácidos nuclelcos artificiais de acordo com a invenção codificam uma proteína Cas9, ou uma isoforma, homólogo, variante, fragmento ou derivado da mesma, como indicado na Tabela 2 do PCT/EP2017/076775, que é aqui incorporado a título de referência em sua totalidade. Por exemplo, os ácidos nucleicos artificiais da invenção podem então compreender pelo menos uma sequência de codificação codificando uma proteína Cas9 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma da SEQ ID NOs: 428-1345 ou 1362-1375do PCT/EP2017/076775 ou uma isoforma, homólogo, variante, fragmento ou derivado (funcional) da mesma.
Sequências de ácido nucleico [0192] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cas9 como aqui definido, em que a dita sequência de ácido nucleico é definida por qualquer uma de SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114
Petição 870190070557, de 24/07/2019, pág. 179/401
115/306
8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 35543567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 36503663; 3666-3679; 3682-3695; 9514-9527: 9626-9639; 9738-9751; 98509863; 9962-9975, 10074-10087; 10186-10199; 10298-10311 ;23302343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 24262439; 2442-2455; 2458-2471; 2474-2487: 2490-2503; 2506-2519; 25222535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 1020210215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 1001 ΟΙ 0023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 81468159; 8162-8175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 82428255; 8258-8271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 95789591; 9690-9703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250-10263: 10362-10375; 9290-9303; 9306-9319; 9322-9335; 93389351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 94349447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; 27; 996-1009; 2156-2169; 3316-3329; 4476-4489; 56365649; 6796-6809; 7956-7969; 1010- 1913; 2170-3073; 3330-4233; 4490-5393; 5650-6553; 6810-7713; 7970-8873, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma
Petição 870190070557, de 24/07/2019, pág. 180/401
116/306 sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0193] Em modalidades preferidas, os ácidos nucleicos artificiais da invenção codificam ainda, em sua região de codificação, pelo menos um sinal de localização nuclear. A sequência de ácido nucleico codificando o(s) slnal(ais) de localização nuclear é preferivelmente fundida ao ácido nucleico codificando a proteína Cas9, ou um homólogo, variante, fragmento ou derivado da mesma, como aqui definido, de modo a facilitar transporte da dita proteína Cas9, ou seu homólogo, variante, fragmento ou derivado da mesma, para o núcleo. Em modalidades preferidas, os ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas9, ou um homólogo, variante, fragmento ou derivado da mesma, fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NOs: 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988; 11990-11996; 1199812004; 12006-12012; 12014-12020 ou qualquer sequência de ácido nucleico codificando a proteínas de SEQ ID NOs: 12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, In particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%,
Petição 870190070557, de 24/07/2019, pág. 181/401
117/306
80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0194] A presente invenção compreende a combinação benéfica de regiões de codificação de proteína associada à CRISPR com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucieico codificando uma proteína Cas9 ou um homóiogo, variante, fragmente ou derivado da mesma fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 101/ΟΙ 0183-10282-10295: 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994
Petição 870190070557, de 24/07/2019, pág. 182/401
118/306
10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 69866999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 1012210135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 81628175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 82588271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 96909703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular sequências de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0195] A presente invenção compreende a combinação benéfica de regiões de codificação de proteína associada a CRISPR com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas9 ou um homólogo, variante, fragmento ou derivado da mesma fundida a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer SEQ ID NO selecionada do grupo consistindo em SEQ
Petição 870190070557, de 24/07/2019, pág. 183/401
119/306
ID NO: 14274, SEQ ID NO: 14275, SEQ ID NO: 14276, SEQ ID NO: 14277, SEQ ID NO: 14278, SEQ ID NO: 14279, SEQ ID NO: 14280, SEQ ID NO: 14281 e SEQ ID NO: 14282; mais preferivelmente SEQ ID NO: 14281, SEQ ID NO: 417 (HSD17B4/PSMB3.1 i.e. construto HSD17B4_ NLS2..STRP1 (SF370)-cas9_HsOpt_NLS4_PSMB3.1; Hsopt - otimização de Homo sapiens) ou SEQ ID NO:414 (Slc7a3.1 / Gnasl, i.e. construto Scl7a3.1__NLS2_STRP1(SF370)-cas9__HsOpt_NLS4_Gnas.1).
[0196] Vantajosamente, qualquer sequência de Cas9 como revelado pode ser selecionada para uso na invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cas9 e mRNAs codificando versões diferentes das respectivas sequências de proteína Cas9, isto é, sequências do tipo selvagem ou otimizadas.
[0197] Ainda, a excisão precisa do Trato CAG do Gene da Huntingtina por nickase de Cas9 está compreendida nos ensinamentos da presente invenção com referência a PMID 29535594, que é aqui incorporado a título de referência. Também, a divagem de RNA programável e reconhecimento por um Sistema CRISPR-Cas9 natural de Neisseria meningitidis está compreendida nos ensinamentos da invenção com referência a PMID 29456189 que é aqui incorporado a título de referência. Ainda, ligação e divagem dependente de RNA de CRISPR de RNAs endógenos pela Cas9 de Campylobacter jejuni são compreendidas nos ensinamentos da invenção com referência a PMID 29499139 que é aqui incorporado a título de referência. Também ativação de gene alvo in vivo através de modulação transepigenética mediada por CRISPR/Cas9 é compreendida nos ensinamentos da invenção, com referência ao PMID 29224783, que é aqui incorporado a título de referência.
[0198] Em uma modalidade adicional, a presente invenção compreende também as sequências de ácido nucleico como mostrado na Tabela 2A.
Petição 870190070557, de 24/07/2019, pág. 184/401
120/306
Tabela 2A. Sequências de Cas9 otimizadas preferidas adicionais da in venção
5‘ UTR Cas9 incl. NLS 3‘UTR SEQ ID NO
Slc7a3.1 N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4 Gnas.1 14521
Ubqln2.1 N LS2J5TRP1 (SF370)-cas9(opt1 )_N LS4 RPS9.1 14522
HSD17B4 N LS2JSTRP 1 (SF370)-cas9(opt1 )__N LS4 PSBM3 14523
HSD17B4 N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4 Gnas.1 14524
Nosip.1 N LS2_STRP1 (SF370)-cas9(opt1 )_N LS4 Ndufa1.1 14525
Mp68 N LS2JSTRP 1 (SF370)-cas9(opt1 )__N LS4 Gnas.1 14526
Mp68 N LS2_STRP 1 (SF370)-cas9(opt1 )_N LS4 Ndufa1.1 14527
Slc7a3.1 N LS2_STRP1 (SF370)-cas9(opt2)__N LS4 Gnas.1 14528
Ubqln2.1 N LS2JSTRP1 (SF370)-cas9(opt2)...N LS4 RPS9.1 14529
HSD17B4 N LS2_STRP 1 (SF370)-cas9(opt2)_N LS4 PSBM3 14530
HSD17B4 N LS2__STRP 1 (SF370)-cas9(opt2)_N LS4 Gnas.1 14531
Nosip.1 N LS2JSTRP1 (SF370)-cas9(opt2)...N LS4 Ndufa1.1 14532
Mp68 N LS2__STRP 1 (SF370)~cas9(opt2)_N LS4 Gnas.1 14533
Mp68 N LS2__STRP 1 (SF370)-cas9(opt2)_N LS4 Ndufa1.1 14534
Slc7a3.1 N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4 Gnas.1 14535
Ubqln2.1 N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4 RPS9.1 14536
HSD17B4 N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4 PSBM3 14537
HSD17B4 N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4 Gnas.1 14538
Nosip.1 N LS2__STRP 1 (SF370)-cas9(opt10)_N LS4 Ndufa1.1 14539
Mp68 N LS2_STRP1 (SF370)-cas9(opt10)_N LS4 Gnas.1 14540
Mp68 N LS2J5TRP1 (SF370)-cas9(opt10)_N LS4 Ndufa1.1 14541
[0199] Em uma modalidade adicional, NLS2JSTRP1(SF370)~ cas9JHsOptJ\ILS4 (SEQ ID NO: 412) é combinada com as combinações de UTR como mostrado na Tabela 2A, isto é, com Slc7a3.1 (SEQ ID NO: 15/16) / Gnas.1 (SEQ ID NO: 29/30).
Tabela 2B. Sequências de Cas9 preferidas adicionais da invenção
5‘ UTR Cas9 (Hsopt) íncl. NLS 3‘UTR SEQ ID NO
Slc7a3.1 NLS2__STRP1(SF370)-cas9__HsOpt__NLS4 Gnas.1 414
Ubqln2.1 NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 RPS9.1 14542
HSD17B4(V2) NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 PSBM3 417
HSD17B4ÍV2) NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 Gnas.1 14543
Nosip.1 NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 Ndufa1.1 14544
Mp68 NLS2_STRP1(SF370)~cas9_HsOpt_NLS4 Gnas.1 14545
Mp68 NLS2_STRP1(SF370)-cas9_HsOpt_NLS4 Ndufa1.1 14546
[0200] Em modalidades adicionais, as sequências de ácido nucleico
Petição 870190070557, de 24/07/2019, pág. 185/401
121/306 artificiais de acordo com a invenção podem compreender ou consistir em sequências de ácido nucleico de acordo com SEQ ID NOs: 1380 1393; 1394 - 2297; 2314™ 2327; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458
- 2471; 2474 - 2487; 2490 - 2503; 2506 - 2519; 2522 - 2535; 9498 -9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 - 10295; 2540 - 2553; 2554 - 3457; 3474 3887; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650
- 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 -10087; 10186-10199; 10298 -10311; 3700 - 3713; 3714 - 4617; 4634 - 4647; 4650 - 4663; 4666 - 4679; 4682
- 4695; 4698 -4711; 4714 - 4727; 4730 - 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530
- 9543; 9642 - 9655; 9754 -9767; 9866 -9879; 9978 - 9991; 10090 10103; 10202 - 10215; 10314-10327; 4860 - 4873; 4874-5777; 5794
- 5807; 5810 - 5823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 - 5999; 6002 - 6015; 9546 - 9559; 9658 - 9671; 9770
- 9783; 9882 - 9895; 9994 - 10007; 10106-10119; 10218 - 10231; 10330 - 10343; 6020 - 6033; 6034 - 6937; 6954 - 6967; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 -7079; 7082-7095; 7098 - 7111; 7114 - 7127; 7130-7143; 7146-7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010
- 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 7180 - 7193; 7194-8097; 8114-8127; 8130-8143; 8146-8159; 8162-8175; 8178
- 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322 - 8335; 9578 - 9591; 9690 -9703; 9802-9815; 9914-9927; 10026- 10039; 10138-10151; 10250 -10263; 10362 - 10375; 8340 - 8353; 8354 - 9257; 9274 - 9287; 9290
Petição 870190070557, de 24/07/2019, pág. 186/401
122/306
- 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 - 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466
- 9479; 9482 - 9495; 9594 -9607: 9706 - 9719; 9818-9831; 9930 - 9943; 10042 - 10055; 10154 - 10167; 10266 - 10279; 10378 -- 10391; 411; 1380 - 1393; 2540 - 2553; 3700 - 3713; 4860 - 4873; 6020 - 6033; 7180
- 7193; 8340 - 8353; 1394 - 2297; 2554 - 3457; 3714 - 4617; 4874 5777; 6034 - 6937; 7194 - 8097; 8354 - 9257; 2314 - 2327; 3474 - 3887 : 4634-4647; 5794-5807; 6954-6967; 8114-8127; 9274-9287; 413
- 425; 2330 - 2343; 2346 - 2359; 2362 - 2375; 2378 - 2391; 2394 - 2407; 2410 - 2423; 2426 - 2439; 2442 - 2455; 2458 - 2471; 2474 - 2487; 2490
- 2503; 2506 - 2519; 2522 - 2535; 9498 -9511; 9610 - 9623; 9722 - 9735; 9834 - 9847; 9946 - 9959; 10058 - 10071; 10170 - 10183 - 10282 10295; 3490 - 3503; 3506 - 3519; 3522 - 3535; 3538 - 3551; 3554 - 3567; 3570 - 3583; 3586 - 3599; 3602 - 3615; 3618 - 3631; 3634 - 3647; 3650
- 3663; 3666 - 3679; 3682 - 3695; 9514 - 9527; 9626 - 9639; 9738 - 9751; 9850 - 9863; 9962 - 9975, 10074 -10087; 10186-10199; 10298 -10311; 4650 - 4663; 4666 - 4679; 4682 - 4695; 4698 -4711; 4714 - 4727; 4730
- 4743; 4746 - 4759; 4762 - 4775; 4778 - 4791; 4794 - 4807; 4810 - 4823; 4826 - 4839; 4842 - 4855; 9530 - 9543; 9642 - 9655; 9754 -9767; 9866 9879; 9978-9991; 10090- 10103; 10202- 10215; 10314- 10327; 58105823; 5826 - 5839; 5842 - 5855; 5858 - 5871; 5874 - 5887; 5890 - 5903; 5906 - 5919; 5922 - 5935; 5938 - 5951; 5954 - 5967; 5970 - 5983, 5986 -
QA71 - Q77H Q7&^- QO0O QftQfv OUUZ - oulu, ~ í, ~ - destra,
9994 -10007; 10106 -10119; 10218 - 10231; 10330 -10343; 6970 - 6983; 6986 - 6999; 7002 - 7015; 7018 - 7031; 7034 - 7047; 7050 - 7063; 7066 7079; 7082- 7095; 7098- 7111; 7114-7127; 7130- 7143; 7146- 7159; 7162 - 7175; 9562 - 9575; 9674 - 9687; 9786 - 9799; 9898 - 9911; 10010 10023; 10122 - 10135; 10234 - 10247; 10346 - 10359; 8130 - 8143; 8146
- 8159; 8162 - 8175; 8178 - 8191; 8194 - 8207; 8210 - 8223; 8226 - 8239; 8242 - 8255; 8258 - 8271; 8274 - 8287; 8290 - 8302; 8306 - 8319; 8322
Petição 870190070557, de 24/07/2019, pág. 187/401
123/306
8335: 9578 - 9591; 9690 - 9703; 9802 - 9815; 9914 - 9927; 10026 -10039; 10138-10151; 10250 -10263; 10362 - 10375; 9290 - 9303; 9306 - 9319; 9322 - 9335; 9338 - 9351; 9354 - 9367; 9370 - 9383; 9386 - 9399; 9402 9415; 9418 - 9431; 9434 - 9447; 9450 - 9463; 9466 - 9479; 9482 - 9495; 9594 -9607; 9706 - 9719; 9818 - 9831; 9930 - 9943; 10042 -10055; 10154 - 10167; 10266 - 10279; 10378 - 10391 do PCT/EP2017/076775 ou homólogos, fragmentos, variantes ou derivados (funcionais) das mesmas. Cpf1 [0201 ] Cpf1 (CRISPR de Prevctelia e Frandsella 1) ou ”Cas12” refere-se a endonucleases de DNA guiadas por RNA, que pertencem aos sistemas CRiSPR-Cas tipo V classe 2 putativos (Zetsche e outros, Cell. 2015 Out 22; 163(3): 759-771) e homólogos, variantes, fragmentos e derivados das mesmas. Genes codificando Cpr1 incluem o gene cpf1 de Frandsella tuíarensís subsp. novidda (cepa U112) (Sequência de Referência NCBI: NZ_CP009633.1, AW25_RS03035) ou homólogos, variantes ou fragmentos do mesmo. Com base em análise de sequência, Cpf1 contém apenas um domínio de endonuclease RuvC, e um segundo domínio de nuclease (NUC) novo putativo (Zetsche e outros, Cell. 2015 Out 22; 163(3): 759-771, Gao e outros, Cell Res. 2016 Ago;26(8):901-13).
[0202] Proteínas Cpf1 preferivelmente se associam com um crRNA formando um complexo Cpf1 :crRNA que é preferivelmente capaz de interagir especificamente com uma sequência de DNA-alvo. Complexos de Cpf1 :crRNA são preferivelmente capazes de clivar eficientemente DNAalvo seguido por um motivo adjacente protoespaçador rico em T curto (PAM) localizado 5’ do DNA-alvo, e podem introduzir quebras de filamento duplo de DNA escalonado com uma sobreposição 5’ de 4 ou 5-nt.
Seguêndas de aminoáddo [0203] Várias proteínas Cpf1 são conhecidas na técnica e são compreendidas como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cpf1 adequadas são listadas na Tabela 3
Petição 870190070557, de 24/07/2019, pág. 188/401
124/306 abaixo. Nela, cada fileira corresponde a uma proteína Cpf1 como identificado por seu número de acesso no banco de dados (primeira coluna, A, No. Ac.). A segunda coluna na Tabela 3 (B) indica a SEQ ID NO: correspondendo à respectiva sequência de aminoácido conforme provido aqui. Proteínas Cpf1 preferidas são mostradas na listagem de sequência sob SEQ ID NOs: 1346-1347; 10576-10577; e1348-1361. As sequências de mRNA otimizadas correspondentes que sâo modalidade preferida da invenção são mostradas na listagem de sequência sob SEQ ID NO: 10552; 3458-3459; 3460-34732298-2299; 4618-4619;
5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; e 9260-9273.
Tabela 3. Proteínas Cpf1
Coluna A Coluna B
Fileira No. Ac. SEQ ID NO
1 U2UMQ6 1346
2 A0Q7Q2 1347
3 A8WNM2 1348
4 E3LGD2 1349
5 A0A182DWE3 1350
6 A0A0B6KQP9 1351
7 A0A0E1N6W4 1352
8 V6HCU8 1353
9 A0A0E1N9S2 1354
10 A0A1B8PW75 1355
11 A0A1J0L0B6 1356
12 A0A1F3JTA5 1357
13 A0A1G2R4W1 1358
14 A0A1F5S360 1359
15 A0A1F5ENJ2 1360
16 A0A1J4U637 1361
17 U2UMQ6 (NLS2___cpf1__U2UMQ6__NLS4__prot) 1376
18 A0Q7Q2 (NLS2__cpf1__A0Q7Q2__NLS4__prot) 1377
Petição 870190070557, de 24/07/2019, pág. 189/401
125/306 [0204] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção então compreende uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 como definido pelo número de acesso no banco de dados provido sob a respectiva coluna na Tabela 3, ou um homólogo, variante, fragmento ou derivado da mesma. Em particular, a proteína Cpf1 codificada pode compreender ou consistir preferivelmente em uma sequência de aminoácido como indicado sob a respectiva coluna na Tabela 3, ou um homólogo, variante, fragmento ou derivado da mesma.
[0205] Especificamente, em modalidades preferidas a molécula de ácido nucleico artificial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma de SEQ ID NO: 1346-1347; 10576-10577; ou 1348-1361, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0206] Em particular, a proteína Cpf1 codificada pode compreender preferivelmente pelo menos um sinal de localização nuclear (NLS), mais preferivelmente dois NLS selecionados de NLS2 e NLS4 como acima definido. Em modalidades preferidas, a molécula de ácido nucleico arti
Petição 870190070557, de 24/07/2019, pág. 190/401
126/306 ficial da invenção pode então compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 com sinais de localização nuclear, compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma de SEQ ID NOs: 992-993 ou um homólogo, variante, fragmento ou derivado (funcional) do mesmo compreendendo ou consistindo em uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0207] Em modalidades adicionais, ácidos nucleicos artificiais de acordo com a invenção codificam uma proteína Cpf1, ou uma isoforma, homólogo, variante, fragmento ou derivado da mesma, como indicado na Tabela 3 do PCT/EP2017/076775, que é aqui incorporado a título de referência em sua totalidade. Especificamente, a molécula de ácido nucleico artificial (RNA) da invenção pode então compreender uma sequência de codificação codificando uma proteína Cpf1 compreendendo ou consistindo em uma sequência de aminoácido como definido por qualquer uma SEQ ID NOs: 1346-1361 ou 1376-1377 ou 10576-10577 do PCT/EP2017/076775 ou uma isoforma, homólogo, variante, fragmento ou derivado (funcional) da mesma.
Sequências de ácido nucleico [0208] Em modalidades preferidas, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico
Petição 870190070557, de 24/07/2019, pág. 191/401
127/306 codificando uma proteína Cpf1 como definido aqui, em que a dita sequência de ácido nucleico é definida por qualquer uma das SEQ ID NOs: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 1008810089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 1007210073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 1010410105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 1012010121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 70487049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 71447145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912
Petição 870190070557, de 24/07/2019, pág. 192/401
128/306
9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525: 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377;
10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463;
10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526;
10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 10579-
10580; 10585-10586; 10588-10589; 10591 -10592; 10594-10595;
10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629;
10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686;
10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755;
10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812;
10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881;
10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646;
10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715;
10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772;
10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841;
10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606;
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
Petição 870190070557, de 24/07/2019, pág. 193/401
129/306
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777: 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668: 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 9352
9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548; ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0209] Em uma outra modalidade preferida, a molécula de ácido nucleico artificial da invenção pode compreender uma sequência de codificação compreendendo ou consistindo em uma sequência de ácido nucleico codificando uma proteína Cpf1 como aqui definido, em que a dita sequência de ácido nucleico é definida por qualquer uma da SEQ ID
Petição 870190070557, de 24/07/2019, pág. 194/401
130/306
NO: 10549 (i.e. AsCpfl 32L4__AsCpf1(Hsopt)-NLS3-3xHA-tag_albumina7) ou SEQ ID NO: 10550 (i.e. LbCpfl = 32L4....LbCpf1(Hsopt)NLS3-3xHA-tag_albumina7); ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0210] Em modalidades preferidas, os ácidos nucleicos artificiais da invenção codificam ainda, em sua região de codificação, pelo menos um sinal de localização nuclear. A sequência de ácido nucleico codificando o(s) sinal(ais) de localização nuclear é preferivelmente fundida ao ácido nucleico codificando a proteína Cpf1, ou seu homólogo, variante, fragmento ou derivado, como definido aqui, de modo a facilitar transporte da dita proteína Cpf 1, ou seu homólogo, variante, fragmento ou derivado, para o núcleo. Em modalidades preferidas, ácidos nucleicos artificiais então compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cpf 1, ou seu homólogo, fragmento, variante ou derivado, fundida a pelo menos um sinal de localização, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NOs: 10551; 10581; 10593; 10584; 10587; 10590; 10593; 10596; 409; 2538; 410; 2539; 10551; 10581; 11973; 11974-11980; 1378; 3698; 4858; 6018; 7178; 8338; 1379; 3699; 4859; 6019; 7179; 8339; 10593; 10584; 10587; 10590; 10593; 10596; 11965; 11981; 11989; 11997; 12005; 12013; 11966-11972; 11982-11988;
Petição 870190070557, de 24/07/2019, pág. 195/401
131/306
11990-11996; 11998-12004; 12006-12012; 12014-12020 ou sequências de ácido nucleico codificando qualquer uma de uma combinação de SEQ ID NO:12021-14274, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0211] Vantajosamente, as sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como Cpf1, ou seus homólogos, variantes, fragmentos ou derivados, são combinadas com a região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, os ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cpf1, ou um homólogo, variante ou fragmento da mesma, que são fundidos ainda a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID Nos: 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 1008810089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487;
Petição 870190070557, de 24/07/2019, pág. 196/401
132/306
10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 1007210073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479: 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 1010410105; 10216-10217; 10328-10329; 10404: 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5Ο/Π ΚΟ/Ν· &QE& CQE7- £0*70 COQÔ· EQfM CCiAC SQOA ΕΩΟ-1· o4U~Oo41, bobo-bob/, bo/z-ba/o, booo-booy, byU4~byub, byzU~byzl, 5936-5937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 1012010121; 10232-10233; 10344-10345; 10405: 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 70487049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 71447145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 99129913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526;
Petição 870190070557, de 24/07/2019, pág. 197/401
133/306
10533; 10540; 10547; ! 9288-9289; 10401; 10553: 10582-1058310579-
10580; 10585-10586; 10588-10589; 10591-10592; 10594-10595;
10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629;
10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686;
10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755;
10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812;
10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881;
10882 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646;
10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702: 10715;
10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772;
10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841;
10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605: 10606;
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788: 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691: 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874: 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
Petição 870190070557, de 24/07/2019, pág. 198/401
134/306
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548, ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0212] Vantajosamente, qualquer sequência de Cpf1 como aqui revelado pode ser selecionada para uso na invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cpf1 e mRNAs codificando versões diferentes das respectivas sequências de proteína Cpf1, isto é, sequências do tipo selvagem ou otimizadas.
[0213] Em modalidades adicionais, as sequências de ácido nucleico artificiais de acordo com a invenção podem compreender ou consistir em uma sequência de ácido nucleico de acordo com SEQ ID NOs: 2298 - 2299; 3458 - 3459; 4618 - 4619; 5778 - 5779; 6938 - 6939; 8098 8099; 9258 - 9259; 2300 - 2313; 3460 - 3473; 4620 - 4633; 5780 5793; 6940 - 6953; 8100 - 8113; 9260 - 9273; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 2344 - 2345;
Petição 870190070557, de 24/07/2019, pág. 199/401
135/306
2360 - 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440
- 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960
- 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584 - 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664
- 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864 - 9865; 9976 - 9977; 10088 -10089; 10200 -10201; 10312 -10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656
- 9657; 9768-9769; 9880 - 9881; 9992 - 9993; 10104- 10105; 10216 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; ARRR - ARA7· AR79 - AR7R- ARRR - ARRQ- RQf)4 - RQDA· - RQ91 AQRR
- 5937; 5952 - 5953; 5968 - 5969; 5984 - 5985; 6000 - 6001; 6016 - 6017; 9560 - 9561; 9672 - 9673; 9784 - 9785; 9896 - 9897; 10008 - 10009; 10120-10121; 10232 - 10233; 10344 - 10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 6984 - 6985; 7000 - 7001; 1016 - 7017; 7032 - 7033; 7048 - 7049; 7064 -7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160 - 7161; 7176 - 7177; 9576 - 9577; 9688 - 9689; 9800 - 9801; 9912
- 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462;
Petição 870190070557, de 24/07/2019, pág. 200/401
136/306
10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704
- 9705; 9816-9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264
- 10265; 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304-9305; 9320-9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416
- 9417; 9432 - 9433; 9448 - 9449; 9464 - 9465; 9480 - 9481; 9496 - 9497; 9608 - 9609; 9720 - 9721; 9832 - 9833; 9944 - 9945; 10056 - 10057;
10168 - 10169; 10280 - 10281; 10392 - 10393 10408; 10415; 10422
10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485
10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548
10552; 10594 - 10595; 10582 - 10583; 10585 - 10586; 10588 - 10589
10591 - 10592; 10594 - 10595; 10597 - 10598 10553 10599; 10600
10613; 10614; 10627; 10628; 10641; 10642; 10655; 10656; 10669
10670; 10683; 10684; 10697; 10698; 10711; 10712; 10725; 10726
10739; 10740; 10753; 10754; 10767; 10768; 10781; 10782; 10795
10796; 10809; 10810; 10823; 10824; 10837; 10838; 10851; 10852
10865; 10866; 10879; 10880; 10601; 10602; 10615; 10616; 10629
10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686
10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755
10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812
10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881
10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646
10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715
10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772
10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841
10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606
Petição 870190070557, de 24/07/2019, pág. 201/401
137/306
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788: 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691: 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892; 2298 - 2299; 3458 - 3459; 4618 - 4619; 577A £x77Q- QOhO *
2313; 3460 - 3473; 4620 - 4633; 5780 - 5793; 6940 - 6953; 8100-8113; 9260 - 9273; 2314 - 2327; 3474 - 3887 ; 4634 - 4647; 5794 - 5807; 6954 - 6967; 8114 - 8127; 9274 - 9287; 2328 - 2329; 10395; 3488 - 3489; 10396; 4648 - 4649; 10397; 5808 - 5809; 10398; 6968 - 6969; 10399; 8128 - 8129; 10400 ; 9288 - 9289; 10401; 10553; 2344 - 2345; 2360 2361; 2376 - 2377; 2392 - 2393; 2408 - 2409; 2424 - 2425; 2440 - 2441; 2456 - 2457; 2472 - 2473; 2489 - 2490; 2504 - 2505; 2520 - 2521; 2536 - 2537; 9512 - 9513; 9624 - 9625; 9736 - 9737; 9848 - 9849; 9960 - 9961; 10072 - 10073; 10184 - 10185; 10296 - 10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479;
Petição 870190070557, de 24/07/2019, pág. 202/401
138/306
10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 3504 - 3505; 3520 - 3521; 3536 - 3537; 3552 - 3553; 3568 - 3669; 3584
- 3585; 3600 - 3601; 3616 - 3617; 3632 - 3633; 3648 - 3649; 3664 - 3665; 3680 - 3681; 3696 - 3697; 9528 - 9529; 9640 - 9641; 9752 - 9753; 9864
- 9865; 9976 - 9977; 10088 - 10089; 10200 - 10201; 10312 - 10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 4664 - 4665; 4680 - 4681; 4696 - 4697; 4712 4713; 4728 - 4729; 4744 - 4745; 4760 - 4761; 4776 - 4777; 4792 - 4793; 4808 - 4809; 4824 - 4825; 4840 - 4841; 4856 - 4857; 9544 - 9545; 9656 -9657; 9768-9769; 9880 - 9881; 9992 - 9993; 10104- 10105; 10216 10217; 10328 - 10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856 - 5857; 5872 - 5873; 5888 - 5889; 5904 - 5905; 5920 - 5921; 5936
- 5937; 5952 - 5953; 5968 - 5969; 5984 - 5985; 6000 - 6001; 6016 - 6017; 9560 - 9561; 9672 - 9673; 9784 - 9785; 9896 - 9897; 10008 - 10009; 10120-10121; 10232 - 10233; 10344 - 10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 6984 - 6985; 7000 - 7001; 1016 - 7017; 7032 - 7033; 7048 - 7049; 7064 -7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160 - 7161; 7176 - 7177; 9576 - 9577; 9688 - 9689; 9800 - 9801; 9912
- 9913; 10024 - 10025; 10136 - 10137; 10248 - 10249; 10360 - 10361;
10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462;
10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525;
10532; 10539; 10546; 8144-8145; 8160 - 8160; 8176 - 8177; 8192 8193; 8208 - 8209; 8224 - 8225; 8240 - 8241; 8256 - 8257; 8272 - 8273; 8288 -8289; 8304 - 8305; 8320 - 8321; 8336 - 8337; 9592 - 9593; 9704
- 9705; 9816-9817; 9928 - 9929; 10040 - 10041; 10152 - 10153; 10264
Petição 870190070557, de 24/07/2019, pág. 203/401
139/306
- 10265: 10376 - 10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9304-9305; 9320-9321; 9336 - 9337; 9352 - 9353; 9368 - 9369; 9384 - 9385; 9400 - 9401; 9416
- 9417; 9432 - 9433; 9448 - 9449; 9464 - 9465; 9480 - 9481; 9496 - 9497; 9608 - 9609; 9720 - 9721; 9832 - 9833; 9944 - 9945; 10056 - 10057;
10168 - 10169; 10280 - 10281; 10392 - 10393 10408; 10415; 10422;
10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485;
10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541: 10548;
10554-- 10574; 10594- 10595; 10582- 10583 10585 - 10586 10588
-- 10589; 10591 -10592; 10594 -10595; 10597 -10598; 10599; 10600;
10613; 10614; 10627; 10628; 10641; 10642; 10655; 10656: 10669;
10670; 10683; 10684; 10697; 10698; 10711; 10712; 10725; 10726;
10739; 10740; 10753; 10754; 10767; 10768; 10781; 10782; 10795;
10796; 10809; 10810; 10823; 10824; 10837; 10838; 10851: 10852;
10865; 10866; 10879; 10880; 10601; 10602; 10615; 10616; 10629;
10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686;
10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742: 10755;
10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812;
10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881;
10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645: 10646;
10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715;
10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772;
10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841;
10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606;
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
Petição 870190070557, de 24/07/2019, pág. 204/401
140/306
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892 do PCT/EP2017/076775 ou homólogos, fragmentos, variantes ou derivados (funcionais) das mesmas.
Cas13, CasX, CasY e outras (endo)nudeases
Sequências de aminoácido [0214] Várias proteínas Cas13, CasX e CasY são conhecidas na técnica e compreendidas como proteínas associadas a CRISPR no contexto da presente invenção. Proteínas Cas13, CasX e CasY adequadas são mostradas sob SEQ ID NO: 10893-10925; 10926-10998 (Cas13 i.e. WP15770004, WP18451595, WP21744063, WP21746774, ERK53440, WP31473346, CVRQ01000008, CRZ35554, WP22785443,
WP36091002, WP12985477, WP13443710, ETD76934, WP38617242, WP2664492, WP4343973, WP44065294, ADAR2DD, WP47447901, ERI81700, WP34542281, WP13997271, WP41989581, WP47431796, WP14084666, WP60381855, WP14165541, WP63744070,
WP65213424, WP45968377, ΕΗΘ06562, WP6261414, EKB06014, WP58700060, WP13446107, WP44218239, WP12458151, ERJ81987, ERJ65637, WP21665475, WP61156637, WP23846767, ERJ87335,
Petição 870190070557, de 24/07/2019, pág. 205/401
141/306
WP5873511, WP39445055, WP52912312, WP53444417,
WP12458414, WP39417390, ΕΘΑ10535, WP61156470, WP13816155, WP5874195, WP39437199, WP39419792, WP39431778,
WP46201018, WP39442171, WP39426176, WP39418912,
WP39434803, WP39428968, WP25000926, EFU31981, WP4343581, WP36884929, BAU18623, AFJ07523, WP14708441, WP36860899, WP61868553, KJJ86756, EGQ18444, EKY00089, WP36929175, WP7412163, WP44072147, WP42518169, WP44074780,
WP15024765, WP49354263, WP4919755, WP64970887,
WP61710138); 11002; 11003 (CasX, i.e. OGP07438, OHB99618); e11004-11010 (CasY, i.e. OJI08769, OGY82221, OJI06454, APG80656, OJI07455, OJI09436, PIP58309).
[0215] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como Cas13, ou seu homólogo, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína Cas13, ou um homólogo, variante ou fragmento da mesma, que são ainda fundidos a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma das SEQ ID NO: 1101111042; 11249-11280; 11044-11116; 11282-11354; 11131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 1183911870; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%,
Petição 870190070557, de 24/07/2019, pág. 206/401
142/306
89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. Também outras proteínas Cas13 são compreendidas na descrição da invenção, isto é, Cas13a, Cas13b, Cas13c e Cas13d (como aparente a partir de PMID 29551514 e 29551272, aqui incorporados a título de referência). Também incorporadas aqui a título de referência estão as publicações PMID 26593719, 28976959 e 29070703 relacionadas a Cas13.
[0216] Um grande número de proteínas é conhecido na técnica e compreendidos como proteínas associadas a CRISPR no contexto da presente invenção. Sequências de Cas13 preferidas da invenção são Proteína Cas13d (SEQ ID NO: 14294-14321) e suas sequências de mRNA otimizadas tendo SEQ ID NO: 14322-14349, SEQ ID NO: 1435014377, SEQ ID NO: 14378-14405, SEQ ID NO: 14406-14433, SEQ ID NO: 14434-14461, SEQ ID NO: 14462-14489 e SEQ ID NO:1449014517.
[0217] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como CasX, ou seus homólogos, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com UTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína CasX, ou um homólogo, variante ou fragmento da mesma, que são fundidos ainda a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NO: 11120
Petição 870190070557, de 24/07/2019, pág. 207/401
143/306
11122; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0218] Vantajosamente, qualquer sequência de Cas13, CasX ou CasY como aqui revelado ou na listagem de sequência pode ser selecionada para o uso da invenção como proteínas associadas a CRISPR no contexto da presente invenção, isto é, qualquer sequência como mencionado acima, isto é, como revelado aqui e/ou na listagem de sequência, isto é, sequências de proteína Cas13, CasX ou CasY e mRNAs codificando versões diferentes das respectivas sequências de proteína Cas13, CasX ou CasY, isto é, sequências de proteína do tipo selvagem ou otimizadas.
[0219] Ainda, editores à base de adenina (ABEs) que fazem a mediação da conversão de A*T em G*C em DNA genômico como descrito no PMID 29160308 são incorporados aqui a título de referência bem como a própria publicação PMID 29160308. De acordo com os autores, ABEs introduz mutações por ponto mais eficientemente e de modo mais nítido, e com menos modificação de genoma fora do alvo, do que um método à base de nuclease de Cas9 atual, e pode instalar mutações de correção de doença ou supressão de doença em células humanas. Endonucleases ARMAN [0220] Ainda, o uso de novos sistemas CRISPR-Cas de micróbios
Petição 870190070557, de 24/07/2019, pág. 208/401
144/306 não cultivados, isto é, Cas9 de ARMAN, ARMAN-1 (ARMAN-1 de acidiphilum de Candidatus Microarcheaum) e ARMAN-4 (ARMAN-4 de acidiphilum de Candidatus Parvarchaeum) não arequa, é compreendido nos ensinamentos da invenção com referência aPMID 28005056, 20421484 e 17185602 que são aqui incorporados a título de referência. [0221] Vantajosamente, sequências de ácido nucleico codificando proteínas associadas a CRISPR tal como CasY, ou seu homólogo, variantes, fragmentos ou derivados, são combinadas dentro da região de codificação do ácido nucleico artificial de acordo com a invenção com LJTRs como aqui definido, a fim de preferivelmente aumentar a expressão das ditas proteínas codificadas. Em modalidades preferidas, ácidos nucleicos artificiais compreendem ou consistem em uma sequência de ácido nucleico codificando uma proteína CasY, ou um homólogo, variante ou fragmento da mesma, que são ainda fundidos a pelo menos um sinal de localização nuclear, a dita sequência de ácido nucleico sendo preferivelmente definida por qualquer uma de SEQ ID NO: 1112311130; 11360-11366; 11242-11248; 11478-11484; 11596-11602; 11714-11720; 11832-11838; 11950-11956 ou um homólogo, variante, fragmento ou derivado (funcional) da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
qRNAs [0222] Como discutido aqui, um sistema CRISPR-Cas funcional requer tipicamente a presença de um RNA-guia (gRNA) que se associa
Petição 870190070557, de 24/07/2019, pág. 209/401
145/306 com e recruta uma proteína associada a CRISPR para uma sequência de DNA-alvo complementar. A estrutura e características do RNA-guia tipicamente dependem da escolha da proteína associada a CRISPR particular.
[0223] Como aqui usado, o termo RNA-guia então refere-se a qualquer molécula de RNA capaz de direcionar a uma proteína associada a CRISPR para uma sequência de DNA-alvo de interesse. RNAsguia (gRNAs) compreendem preferivelmente uma i) primeira região de complementaridade que é capaz de hibridizar especificamente com uma sequência de DNA-alvo e ii) uma segunda região que interage com uma proteína associada a CRISPR.
[0224] A dita região, que é tipicamente localizada na extremidade 5’ do gRNA, compreendendo uma sequência de nucleotídeo curta que é complementar a uma sequência de DNA-alvo, é também referida aqui como uma região de direcionamento”. O termo região refere-se a uma seção/segmento de uma molécula, por exemplo, uma extensão contínua de nucleotídeos em um RNA. A região de direcionamento pode ser cerca de 17-20, por exemplo, 21-23, nucleotídeos de comprimento ou pode ser mais longa ou mais curta (gRNA truncado). Ela pode preferivelmente interagir com a sequência de DNA-alvo através de ligação hidrogênio entre pares de base complementares (isto é, bases emparelhadas).
[0225] O gRNA pode ser de qualquer comprimento, contanto que ele compreenda um gene de direcionamento e seja preferivelmente capaz de recrutar uma proteína associada a CRISPR para uma sequência de DNA-alvo de uma maneira específica de sequência. Desta maneira, gRNAs podem ser de pelo menos 10, pelo menos 11, pelo menos 12, mais preferivelmente pelo menos 13, pelo menos 14, pelo menos 15 e sobretudo preferivelmente pelo menos 16 ou pelo menos 17
Petição 870190070557, de 24/07/2019, pág. 210/401
146/306 nudeotídeos ou pelo menos 18 nudeotídeos ou pelo menos 19 nucleotídeos ou pelo menos 20 nudeotídeos de comprimento. Em algumas modalidades, o gRNA compreende uma região de direcionamento que é preferivelmente de pelo menos 21, pelo menos 22, pelo menos 23, pelo menos 24, pelo menos 25 ou mais de comprimento e ii) uma segunda região que interage com uma proteína associada a CRISPR.
[0226] Como aqui usado, o termo gRNA inclui gRNAs de duas moléculas bem como RNAs de molécula única. O gRNA pode ou não compreender características de estrutura secundária para interação com a proteína associada a CRISPR.
[0227] O sistema CIRSPR~Cas9 tipo II emprega naturalmente gRNAs de duas moléculas. Tais gRNAs de duas moléculas (tracrRNA/ crRNA) compreende tipicamente uma molécula de crRNA (RNA CRISPR RNA direcionadora ou crRNA ou repetição de crRNA) e um tracrRNA correspondente (CRISPR RNA de trans-ação ou RNA ativadora ou tracrRNA). Um cRNA compreende ambas uma região de direcionamento (filamento simples) e uma extensão (região formador de dúplex) de nudeotídeos que foram uma metade do dúplex de dsRNA da região de ligação a Cas9 do gRNA. Um tracrRNA correspondente compreende uma extensão de nudeotídeos (região de formação de dúplex) que forma a outra metade do dúplex de dsRNA da região de ligação a Cas9 do gRNA. Em outras palavras, uma extensão de nudeotídeos de um crRNA é complementar a e hibridiza com uma extensão de nudeotídeos de um tracrRNA para formar o dúplex de dsRNA da região de ligação a Cas9 do gRNA. Desta maneira, cada crRNA pode ser dito ter um tracrRNA correspondente. O crRNA provê ainda a região de direcionamento de filamento simples. Desta maneira, um crRNA e um tracrRNA (como um par correspondente) hibridizam para formar um gRNA.
Petição 870190070557, de 24/07/2019, pág. 211/401
147/306 [0228] O crRNA e o tracrRNA podem ser também unidos para prover RNAs-guia de molécula simples (artificial) (RNAs-guia simples, sgRNAs). Um sgRNA compreende tipicamente um crRNA conectado em sua extremidade 3’ à extremidade 5’ de um tracrRNA através de uma sequência de alça (vide, por exemplo, Pedido de Patente U.S. No. 20140068797). Similar a crRNA, sgRNA compreende uma região de direcionamento de complementaridade com uma sequência de polinucleotídeo-alvo, tipicamente adjacente a uma segunda região que forma ligações hidrogênio de par de base que formam uma estrutura secundária, tipicamente uma estrutura de tronco. sgRNAs são tipicamente de -100 nucleotídeos de comprimento, no entanto, o termo também inclui RNAs-guia simples truncados (tru-sgRNAs) de aproximadamente 17-18 nt (Fu, Y. e outros, Nat. Biotechnol. 2014 Mar;32(3):279-84). O termo também compreende sgRNAs em miniatura funcionais com características dispensáveis removidas, que retêm um módulo essencial e conservado chamado o nexus localizado na porção de sgRNA que corresponde a tracrRNA (não crRNA) (cf. Pedido de Patente U.S. No. 20140315985 e Briner, A.E. e outros, Mol Cell. 2014 Out 23;56(2):333-9). O nexus está localizado imediatamente a jusante (isto é, localizado na direção 3’ a partir do) do tronco inferior em sistemas CRISPR~Cas9 Tipo II. O termo sgRNA também compreende mortadRNAs (dRNAs) compreendendo regiões de direcionamento encurtadas de 11-15 nucleotídeos. Tais dRNAs podem ser usados para recrutar endonucleases Cas9 cataliticamente ativas para se direcionar a sequências de DNA-alvo para alteração de expressão de gene sem indução de DSBs (cf. Dahlman,
J.E. e outros, Nat Biotechnol. 2015 Nov;33(11):1159-61). Derivados de sgRNA são também compreendidos pelo termo. Tais derivados incluem tipicamente porções ou entidades adicionais conferindo uma funcionalidade nova ou adicional. Particularmente, aptâmeros de MS2 adicionados à tetra-alça de sgRNA e/ou estruturas de tronco-alça são capazes
Petição 870190070557, de 24/07/2019, pág. 212/401
148/306 de seletivamente recrutar proteínas compreendendo os ditos domínios MS2 para o DNA-alvo (sgRNA-MS2) (cf. Konermann, S. e outros. Nature. 2015 Jan 29; 517(7536): 583-588). Modificações adicionais são também concebíveis e compreendidas aqui.
[0229] O uso de tracrRNA/crRNA ou sgRNAs como gRNAs não é limitada a proteínas Cas9. Qualquer outro sistema associado a CRISPR, preferivelmente do sistema CRISPR-Cas tipo II, pode ser usado em conexão com tais gRNAs. No entanto, outros gRNAs podem ser requeridos para assegurar funcionalidade das outras proteínas CRISPR-Cas, e tais gRNAs são também compreendidos na respectiva definição. Por exemplo, proteínas associadas a CRISPR tipo V, tal como Cpf1, são guiadas por um crRNA simples e curto (42-44 nt), compreendendo tipicamente alça tronco simples em uma sequência de repetição direta.
[0230] gRNAs, tais como tracr/RNA/crRNA, sgRNAs ou crRNAs podem ser providos através de qualquer meio adequado, por exemplo, em forma nua ou complexada como descrito aqui no contexto de moléculas de ácido nucleico artificiais, por exemplo, usando lipídeos ou carreadores (poli)catiônicos, mas são tipicamente administrados através de um vetor. Vetores adequados (como definido na seção intitulada Definições) incluem qualquer ácido nucleico que seja capaz de preferivelmente ubiquamente expressar gRNAs funcionais (isto é, que seja capaz de recrutar a respectiva proteína associada a CRISPR para a a sequência de DNA-alvo). Vetores então incluem plasmídeos e vetores virais, em particular vetores lentivirais e vetores de vírus adenoassociados (AAV).
RNAs [0231] A molécula de ácido nucleico artificial da invenção pode ser preferivelmente um RNA. Será compreendido que o termo RNA referese a moléculas de ácido ribonucleico caracterizadas pela sucessão específica de seus nucleotídeos unidos para formas as ditas moléculas
Petição 870190070557, de 24/07/2019, pág. 213/401
149/306 (isto é, sua sequência de RNA). O termo RNA” pode então ser usado para se referir a moléculas de RNA ou sequências de RNA como será compreendido prontamente pelo versado na técnica no respectivo contexto. Por exemplo, o termo RNA como usado no contexto da invenção refere-se preferivelmente a uma molécula de RNA (a dita molécula sendo caracterizada, inter alia, por sua sequência de RNA particular). O termo RNA no contexto de modificações de sequência será compreendido se relacionar a sequências de RNA modificadas, mas tipicamente inclui também as moléculas de RNA resultantes (que são modificadas com relação à sua sequência de RNA). Em modalidades preferidas, o RNA pode ser um mRNA, um RNA viral ou um RNA de replicon, preferivelmente um mRNA.
RNAs mono-, bi- e multicistrônicos [0232] De acordo com algumas modalidades da presente invenção, a molécula de ácido nucleico artificial, preferivelmente RNA, pode ser mono-, bi- ou multicistrônica, preferivelmente como aqui definido. RNAs bi- ou multicistrônicos compreendem tipicamente duas (bicistrônica) ou mais (multicistrônica) estruturas de leitura aberta (ORF). Uma estrutura de leitura aberta neste contexto é uma sequência de códon que é traduzivel em um peptídeo ou proteína. As sequências de codificação em uma molécula de ácido nucleico artificial bi- ou multicistrônica, preferivelmente RNA, preferivelmente codificam proteínas distintas como definido aqui. Molécula de ácido nucleico artificial bi- ou até mesmo multicistrônica, preferivelmente RNAs, pode codificar, por exemplo, pelo menos duas, três, quatro, cinco, seis ou mais (preferivelmente diferentes) proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas) como aqui definido. O termo codificando duas ou mais proteínas pode significar, sem ser limitado ao mesmo, que a molécula de ácido nucleico artificial bi- ou até mesmo multicistrônica, preferivelmente RNA, pode codificar, por exemplo, pelo menos duas, três, quatro, cinco, seis
Petição 870190070557, de 24/07/2019, pág. 214/401
150/306 ou mais (preferivelmente diferentes) proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas).
[0233] Em algumas modalidades, as sequências de codificação codificando duas ou mais proteínas associadas a CRISPR, ou homólogos, variantes, fragmentos ou derivados das mesmas como aqui definido, podem ser separadas no RNA bis- ou multicistrônico por pelo menos uma sequência IRES (sítio de entrada ribossomal interno). O termo IRES (sítio de entrada ribossomal interno) refere-se a uma sequência de RNA que permite início de tradução. Um IRES pode funcionar como um sítio de ligação de ribossomo único, mas pode também servir para prover uma molécula de ácido nucleico artificial bi~ ou até mesmo multicistrônica, preferivelmente RNA como acima definido, que codifica várias proteínas (ou homólogos, variantes, fragmentos ou derivados das mesmas), que devem ser traduzidas pelos ribossomos independentemente umas das outras. Exemplos de sequências de IRES, que podem ser usadas de acordo com a invenção, são aquelas derivadas de picornavírus (por exemplo, FMDV), pestvirus (CFFV), poliovirus (PV), vírus da encefalomiocardite (ECMV), vírus da doença do pé e da boca (FMDV), vírus da hepatite C (HCV), vírus da febre suína clássica (CSFV), vírus do leucoma do camundongo (MLV), vírus da imunodeficiência simiana (SIV) ou vírus da paralisia do grilo (CrPV).
[0234] De acordo com modalidades adicionais, a pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode codificar pelo menos duas, três, quatro, cinco, seis, sete, oito e mais proteínas associadas a CRISPR (ou homólogos, variantes, fragmentos ou derivados das mesmas) como aqui definido ligadas com ou sem uma sequência ligante de aminoácido, em que a dita sequência ligante pode compreender ligantes rígidos ligantes flexíveis, ligantes cliváveis (por exemplo, peptídeos de autocliva
Petição 870190070557, de 24/07/2019, pág. 215/401
151/306 gem) ou uma combinação dos mesmos. Ligantes exemplares são descritos na seção intitulada Derivados. A respectiva descrição é aplicável à ligação de proteínas associadas a CRISP múltiplas, mutatis mutandis. Nela, proteínas associadas a CRISPR como aqui definido podem ser idênticas ou diferentes ou uma combinação das mesmas.
[0235] Preferivelmente, a molécula de ácido nucleico artificial, preferivelmente RNA, compreende um comprimento de cerca de 50 a cerca de 20000, ou 100 a cerca de 20000 nucleotídeos, preferivelmente de cerca de 250 a cerca de 20000 nucleotídeos, mais preferivelmente de cerca de 500 a cerca de 10000, ainda mais preferivelmente de cerca de 500 a cerca de 5000.
[0236] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pode ainda ser de filamento simples ou filamento duplo. Quando provida como um RNA de filamento duplo, a molécula de ácido nucleico artificial compreende preferivelmente um filamento de senso e um de antissenso correspondente.
Modificações de ácido nucleico [0237] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, da Invenção, ou qualquer outro ácido nucleico definido aqui (por exemplo, um vetor), podem ser providas na forma de ácidos nucleicos modificados. Modificações de ácido nucleico adequadas compreendidas no contexto da presente invenção são descritas abaixo. A expressão qualquer outro ácido nucleico como aqui definido pode, mas tipicamente não, refere-se a gRNAs.
[0238] De acordo com modalidades preferidas, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (sequência) da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é modificada como aqui definido. Uma modificação como aqui definido preferivelmente leva a uma estabilização da dita molécula de ácido nucleico artificial, preferivelmente RNA. Mais preferivelmente,
Petição 870190070557, de 24/07/2019, pág. 216/401
152/306 a invenção então provê uma molécula de ácido nucleico artificial estabilizada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).
[0239] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (para qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode então ser provida como uma molécula de ácido nucleico artificial estabilizada, preferivelmente RNA, em particular mRNA, isto é, que é essencialmente resistente à degradação in vivo (por exemplo, por uma exoou endo-nuclease).
[0240] Tal estabilização pode ser realizada, por exemplo, por uma estrutura principal de fosfato modificada da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Uma modificação de estrutura principal em relação à presente invenção é uma modificação em que fosfatos da estrutura principal dos nucleotídeos contidos no dito RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são quimicamente modificados. Nucleotídeos que podem ser preferivelmente usados nesta relação incluem, por exemplo, uma estrutura principal de fosfato modificada com fosforotioato, preferivelmente pelo menos um dos oxigênios fosfato contidos na estrutura principal de fosfato sendo substituídos por um átomo de enxofre. Molécula de ácido nucleico artificial estabilizada, preferivelmente RNAs (ou outros ácidos nucleicos, em particular RNAs, como aqui definido) podem incluir ainda, por exemplo: análogos de fosfato não iônicos tais como, por exemplo, fosfonatos de alquila e arila, em que o oxigênio fosfato carregado é substituído por um grupo alquila ou arila, ou fosfodiésteres e alquilfosfotriésteres, em que o resíduo de oxigênio carregado está presente em forma alquilada. Tais modificações de estrutura principal incluem tipica
Petição 870190070557, de 24/07/2019, pág. 217/401
153/306 mente, sem implicar qualquer limitação, modificados do grupo consistindo em metilfosfonato, fosforamidatos e fosforotioatos (por exemplo, citidina-5’-O-(1 -tiofosfato)).
[0241 ] Abaixo, modificações específicas são descritas, as quais são preferivelmente capazes de estabilizar a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui).
Modificações químicas [0242] O termo modificação como aqui usado pode se referir a modificações químicas compreendendo modificações de estrutura principal bem como modificações de açúcar ou modificações de base.
[0243] Neste contexto, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode conter análogos/modificações de nucleotídeo (nucleotídeos ou nucleosídeos modificados), por exemplo, modificações de estrutura principal, modificações de açúcar ou modificações de base.
[0244] Uma modificação de estrutura principal em relação à presente invenção é uma modificação em que fosfatos da estrutura principal dos nucleotídeos contidos na dita molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), aqui são quimicamente modificados. Uma modificação de açúcar em relação à presente invenção é uma modificação química do açúcar dos nucleotídeos do ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Ainda, uma modificação de base em relação à presente invenção é uma modificação química da porção de base dos nucleotídeos da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Neste contexto, análogos de nucleotídeo ou modificações são
Petição 870190070557, de 24/07/2019, pág. 218/401
154/306 preferivelmente selecionados a partir de análogos de nucleotídeo que sâo aplicáveis para transcrição e/ou tradução.
Modificações de açúcar [0245] Ácidos nuclelcos (quimicamente) modificados, em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de açúcar, isto é, nucleosídeos/nucleotídeos que são modificados em sua porção açúcar.
[0246] Por exemplo, o grupo 2’ hidroxila (OH) pode ser modificado ou substituído com um número de diferentes substituintes óxi ou desóxi. Exemplos de modificações de grupo óxi-2’ hidroxila incluem, mas não estão limitados a, alcóxi ou arilóxi (-OU, por exemplo, R ··· H, alquila, cicloalquila, arila, aralquila, heteroarila ou açúcar); polietilenoglioóis (PEG), -O(CH2CH2O)nCH2CH2OR; ácidos nuclelcos bloqueados (LNA), em que a 2’ hidroxila está conectada, por exemplo, por uma ponte metileno, ao carbono 4’ do mesmo açúcar ribose; e grupos amino (-Ο-amino, em que o grupo amino, por exemplo, NRR, pode ser alquilamino, dialquilamino, heterociclila, arilamino, diarilamino, heteroarilamino ou di-heteroarilamino, etileno diamina, poliamino) ou aminoalcóxi.
[0247] Modificações desóxi incluem hidrogênio, amino (por exemplo, NH2; alquilamino, dialquilamino, heterociclila, arilamino, diaril amino, heteroaril amino, di-heteroaril amino ou aminoácido); ou o grupo amino pode ser ligado ao açúcar através de um ligante, em que o ligante compreende um ou mais dos átomos deC, Ne O.
[0248] O grupo açúcar pode conter também um ou mais carbonos que possuem a configuração estereoquímica oposta àquela do carbono correspondente em ribose. Desta maneira, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode incluir nucleotídeos contendo, por exemplo, arabinose como o açúcar.
Petição 870190070557, de 24/07/2019, pág. 219/401
155/306
Modificações de Estrutura Principal:
[0249] Ácidos nucleicos (químicamente modificados), em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de estrutura principal, isto é, nucleosídeos/nucleotídeos que são modificados em sua estrutura principal de fosfato.
[0250] Os grupos fosfato da estrutura principal podem ser modificados substituindo um ou mais dos átomos de oxigênio com um substitute diferente. Ainda, os nucleosídeos e nudeotídeos modificados podem incluir a substituição integral de uma porção fosfato não modificada com um fosfato modificado como aqui descrito.
[0251] Exemplos de grupos fosfato modificados incluem, mas não estão limitados a, fosforotioato, fosforoselenatos, borano fosfatos, ésteres de borano fosfato, hidrogênio fosfonatos, fosforamidatos, alquil ou aril fosfonatos e fosforotriésteres. Fosforoditioatos têm ambos oxigênios de não ligados substituídos por enxofre. O ligante fosfato também pode ser modificado pela substituição de um oxigênio de ligação com nitrogênio (fosforamidatos em ponte), enxofre (fosforotioatos em ponte) e carbono (metileno-fosfonatos em ponte).
Modificações de base:
[0252] Ácidos nucleicos (quimicamente) modificados, em particular moléculas de ácido nucleico artificiais de acordo com a invenção, podem compreender modificações de (núcleo-)base, isto é, nucleosídeos/nucleotídeos que são modificados em sua porção nucleobase.
[0253] Exemplos de nucleobases encontradas em RNA incluem, mas não estão limitados a, adenina, guanina, citosina e uracila. Por exemplo, os nucleosídeos e nudeotídeos descritos aqui podem ser quimicamente modificados na face do sulco principal. Em algumas modalidades, as modificações químicas de sulco prindpal podem incluir um grupo amino, um grupo tiol, um grupo alquila ou um grupo halo.
Petição 870190070557, de 24/07/2019, pág. 220/401
156/306 [0254] Em algumas modalidades, os análogos/modificações de nucleotídeo são selecionados de modificações de base, que são preferivelmente selecionadas de 2~amino-6-cloropurinoribosídeo-5-trifosfato,
2-Aminopurino-ribosideo-5'-trifosfato; 2-aminoadenosina-5'-trifosfato, 2,Amino-2,”desoxicitldino-trifosfato) 2-tiocitidlno-5'-trifosfato, 2-tiourldino-5!-trifosfato, Z'-Fluortimidino-S'-trifosfato, 2s-O~Metil-inosina-5!-trifosfato 4-tiouridino-5'-trifosfato, 5-aminoalilcitidino-5'-trifosfato, 5-aminoaliluridino-5'-trifosfato, 5-bromocitidino-5!-trifosfato, 5-bromouridino-5'trifosfato, 5-Bromo-2'-desoxicitidino-5'-trifosfato, 5-Bromo-2'-desoxiuridino-5'-trifosfato, 5-iodocitidino-5'-trifosfato, 5-lodo-2'-desoxicitidino-5'trifosfato, 5-iodouridino~5’-trifosfato, S-lodo-Z’-desoxiuridino-S'-trifosfato,
5-metilcitidino-5'-trifosfato, 5-metiluridino-5'-trifosfato, 5-Propinil-2'-desoxicitídino-õ-trífosfato, 5-Propinil-2,-desoxíuridino-5'-trifosfatoi 6-azacitidino-58-trifosfato, e-azauridino-S’-trifosfato, 6-cloropurinoribosídeo-5'~ trifosfato, 7-desazaadenosina-5'-trifosfato, 7-desazaguanosina-5’-trifosfato, 8-azaadenosina-5'-trifosfato, 8-azidoadenosina-5'-trifosfato, benzímidazol-ribosídeo-5'~trifosfato, N1 ~metiladenosina~5'~trifosfato, N1 -metilguanosina-5'-trifosfato, N6-metiladenosina-5'-trifosfato, 06-metilguanoslna-õ-trifosfato, pseudouridino-5'-trifosfatoou puromicin-5-trifosfato, xantosina-5s-trifosfato. Preferência particular é dada a nucleotídeos para modificações de base selecionadas do grupo de nucleotídeos modificados na base consistindo em 5-metilcitidino-5'-trifosfato, 7-desazaguanosina-5'~trifosfato, 5-bromocitidino-5'-trifosfato e pseudouridino~5'~trifos~ fato.
[0255] Em algumas modalidades, nucleosídeos modificados incluem piridin-4-ona ribonucleosídeo, 5-aza-uridina, 2-tio-5-aza-uridina,
2- tiouridina, 4-tio-pseudouridina, 2-tio-pseudouridina, 5-hidroxiuridina,
3- metiluridina, 5-carboximetil-uridina, 1-carboximetil-pseudouridina, 5propinil-uridina, 1-propinil-pseudouridina, 5-taurinometiluridina, 1-taurinometil-pseudouridina, 5-taurinometil-2-tio-uridina, 1-taurinometil-4-tio
Petição 870190070557, de 24/07/2019, pág. 221/401
157/306 uridina, 5-metil-uridina, 1-metil-pseudouridina, 4-tio-1-metil-pseudouridina, 2-tio-1-metil-pseudouridina, 1-metil-1-desaza-pseudouridina, 2-tio1 -metil~1-desaza-pseudouridina, di-hidrouridina, di~hidropseudouridina,
2-tio-di-hidrouridina, 2-tio-di-hidropseudouridina, 2-metoxiuridina, 2-metóxi-4-tio-uridina, 4-metóxi-pseudouridina e 4-metóxi-2-tio-pseudouridina.
[0256] Em algumas modalidades, nucieosídeos modificados incluem 5-aza-citidina, pseudoisocitidína, 3-metil-citidina, N4-acetilcitidina, 5-formilcitidina, N4-metilcitidina, 5-hidroximetilcitidina, 1-metilpseudoisocitidina, pirrol-citidina, pirrol-pseudoisocitidina, 2-tio-citidina,
2-tio-5-metil~citidina, 4-tio-pseudoisocitidina, 4-tio~ 1 -metil-pseudoisocitl· dina, 4-tio-1 -metil-1 -desaza-pseudoisocitidina, 1 -metil-1 -desaza-pseudoisocitidina, zebularina, 5-aza-zebularina, 5-metil-zebularina, 5-aza-2tio-zebularina, 2-tio-zebularina, 2-metóxi-citidina, 2-metóxi~5~metil-citi~ dina, 4-metóxi-pseudoisocitidina e 4^βΙόχί~1~η'ΊβίΗ-ρ36υΰοί3οαίίΰΙη3.
[0257] Em outras modalidades, nucieosídeos modificados incluem 2~aminopurina, 2, 6-diaminopurina, 7-desaza-adenina, 7-desaza~8~aza~ adenina, 7-desaza-2-amínopurina, 7-desaza-8-aza-2-aminopurina, 7desaza-2,6-diaminopurína, 7-desaza-8-aza-2,6-diaminopurina, 1 -metiladenosina, N6~metiladenosina, N6-isopenteniladenosina, N6-(cis-hi~ droxi-isopenteniQadenosina, 2-metiltio-N6-(cis-hidróxi-isopentenil) adenosina, N6-glícínilcarbamoiladenosina, N6-treonilcarbamoiladenosina, 2~metiltio-N6-treonil carbamoiladenosina, N6,N6~dimetiladenosina, 7metiladenina, 2-metiltio-adenina e 2-metóxi-adenina.
[0258] Em outras modalidades, nucieosídeos modificados incluem inosina, 1 -Metil-inosina, wiosina, wibutosina, 7-desaza-guanosina, 7-desaza-8-aza-guanosina, 6-tio-guanosina, 6-tio-7-desaza-guanosina, 6tio-7-desaza-8-aza-guanosina, 7-metil-guanosina, 6-tio-7-metil-guanosina, 7-metilinosina, 6-metóxi-guanosina, 1-metilguanosina, N2-metilguanosina, N2,N2-dimetilguanosina, 8-oxo-guanosina, 7-metil-8-oxo
Petição 870190070557, de 24/07/2019, pág. 222/401
158/306 guanosina, 1-metik6-tio-guanosina, N2-metil-6-tio-guanosina e N2,N2dimetik6-tio-guanosina.
[0259] Em algumas modalidades, o nucleotídeo pode ser modificado na face de sulco principal e pode incluir substituição de hidrogênio em C-5 de uracila com um grupo metila ou um grupo halo. Em modalidades específicas, um nucleosídeo modificado é 5'-O-(1~tiofosfato)~adenosina, 5'-O-(1-tiofosfato)-citidina, 5!-O-(1-tiofosfato)-guanosina, 5-0(l-tiofosfato)-uridina ou 5'-O-(1-tiofosfato)-pseudouridina.
[0260] Em algumas modalidades, o RNA modificado da invenção (ou qualquer outro ácido nucleico modificado, em particular RNA, como aqui definido) pode compreender modificações de nucleosídeo selecionadas de 6-aza-citidina, 2-tio-citidina, a-tio-citidina, Pseudo-iso-citidina,
5- aminoalil-uridina, 5-iodo-uridina, N1-metikpseudouridina, 5,6-di-hk drouridina, o-tio-uridina, 4-tio-uridina, 6-aza-uridina, 5-hidróxi-uridina, desóxktimidina, 5-metikuridina, Pirrol-citidina, inosina, o-tio-guanosina,
6- metil-guanosina, 5-metikcitdina, 8-oxo-guanosina, 7-desaza-guanosina, N1-metikadenosina, 2-amino-6-Cloro-purina, N6-metil-2-amino~ purina, Pseudo-iso-citidina, 6-Cloro-purina, N6-metikadenosina, a-tioadenosina, 8-azido-adenosina, 7-desaza-adenosina.
[0261] Em algumas modalidades, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), não compreende nenhuma das modificações químicas como aqui descrito. Tais ácidos nucleicos artificiais modificados podem, não obstante, compreender uma modificação de lipídeo ou uma modificação de sequência como descrito abaixo.
Modificações de lipídeo [0262] De acordo com modalidades adicionais, moléculas de ácido nucleico artificiais, preferivelmente RNAs, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) contêm pelo
Petição 870190070557, de 24/07/2019, pág. 223/401
159/306 menos uma modificação de lipídeo.
[0263] Tal molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA da invenção (ou dito ácido nucleico, em particular RNA, descrito aqui) tipicamente compreende (i) uma molécula de ácido nucleico artificial, preferivelmente RNA como definido aqui (ou dito ácido nucleico, em particular RNA), (ii) pelo menos um ligante covalentemente ligado com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito ácido nucleico, em particular RNA) e (iii) pelo menos um lipídeo covalentemente ligado com o respectivo ligante.
[0264] Alternativamente, a molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA (ou outro ácido nucleico como definido aqui), compreende pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) e pelo menos um lipídeo (bifuncional) covalentemente ligado (sem um ligante) com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA). [0265] Alternativamente, a molécula de ácido nucleico artificial modificada com lipídeo, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) compreende (i) uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), (ii) pelo menos um ligante covalentemente ligado com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) e (iii) pelo menos um lipídeo covalentemente ligado com o respectivo ligante, e também (iv) pelo menos um lipídeo (bifuncional) covalentemente ligado (sem um ligante) com a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou outro dito ácido nucleico, em particular RNA). [0266] Neste contexto, é particularmente preferido que a modificação de lipídeo esteja presente nas extremidades terminais de uma mo
Petição 870190070557, de 24/07/2019, pág. 224/401
160/306 lécula de ácido nucleico artificial linear, preferivelmente RNA (ou qualquer outro ácido nucleico definido aqui).
Modificações de Sequência [0267] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção, preferivelmente um mRNA, ou qualquer outro ácido nucleico como definido aqui é modificado na sequência, isto é, compreende pelo menos uma modificação de sequência como descrito abaixo. Sem desejar ser limitado por teoria específica, tais modificações de sequência podem aumentar a estabilidade e/ou aumentar a expressão das moléculas de ácido nucleico artificiais da invenção, preferivelmente RNAs.
Modificação de teor de G/C [0268] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, mais preferivelmente mRNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode ser modificada, e então estabilizada, através da modificação de seu teor de guanosina/citosina (G/C), preferivelmente através da modificação do teor de G/C da pelo menos uma sequência de codificação. Em outras palavras, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) e preferivelmente sua sequência pode ser de G/C modificada.
[0269] Uma sequência de ácido nucleico com G/C modificada (preferivelmente RNA) tipicamente refere-se a um ácido nucleico (preferivelmente RNA) compreendendo uma sequência de ácido nucleico (preferivelmente RNA) que é baseada em uma sequência de ácido nucleico do tipo selvagem modificada (preferivelmente RNA) e compreende um número alterado de nucleotídeos de guanosina e/ou citosina comparado com a dita sequência de ácido nucleico do tipo selvagem (preferivelmente RNA). Tal número alterado de nucleotídeos de G/C
Petição 870190070557, de 24/07/2019, pág. 225/401
161/306 pode ser gerado substituindo códons contendo nucleotídeos de adenosina ou timidina por códons sinônimos contendo nucleotídeos de guanosina ou citosina. Desta maneira, as substituições de códon preferivelmente não alteram os resíduos de aminoácido codificados, mas alteram exclusivamente o teor de G/C do ácido nucleico (preferivelmente RNA). [0270] Em uma modalidade particularmente preferida da presente invenção, o teor de G/C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificado, particularmente aumentado, comparado com o teor de G/C da sequência de codificação do respectivo ácido nucleico do tipo selvagem, isto é, não modificado. A sequência de aminoácido codificada pela molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é preferivelmente não modificada comparado com a sequência de aminoácido codificada pelo respectivo ácido nucleico do tipo selvagem, preferivelmente RNA.
[0271] Tal modificação da molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é baseada no fato de que a sequência de qualquer região de RNA (ou outro ácido nucleico) a ser traduzido é importante para tradução eficiente do dito RNA (ou dito outro ácido nucleico). Desta maneira, a composição do RNA (ou dito outro ácido nucleico) e a sequência de vários nucleotídeos são importantes. Em particular, sequências tendo um teor de G (guanosina)/C (citosina) aumentado são mais estáveis do que as sequências tendo um teor de A (adenosina)/U (uracila) aumentado.
[0272] De acordo com a invenção, os códons da molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro
Petição 870190070557, de 24/07/2019, pág. 226/401
162/306 ácido nucleico, em particular RNA, como definido aqui) são então variados comparado com o respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico), enquanto retendo a sequência de aminoácido traduzida, de modo que elas incluem uma quantidade aumentada de nucleotídeos de G/C.
[0273] Em relação ao fato que vários códons codificam um e o mesmo aminoácido (a chamada degeneração do código genético), os códons mais favoráveis para a estabilidade podem ser determinados (o chamado uso de códon alternativo). Dependendo do aminoácido a ser codificado pela molécula de ácido nucleico artificial da invenção, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), há várias possibilidades para modificação de sua sequência de ácido nucleico, comparado com sua sequência do tipo selvagem. No caso de aminoácidos, que são codificados por códons, que contêm exclusivamente nucleotídeos G ou C, nenhuma modificação do códon é necessária.
[0274] Desta maneira, os códons para Pro (CCC ou CCG), Arg (CGC ou CGG), Ala (GCC ou GCG) e Gly (GGC ou GGG) não requerem modificação, uma vez que nenhum A ou U está presente. Em contraste, códons que contêm nucleotídeos A e/ou U podem ser modificados através de substituição de outros códons, que codificam os mesmos aminoácidos, mas não contêm nenhum A e/ou U. Exemplos desses são: os códons para Pro podem ser modificados de CCU ou CCA para CCC ou CCG; os códons para Arg podem ser modificados de CGU ou CGA ou AAGA ou AGG para CGC ou CGG; os códons para Ala podem ser modificados de GCU ou GCA para GCC ou GCG; os códons para Gly para podem modificados de GGU ou GGA para GGC ou GGG. Em outros casos, embora nucleotídeos A ou U não possam ser eliminados dos códons, é, no entanto, possível diminuir o teor de A e U usando códons que contêm um teor menor de nucleotídeos A e/ou U. Exemplos desses
Petição 870190070557, de 24/07/2019, pág. 227/401
163/306 são: os códons para Phe podem ser modificados de UUU para UUC; os códons para Leu podem ser modificados de UUA, UUG, CUU ou CUA para CUC ou CUG; os códons para Ser podem ser modificados de UCU ou UCA ou AGU para UCC, UCG ou AGC; o códon para Tyr pode ser modificado de UAU para UAC; o códon para Cys pode ser modificado de UGU para UGC; o códon para His pode ser modificado de CAU para CAC; o códon para Gin pode ser modificado de CAA para CAG; os códons para He podem ser modificados de AUU ou AUA para AUG; os codons para Thr podem ser modificados de ACU ou ACA para AGO ou ACG; o códon para Asn pode ser modificado de AAU para AAC; o códon para Lys pode ser modificado de AAA para AAG; os códons para Vai podem ser modificados de GUU ou GUA para GUC ou GUG; o códon para Asp pode ser modificado de GAU para GAC; o códon para Glu pode ser modificado de GAA para GAG; o códon de parada UAA pode ser modificado para UAG ou UGA, No caso dos códons para Met (AUG) e Trp (UGG), por outro lado, nâo há nenhuma possibilidade de modificação de sequência. As substituições listadas acima podem ser usadas ou individualmente ou em todas as combinações possíveis para aumentar o teor de G/C da sequência de ácido nucleico artificial da invenção, preferivelmente sequência de RNA (ou qualquer outra sequência de ácido nucleico como aqui definido) comparado com sua sequência de ácido nucleico do tipo selvagem particular (Isto é, a sequência original). Desta maneira, por exemplo, todos os códons para Thr ocorrendo na sequência do tipo selvagem podem ser modificados para ACC (ou ACG). Preferivelmente, no entanto, por exemplo, combinações das possibilidades de substituição acima são usadas:
substituição de todos os códons codificando Thr na sequência original (RNA do tipo selvagem) para ACC (ou ACG) e substituição de todos os códons originalmente codificando
Petição 870190070557, de 24/07/2019, pág. 228/401
164/306
Ser para UCC (ou UCG ou AGC); substituição de todos os códons co dificando He na sequência original para AUC e substituição de todos os codons originalmente codificando Lys para AAG e substituição de todos os códons originalmente codificando Tyr para UAC; substituição de todos os códons codificando Vai na sequência original para GLJC (ou GUG) e substituição de todos os códons originalmente codificando Glu para GAG e substituição de todos os códons originalmente codificando Ala para GCC (ou GCG) e substituição de todos os códons originalmente codificando Arg para CGC (ou CGG); substituição de todos os códons codificando
Va! na sequência original para GUC (ou GUG) e substituição de todos os códons originalmente codificando
Glu para GAG e substituição de todos os códons originalmente codificando Ala para GCC (ou GCG) e substituição de todos os códons originalmente codificando Gly para GGC (ou GGG) e substituição de todos os códons originalmente codificando
Asn para AAC; substituição de todos os códons codificando Vai na se quência original para GUC (ou GUG) e substituição de todos os códons originalmente codificando Phe para UUC e substituição de todos os códons originalmente codificando Cys para UGC e substituição de todos os códons originalmente codificando
Leu para CUG (ou CUC) e substituição de todos os códons originalmente codificando
Petição 870190070557, de 24/07/2019, pág. 229/401
165/306
Gin para CAG e substituição de todos os códons originalmente codificando Pro para CCC (ou CCG); etc.
[0275] Preferivelmente, o teor de G/C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) é aumentado em pelo menos 7%, mais preferivelmente em pelo menos 15%, particularmente preferivelmente em pelo menos 20%, comparado com o teor de G/C da sequência de codificação do ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), que codifica pelo menos uma proteína como aqui definido.
[0276] De acordo com modalidades preferidas, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, mais preferivelmente pelo menos 70%, ainda mais preferivelmente pelo menos 80% e sobretudo preferivelmente pelo menos 90%, 95% ou até mesmo 100% dos códons substituídos na região codificando uma proteína associada a CRISPR, ou um homólogo, variante, fragmento ou derivado como definido aqui ou a sequência inteira da sequência de RNA do tipo selvagem, são substituídos, desta maneira aumentando o teor de G/C da dita sequência.
[0277] Neste contexto, é particularmente preferível aumentar o teor de G/C da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), preferivelmente de sua pelo menos uma sequência de codificação, para o máximo (isto é, 100% dos códons substituíveis) comparado com a sequência do tipo selvagem.
[0278] Uma modificação preferida adicional da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é baseada na constatação que a eficiência de tradução é também determinada por
Petição 870190070557, de 24/07/2019, pág. 230/401
166/306 uma frequência diferente na ocorrência dos tRNAs em células. Desta maneira, se os chamados códons raros estiverem presentes na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA) para um grau aumentado, a sequência de RNA correspondente modificada (ou dito outro ácido nucleico, em particular RNA) é traduzida em um grau significantemente mais pobre do que no caso onde códons codificando tRNAs relativamente frequentes estão presentes.
[0279] Em algumas modalidades preferidas, em molécula de ácido nucleico artificial modificada, preferivelmente RNAs (ou qualquer outro ácido nucleico) definido aqui, a região que codifica uma proteína é modificada comparado com a região correspondente do ácido nucleico do tipo selvagem, preferivelmente RNA, de modo que pelo menos um códon da sequência do tipo selvagem, que codifica um tRNA que é relativamente raro na célula, é trocado por um códon, que codifica um tRNA que é relativamente frequente na célula e carrega o mesmo aminoácido que o tRNA relativamente raro.
[0280] Desta maneira, as sequências da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são modificadas de modo que códons para os quais tRNAs frequentemente ocorrendo estão disponíveis são inseridos. Em outras palavras, de acordo com a invenção, através desta modificação todos os códons da sequência do tipo selvagem, que codificam um tRNA que é relativamente raro na célula, podem ser em cada caso trocados por um códon, que codifica um tRNA que é relativamente frequente na célula e que, em cada caso, carrega o mesmo aminoácido que o tRNA relativamente raro. Quais tRNAs ocorrem relativamente frequente na célula e que, em contraste, ocorrem relativamente raramente, é conhecido de um versado na técnica: c.f., por
Petição 870190070557, de 24/07/2019, pág. 231/401
167/306 exemplo, Akashi Curr. Opin. Genet. Dev. 2001, 11(6): 660-666. Os códons que usam para o aminoácido particular o tRNA que ocorre com mais frequência, por exemplo, o códon Gly, que usa o tRNA, que ocorre com mais frequência na célula (humana), são particularmente preferidos.
[0281] De acordo com a invenção, é particularmente preferível ligar o teor de G/C sequencial que é aumentado, em particular maximizado, na molécula de ácido nucleico artificial modificada, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), com os códons frequentes sem modificação da sequência de aminoácido codificada que é codificada pela sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA. Tais modalidades preferidas permitem a provisão de uma molécula de ácido nucleico artificial eficientemente traduzida e estabilizada (modificada), preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido).
[0282] A determinação de uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido) como descrito acima (teor de G/C aumentado; troca de tRNAs) pode ser realizada usando o programa de computador explicado no WO02/098443, cujo teor é incluído em seu escopo integral na presente invenção. Usando este programa de computador, a sequência de nucleotídeo de qualquer ácido nucleico desejado, em particular RNA, pode ser modificada com o auxílio do código genético ou a sua natureza degenerativa de modo que um teor de G/C máximo resulta, em combinação com o uso de códons que codificam tRNAs ocorrendo o mais frequentemente possível na célula, a sequência de aminoácido codificada pelo ácido nucleico modificado, em particular RNA, preferivelmente não sendo modificada comparado com a sequência não modificada.
[0283] Alternativamente, é também possível modificar apenas o teor
Petição 870190070557, de 24/07/2019, pág. 232/401
168/306 de G/C ou apenas o uso de códon comparado com a sequência original. O código-fonte em Visual Basic 6.0 (ambiente de desenvolvimento usado: Microsoft Visual Studio Enterprise 6.0 com Servicepack 3) é também descrito no WO 02/098443.
Modificação de teor de A/U [0284] Em modalidades adicionais da presente invenção, o teor de A/U no ambiente do sítio de ligação de ribossomo da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é aumentado comparado com o teor de A/U no ambiente do sítio de ligação de ribossomo de seu respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA).
[0285] Esta modificação (um teor de A/U aumentado ao redor do sitio de ligação de ribossomo) aumenta a eficiência de ligação de ribossomo à dita molécula de ácido artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido). Uma ligação efetiva dos ribossomos ao sítio de ligação de ribossomo (sequência Kozak) por sua vez tem o efeito uma tradução eficiente da molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).
Modificações de DSE [0286] De acordo com modalidades adicionais da presente invenção, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode ser modificada com relação a elementos de sequência potencialmente desestabilizadores. Particuiarmente, a sequência de codificação e/ou a região não traduzida 5’ e/ou 3’ da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), pode ser modificada comparado com o respectivo ácido
Petição 870190070557, de 24/07/2019, pág. 233/401
169/306 nudeico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nudeico do tipo selvagem), de modo que ela não contenha quaisquer elementos de sequência desestabilizadores, a sequência de aminoácido codificada da molécula de ácido nudeico artificial modificada, preferivelmente RNA (ou dito outro ácido nudeico, em particular RNA), preferivelmente não sendo modificada comparado com seu respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nudeico do tipo selvagem).
[0287] É conhecido que, por exemplo, em sequências dos RNAs eucarióticos, elementos de sequência desestabilizadores (DSE) ocorrem, aos quais proteínas de sinal se ligam e regulam a degradação en~ zimática de RNA in vivo. Para estabilização adicional da molécula de ácido nucleico artificial modificada, preferivelmente RNA, opdonalmente na região que codifica uma proteína associada a CRISPR como definido aqui, ou qualquer outro ácido nucleico como aqui definido, uma ou mais tais modificações comparado com a região correspondente do ácido nucleico do tipo selvagem, preferivelmente RNA, podem então ser realizadas, de modo que quaisquer ou substancialmente quaisquer elementos de sequência desestabilizadores estão contidos na mesma.
[0288] De acordo com a invenção, DSE presente nas regiões não traduzidas (3’- e/ou 5’-UTR) pode também ser eliminada na molécula de ácido nudeico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui), portais modificações. Tais sequências de desestabilização são, por exemplo, sequências ricas em AU (AURES), que ocorrem nas seções 3’-UTR de vários RNAs instáveis (Caput e outros, Proc. Natl. Acad. Sei. USA 1986, 83: 1670 a 1674). A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é então preferivelmente modificada comparado com o respectivo ácido nudeico do tipo selvagem, preferivelmente RNA (ou dito
Petição 870190070557, de 24/07/2019, pág. 234/401
170/306 respectivo outro ácido nucleico do tipo selvagem) de modo que a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), não contenha quaisquer de tais sequências de desestabilização. Isso também se aplica àqueles motivos de sequência que são reconhecidos por possíveis endonucleases, por exemplo, a sequência GAACAAG, que está contida no segmento 3’LJTR do gene codificando o receptor de transferrina (Binder e outros, EMBO J. 1994, 13: 1969 a 1980). Esses motivos de sequência sâo também preferivelmente removidos da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido).
Sequências adaptadas para uso de códon humano [0289] Uma modificação preferida adicional da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é baseada na constatação que códons codificando o mesmo aminoácido tipicamente ocorrem em frequências diferentes. De acordo com modalidades preferidas adicionais, na molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), a sequência de codificação é modificada comparado com a região correspondente do respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou dito outro ácido nucleico do tipo selvagem), de modo que a frequência dos códons codificando o mesmo aminoácido corresponde à frequência de ocorrência natural daquele códon de acordo com o uso de códon humano como, por exemplo, mostrado na Tabela 4.
[0290] Por exemplo, no caso do aminoácido alanina (Ala) presente em uma sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), a sequência de codificação do tipo
Petição 870190070557, de 24/07/2019, pág. 235/401
171/306 selvagem é preferivelmente adaptada de um modo que o códon GCC seja usado com uma frequência de 0,40, o códon GCT seja usado com uma frequência de 0,28, o códon !'GCA seja usado com uma frequência de 0,22 e o códon GCG seja usado com uma frequência de 0,10, etc.
(vide Tabela 4).
Tabela 4. Tabela de uso de códon humano
Aminoácido códon fração /1000 Aminoácido códon fração /1000
Ala GCG 0,10 7,4 Pro CCG 0,11 6,9
Ala GCA 0,22 15,8 Pro CCA 0,27 16,9
Ala GCT 0,28 18,5 Pro CCT 0,29 17,5
Ala GCC* 0,40 27,7 Pro CCC* 0,33 19,8
Cys TGT 0,42 10,6 Gin CAG* 0,73 34,2
Cys TGC* 0,58 12,6 Gin CAA 0,27 12,3
Asp GAT 0,44 21,8 Arg AGG 0,22 12,0
Asp GAC* 0,56 25,1 Arg AGA* 0,21 12,1
Glu GAG* 0,59 39,6 Arg CGG 0,19 11,4
Glu GAA 0,41 29,0 Arg CGA 0,10 6,2
Phe TTT 0,43 17,6 Arg CGT 0,09 4,5
Phe TTC* 0,57 20,3 Arg CGC 0,19 10,4
Gly GGG 0,23 16,5 Ser AGT 0,14 12,1
Gly GGA 0,26 16,5 Ser AGC* 0,25 19,5
Gly GGT 0,18 10,8 Ser TCG 0,06 4,4
Gly GGC* 0,33 22,2 Ser TCA 0,15 12,2
His CAT 0,41 10,9 Ser TCT 0,18 15,2
His CAC* 0,59 15,1 Ser TCC 0,23 17,7
He ATA 0,14 7,5 Thr ACG 0,12 6,1
He ATT 0,35 16,0 Thr ACA 0,27 15,1
He ATC* 0,52 20,8 Thr ACT 0,23 13,1
Lys AAG* 0,60 31,9 Thr ACC* 0,38 18,9
Lys AAA 0,40 24,4 Vai GTG* 0,48 28,1
Leu TTG 0,12 12,9 Vai GTA 0,10 7,1
Leu TTA 0,06 7,7 Vai GTT 0,17 11,0
Leu CTG* 0,43 39,6 Vai GTC 0,25 14,5
Leu CTA 0,07 7,2 Trp TGG* 1 13,2
Leu CTT 0,12 13,2 Tyr TAT 0,42 12,2
Leu CTC 0,20 19,6 Tyr TAG* 0,58 15,3
Met ATG* 1 22,0 Parada TGA* 0,61 1,6
Asn AAT 0,44 17,0 Parada TAG 0,17 0,8
Asn AAC* 0,56 19,1 Parada TAA 0,22 1,0
*: códon mais frequente
Petição 870190070557, de 24/07/2019, pág. 236/401
172/306
Sequência otimizada no códon [0291 ] Como descrito acima, é preferido de acordo com a invenção que todos os códons da sequência do tipo selvagem que codificam um tRNA, que é relativamente raro na célula, sejam trocados por um códon que codifica um tRNA, que é relativamente frequente na célula e que, em cada caso, carrega o mesmo aminoácido que o tRNA relativamente raro.
[0292] Desta maneira, é particularmente preferido que os códons mais frequentes sejam usados para cada aminoácido codificado (vide Tabela 4, os códons mais frequentes são marcados com asteriscos). Tal procedimento de otimização aumenta o índice de adaptação do códon (CAI) e por fim maximiza o CAI. No contexto da invenção, sequências com CAI aumentado ou maximizado são referidas como sequências com códon otimizado e/ou sequências com CAI aumentado e/ou maximizado. De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular, RNA, como aqui definido) compreende pelo menos uma sequência de codificação, em que a sequência de codificação é otimizada no códon como aqui descrito. Mais preferivelmente, o índice de adaptação de códon (CAI) da pelo menos uma sequência de codificação é pelo menos 0,5, pelo menos 0,8, pelo menos 0,9 ou pelo menos 0,95. Sobretudo mais preferivelmente, o índice de adaptação do códon (CAI) da pelo menos uma sequência de codificação é 1.
[0293] Por exemplo, no caso do aminoácido alanina (Ala) presente na sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), a sequência de codificação do tipo selvagem é adaptada de um modo que o códon humano mais frequente GCC é sempre usado para o dito aminoácido, ou para o aminoácido Cisteína
Petição 870190070557, de 24/07/2019, pág. 237/401
173/306 (Cys), a sequência do tipo selvagem é adaptada de um modo que o códon humano mais frequente TGC é sempre usado para o dito aminoácido, etc.
Sequências otimizadas em C [0294] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificada através da modificação, preferivelmente aumento, do teor de citosina (C) da dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA), em particular em sua pelo menos uma sequência de codificação.
[0295] Em modalidades preferidas, o teor de C da sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificado, preferivelmente aumentado, comparado com o teor de C da sequência de codificação do respectivo ácido nucleico do tipo selvagem (não modificado). A sequência de aminoácido codificada pela pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção preferivelmente não é modificada comparado com a sequência de aminoácido codificada pelo respectivo ácido nucleico do tipo selvagem, preferivelmente RNA (ou o respectivo outro ácido nucleico do tipo selvagem).
[0296] Em modalidades preferidas, a dita molécula de ácido nucleico modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é modificada de modo que pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70% ou 80% ou pelo menos 90% do teor de citosina máximo teoricamente possível ou até mesmo um teor de citosina máximo é atingido.
[0297] Em modalidades preferidas adicionais, pelo menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% ou até mesmo 100% dos
Petição 870190070557, de 24/07/2019, pág. 238/401
174/306 códons do ácido nucleico do tipo selvagem, preferivelmente RNA, sequências que são otimizáveis no teor de citosina são substituídas por códons tendo um teor de citosina mais alto do que os presentes na sequência do tipo selvagem.
[0298] Em modalidades preferidas adicionais, alguns dos códons da sequência de codificação do tipo selvagem podem ser ainda modificados de modo que um códon para um tRNA relativamente raro na célula é trocado por um códon para um tRNA relativamente frequente na célula, contanto que o códon substituído por um tRNA relativamente frequente carregue o mesmo aminoácido que o tRNA relativamente raro do códon do tipo selvagem original. Preferivelmente, todos dos códons para um tRNA relativamente raro são substituídos por um códon para um tRNA relativamente frequente na célula, exceto códons codificando aminoácidos, que são exclusivamente codificados por códons não contendo nenhuma citosina, ou exceto glutamina (Gin), que é codificada por dois códons, cada um contendo o mesmo número de citosinas.
[0299] Em modalidades preferidas adicionais da presente invenção, a molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é modificada de modo que pelo menos 80%, ou pelo menos 90%, do teor de citosina máximo teoricamente possível ou até mesmo um teor de citosina máximo seja obtido por meio de códons, que codificam tRNAs relativamente frequentes na célula, em que a sequência de aminoácido permanece sem modificação.
[0300] Devido à degeneração do código genético de ocorrência natural, mais de um códon pode codificar um aminoácido particular. Desta maneira, 18 de 20 aminoácidos de ocorrência natural sâo codificados por mais de um códon (com Tryp e Met sendo uma exceção), por exemplo, por 2 códons (por exemplo, Cys, Asp, Glu), por três códons (por exemplo, He), por 4 códons (por exemplo, Al, Gly, Pro) ou por 6 códons
Petição 870190070557, de 24/07/2019, pág. 239/401
175/306 (isto é, Leu, Arg, Ser). No entanto, nem todos os códons codificando o mesmo aminoácido são utilizados com a mesma frequência sob condições in vivo. Dependendo de cada organismo único, um perfil de uso de códon típico é estabelecido.
[0301 ] O termo códon com teor de citosina otimizável como usado dentro do contexto da presente invenção refere-se a códons que exibem um teor menor de citosinas do que outros códons codificando o mesmo aminoácido. Desta maneira, qualquer códon do tipo selvagem, que possa ser substituído por um outro códon codificando o mesmo aminoácido e exibindo um número maior de citosina do que aquele códon, é considerado ser otimizável em citosina (otimizável em C). Qualquer tal substituição de um códon do tipo selvagem otimizável em C pelo códon com C otimizada específico dentro de uma sequência de codificação do tipo selvagem aumenta seu teor de C total e reflete uma sequência de RNA modificada enriquecida em C.
[0302] De acordo com algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) e em particular sua pelo menos uma sequência de codificação, compreende ou consiste em uma sequência maximizada em C contendo códons com C otimizada para todos os códons potencialmente com C otimizável. Desta maneira, 100% ou todos dos códons com C otimizável teoricamente são preferivelmente substituídos por códons com C otimizada em todo o comprimento da sequência de codificação.
[0303] Neste contexto, códons com teor de citosina otimizável são códons que contêm um número menor de citosinas do que outros códons codificando o mesmo aminoácido. Qualquer um dos códons GCG, GCA, GCU codifica o aminoácido Ala, que pode ser trocado pelo códon GCC codificando o mesmo aminoácido, e/ou o códon UGLJ que codifica Cys pode ser trocado pelo códon
Petição 870190070557, de 24/07/2019, pág. 240/401
176/306
UGC codificando o mesmo aminoácido e/ou o códon GAU que codifica Asp pode ser trocado peio códon GAC codificando o mesmo aminoácido, e/ou o códon UUU que codifica Phe pode ser trocado pelo códon UUC codificando o mesmo aminoácido, e/ou qualquer um dos códons GGG, GGA, GGU que codificam Gly pode ser trocado pelo códon GGC codificando o mesmo aminoácido, e/ou o códon CAU que codifica His pode ser trocado pelo códon CAC codificando o mesmo aminoácido, e/ou qualquer um dos códons AUA, AUU que codificam lie pode ser trocado pelo códon AUC, e/ou qualquer um dos códons UUG, UUA, CUG, CUU codificando Leu pode ser trocado pelo códon CUC codificando esses aminoácidos, e/ou o códon AAU que codifica Asn pode ser trocado pelo códon AAC codificando o mesmo aminoácido, e/ou qualquer um dos códons COG, CCA, CCU codificando Pro pode ser trocado pelo códon CCC codificando o mesmo aminoácido, e/ou qualquer um dos códons AGG, AGA, CGG, CGU codificando Arg pode ser trocado pelo códon CGC codificando o mesmo aminoácido, e/ou qualquer um dos códons AGU, AGC, UCG, UCA, UCU codificando Ser pode ser trocado pelo códon UCC codificando o mesmo aminoácido, e/ou qualquer um dos códons ACG, ACU codificando Thr pode ser trocado pelo códon ACC codificando o mesmo aminoácido, e/ou qualquer um dos códons GUG, GUA, GUU codificando Vai pode ser trocado pelo códon GUC codificando o mesmo aminoácido,
Petição 870190070557, de 24/07/2019, pág. 241/401
177/306 e/ou o códon UAU codificando Tyr pode ser trocado pelo códon UAC codificando o mesmo aminoácido.
[0304] Em qualquer um dos casos acima, o número de citosinas é aumentado em 1 por códon trocado. Troca de todos os códons não C otimizada (correspondendo a códons otimizáveis em C) da sequência de codificação resulta em uma sequência de codificação maximizada em C. No contexto da invenção, pelo menos 70%, preferivelmente pelo menos 80%, mais preferivelmente pelo menos 90%, dos códons não C otimizada dentro da pelo menos uma sequência de codificação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) são substituídos por códons com C otimizada.
[0305] Pode ser preferido que para alguns aminoácidos a porcentagem de códons com C otimizável substituídos por códons com C otimizada seja menos do que 70%, enquanto para outros aminoácidos a porcentagem de códons substituídos é maior do que 70% para satisfazer a porcentagem total de otimização de C de pelo menos 70% de todos os códons do tipo selvagem com C otimizável da sequência de codificação. [0306] Preferivelmente, em uma molécula de ácido nucleico artificial otimizada em C, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), pelo menos 50% dos códons do tipo selvagem com C otimizável para qualquer dado aminoácido são substituídos por códons otimizados em C, por exemplo, qualquer RNA enriquecido em C modificado (ou outro ácido nucleico, em particular RNA) contém preferivelmente pelo menos 50% de códons otimizados em C nas posições de códon do tipo selvagem com C otimizável codificando qualquer um dos aminoácidos mencionados acima Ala, Cys, Asp, Phe, Gly, His, He, Leu, Asn, Pro, Arg, Ser, Thr, Vai e Tyr, preferivelmente pelo menos 60%.
Petição 870190070557, de 24/07/2019, pág. 242/401
178/306 [0307] Neste contexto, códons codificando aminoácidos, que não sâo otimizáveis no teor de citosina e que são, no entanto, codificados por pelo menos dois códons, podem ser usados sem nenhum processo de seleção adicional. No entanto, o códon da sequência do tipo selvagem que codifica um tRNA relativamente raro na célula, por exemplo, uma célula humana, pode ser trocado por um códon que codifica um tRNA relativamente frequente na célula, em que ambos codificam o mesmo aminoácido. Desta maneira, o códon relativamente raro GAA codificando Glu pode ser trocado pelo códon relativamente frequente GAG codificando o mesmo aminoácido, e/ou o códon relativamente raro AAA codificando Lys pode ser trocado pelo códon frequente relativo AAG codificando o mesmo aminoácido, e/ou o códon relativamente raro GAA codificando Gin pode ser trocado pelo códon relativamente frequente CAG codificando o mesmo aminoácido.
[0308] Neste contexto, os aminoácidos Met (AUG) e Trp (UGG), que são codificados por apenas um códon cada um, permanecem sem modificação. Códons de parada não são otimizados no teor de citosina, no entanto, os códons de parada relativamente raros âmbar, ocre (UAA, UAG) podem ser trocados pelo códon de parada relativamente frequente opal (UGA).
[0309] As substituições únicas listadas acima podem ser usadas individualmente bem como em todas as combinações possíveis a fim de otimizar o teor de citosina da molécula de ácido nucleico artificial modificada, preferivelmente RNA, comparado com a sequência do tipo selvagem.
[0310] Desta maneira, a pelo menos uma sequência de codificação como definido aqui pode ser mudada comparado com a sequência de
Petição 870190070557, de 24/07/2019, pág. 243/401
179/306 codificação do respectivo ácido nucleico do tipo selvagem, preferivelmente RNA, de tal maneira que um aminoácido codificado por pelo menos dois ou mais códons, dos quais um compreende uma citosina adicional, tal códon pode ser trocado pelo códon otimizado em C compreendendo uma citosina adicional, em que o aminoácido é preferivelmente não alterado comparado com a sequência do tipo selvagem.
[0311] De acordo com modalidades particularmente preferidas, a combinação da invenção compreende uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo (em adição às 5’ UTR e 3’ UTR especificadas aqui) pelo menos uma sequência de codificação como definido aqui, em que (a) o teor de G/C da pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, é aumentada comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico do tipo selvagem correspondente (preferivelmente RNA) e/ou (b) em que o teor de C da pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico do tipo selvagem correspondente (preferivelmente RNA) e/ou (c) em que os códons na pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação da dita molécula de ácido nucleico artificial, preferivelmente RNA, e em que a sequência de aminoácido codificada pela molécula de ácido nucleico artificial, preferivelmente RNA, não está sendo preferivelmente modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico do tipo selvagem correspondente (preferivelmente RNA).
Petição 870190070557, de 24/07/2019, pág. 244/401
180/306
Sequências de Ácido Nucleico Modificadas [0312] As modificações de sequência indicadas acima podem em geral ser aplicadas a qualquer uma das sequências de ácido nucleico descritas aqui, e são particularmente compreendidas ser aplicadas às sequências de codificação compreendendo ou consistindo em sequências de ácido nucleico codificando proteínas associadas a CRISPR como aqui definido, e opcionalmente NLS ou outras porções, domínios ou marcadores de peptídeo ou proteína. As modificações (incluindo modificações químicas, modificações de lipídeo e modificações de sequência) podem, se adequado ou necessário, se combinadas umas com as outras em qualquer combinação, contanto que as modificações combinadas não Interfiram umas com as outras, e preferivelmente contanto que a proteína associada a CRISPR codificada (e a NLS, sequência de sinal, marcador de proteína/peptídeo) preferivelmente retenha sua funcionalidade ou propriedade biológica desejada, como acima definido.
[0313] Em modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína associada a CRISPR, em que a dita sequência de codificação foi modificada como descrito acima.
[0314] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína Cas9 ou um homólogo, variante, fragmento ou derivado da mesma, em que a dita sequência de codificação compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NOs: 412; 3474-3887; 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 1018610199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391;
Petição 870190070557, de 24/07/2019, pág. 245/401
181/306
2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 99789991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 58265839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 59225935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 95469559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999; 7002-7015; 70187031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 8178-8191; 81948207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 8274-8287; 82908302; 8306-8319; 8322-8335; 9578-9591; 9690-9703; 9802-9815; 99149927; 10026-10039; 10138-10151; 10250-10263; 10362-10375; 92909303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 93869399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 94829495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo
Petição 870190070557, de 24/07/2019, pág. 246/401
182/306
97%, de identidade de sequência com qualquer uma dessas sequências.
[0315] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem uma sequência de codificação codificando uma proteína Cpf1 ou um homólogo, variante, fragmento ou derivado da mesma, em que a dita sequência de codificação compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 69686969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 1020010201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543 2344-2345; 23602361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 24562457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 95129513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 46804681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 47764777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 95449545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840Petição 870190070557, de 24/07/2019, pág. 247/401
183/306
5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 59365937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 95609561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 8208P9AQ· R97R· 89ΑΠ S941 &9RA P9R7· 8979 ^97^- 8988 898Q8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-105831057910580; 10585-10586; 10588-10589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686;
10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755;
10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812;
10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881;
10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646;
10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715;
10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772;
10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841;
10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606;
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
Petição 870190070557, de 24/07/2019, pág. 248/401
184/306
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 94489449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente
Petição 870190070557, de 24/07/2019, pág. 249/401
185/306 peto menos 85%, ainda mais preferivelmente peto menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0316] O ácido nudeico artificial de acordo com a invenção pode, na(s) mesma região(ões) (ácido nudeico monocistrônico) ou diferente^) (ácido nudeico multicistrônico), codificar mais proteínas ou peptídeo. As respectivas sequências de ácido nudeico de codificado podem ser submetidas às mesmas modificações de sequência como descrito acima. Em particular, a sequência de codificação do ácido nucleico artificial da invenção pode compreender uma ou mais sequências codificando um ou mais sinais de localização nuclear (NLS), que são preferivelmente fundidos à sequência de ácido nudeico codificando a proteína associada a CRISPR. Essas sequências podem ser modificadas como descrito acima, também.
[0317] As sequências de codificação modificadas (ou ’'otimizadas) podem ser combinadas com qualquer uma das UTRs reveladas aqui.
[0318] Desta maneira, em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem pelo menos um elemento de 5’ UTR como aqui definido, pelo menos um elemento de 3’ UTR como aqui definido e uma sequência de codificação codificando uma proteína Cas9 ou Cpf1 ou um homólogo, variante, fragmento ou derivado (funcional) do mesmo, em que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO:413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130-8145; 9290-9305; 1040210408; 10554; 10599-10612 (HSD17B4 / Gnas.1); SEQ ID NO:414; 2346-2361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 9306-9321; 10409-10415; 10555; 10613-10626 (Slc7a3.1 / Gnas.1); SEQ ID NO:415; 2362-2377; 3522-3537: 4682-4697; 5842-5857; 70027017; 8162-8177; 9322-9337; 10416-10422; 10556; 10627-10640
Petição 870190070557, de 24/07/2019, pág. 250/401
186/306 (ATP5A1 / CASP.1); SEQ ID NO:416; 2378-2393; 3538-3553; 46984713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654 (Ndufa4.1 / PSMB3.1); SEQ ID NO:417; 23942409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 93549369; 10430-10436; 10558; 10655-10668 (HSD17B4 / PSMB3.1); SEQ ID NO:418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 (RPL32var / albumina7); SEQ ID NO:419; 2426-2441; 3586-3601; 4746-4761; 5906-5921; 7066-7081; 8226-8241; 9386-9401; 10444-10450; 10560; 10683-10696 (32L4 / albumina7); SEQ ID NO:420; 2442-2457; 36023617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710 (HSD17B4 / CASP1.1); SEQ ID NO:421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724 (Slc7a3.1 / CASP1.1); SEQ ID NO:422; 2474-2489; 3634-3649; 4794-4809; 59545969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 1072510738 (Slc7a3.1 / PSMB3.1); SEQ ID NO:423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 8290-8305; 9459-9450; 1047210478; 10564; 10739-10752 (Nosip.1 / PSMB3.1); SEQ ID NO:424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 8306-8321; 9466-9481; 10479-10485; 10565; 10753-10766 (Ndufa4.1 / RPS9.1); SEQ ID NO:425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 71627177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780 (HSD17B4 / RPS9.1); SEQ ID NO:9498- 9609; 10493-10499; 10567; 10781-10794 (ATP5A1 / Gnas.1); SEQ ID NO:9610-9721; 1050010506; 10568; 10795-10808 (Ndufa4.1 / COX6B1.1); SEQ ID NO:97229833; 10507-10513; 10569; 10809-10822 (Ndufa4.1 / Gnas.1); SEQ ID NO:9834-9945; 10514-10520; 10570; 10823-10836 (Ndufa4.1 / Ndufal. 1); SEQ ID NO:9946-10057; 10521-10527; 10571; 10837-10850 (Nosip.1 / Ndufal.1); SEQ ID N0:10058-10169; 10528-10534; 10572;
Petição 870190070557, de 24/07/2019, pág. 251/401
187/306
10851-10864 (Rpl31.1 / Gnas.1); SEQ ID N0:10170-10281; 1053510541; 10573; 10865-10878 (TUBB4B.1 /RPS9.1); SEQ ID NO:1028210393; 10542-10548; 10574; 10879-10892 (Ubqln2.1 / RPS9.1) ou urn homólogo, variante ou fragmento de qualquer uma das ditas sequências, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências. É facilmente aparente para um versado na técnica qual SEQ ID NO pertence a qual proteína (Cas9 ou Cpf1) pela orientação dada na linha Outras informações na listagem de sequência sob <223>, onde é revelado se a respectiva SE ID NO: lembra um produto de mRNA variante de Cpf1 ou um produto de mRNA variante de Cas9.
5’ Cap [0319] De acordo com modalidades preferidas da invenção, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA) como aqui definido, pode ser modificada através da adição de uma chamada estrutura ‘5’ cap’, que preferivelmente estabiliza a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA) como descrito aqui.
[0320] Um 5’ cap é uma entidade, tipicamente uma entidade nucleotídeo modificado, que geralmente faz capeamento da extremidade 5’ de um mRNA maduro. Um 5’ cap pode ser tipicamente formado por um nucleotídeo modificado, particularmente por um derivado de um nucleotídeo guanina. Preferivelmente, o 5’ cap é ligado ao terminal 5’ através
Petição 870190070557, de 24/07/2019, pág. 252/401
188/306 de uma ligação 5’-5’-trifosfato. Um 5’ cap pode ser metilado, por exemplo, m7GpppN, em que N é o nucleotídeo 5’ terminal do ácido nucleico carregando o 5’ cap, tipicamente a extremidade 5’ de um mRNA. M7GpppN é a estrutura 5’-cap, que ocorre naturalmente em mRNA transcrito por polimerase II e então preferivelmente não é considerado uma modificação compreendida em um mRNA modificado neste contexto. Desta maneira, uma molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender uma m7GpppN como 5’-cap, mas ainda a dita molécula de ácido nucleico artificial modificada, preferivelmente RNA (ou outro ácido nucleico), compreende tipicamente pelo menos uma modificação adicional como definido aqui. [0321] Exemplos adicionais de estruturas 5’ cap incluem glicerila, resíduo desóxi abásico invertido (porção), nucleotídeo de 4’,5’-metileno, nucleotídeo de l-(beta-D-eritrofuranosila), nucleotídeo de 4’-tio, nucleotídeo carbocíclico, nucleotídeo de 1,5-anidroexitol, L-nucleotídeos, alfanucleotídeo, nucleotídeo base modificado, nucleotídeo de treo-pentofuranosil, nucleotídeo de 3’,4’-seco acíclico, nucleotídeo de 3,4-di-hidroxibutila acíclico, nucleotídeo de 3,5-dí-hidroxipentila acíclico, porção de nucleotídeo invertida 3’,3’, porção abásica invertida 3’,3’, porção de nucleotídeo invertida 3’-2’, porção abásica invertida 3’-2’, fosfato de 1,4butanodiol, 3’-fosforamídato, hexilfosfato, fosfato de aminoexila, 3’-fosfato, 3’-fosforotioato, fosforoditioato ou porção metilfosfonato em ponte ou não em ponte. Essas estruturas 5’-cap modificadas são consideradas como pelo menos uma modificação neste contexto.
[0322] Estruturas 5’-cap modificadas particularmente preferidas são cap1 (metilação da ribose do nucleotídeo adjacente de m7G), cap2 (metilação adicional da ribose do 2o nucleotídeo a jusante de m7G), cap3 (metilação adicional da ribose do 3o nucleotídeo a jusante de m7G), cap4 (metilação da ribose no 4o nucleotídeo a jusante de m7G), ARCA
Petição 870190070557, de 24/07/2019, pág. 253/401
189/306 (análogo de cap antirreverso), ARCA modificado (por exemplo, ARCA modificado com fosforotioato), CleanCap (TriLink) ou uma estrutura de Cap como revelado no WO2017053297A1 (aqui incorporado a titulo de referência), inosina, Nl-metil-guanosina, 2!-fluor-guanosina, 7-desazaguanosina, 8-oxo-guanosina, 2-amíno-guanosina, LNA-guanosina e 2azido-guanosina.
[0323] De acordo com modalidades preferidas, o ácido nucleico artificial compreende um grupo metila na posição 2’-0 da posição ribose2’-0 do primeiro nucleotídeo adjacente à estrutura de cap na extremidade 5’ do RNA (cap-1). Tipicamente, metilação pode ser obtida através da ação de Cap 2’-O~Metiltransferase, utilizando ácidos nucleicos artificiais capeados m7GpppN (preferivelmente RNA) como um substrato e S-adenosinametionina (SAM) como um doador de metila para metilar RNA capeado (cap~0) resultando na estrutura cap-1. A estrutura cap-1 foi relatada aumentar a eficiência de tradução de mRNA e desta maneira pode ajudar a melhorar a eficácia de expressão do ácido nucleico artificial da invenção, preferivelmente RNA, descrito aqui.
Poli(A) [0324] De acordo com modalidades preferidas adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) contém uma sequência de poli(A).
[0325] Uma sequência de poli(A), também chamada cauda poli(A) ou cauda 3’-poii(A), é tipicamente compreendida ser uma sequência de nucleotídeos de adenosina, por exemplo, de até cerca de 400 nucleotídeos de adenosina, por exemplo, de a partir de cerca de 20 a cerca de 400, preferivelmente de a partir de cerca de 50 a cerca de 400, mais preferivelmente de a partir de cerca de 50 a cerca de 300, ainda mais preferivelmente de a partir de cerca de 50 a cerca de 250, sobretudo preferivelmente de a partir de cerca de 60 a cerca de 250 nucleotídeos
Petição 870190070557, de 24/07/2019, pág. 254/401
190/306 de adenosina. Como aqui usado, uma sequência de ροΠ(Α) pode também compreender cerca de 10 a 200 nucleotídeos de adenosina, preferivelmente cerca de 10 a 100 nucleotídeos de adenosina, mais preferivelmente cerca de 40 a 80 nucleotídeos de adenosina ou ainda mais preferivelmente cerca de 50 a 70 nucleotídeos de adenosina. Uma sequência de poli(A) está tipicamente localizada na extremidade 3’ de um RNA, em particular um mRNA.
[0326] Desta maneira, em modalidades preferidas adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) contém em seu terminal 3’ uma cauda poli(A) de tipicamente cerca de 10 a 200 nucleotídeos de adenosina, preferivelmente cerca de 10 a 100 nucleotídeos de adenosina, mais preferivelmente cerca de 40 a 80 nucleotídeos de adenosina ou ainda mais preferivelmente cerca de 50 a 70 nucleotídeos de adenosina.
[0327] Preferivelmente, a sequência de poli(A) na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA), é derivada de um modelo de DNA através de transcrição de RNA in vitro. Alternativamente, a sequência de poli(A) pode ser também obtida in vitro através de métodos comuns de síntese química sem ser necessariamente transcrita a partir de um progenitor de DNA.
[0328] Além disso, sequências de poli(A), ou caudas de poli(A), podem ser geradas através de poliadenilação enzimática da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou dito outro ácido nucleico, em particular RNA) usando kits de poliadenilação comercialmente disponíveis e protocolos correspondentes conhecidos na técnica. Poliadenilação é tipicamente compreendida ser a adição de uma sequência de poli(A) a uma molécula de ácido nucleico, tal como uma molécula de RNA, por exemplo, um mRNA prematuro. Poliadenilação
Petição 870190070557, de 24/07/2019, pág. 255/401
191/306 pode ser induzida por um chamado sinal de poliadenilação. O sinal está preferivelmente localizado dentro de uma extensão de nudeotídeos na extremidade 3’ do mRNA a ser poliadenilado. Um sinal de poliadenilação compreende tipicamente um hexâmero consistindo em nucleotídecs adenina e uradl/timina, preferivelmente a sequência de hexâmero AAUAAA. Outras sequências, preferivelmente sequências de hexâmero, são também concebíveis. Poliadenilação tipicamente ocorre durante processamento de um pré-mRNA (também chamado mRNA prematuro). Tipicamente, maturação de RNA (de pré-mRNA para mRNA maduro) compreende uma etapa de poliadenilação.
[0329] Desta maneira, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender um sinal de poliadenilação que provê poliadenilação a um RNA (transcrito) através de fatores de proteína específicos (por exemplo, fator de especificidade de divagem e poliadenilação (CPSF), fator de estimulação de divagem (CstF), fatores de divagem I e II (CF I e CF II), polimerase de poli(A) (PAP)).
[0330] Neste contexto, um sinal de poliadenilação de consenso é preferido compreendendo a sequência de consenso NN(U/T)ANA. Em um aspecto particularmente preferido, o sinal de poliadenilação compreende uma das sequências que seguem: AA(U/T)AAA ou A(U/T)(U/T) AAA (em que uridina está geralmente presente em RNA e timidina está geralmente presente em DNA).
Poli(C) [0331] De acordo com modalidades preferidas adidonais, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) contém uma cauda poli(C) no terminal 3’ de tipicamente cerca de 10 a
Petição 870190070557, de 24/07/2019, pág. 256/401
192/306
200 nucleotídeos citosina, preferivelmente cerca de 10 a 100 nucieotídeos citosina, mais preferivelmente cerca de 20 a cerca de 70 nucleotídeos citosina ou ainda mais preferivelmente cerca de 20 a 60 ou até mesmo 10 a 40 nucleotídeos citosina.
Alça-tronco de histona (HSL) [0332] Em algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) compreende uma sequência/estrutura de alça-tronco de histona (HSL). Tais sequências de alça-tronco de histona são preferivelmente selecionadas de sequências de alça-tronco de histona como revelado no WO2012/019780, cuja descrição é aqui incorporada a título de referência.
[0333] Uma sequência de alça-tronco de histona, adequada para ser usada na presente invenção, é preferivelmente selecionada de pelo menos uma da fórmula (I) ou (II) que segue:
fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) fórmula (li) (sequência de tronco-alça com elementos limítrofes de tronco):
[N0-2GN3..5] [No_4(ü/T)No_4] [Ns-sCIfe] tronco! silçsj troncok em que:
Ni-β [N0-2GN3-5] [No^(U/T)No^] [N3-5CN0-2]
-----! '--.....------------------· ·, '---' 5-------y-----Ύ tronco! tronco! a^a tronco2 tronco2 , ... . elemento limítrofe elemsmo hmltrote elementos limítrofes de troncol ou tronco2 hh-s é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de
Petição 870190070557, de 24/07/2019, pág. 257/401
193/306 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C, ou um análogo de nucleotídeo do mesmo;
troncol [N0-2GN3-5] é complementar reverso ou parcialmente complementar reverso com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotídeos;
em que No-2Ó uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, GeC ou um análogo de nucleotídeo do mesmo;
em que N3-5 θ uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma, contanto que sua nucleotídeo citidina complementar seja substituída por guanosina;
sequência de alça [N0-4(U/T)N0-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nucleotídeos;
em que cada N0-4 é independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucleotídeo selecionada de A, U, T, G e C ou um análogo de nucleotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva
Petição 870190070557, de 24/07/2019, pág. 258/401
194/306 de entre 5 a 7 nudeotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;
em que N0-2 é uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contendo que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;
em que 0 troncol e 0 tronco2 são capazes de emparelhamento de base um com 0 outro formando uma sequência reversa complementar, em que 0 emparelhamento de base pode ocorrer entre 0 troncol e 0 tronco2, por exemplo, emparelhamento de base WatsonCrick de nudeotídeos A e U/T ou G e C ou por emparelhamento de base não Watson Crick, por exemplo, emparelhamento de base wobble, emparelhamento de base Watson-Crick, emparelhamento de base Hoogsteen, emparelhamento de base Hoogsten ou são capazes de emparelhamento de base um com 0 outro formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre 0 troncol e tronco2, com base em que uma ou mais bases no tronco não têm uma base complementar na sequência de complementaridade reversa do outro tronco.
[0334] De acordo com uma modalidade preferida, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender pelo menos uma sequência de tronco-alça de histona (HSL)
Petição 870190070557, de 24/07/2019, pág. 259/401
195/306 de acordo com peto menos uma da fórmula (Ia) ou (Ha) específica que segue:
fórmula (Ia) (sequência de tronco-alça sem elementos limítrofes de tronco):
[No-tGNw] [Ni.3(U/T)N0.2] [N3.5CN0.1] x__________ç,y -----------v' tronco 1 alça tronco 2 fórmula (Ha) (sequência de tronco-alça com elementos limítrofes de tronco):
N2-5 IW1GN3-5] [Ni-3(U/T)N0_2] [N3-5CN0-1] N2-5
.... · ----------------...-----------------. ..J--· ·--
V tronco 1 troncol alça. tronco2 tronco2 elemento limítrofe elemento limítrofe em que:
N, C, G, T e U são como acima definido.
[0335] De acordo com uma modalidade mais particularmente preferida adicional, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como definido aqui) pode compreender peto menos uma sequência de tronco-alça de histona de acordo com peto menos uma da fórmula (Ib) ou (llb) específica que segue:
Fórmula (Ib) (sequência de tronco-alça sem elementos limítrofes de fes de tronco):
[N1GN4] [N2(U/T)Ni] [N4CN1]
V M y ·.
tronco! atoa trooco2 fórmula (llb) (sequência de tronco-alça com elementos limítrofes de tronco):
Petição 870190070557, de 24/07/2019, pág. 260/401
196/306
N4-5 [N1GN4] [N2(U/T)Ni] [N4CN1] N4-5 \__________' „__________X.---------,.--------V V trancol troncol alça tronco2 tronccS elemento limítrofe elemento limítrofe em que
N, C, G, T e U são como acima definido.
[0336] Uma sequência de tronco-alça de histona particularmente preferida é a sequência CAAAGGCTCTTTTCAGAGCCACCA ou mais preferivelmente a sequência de RNA correspondente CAAAGGCUCUUUUCAGAGCCACCA.
Porções de miRNA [0337] Em uma modalidade adicional, porções de não codificação, isto é, por exemplo, porções de miRNA, são combinadas com as sequências da invenção. Porções de não codificação podem ser selecionadas de sequências de ácido nucleico de uma ou mais reveladas na lista que segue: uma 5’-UTR;
uma 3-UTR;
uma porção de miRNA;
um Cap;
uma sequência de poli(C) uma sequência de tronco-alça de histona uma sequência de poli(A) ou um sinal de poliadenilação;
uma porção de IRES uma porção grampo de cabelo.
porções para proteínas de ligação a RNA uma porção que previne degradação de 3’-5’ porções que regulam taxas de declínio de RNA
Petição 870190070557, de 24/07/2019, pág. 261/401
197/306 [0338] Os acima são termos genéricos. Porções específicas que se encaixam nesses termos genéticos são também providas pela presente invenção. Detalhes de porções da lista acima, incluindo sequências pertencentes às modalidades específicas, são providos abaixo.
[0339] Embora a lista acima proveja itens na forma singular, é igualmente possível que mais de uma porção respectiva seja selecionada. Porções de ácido nucleico não incluídas na lista acima podem ser igualmente selecionadas. Preferivelmente, pelo menos um módulo ou porção é da lista acima.
[0340] Em modalidades típicas, pelo menos uma porção 5’-UTR e/ou pelo menos uma porção 3!~UTR é selecionada. Preferivelmente, pelo menos uma 5’-UTR e pelo menos uma 3’-UTR é selecionada.
[0341 ] Um miRNA pode ser também selecionado como uma porção na presente invenção. Qualquer porção de miRNA conhecida na técnica pode ser selecionada. Tal porção pode ser selecionada de sequênciasalvo de microRNA, sequências de microRNA ou sementes de microRNA. Por exemplo, sequências de miRNA (sequências-alvo de microRNA, sequências de microRNA ou sementes de microRNA) são descritas nos WO2015085318A2, US2005/0261218, US20170211066, WO2017201332, WO2017201328, WO2017201349, WO2017201347, WO2017201348, WO2017201342, WO2017201346, US20160177295, WO2014113089, EP2946014, W02016100812, WO2013126803 e US2005/0059005 (todas as referências mencionadas são aqui incorporadas a título de referência). Identificação de microRNA, regiões-alvo de microRNA e seus padrões de expressão e papel em biologia foram relatados (Bonauer e outros, Curr Drug Targets 2010 11 :943-949; Anand e Cheresh, Curr Opin Hematol 2011, 18: 171-176; Contreras eRao Leukemia, 2012 26:404-413; Barrel, Cell, 2009 136:215-233; Landgraf e outros Cell, 2007 129: 1401-1414 todas as referências mencionadas acima são aqui incorporadas a título de referência).
Petição 870190070557, de 24/07/2019, pág. 262/401
198/306 [0342] Em geral, microRNAs (ou miRNA) são RNAs de não codificação de 19-25 nucleotídeos de comprimento. miRNAs se ligam a 3’UTR de moléculas de ácido nucleico. Isso causa sub-regulagem de expressão de gene, ou através da redução da estabilidade da molécula de ácido nudeico ou inibindo tradução. Como um módulo da presente invenção, os polinucleotídeos da presente invenção podem compreender uma sequências-alvo de microRNA, sequências de microRNA ou sementes de microRNA.
[0343] Como aqui usado, o termo sítio de microRNA refere-se a uma sequência de polinucleotídeo à qual microRNA pode se ligar ou de outro modo se associar. Ligação tipicamente ocorre através de hibridização Watson-Crick; mas qualquer outra associação estável do microRNA com a sequência-alvo no ou adjacente ao sítio de microRNA é também compreendida no conceito de sítio de microRNA de acordo com a presente invenção.
[0344] Em geral, uma sequência de microRNA compreende uma região semente, isto é, uma sequência tipicamente na região de posições 2-8 de um microRNA maduro. A sequência de região de semente tem complementaridade Waston-Crick perfeita com a sequência-alvo de miRNA. Tal semente de microRNA pode compreender posições 2-8 ou, alternativamente, 2-7 do microRNA maduro. Desta maneira, em uma modalidade, uma semente de microRNA compreende 7 nucleotídeos (por exemplo, nucleotídeos 2-8 do microRNA maduro), em que o sítio de complementaridade de semente no alvo de miRNA correspondente é flanqueado por uma adenina (A) oposto à posição 1 de microRNA. Em uma outra modalidade, uma semente de microRNA compreende 6 nucleotídeos (por exemplo, nucleotídeos 2-7 do microRNA maduro), em que o sítio de complementaridade de semente no alvo de miRNA correspondente é flanqueado por adenina (A) oposto à posição de microRNA 1. As respectivas moléculas de ácido nucleico são reveladas
Petição 870190070557, de 24/07/2019, pág. 263/401
199/306 em Grimson e outros; Mol Cell. 2007 Jul 6;27(1 ):91 -105.
[0345] Na presente invenção, uma sequência-alvo de microRNA é tipicamente projetada para ser compreendida em uma 3’-UTR ou de outro modo 3’ (a montante) de uma estrutura de leitura aberta. Em tal caso, a sequência-alvo de miRNA é pensada se direcionar à molécula para degradação ou tradução reduzida, contanto que um microRNA correspondente em questão esteja disponível. Isso permite controlar quaisquer efeitos fora do alvo indesejados quando da administração da molécula de ácido nucleico da presente invenção.
[0346] No caso de não ser desejado traduzir um mRNA no fígado, mas o mRNA é transportado para o fígado ou de outro modo termina nele, então miR-122, um microRNA abundante no fígado, pode inibir a expressão do ácido nucleico da presente invenção, se um ou múltiplos sítios-alvo de miR-122 estiverem presentes (por exemplo, projetado) na região 3’-UTR do polinucleotídeo na presente invenção. Introdução de um ou múltiplos sítios de ligação para microRNA diferente pode ser engenheirada para influenciar mais (por exemplo, diminuir) a longevidade, estabilidade e tradução de proteína de polinucleotídeos.
[0347] Em contraste, no caso de ser realmente desejado traduzir um mRNA, sítios de ligação de microRNA podem ser engenheirados a partir de (isto é, removidos de) sequências em que eles ocorrem, por exemplo, a fim de aumentar a expressão de proteína em tecidos específicos. Por exemplo, um ou mais sítios de ligação de miR-122 podem ser removidos para melhorar a expressão da proteína no fígado.
[0348] Desta maneira, regulagem de expressão em tecidos específicos pode ser realizada através de introdução ou remoção de um ou vários sítios de ligação de microRNA. Por exemplo, microRNAs são conhecidos regular mRNA, e desta maneira expressão de proteína, sem limitação no fígado (miR-122), coração (miR-ld, miR-149), células endoteliais (miR-17-92, miR-126), tecido adiposo (let-7, miR-30c), rim (miR
Petição 870190070557, de 24/07/2019, pág. 264/401
200/306
192, miR-194, miR-204), células mieloides (miR-142-3p, miR-142-5p), miR-16, mlR-21, miR223, miR-24, miR-27), músculo (mlR-133, miR206) e células epiteliais do pulmão (let-7, miR-133, miR-126). MicroRNA pode também regular processos biológicos complexos, tal como angiogênese (miR-132) (por exemplo, Anand e Cheresh, Curr. Opin. Hematol. 2011, 18: 171-176).
[0349] Desta maneira, em geral, de acordo com o princípio de projeto modular da presente invenção, sítios de ligação para microRNAs podem ser removidos ou introduzidos, a fim de adaptar a expressão da expressão de polinucleotídeo para os tipos de célula ou tecidos desejados ou ao contexto de processos biológicos relevantes. Listagens de sequências de miRNA e sítios de ligação estão disponíveis para o público. Qualquer sequência revelada na literatura discutida aqui pode ser usada no contexto da presente invenção: exemplos de microRNA que direcionam expressão de gene específica de tecido ou doença são listados em Getner e Naldini, Tissue Antigens. 2012, 80:393-403. Um exemplo de incorporação de sítios de semente de microRNA é incorporação de sítios de mlR-142 a um vetor lentiviral expressando UGT1A1, que causa expressão reduzida em células apresentando antígeno, levando à ausência de uma resposta imune contra o UGT1A1 viralmente expresso como revelado em Schmitt e outros, Gastroenterology 2010; 139:999-1007; Gonzalez-Asequinolaza e outros, Gastroenterology 2010, 139:726-729. Desta maneira, incorporação de um ou mais sítios de semente de m!R142 em mRNA é pensada ser importante no caso de tratamento de pacientes com deficiências de proteína completa (UGT1A1 tipo I, pacientes deficientes em LDLR, pacientes Pompe negativos em CRIM, etc). Desta maneira, a molécula de ácido nucleico da presente invenção pode ser projetada para se adequar a tais propósitos. Qualquer polinucleotídeo pode ser selecionado, que seja caracterizado
Petição 870190070557, de 24/07/2019, pág. 265/401
201/306 por peto menos 80% de identidade, pelo menos 85% de identidade, preferivelmente pelo menos 90% de identidade e mais preferivelmente pelo menos 95% de identidade com qualquer uma de tais sequências de miRNA.
[0350] Devido aos padrões de expressão diferentes de microRNA em tipos de células diferentes, a presente invenção permite projetar especificamente moléculas de polinucleotídeo para expressão direcionada em tipos de célula específicos ou sob condições biológicas específicas. Através de introdução de sítios de ligação de microRNA específicos de tecido, polinucleotídeos podem ser projetados para expressão de proteína em um tecido ou no contexto de uma condição biológica.
[0351] Em uma modalidade da Invenção, a molécula de ácido nucleico artificial da invenção codificando uma proteína associada a CRISPR (por exemplo, Cas9, Cpf1) da invenção compreende pelo menos uma sequência de miRNA selecionada do grupo consistindo em hsa-miR-27a-3p, hsa-miR-99b-5p, hsa-miR-21-5p, hsa-miR-142-5p, hsa-míR-27a~3p, hsa-míR-21~5p, hsa-miR-223~3p, hsa-miR-150~5p e hsa-mlR-142-5p.
Construtos [0352] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção, que compreende peto menos uma sequência de codificação como aqui definido compreende pelo menos uma 5’ UTR e peto menos uma 3’ UTR como aqui descrito, e opcionalmente pelo menos um tronco-alça de histona.
[0353] A 3’ UTR da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) pode compreender ainda uma sequência de poli(A) e/ou poli(C) como aqui definido.
[0354] Os elementos únicos da 3’ UTR podem ocorrer aí em qual
Petição 870190070557, de 24/07/2019, pág. 266/401
202/306 quer ordem de 5’ a 3’ ao longo da sequência da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção.
[0355] Ainda, elementos adicionais como aqui descrito também podem estar contidos, tal como uma sequência de estabilização como definido aqui (por exemplo, derivada da UTR de um gene da globina), sequências de IRES, etc. Cada um dos elementos pode também ser repetido na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção pelo menos uma vez (particularmente em construtos di- ou multicistrônicos), por exemplo, duas vezes ou mais. Como um exemplo, os elementos únicos podem estar presentes na molécula de ácido nucleico artificial, preferivelmente RNA, da invenção na ordem que segue: 5’-sequência de codificação-tronco-alça de histona-sequência de poli(A)/(C) 3’; ou
5’-sequência de codificação-sequência de poli(A)/(C)-tronco-alça de h istona-3’; ou
5’-sequência de codificação-tronco-alça de histona-sinal de poliadenilação-3’; ou
5’-sequência de codificação-sinal de poliadenilação-tronco-alça de histona-3’; ou
5’-sequência de codificação-histona alça-tronco-alça-tronco de histonasequência de poli(A)/(C)-3’; ou
5’-sequência de codificação-tronco-alça de histona-tronco-alça de histona-sinal de poliadenilação~3’; ou
5!-sequência de codificação-sequência de estabilização-sequência de poli(A)/(C)-tronco-alça de histona-3’; ou
5’-sequência de codificação, sequência de estabilização-sequência de poli(A)/(C)-sequência de poli-(A)/(C)-tronco-alça de histona-3’, etc.
[0356] De acordo com modalidades adicionais, a molécula de ácido nucleico artificial, preferivelmente RNA, preferivelmente compreende
Petição 870190070557, de 24/07/2019, pág. 267/401
203/306 ainda pelo menos um dos elementos estruturais que seguem: uma estrutura de histona-tronco-alça, preferivelmente uma histona-tronco-aiça na região não traduzida 3’; uma estrutura de 5’-cap; uma cauda de poliA; ou uma sequência de poli(C).
[0357] De acordo com algumas modalidades, é particularmente preferido que se, em adição a uma proteína associada a CRISPR, um peptídeo ou proteína adicional for codificado por pelo menos uma sequência de codificação como definido aqui-o peptídeo ou proteína codificado preferivelmente não é nenhuma proteína histona, nem proteína repórter (por exemplo, Luciferase, GFP e suas variantes (tal como eGFP, RFP ou BFP) e/ou nenhum marcador ou proteína de seleção, incluindo alfaglobina, galactocinase e Xantina:Guanina fosforribostil transferase (GPT), hipoxantina-guanina fosforribosiltransferase (HGPRT), beta galactosidase, galactocinase, fosfatase alcalina, fosfatase alcalina embriônica secretada (SEAP) ou um gene de resistência (tal como um gene de resistência contra neomicina, puromicina, higromicina e zeocina). Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica um gene repórter ou um gene marcador. Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica luciferase. Em outras modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, não codifica GFP ou uma variante da mesma.
[0358] Especificamente, moléculas de ácido nucleico artificiais, em particular RNAs, de acordo com a invenção podem compreender preferivelmente na direção 5’ para 3’, os elementos que seguem:
a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1
b) um elemento de 5’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como aqui definido, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com
Petição 870190070557, de 24/07/2019, pág. 268/401
204/306
SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma;
c) pelo menos uma sequência de codificação como aqui definido;
d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3!~UTR como definido aqui, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 23; 25; 27; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,
e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nudeotídeos de adenosina,
f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nudeotídeos cisteína, e
g) opcionalmente um tronco-alça de histona.
[0359] Construtos de ácido nucleico artificias preferidos são discutidos em detalhes abaixo.
Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de GNAS [0360] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 413; 2330-2345; 3490-3505; 4650-4665; 5810-5825; 6970-6985; 8130
Petição 870190070557, de 24/07/2019, pág. 269/401
205/306
8145; 9290-9305; 10402-10408; 10554; 10599-10612, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3! UTR derivado de GNAS:
[0361] Em algumas modalidades, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 414; 23462361; 3506-3521; 4666-4681; 5826-5841; 6986-7001; 8146-8161; 93069321; 10409-10415; 10555; 10613-10626, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo
Petição 870190070557, de 24/07/2019, pág. 270/401
206/306
97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de ATP5A1 e elemento de 3’ UTR derivado de CASP1 [0362] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de ATP5A1, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 415; 2362-2377; 3522-3537; 4682-4697; 5842-5857; 7002-7017; 81628177; 9322-9337; 10416-10422; 10556; 10627-10640, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de NDUFA4 e elemento de 3! UTR derivado de PSMB3:
[0363] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR
Petição 870190070557, de 24/07/2019, pág. 271/401
207/306 de urn gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nudeico artificial compreende ou consiste em uma sequência de ácido nudeico de acordo com SEQ ID NO: 416; 2378-2393; 3538-3553; 4698-4713; 5858-5873; 7018-7033; 8178-8193; 9338-9353; 10423-10429; 10557; 10641-10654, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nudeico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de PSMB3 [0364] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 417; 2394-2409; 3554-3569; 4714-4729; 5874-5889; 7034-7049; 8194-8209; 9354-9369; 10430-10436: 10558; 10655-10668, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%,
Petição 870190070557, de 24/07/2019, pág. 272/401
208/306 preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de RPL32 e elemento de 3’ UTR derivado de ALB:
[0365] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de RPL32, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 418; 2410-2425; 3570-3585; 4730-4745; 5890-5905; 7050-7065; 8210-8225; 9370-9385; 10437-10443; 10559; 10669-10682 ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5! UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de CASP1:
[0366] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo
Petição 870190070557, de 24/07/2019, pág. 273/401
209/306 menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 420; 2442-2457; 3602-3617; 4762-4777; 5922-5937; 7082-7097; 8242-8257; 9402-9417; 10451-10457; 10561; 10697-10710, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3’ UTR derivado de CASP1 [0367] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 421; 2458-2473; 3618-3633; 4778-4793; 5938-5953; 7098-7113; 8258-8273; 9418-9433; 10458-10464; 10562; 10711-10724, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência
Petição 870190070557, de 24/07/2019, pág. 274/401
210/306 de ácido nucleico tendo, em ordem crescente de preferência, peio menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de SLC7A3 e elemento de 3’ UTR derivado de PSMB3 [0368] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 422; 2474-2489; 3634-3649; 4794-4809; 5954-5969; 7114-7129; 8274-8289; 9434-9449; 10465-10471; 10563; 10725-10738, ou uma variante ou um fragmento de qualquer uma das ditas sequencais, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Petição 870190070557, de 24/07/2019, pág. 275/401
211/306
Elemento de 5’ UTR derivado de NOSIP e elemento de 3! UTR derivado de PSMB3:
[0369] Em algumas modalidades preferidas, os ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NOSIP, ou de um homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 423; 2490-2505; 3650-3665; 4810-4825; 5970-5985; 7130-7145; 82908305; 9459-9450; 10472-10478; 10564; 10739-10752, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de NDUFA4 e elemento de 3' UTR derivado de RPS9 [0370] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante
Petição 870190070557, de 24/07/2019, pág. 276/401
212/306 do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 424; 2506-2521; 3666-3681; 4826-4841; 5986-6001; 7146-7161; 83068321; 9466-9481; 10479-10485; 10565; 10753-10766, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos 80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
Elemento de 5’ UTR derivado de HSD17B4 e elemento de 3’ UTR derivado de RPS9:
[0371] Em algumas modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de HSD17B4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou uma variante do mesmo, em que o dito ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com SEQ ID NO: 425; 2522-2537; 3682-3697; 4842-4857; 6002-6017; 7162-7177; 8322-8337; 9482-9497; 10486-10492; 10566; 10767-10780, ou um homólogo, variante ou fragmento da mesma, em particular uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99%, preferivelmente pelo menos 70%, mais preferivelmente pelo menos
Petição 870190070557, de 24/07/2019, pág. 277/401
213/306
80%, ainda mais preferivelmente pelo menos 85%, ainda mais preferivelmente pelo menos 90% e sobretudo preferivelmente pelo menos 95% ou até mesmo 97%, de identidade de sequência com qualquer uma dessas sequências.
[0372] Em outras modalidades preferidas, ácidos nucleicos artificiais de acordo com a invenção compreendem ou consistem em pelo menos um elemento 5’ UTR e 3’ UTR como descrito aqui abaixo (ou de um homólogo, um fragmento ou variante da mesma), em que o ácido nucleico artificial compreende ou consiste em um a sequência de ácido nucleico de acordo com a SEQ ID NO: em parênteses atrás da combinação de UTR específica:
ATP5A1 / Gnas.1 (SEQ ID NO: 9498- 9609; 10493-10499; 10567; 10781-10794);
Ndufa4.1 / COX6B1.1 (SEQ ID NO: 9610-9721; 10500-10506; 10568; 10795-10808);
Ndufa4.1 / Gnas.1 (SEQ ID NO: 9722-9833; 10507-10513; 10569; 10809-10822);
Ndufa4.1 / Ndufal. 1 (SEQ ID NO: 9834-9945; 10514-10520; 10570; 10823-10836);
Nosip.1 / Ndufal.1 (SEQ ID NO: 9946-10057; 10521-10527; 10571; 10837-10850);
Rpl31.1 / Gnas.1 (SEQ ID NO: 10058-10169; 10528-10534; 10572; 10851-10864);
TUBB4B.1 ZRPS9.1 (SEQ ID NO: 10170-10281; 10535-10541; 10573; 10865-10878);
Ubqln2.1 / RPS9.1 (SEQ ID NO: 10282-10393; 10542-10548; 10574; 10879-10892).
Complexação [0373] Em modalidades preferidas, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer
Petição 870190070557, de 24/07/2019, pág. 278/401
214/306 outro ácido nucleico como aqui descrito) é provida em uma forma complexada, isto é, complexada ou associada com um ou mais compostos (poli-)catiônicos, preferivelmente com polímeros (poli-jcatiônicos, peptídeos (poli-jcatiônicos ou proteínas, por exemplo, protamina, polissacarídeos (poli)catiônicos e/ou lipídeos (poli-)catiônicos. Neste contexto, o termo complexado ou associado refere-se à combinação essencialmente estável da pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico) com um ou mais dos compostos mencionados acima em complexos ou arranjos maiores sem ligação covalente.
Lipídeos [0374] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção é complexada ou associada com lipídeos (em particular lipídeos catiônicos e/ou neutros) para formar um ou mais lipossomos, lipoplexos, nanopartículas de lipídeo ou nanolipossomas.
[0375] Desta maneira, em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido) é provida na forma de uma formulação à base de lipídeo, em particular na forma de lipossomas, lipoplexos e/ou nanopartículas de lipídeo compreendendo a dita molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico, em particular RNA).
Nanopartículas de lipídeo [0376] De acordo com algumas modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), é complexada ou associada com lipídeos (em particular lipídeos catiônicos e/ou neutros) para formar uma ou mais nanopartículas de lipídeo.
Petição 870190070557, de 24/07/2019, pág. 279/401
215/306
Em algumas modalidades, a(s) nanopartícula(s) da invenção compreende(m) pelo menos uma molécula de ácido nucleico artificial codificando uma proteína associada a CRISPR como aqui descrito, em ainda pelo menos um gRNA como aqui descrito.
[0377] Preferivelmente, nanopartículas de lipídeo (LNPs) compreendem: (a) pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), (b) um lipídeo catiônico, (c) um agente de redução de agregação (tal como lipídeo de polietileno glicol (PEG) ou lipídeo modificado com PEG), (d) opcionalmente um lipídeo não catiônico (tal como um lipídeo neutro) e (e), opcionalmente, um esterol.
[0378] Em algumas modalidades, LNPs compreendem, em adição à pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), (i) pelo menos um lipídeo catiônico; (ii) um lipídeo neutro; (iii) um esterol, por exemplo, colesterol; e (iv) um PEG-lipídeo, em uma razão molar de cerca de 20-60% de lipídeo catiônico:5-25% de lipídeo neutro:25~55% de esterol; 0,5-15% de PEG-lipídeo.
[0379] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), pode ser formulada em um aminoálcool lipidoide. Aminoálcoois lipidoides que podem ser usados na presente invenção podem ser preparados através dos métodos descritos na Patente U.S. No. 8.450.298, aqui incorporada a título de referência em sua totalidade.
(i) Lipídeos catiônicos [0380] LNPs podem incluir qualquer lipídeo catiônico adequado para formação de uma nanopartícula de lipídeo. Preferivelmente, o lipídeo catiônico carrega uma carga positiva líquida em pH mais ou menos fisiológico.
Petição 870190070557, de 24/07/2019, pág. 280/401
216/306 [0381] O lipídeo catiônico pode ser um amino lipídeo. Como aqui usado, o termo amino lipídeo pretende incluir aqueles lipídeos tendo uma ou duas cadeias alquila do ácido graxo ou graxas e um grupo amino principal (incluindo um grupo alquilamino ou dialquilamino) que pode ser protonado para formar um lipídeo catiônico em pH fisiológico.
[0382] O lipídeo catiônico pode ser, por exemplo, cloreto de N,Ndíoleil·N,Ndimetilamônio (DODAC), brometo de N,N-diestearil~N,N~dl·metilamônio (DDAB), cloreto de 1,2-dioleoiltrimetil amônio (DOTAP) (também conhecido como cloreto de N(2,3dioleoil0xi)propil)N,N,N-trimetilamônio e Sal de cloreto de 1 ^dioleiloxhS-trimetilaminopropano), cloreto de N~(1-(2,3-dioleilóxi)propil)-N,N,N-trimetilamônio (DOTMA), N,Ndimetil2,3- dioleilóxi)propilamina (DODMA), 1,2DiLinoieilóxi-N,Ndimetilaminopropano (DLinDMA), 1,2--ΟίΙίηοί©ηίΙόχΕ-Ν,N--dimetHaminopropano (DLenDMA), 1,2~dH-linolenilóxi~N,N~dimetilaminopropano (y~ DLenDMA), 1,2-Dilinolellcarbamoilóxi3 dimetilaminopropano (DLin-CDAP), UZ-DilinoleioxhS-idimetilaminojacetoxipropano (DLin-DAC), 1,2Dilinoleióxi-S-morfolinopropano (DLin-MA), 1,2~Dilinoleoil~3~ dimetilaminopropano (DLinDAP), l,2”Dilinoieiitio~3~dimetiiaminopropano (DLin-SDMA), 1 Unoleoil2linoleilóxl-3-dimetilaminopropano (DLIn-2-DMAP), Sal de cloreto de 1,2~dilinoleilóxi~3~trimetilaminopropano (DLin~TMA.CI), Sal de cloreto de 1,2-dilinoleoil-3- trimetilaminopropano (DLin-TAP.CI), 1,2-ΟΙΙΙηοΙβΙΙόχί3(Ν- metllpiperazino)propano (DLin-MPZ) ou 3-(N,NDilinoleilamino)~1,2-propanodiol (DLinAP), 3~(N,N~Dioleilamino)-1,2propanodio (DOAP), 1,2-Dilinoleiloxo~3-(2--N,N dimetilamino)etoxipro~ pano (DLin-EG-DM A), 2,2-Dilinolell-4“dlmetilaminometil-[1,3]-dloxolana (DLin-K-DMA) ou análogos dos mesmos, (3aR,5s,6aS)”N,N-dimetil2,2di((9Z, 12Z)- octadeca-9,12~dienil)tetrahidro~3aH“Ciclopenta[d][1,3]d io~ xol-5-amina, (6Z,9Z,28Z,31Z)~heptatriaconta--6,9,28,31~tetraen-19~il 4(dimetilamino)butanoato (MC3), 1,1'-(2-(4-(2-((2-(bis(2-hidroxidode
Petição 870190070557, de 24/07/2019, pág. 281/401
217/306 cn)amino)etn)(2”Mdr0xHdodecH)armno)etH)piperazin-J”H)etnaz:anediH)dk dodecan-2-ol (C12-200), 2,2“dHinoieH~4~(2~dimetnaminoetH)~[1,3]-dioxolana (DLin-K~C2~DMA), 2,2-diHnoleil-4-dimetilaminometil-[l,3]-dioxolana (DLin-K-DMA), (6Z,9Z,28Z,31 Z)-heptatriaconta-6,9,28,31 -tetraen-19-il
4-(dimetilamino) butanoato (DLin-M-C3-DMA), 3-((6Z,9Z,28Z,31Z)-heptatriaconta-6,9,28,3 l-tetraen-W-ilóxij-N^-dimetilpropan-l-amina (MC3 Éter), 4-((6Z,9Z,28Z,31 Z)-heptatriaconta-6,9,28,31-tetraen-19-ilóxi)N,N-dimetilbutan-1-amina (MC4 Éter) ou qualquer combinação de qualquer um dos acima.
[0383] Outros Hpídeos catiônicos incluem, mas não estão limitados a, brometo de N,N-distearil~N,N~dimetilamônio (DDAB), 3P-(N-(Ns,Ns-di~ metilaminoetano)-carbamoil)colesterol (DC-Choi), trifluoracetato de N(1-(2,3-dioleilóxi)propil)-N-2-(esperminocarboxamido)etil)-N,N-dimetilamônio (DOSPA), dioctadecilamidoglicil carboxispermina (DOGS), 1,2dileoil-sn-3-fosfoetanolamina (DOPE), 1,2-dioleoH-3-dimetilarnônio propane (DODAP), brometo de N-(1,2-dimiristiloxiprop-3-il)-N,N-dimetil-Nhidroxietil amônio (DMRIE) e 2,2~Dilinoleil~4~dirnetHaminoetH~[1,3]-dio~ xolana (XTC). Ainda, preparações comerciais de Hpídeos catiônicos podem ser usadas, tais como, por exemplo, LIPOFECTIN (incluindo DOTMA e DOPE, disponíveis da GIBCO/BRL) e LIPOFECTAMINE (compreendendo DOSPA e DOPE, disponíveis da GIBCO/BRL).
[0384] Outros Hpídeos catiônicos adequados são revelados nas Publicações Internacionais Nos. WO 09/086558, WO 09/127060, WO 10/048536, WO 10/054406, WO 10/088537, WO 10/129709 e WO 2011/153493; Publicações de Patente U.S. Nos. 2011/0256175, 2012/0128760 e 2012/0027803; Patentes U.S. Nos. 8.158.601; e Love e outros, PNAS, 107(5), 1864-69, 2010.
[0385] Outros lipídeos de aminoácido adequados incluem aqueles tendo grupos de ácido graxo alternativos e outros grupos dialquilamino, incluindo aqueles em que os substituintes alquila são diferentes (por
Petição 870190070557, de 24/07/2019, pág. 282/401
218/306 exemplo, N-etil-N-metilamino e N-propil-N-etilamino). Em geral, amino lipídeos tendo menos cadeias acila saturadas são mais facilmente dimensionados, particularmente quando os complexos devem ser dimensionados abaixo de cerca de 0,3 microns, para propósitos de esterilização do filtro. Amino lipídeos contendo ácidos graxos insaturados com comprimentos de cadeia de carbono na faixa de C14 a C22 podem ser usados. Outras bases podem ser também usadas para separar o grupo amino e a porção de ácido graxo ou alquila graxa do amino lipídeo.
[0386] Em algumas modalidades, amino lipídeos ou catiônicos têm pelo menos um grupo protonável ou desprotonável, de modo que o lipídeo é positivamente carregado em um pH em ou abaixo do pH fisiológico (por exemplo, pH 7,4) e neutro em um segundo pH, preferivelmente em ou acima do pH fisiológico. Será, por certo, compreendido que a adição ou remoção de prótons como uma função de pH é um processo de equilíbrio, e que a referência a um lipídeo carregado ou neutro referese à natureza da espécie predominante e não requer que todo o lipídeo esteja presente na forma carregada ou neura. Lipídeos que têm mais de um grupo protonável ou desprotonável, ou que são zwitteriônicos, não são excluídos de uso na invenção.
[0387] Em algumas modalidades, os lipídeos protonáveis têm uma pKa do grupo protonável na faixa de cerca de 4 a cerca de 11, por exemplo, uma pKa de cerca de 5 a cerca de 7.
[0388] LNPs podem incluir dois ou mais lipídeos catiônicos. Os lipídeos catiônicos podem ser selecionados para contribuir com propriedades vantajosas diferentes. Por exemplo, lipídeos catiônicos que diferem em propriedades tais como pKa de amina, estabilidade química, meiavida em circulação, meia-vida em tecido, acúmulo líquido em tecido ou toxidez podem ser usados na LNP. Em particular, os lipídeos catiônicos podem ser escolhidos de modo que as propriedades da LNP mista são mais desejáveis do que as propriedades de uma LNP única de lipídeos
Petição 870190070557, de 24/07/2019, pág. 283/401
219/306 individuais.
[0389] Em algumas modalidades, o lipídeo catiônico está presente em uma razão de a partir de cerca de 20% em mol a cerca de 70 ou 75% em mol ou de a partir de 45 a cerca de 65% em mol ou cerca de 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 ou cerca de 70% em mol do lipídeo total presente na LNP. Em modalidades adicionais, as LNPs compreendem de a partir de cerca de 25% a cerca de 75% em uma base molar de lipídeo catiônico, por exemplo, de a partir de cerca de 20 a cerca de 70%, de a partir de cerca de 35 a cerca de 65%, de a partir de cerca de 45 a cerca de 65%, cerca de 60%, cerca de 50% ou cerca de 40% em uma base molar (com base em 100% de moles totais de lipídeo na nanopartícula de lipídeo). Em algumas modalidades, a razão de lipídeo catiônico para ácido nucleico é de a partir de cerca de 3 a cerca de 15, tal como de a partir de cerca de 5 a cerca de 13 ou de a partir de cerca de 7 a cerca de 11.
[0390] Em algumas modalidades, o lipossoma pode ter uma razão molar de átomos de nitrogênio no lipídeo catiônico para os fosfatos no RNA (razão N:P) entre 1:1 e 20:1 como descrito na Publicação Internacional No. W02013/006825A1, aqui incorporada a título de referência em sua totalidade. Em outras modalidades, o lipossoma pode ter uma razão N:P de mais de 20:1 ou menos de 1:1.
[0391] Em alguns aspectos, o lipídeo é selecionado do grupo consistindo em 98N12-5, C12-200 e CKK-E12. Em uma modalidade, os ácidos nucleicos podem ser formulados em um lipidoide aminoálcool. Lipidoides aminoálcool que podem ser usados na presente invenção podem ser preparados através dos métodos descritos na Patente U.S. No. 8.450.298, aqui incorporada a título de referência em sua totalidade.
[0392] Em uma outra modalidade, lipídeos ionizáveis podem ser compostos como revelado na Publicação Internacional No. WO2015/ 074085A1, Pedidos U.S. Nos. 61/905.724 e 15/614.499, WO2015
Petição 870190070557, de 24/07/2019, pág. 284/401
220/306
074085A1 ou Patentes ou Pedidos U.S. Nos. 9.593.077, 61/905.724, 9.593,077, 9.567.296, 15/614.499 e 9,567,296, aqui incorporados a título de referência em sua totalidade.
[0393] Lipídeos ionizáveis podem ser também os compostos como revelado nas Tabelas 1, 2 e 3 e reivindicações 1-24 da Publicação Internacional No. WO2017/075531A1, aqui incorporada a título de referência em sua totalidade. Em uma outra modalidade, lipídeos ionizáveis podem ser também os compostos como revelado na Publicação Internacional No. W02015/074085A1 (i.e. ATX-001 até ATX-032 ou os compostos como mencionado em 1-26), Pedidos U.S. Nos. 61/905.724 e 15/614,499 ou Patentes U.S. Nos. 9.593.077 e 9.567.296, aqui incorporadas a título de referência em sua totalidade.
(ii) Lipídeos neutros e não catiônicos [0394] O lipídeo não catiônico pode ser um lipídeo neutro, um lipídeo anlônlco ou um lipídeo anfifático. Lipídeos neutros, quando presentes, podem ser qualquer um de várias espécies de lipídeo que existem ou em uma forma zwitteriônica não carregada ou neutra em pH fisiológico. Tais lipídeos incluem, por exemplo, diacilfosfatidilcolina, diacilfosfatidiletanolamina, ceramica, esfingomielina, di-hidroesfingomielina, cefalina e cerebrosídeos. A seleção de lipídeos neutros para uso nas partículas descritas aqui é geralmente guiada através de consideração de, por exemplo, tamanho da LNP e estabilidade da LNP na corrente sanguínea. Preferivelmente, o lipídeo neutro é um lipídeo tendo dois grupos acila (por exemplo, diacilfosfatidilcolina e diacilfosfatidiletanolamina).
[0395] Em algumas modalidades, os lipídeos neutros contêm ácidos graxos saturados com comprimentos de cadeia de carbono na faixa de Ci0 a C20. Em outras modalidades, lipídeos neutros com ácidos graxos mono ou di-insaturados com comprimentos de cadeia de carbono na faixa de C10 a C20 são usados. Ainda, lipídeos neutros tendo misturas
Petição 870190070557, de 24/07/2019, pág. 285/401
221/306 de cadeias de ácido graxo insaturado ou não insaturado podem ser usados.
[0396] Lipídeos neutros adequados incluem, mas não estão limitados a, diestearoilfosfatidilcolina (DSPC), dioleoilfosfatidilcolina (DOPC), dípalmitoilfosfatidilcolina (DPPC), dioleoHfosfatidilglicerol (DOPG), dipalmitoilfosfatidilglicerol (DPPG), dioleoil-fosfatidiletanolamina (DOPE), palmitoiloleoilfosfatidilcolina (POPC), palmitoiloleoilfosfatidiletanolamina (POPE), 4-(N-maleimidometH)-cicloexanO1Carboxílato de dioleoil-fosfatidiletanolamina (DOPE-mal), dipalmitoil fosfatidil etanolamina (DPPE), dimiristoilfosfoetanolamina (DMPE), dimiristoil fosfatidilcolina (DMPC), distearoil-fosfatidil-etanolamina (DSPE), SM, 16~0~monometil PE, 16-0dimetil PE, 18-1-trans PE, 1-stearoil-2-oleoil-fosfatidietanolamina (SOPE), colesterol ou uma mistura dos mesmos. Lipídeos aniônicos adequados para uso em LNPs incluem, mas não estão limitados a, fosfatidilglicerol, cardiolipina, diacilfosfatidilserina, ácido diacilfosfatídico, N-dodecanoil fosfatidiletanoloamina, N-succinil fosfatidiletanolamina, N-glutaril fosfatidiletanolamina, lisilfosfatidilglicerol e outros grupos de modificação aniônicos unidos a lipídeos neutros.
[0397] Lipídeos anfífáticos referem-se a qualquer material adequado, em que a porção hidrofóbica do material de lipídeo orienta para uma fase hidrofóbica, enquanto a porção hidrofílica orienta para a fase aquosa. Tais compostos incluem, mas não estão limitados a, fosfolipídeos, aminolipídeos e esfingolipídeos. Fosfolipídeos representativos incluem esfingomielina, fosfatidilcolina, fosfatidiletanolamina, fosfatidiiserina, fosfatidilinositol, ácido fosfatídico, palmitoiloleoil fosfatdilcolina, IIsofosfatidilcolina, lisofosfatidiletanolamina, dípalmitoilfosfatidilcolina, dioleoilfosfatidilcolina, distearoilfosfatidilcolina ou dilinoleoilfosfatidilcolina. Outros compostos isentos de fósforo, tais como esfingolipídeos, famílias de glicoesfingolipídeo, diacilgliceróis e beta-aciloxiácidos, podem ser também usados.
Petição 870190070557, de 24/07/2019, pág. 286/401
222/306 [0398] Em algumas modalidades, o lipídeo não catiônico está presente em uma razão de a partir de cerca de 5% em mol a cerca de 90% em mol, cerca de 5% em mo! a cerca de 10% em mol, cerca de 5, 10,
15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85 ou cerca de 90% em mol do lipídeo total presente na LNP.
[0399] Em algumas modalidades, LNPs compreendem de a partir de cerca de 0% a cerca de 15 ou 45% em uma base molar de lipídeo neutro, por exemplo, de a partir de 3 a cerca de 12% ou de a partir de cerca de 5 a cerca de 10%. Por exemplo, LNPs podem incluir cerca de 15%, cerca de 10%, cerca de 7,5% ou cerca de 7,1% de lipídeo neutro em uma base molar (com base em 100% de moles totais de lipídeo na LNP).
[0400] O esterol é preferivelmente colesterol.
[0401] O esterol pode estar presente em uma razão de cerca de 10% em mol a cerca de 60% em mol ou cerca de 25% em mol a cerca de 40% em mol da LNP. Em algumas modalidades, o esterol está presente em uma razão de cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 ou cerca de 60% em mol do lipídeo total presente na LNP. Em outras modalidades, LNPs compreendem de a partir de cerca de 5% a cerca de 50% em uma base molar do esterol, por exemplo, cerca de 15% a cerca de 45%, cerca de 20% a cerca de 40%, cerca de 48%, cerca de 40%, cerca de 38,5%, cerca de 35%, cerca de 34,4%, cerca de 31,5% ou cerca de 31% em uma base molar (com base em 100% em moles totais na LNP).
(iv) Agentes de Redução de Agregação [0402] O agente de redução de agregação pode ser um lipídeo capaz de reduzir agregação.
[0403] Exemplos de tais lipídeos incluem, mas não estão limitados
Petição 870190070557, de 24/07/2019, pág. 287/401
223/306 a, lipídeos modificados com poiietileno glicol (PEG), monosiaiogangliosídeo Gml e oligômeros de poliamida (PAG) tais como aqueles descritos na Patente U.S. No. 6.320.017, que é aqui incorporada a titulo de referência em sua totalidade. Outros compostos com porções não carregadas, hidrofílicas, de barreira estérica, que previnem agregação durante formulação, tal como PEG, Gml ou ATTA, podem ser também acoplados a lipídeos. Lipídeos ATTA são descritos, por exemplo, na Patente U.S. No. 6.320.017, e conjugados de PEG-lipídeo são descritos, por exemplo, nas Patentes U.S. Nos. 5.820.873, 5.534.499 e 5.885.613, cada uma das quais é aqui incorporada a título de referência em sua totalidade.
[0404] O agente de redução de agregação pode ser, por exemplo, selecionado de um polietilenoglicol (PEG)-lipídeo incluindo, sem limitação, um PEG-diacilglicerol (DAG), um PEG-dialquilglicerol, um PEG-di~ alqulipropila (DAA), um PEG-fosfolipídeo, um PEG-ceramida (Cer) ou uma mistura dos mesmos (tal como PEG-Cerl4 ou PEG-Cer20). O conjugado PEG-DAA pode ser, por exemplo, um PEG-dilauriloxipropila (C12), um PEG-dimirlstiloxiproplia (C14), um PEG-dipalmltiloxipropila (C16) ou um PEG-diestearoilpropila (C18). Outros lipídeo peguilados incluem, mas não estão limitados a, poiietileno glicol-didimiristoil glicerol (C14-PEG ou PEG-C14, onde PEG tem um peso molecular médio de 2000 (Da) (PEG-DMG); (R)-2,3-bis(octadecilóxi)propil-1-(metoxi poli(etileno glicol)2000)propilcarbamato) (PEG-DSG); PEG-carbamoil~1,2-di~ miristiloxipropilamina, em que PEG tem um peso molecular médio de 2000 Da (PEG-cDMA); N-Acetilgalactosamina-((R)-2,3-bis(octadecilóxi)propil-1 -(metóxi poli(etileno glicol)2000)propilcarbamato)) (GalNAcPEG-DSG); mPEG (mw2000)-diastearoilfosfatidil-etanolamina (PEGDSPE); e poiietileno glicol-dipalmitoilglicerol (PEG-DPG).
[0405] Em algumas modalidades, o agente de redução de agrega
Petição 870190070557, de 24/07/2019, pág. 288/401
224/306 ção é PEG-DMG. Em outras modalidades, o agente de redução de agregação é PEG-c-DMA.
[0406] Em uma outra modalidade, PEG-lipídeos podem ser também os compostos como revelado na US20150376115A1 ou WO2015199952, aqui incorporados a título de referência em sua totalidade. Composição de LNP [0407] A composição de LNPs pode ser influenciada pela, inter alia, seleção do componente de lipídeo catiônico, o grau de saturação de lipídeo catiônico, a natureza da PEGuilação, a razão de todos os componentes e parâmetros biofísicos tal como seu tamanho. Em um exemplo de Semple e outros (Semple e outros, Nature Biotech. 2010 28: 172176; aqui incorporado a título de referência em sua totalidade), a composição de LNP foi composta de 57,1% de lipídeo catiônico, 7,1% de dipalmitoilfosfatidilcolina, 34,3% de colesterol e 1,4% de PEG-c-DMA (Basha e outros, Moi Ther. 2011 19:2186-2200; aqui incorporados a título de referência em sua totalidade).
[0408] Em algumas modalidades, LNPs podem compreender de a partir de cerca de 35 a cerca de 45% de lipídeo catiônico, de a partir de cerca de 40% a cerca de 50% de lipídeo catiônico, de a partir de cerca de 50% a cerca de 60% de lipídeo catiônico e/ou de a partir de cerca de 55% a cerca de 65% de lipídeo catiônico. Em algumas modalidades, a razão de lipídeo para ácido nucleico pode variar de a partir de cerca de 5:1 a cerca de 20:1, de a partir de cerca de 10:1 a cerca de 25:1, de a partir de cerca de 15:1 a cerca de 30:1 e/ou pelo menos 30:1.
[0409] O peso molecular médio da porção de PEG nos Hpídeos modificados com PEG pode variar de a partir de cerca de 500 a cerca de 8.000 Daltons (por exemplo, de a partir de cerca de 1.000 a cerca de 4.000 Daltons). Em uma modalidade preferida, o peso molecular médio da porção de PEG é cerca de 2.000 Daltons.
[0410] A concentração do agente de redução de agregação pode
Petição 870190070557, de 24/07/2019, pág. 289/401
225/306 variar de a partir de cerca de 0,1 a cerca de 15% em mol, por 100% de moles totais de lipídeo na NLP. Em algumas modalidades, LNPs incluem menos do que cerca de 3, 2 ou 1 por cento em mol de PEG ou do iipídeo modificado com PEG, com base nos moles totais de lipídeo na LNP. Em modalidades adicionais, LNPs compreendem de a partir de cerca de 0,1% a cerca de 20% do lipídeo modificado em PEG em uma base molar, por exemplo, cerca de 0,5 a cerca de 10%, cerca de 0,5 a cerca de 5%, cerca de 10%, cerca de 5%, cerca de 3,5%, cerca de 1,5%, cerca de 0,5% ou cerca de 0,3% em uma base polar (com base em 100% de moles totais de Hpídeos na LNP).
[0411] LNPs diferentes tendo razões molares variáveis de lipídeo catiônico, lipídeo não catiônico (ou neutro), esterol (por exemplo, coiesteroi) e agente de redução de agregação (tal como um lipídeo modificado com PEG) em uma base molar (com base nos moles totais de lipídeo nas nanopartículas de iipídeo) como mostrado na Tabela 5 abaixo. Em modalidades preferidas, a formulação de nanopartícula de lipídeo da invenção consiste essencialmente em uma mistura de lipídeo em razões molares de cerca de 20-70% de lipídeo catiônico:5-45% de lipídeo neutro:20-55% de colesterol, 0,5-15% de lipídeo modificado com PEG, mais preferivelmente em razões molares de cerca de 20-60% de lipídeo catiônico:5-25% de lipídeo neutro:25-55% de colesterol:0,5-15% de lipídeo modificado com PEG.
Petição 870190070557, de 24/07/2019, pág. 290/401
Tabela 5. Formulações à base de lipídeo
No. Razão molar de lipídeo (com base em 100% de moles totais de lipídeo na nanopartícula de lipídeo)
Lipídeo catiônico Lipídeo não catiônico (ou Neutro) Este rol Agente de redução de agregação (por exemplo, PEG-lipídeo)
1 de a partir de cerca de 35% a cerca de 65% de a partir de cerca de 3% a cerca de 12% ouou 15 % de a partir de cerca de 15% a cerca de 45 % de a partir de cerca de 0,1% a cerca de 10% (preferivelmente de a partir de cerca de 0,5% a cerca de 2% ou 3%
2 de a partir de cerca de 20% a cerca de 70% de a partir de cerca de 5% a cerca de 45% de a partir de cerca de 20% a cerca de 55% de a partir de cerca de 0,1% a cerca de 10% (preferivelmente de a partir de cerca de 0.5% a cerca de 2% ou 3%
3 de a partir de cerca de 45% a cerca de 65% de a partir de cerca de 5% a cerca de 10% de a partir de cerca de 5% a cerca de 45% de a partir de cerca de 0,1% a cerca de 3%
4 de a partir de cerca de 20% a cerca de 60% de a partir de cerca de 5% a cerca de 25% de a partir de cerca de 25% a cerca de 40% de a partir de cerca de 0,1% a cerca de 5% (preferivelmente de a partir de cerca de 0,1% a cerca de 3%)
5 cerca de 40% cerca de 10% de a partir de cerca de 25% a cerca de 55% cerca de 10%
6 cerca de 35% cerca de 15% cerca de 10%
7 cerca de 52% cerca de 13% cerca de 5%
8 cerca de 50% cerca de 10% cerca de 1,5%
226/306
Petição 870190070557, de 24/07/2019, pág. 291/401
227/306 [0412] Em algumas modalidades, LNPs ocorrem como lipossomas ou lipoplexos como descrito em mais detalhes abaixo.
Tamanho da LNP [0413] Em algumas modalidades, LNPs têm um tamanho de diâmetro médio de a partir de cerca de 50 nm a cerca de 300 nm, tal como de a partir de cerca de 50 nm a cerca de 250 nm, por exemplo, de a partir de cerca de 50 nm a cerca de 200 nm.
[0414] Em algumas modalidades, LNPs menores podem ser usadas. Tais partículas podem compreender um diâmetro de abaixo de 0,1 um até 100 nm, tal como, mas não limitado a, menos de 0,1 um, menos de 1,0 um, menos de 5 um, menos de 10 um, menos de 15 um, menos de 20 um, menos de 25 um, menos de 30 um, menos de 35 um, menos de 40 um, menos de 50 um, menos de 55 um, menos de 60 um, menos de 65 um, menos de 70 um, menos de 75 um, menos de 80 um, menos de 85 um, menos de 90 um, menos de 95 um, menos de 100 um, menos de 125 um, menos de 150 um, menos de 175 um, menos de 200 um, menos de 225 um, menos de 250 um, menos de 275 um, menos de 300 um, menos de 325 um, menos de 350 um, menos de 375 um, menos de 400 um, menos de 425 um, menos de 450 um, menos de 475 um, menos de 500 um, menos de 525 um, menos de 550 um, menos de 575 um, menos de 600 um, menos de 625 um, menos de 650 um, menos de 675 um, menos de 700 um, menos de 725 um, menos de 750 um, menos de 775 um, menos de 800 um, menos de 825 um, menos de 850 um, menos de 875 um, menos de 900 um, menos de 925 um, menos de 950 um, menos de 975 um. Em uma outra modalidade, ácidos nucleicos podem ser derivados usando LNPs menores que podem compreender um diâmetro de a partir de cerca de 1 nm a cerca de 100 nm, de a partir de cerca de 1 nm a cerca de 10 nm, cerca de 1 nm a cerca de 20 nm, de a partir de cerca de 1 nm a cerca de 30 nm, de a partir de cerca de 1 nm a cerca de 40 nm, de a partir de cerca de 1 nm a cerca de 50 nm,
Petição 870190070557, de 24/07/2019, pág. 292/401
228/306 de a partir de cerca de 1 nm a cerca de 60 nm, de a partir de cerca de 1 nm a cerca de 70 nm, de a partir de cerca de 1 nm a cerca de 80 nm, de a partir de cerca de 1 nm a cerca de 90 nm, de a partir de cerca de 5 nm a cerca de 100 nm, de a partir de cerca de 5 nm a cerca de 10 nm, cerca de 5 nm a cerca de 20 nm, de a partir de cerca de 5 nm a cerca de 30 nm, de a partir de cerca de 5 nm a cerca de 40 nm, de a partir de cerca de 5 nm a cerca de 50 nm, de a partir de cerca de 5 nm a cerca de 60 nm, de a partir de cerca de 5 nm a cerca de 70 nm, de a partir de cerca de 5 nm a cerca de 80 nm, de a partir de cerca de 5 nm a cerca de 90 nm, cerca de 10 a cerca de 50 nM, de a partir de cerca de 20 a cerca de 50 nm, de a partir de cerca de 30 a cerca de 50 nm, de a partir de cerca de 40 a cerca de 50 nm, de a partir de cerca de 20 a cerca de 60 nm, de a partir de cerca de 30 a cerca de 60 nm, de a partir de cerca de 40 a cerca de 60 nm, de a partir de cerca de 20 a cerca de 70 nm, de a partir de cerca de 30 a cerca de 70 nm, de a partir de cerca de 40 a cerca de 70 nm, de a partir de cerca de 50 a cerca de 70 nm, de a partir de cerca de 60 a cerca de 70 nm, de a partir de cerca de 20 a cerca de 80 nm, de a partir de cerca de 30 a cerca de 80 nm, de a partir de cerca de 40 a cerca de 80 nm, de a partir de cerca de 50 a cerca de 80 nm, de a partir de cerca de 60 a cerca de 80 nm, de a partir de cerca de 20 a cerca de 90 nm, de a partir de cerca de 30 a cerca de 90 nm, de a partir de cerca de 40 a cerca de 90 nm, de a partir de cerca de 50 a cerca de 90 nm, de a partir de cerca de 60 a cerca de 90 nm e/ou de a partir de cerca de 70 a cerca de 90 nm.
[0415] Em algumas modalidades, a LNP pode ter um diâmetro maior do que 100 nm, maior do que 150 nm, maior do que 200 nm, maior do que 250 nm, maior do que 300 nm, maior do que 350 nm, maior do que 400 nm, maior do que 450 nm, maior do que 500 nm, maior do que 550 nm, maior do que 600 nm, maior do que 650 nm, maior do que 700 nm, maior do que 750 nm, maior do que 800 nm, maior do que 850 nm,
Petição 870190070557, de 24/07/2019, pág. 293/401
229/306 maior do que 900 nm, maior do que 950 nm ou maior do que 1000 nm. [0416] Em outras modalidades, LNPs têm uma distribuição de tamanho de partícula de modo único (isto é, elas não são nem bi- ou polimodais).
Outros componentes [0417] LNPs podem compreender ainda um ou mais Hpídeos e/ou outros componentes em adição àqueles mencionados acima.
[0418] Outros lipídeos podem ser incluídos nas composições de lipossoma para uma variedade de propósitos, tal como prevenir oxidação de lipídeo ou prender ligantes sobre a superfície do lipossoma. Qualquer número de Hpídeos pode estar presente em LNPs, incluindo lipídeos an~ fifáticos, neutros, catiônicos e aniônicos. Tais lipídeos podem ser usados sozinhos ou em combinação.
[0419] Componentes adicionais que podem estar presentes em uma LNP incluem componentes de estabilização em bicamada compreendendo tais oligômeros de poliamida (vide, por exemplo, Patente U.S. No. 6.320.017, que é aqui incorporada a título de referência em sua totalidade), peptídeos, proteínas e detergentes.
Lipossomas [0420] Em algumas modalidades, moléculas de ácido nucleico artificiais, preferivelmente RNAs da combinação da invenção (ou qualquer outro ácido nucleico como aqui definido), são formuladas como lipossomas.
[0421 ] Lipossomas à base de lipídeo catiônico são capazes de complexar com ácidos nucleicos negativamente carregados (por exemplo, RNAs) através de interações eletrostáticas, resultando em complexos que oferecem biocompatibilidade, toxidez baixa e possibilidade da produção em larga escala requerida para aplicações clínicas in vivo. Lipossomas podem fundir com a membrana piasmática para absorção; uma
Petição 870190070557, de 24/07/2019, pág. 294/401
230/306 vez dentro da célula, lipossomas são processados através da via endocítica e o ácido nucleico é então liberado do endossoma/carreador para o citoplasma. Lipossomas têm sido há muito tempo percebidos como veículos de administração de fármaco devido à sua biocompatibilidade superior, dado que os lipossomas são basicamente análogos de membranas biológicas, e podem ser preparados a partir de ambos fosfolipídeos naturais e sintéticos (Int. J. Nanomedicine. 2014; 9: 1833-1843).
[0422] Lipossomas tipicamente consistem em uma bicamada de lipídeo que pode ser composta de (fosfo)Hpídeos catiônicos, aniônicos ou neutros e colesterol, que encerra um núcleo aquoso. Ambas a bicamada de lipídeo e o espaço aquoso podem incorporar compostos hidrofóbicos ou hidrofílicos, respectivamente. Lipossomas podem ter uma ou mais membranas de lipídeo. Lipossomas podem ser de camada única, referidos como unilamelares, ou de camadas múltiplas, referidos como muitilamelares.
[0423] Características e comportamento de lipossoma in vivo podem ser modificados através da adição de um revestimento de polímero hidrofílico, por exemplo, polietileno (PEG), para a superficie do Hpossoma conferir estabilização estérica. Ainda, lipossomas podem ser usados para direcionamento específico por ligantes de anexação (por exemplo, anticorpos, peptídeos e carboidratos) à sua superficie ou à extremidade terminal das cadeias de PEG anexadas (Front. Pharmacol. 2015 Dez 1;6:286).
[0424] Lipossomas estão tipicamente presentes como vesículas esféricas e podem variar em tamanho de 20 nm a alguns microns.
[0425] Lipossomas podem ser de tamanhos diferentes tal como, mas não limitado a, uma vesícula multilamelar (MLV) que pode ser de centenas de nanômetros de diâmetro e pode conter uma série de bícamadas concêntricas separadas por compartimentos aquosos estreitos, uma veículo unicelular pequena (SUV) que pode ser menor do que 50
Petição 870190070557, de 24/07/2019, pág. 295/401
231/306 nm de diâmetro e uma vesícula unilamelar grande (LUV) que pode ser entre 50 e 500 nm de diâmetro. Projeto de lipossomas pode incluir, mas não é limitado a, opsoninas ou ligantes a fim de melhorar a anexação de Hpossomas a tecido não saudável ou ativar eventos tal como, mas não limitado a, endocitose. Lipossomas podem conter um pH baixo ou alto a fim de melhorar a administração das formulações farmacêuticas. [0426] Como um exemplo não limitante, lipossomas tais como veículos de membrana sintética podem ser preparados através dos métodos, aparelhos e dispositivos descritos nas Publicações de Patente Nos. LJS20130177638, US20130177637, US20130177636, US20130177635, US20130177634, US20130177633, US20130183375, US20130183373 e US20130183372, os conteúdos de cada uma são aqui incorporados a título de referência em sua totalidade. A molécula de ácido nucieico artificial, preferivelmente RNA, da invenção, composição (farmacêutica) ou kit (ou qualquer outro ácido nucleico, em particular RNA, como aqui definido), pode ser encapsulada pelo lipossoma ou ela pode estar contida em um núcleo aquoso que pode então ser encapsulado pelo lipossoma (vide Pub. Internacionais Nos. WO2012031046, WO2012031043, WO2012030901 e WO2012006378 e Publicações de Patente U.S. Nos. US20130189351, US20130195969 e US20130202684; os conteúdos de cada uma são aqui incorporados a título de referência em sua totalidade.
[0427] Em algumas modalidades, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido), pode ser formulada em lipossomas tais como, mas não limitado a, lipossomas DiLa2 (Marina Biotech, Bothell, WA), SMARTICLES® (Marina Biotech, Bothell, WA), lipossomas baseados em DOPC neutra (1,2-dioleoil-sn-glicero-3-fosfocoHna) (por exemplo, administração de siRNA para câncer ovariano (Landen e outros, Cancer Biology & Therapy 2006 5(12)1708-1713); aqui incorporados a
Petição 870190070557, de 24/07/2019, pág. 296/401
232/306 título de referência em sua totalidade) e iipossomas revestidos com hialuronano (Quiet Therapeutics, Israel).
Lipoplexos [0428] Em algumas modalidades, moléculas de ácido nucleico artificial, preferivelmente RNAs (ou qualquer outro ácido nucleico como aqui definido) são formuladas como lipoplexos, isto é, bicamadas de lipídeo catiônico intercaladas entre camadas de ácido nucleico.
[0429] Lipídeos catiônicos, tais como DOTAP, (1 ,2-dloleoil-3-trimetilamônio-propano) e DOTMA metil sulfato de (N-[1-(2,3-dioleoilóxi)propil]-N,N,N-trimetil-amônio) podem formar complexos ou lipoplexos com ácidos nucleicos negativamente carregados para formar nanopartículas através de interação eletrostática, provendo eficiência de transfecção in vitro alta.
Nanolipossomas [0430] Em algumas modalidades, moléculas de ácido nucleico artificial, preferivelmente RNAs (ou qualquer outro ácido nucleico como aqui definido) são formuladas como nanolipossomas à base de lipídeo neutro tais como nanolipossomas baseados em 1,2-dioleoil-sn-glicero-
3-fosfatidilcolina (DOPC) (Adv. Drug Deliv. Rev. 2014 Fev; 66: 110116.).
Emulsões [0431] Em algumas modalidades, moléculas de ácido nucleico artificiais, preferivelmente RNAs (ou qualquer outro ácido nucleico como definido aqui) são formuladas como emulsões. Em uma outra modalidade, as ditas moléculas de ácido nucleico artificiais, preferivelmente RNAs, são formuladas em uma emulsão óleo-em-água catiônica onde a partícula da emulsão compreende um núcleo de óleo e um lipídeo catiônico que pode interagir com o(s) ácido(s) nucleico(s) ancorando a molécula à partícula da emulsão (vide Pub. Internacional No. WO2012006380; aqui
Petição 870190070557, de 24/07/2019, pág. 297/401
233/306 incorporada a título de referência em sua totalidade). Em algumas modalidades, a dita molécula de ácido nucleico artificial, preferivelmente RNA, é formulada em uma emulsão água-em-óleo compreendendo uma fase hidrofóbica contínua em que a fase hidrofílica é dispersa. Como um exemplo não limitante, a emulsão pode ser feita através dos métodos descritos na Publicação Internacional No. WO201087791, cujos conteúdos são aqui incorporados a título de referência em sua totalidade. Compostos e carreadores (poli-jcatiônicos [0432] Em modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada ou associada com um composto catiônico ou policatiônico (composto (poli-)catiônico) e/ou um carreador polimérico.
[0433] O termo composto (poli-)catiônico refere-se tipicamente a uma molécula carregada, que é positivamente carregada (cátion) em um valor de pH de tipicamente a partir de 1 a 9, preferivelmente em um valor de pH de ou abaixo de 9 (por exemplo, de a partir de 5 a 9) de ou abaixo de 8 (por exemplo, de a partir de 5 a 8), de ou abaixo de 7 (por exemplo, de a partir de 5 a 7), sobretudo preferivelmente em um pH fisiológico, por exemplo, de a partir de 7,3 a 7,4.
[0434] Desta maneira, um composto (poli-)catiônico pode ser qualquer composto ou polímero positivamente carregado, preferivelmente um peptídeo ou proteína catiônico, que é positivamente carregado sob condições fisiológicas, particularmente sob condições fisiológicas in vivo. Um peptídeo ou proteína (poli-)catiônico pode conter pelo menos um aminoácidos positivamente carregado ou mais de um aminoácido positivamente carregado, por exemplo, selecionado de Arg, His, Lys ou Om.
Aminoácidos, peptídeos e proteínas (poii-)catiônicos [0435] Compostos (poli-)catiônicos sendo agentes particularmente
Petição 870190070557, de 24/07/2019, pág. 298/401
234/306 preferidos para complexação ou associação da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem protamina, nucleolina, espermina ou espermidina, ou outros peptídeos ou proteínas catiônicos, tais como poli-L-lisina (PLL), poli-arginina, polipeptídeos básicos, peptídeos de penetração em célula (CPPs), incluindo peptídeos de ligação a HIV, HIV-1 Tat (HIV), peptídeos derivados de TAT, Penetratina, peptídeos derivados ou análogos de VP22, HSV P22 (Herpes simplex), MAP, KALA ou domínios de transdução de proteína (PTDs), PpT620, peptídeos ricos em prolína, peptídeos ricos em arginina, peptídeos ricos em lisina, MPG-peptídeo(s), Pep-1, oligômeros L, peptídeo(s) catíôníco(s), peptídeos derivados de Antennapedia (particularmente de Drosophila antennapedia), pAntp, plsl, FGF, Lactoferrína, Transportana, Buforina2, Bac715-24, SynB, SynB(1), pVEC, peptídeos derivados de hCT, SAP ou histonas.
[0436] Mais preferivelmente, a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada com um ou mais policátions, preferivelmente com protamina ou oligofectamina (discutido abaixo), sobretudo preferivelmente com protamina. Neste contexto protamina é particularmente preferida.
[0437] Ainda, proteínas ou peptídeos (poli-)catiônicos preferidos podem ser selecionados das proteínas ou peptídeos que seguem tendo a fórmula total (III) que segue:
(Arg)i;(Lys)m;(His)n;(Orn)o;(Xaa)x, (fórmula (III)) em que I + m + n +o + x = 8-15, e I, m, n ou o Independentemente uns dos outros podem ser qualquer número selecionado de 0, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 ou 15, contanto que o teor total de Arg, Lys, His e Orn represente pelo menos 50% de todos os aminoácidos do oli
Petição 870190070557, de 24/07/2019, pág. 299/401
235/306 gopeptídeo; e Xaa pode ser qualquer aminoácido selecionado de aminoácidos nativos (= de ocorrência natural) ou não nativos exceto por Arg, Lys, His ou Orn; e x pode ser qualquer número selecionado de 0, 1,2, 3 ou 4, contanto que o teor total de Xaa não exceda 50% de todos os aminoácidos do oligopeptídeo. Peptídeos catiônicos particularmente preferidos neste contexto são, por exemplo, Arg?, Args, Argg, H3R9, R9H3, H3R9H3, YSSR9SSY, (RKH)4, Y(RKH)2R, etc. Neste contexto, a descrição do WO 2009/030481 é incorporada aqui a título de referência. Polissacarídeos (poli-jcatiônicos [0438] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem polissacarídeos (poH-)catiônicos, por exemplo, quitosana, polibreno, polímeros catiônicos, por exemplo, polietilenoimina (PEI).
Lipídeos (poL-)catiõnlcos [0439] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) incluem lipídeos (poli-jcatiônicos, por exemplo, DTMA: cloreto de [1~(2,3~sioleióxi)propil)]”N,N,N-trimetilamônlo, DMRIE, di-C14-amidina, DOTIM, SAINT, DC-Chol, BGTC, CTAP, DOPC, DODAP, DOPE: Dioleil fosfatidiletanol-amina, DOSPA, DODAB, DOIC, DMEPC, DOGS: Dioctadecilamidoglicilespermina, DIMRI: bromato de dimiristo-oxipropil dimetil hidroxietil amônio, DOTAP: dioleoilóxi-3-(trimetllamonlo)propano, DC-6-14: cloreto de O,O-ditetradecanoll-N”(alfatrimetilamonioacetyl)dietanolamina, CLIP1: cloreto de rac-[(2,3-dioctadeciloxipropil)(2-hidroxietil)]-dimetilam0nio, CLIP6: rac-[2(2,3-di-hexadeciloxipropil-oximetilóxi)etil]trimetilamônto, CLIP9: rac-[2(2,3”di-hexadeciloxipropil-oxisuccinilóxi)etil]-tnmetilamônio ou oligofectamina.
Petição 870190070557, de 24/07/2019, pág. 300/401
236/306
Polímeros (ooli-jcatiônicos [0440] Compostos (poli-)catiônicos preferidos adicionais para complexação de ou associação com a molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) inclui polímeros (poH-jcatiônicos, por exemplo, poliaminoácidos modificados, tais como polímeros de beta~aminoácido ou poliamidas reversas, etc., polietilenos modificados, tal como PVP brometo de poli(N~etH~4--vínnpíndínio)), etc., acrilatos modificados, tal como pDMAEMA (poli(dimetilaminoetil metacrilato)), etc., amidoamina modificadas tal como pAMAM (poli(amidoamina)), etc., polibeta-aminoéster modificado (PBAE), tais como polímeros de diacrilato-co-õ-amino-lpentanol de 1,4-butanodiol modificados na extremidade com diamina, etc., dendrímeros, tais como dendrímeros de polipropilamina ou dendrímeros à base de pAMA, etc., polHmina(s), tais como PEI: poli(etilenoi~ mina), poH(propilenoimina), etc., polialilaminas, polímeros à base de estrutura principal de açúcar, tais como polímeros à base de ciclodextrina, polímeros à base de dextrano, quitosana, etc., polímeros à base de estrutura principal de silano, tais como copolímeros de PMOXA-PDMS, etc., polímeros em bloco consistindo em uma combinação de um ou mais blocos catiônicos (por exemplo, selecionados de um polímero catiônico como mencionado acima) e de um ou mais blocos hidrofílicos ou hidrofóbicos (por exemplo, polietilenoglicol).
Carreadores ooliméricos [0441] De acordo com modalidades preferidas, molécula de ácido nudeico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) é complexada ou associada com um carreador polimérico.
[0442] Um carreador polimérico usado de acordo com a invenção seria um carreador polimérico formado por componentes catiônicos reticulados com dissulfeto. Os componentes catiônicos reticulados com
Petição 870190070557, de 24/07/2019, pág. 301/401
237/306 dissulfeto podem ser iguais ou diferentes uns dos outros. O carreador polimérico também pode conter componentes adicionais.
[0443] É também particularmente preferido que o carreador polimérico usado de acordo com a presente invenção compreenda misturas de peptideos, proteínas ou polímeros catiônicos e opcionalmente componentes adicionais como aqui definido, que sejam reticulados por ligações dissulfeto como descrito aqui. Neste contexto, a descrição do WO2012/013326 é aqui incorporada a título de referência.
[0444] Neste contexto, os componentes catiônicos, que formam base para o carreador polimérico através de reticulação com dissulfeto, são tipicamente selecionados de qualquer peptídeo, proteína ou polímero (poli-)catiônico adequado para este propósito, particularmente qualquer peptídeo, proteína ou polímero (poli-)catiônico capaz de complexação com, e desta maneira preferivelmente condensação, da molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido). O peptídeo, proteína ou polímero (poli-)catiônico é preferivelmente uma molécula linear, no entanto, peptideos, proteínas ou polímeros (poli-)catiônicos ramificados podem também ser usados.
[0445] Cada proteína, peptídeo ou polímero (poli-)catiônico de reticulação com dissulfeto do carreador polimérico, que pode ser usado para complexar a molécula de ácido nucleico artificial, preferivelmente RNA (ou qualquer outro ácido nucleico como aqui definido) contém pelo menos uma porção -SH, sobretudo preferivelmente pelo menos um resíduo cisteína ou qualquer grupo químico adicional exibindo uma porção -SH, capaz de formação de uma ligação dissulfeto quando da condensação com pelo menos uma proteína, peptídeo ou polímero (poli-)catiônico adicional como componente catiônico do carreador polimérico como mencionado aqui.
[0446] Como definido acima, o carreador polimérico, que pode ser
Petição 870190070557, de 24/07/2019, pág. 302/401
238/306 usado para complexar a molécula de ácido nucleico artificial, preferivelmente RNA, da Invenção (ou qualquer outro ácido nucleico como aqui definido) pode ser formado por componentes catiônicos (ou policatiônicos) reticulados com dissulfeto. Preferivelmente, tais peptídeos ou proteínas ou polímeros (poli-)catiônicos do carreador pollmérico, que compreendem ou são adicionalmente modificados para compreender pelo menos uma porção --SH, são selecionados de proteínas, peptídeos e polímeros como aqui definido.
[0447] Em algumas modalidades, o carreador polimérico pode ser selecionado de uma molécula carreadora polimérica de acordo com a fórmula (IV) genérica:
L-P1S-[S-P2-S]n-S-P3-L fórmula (IV) em que
P1 e P3 são diferentes ou idênticos um ao outro e representam uma cadeia de polímero hidrofílico linear ou ramificada, cada P1 e P3 exibindo pelo menos uma porção -SH capaz de formar uma ligação dissulfeto quando da condensação com componente P2, ou alternativamente com (AA), (AA)x ou [(AAx)]z, se tais componentes forem usados como um ligante entre P1 e P2e P2) e/ou com componentes adicionais (por exemplo, (AA), (AA)X, [(AAX]Z ou L), a cadeia de polímero hidrofílico linear ou ramificada selecionada independentemente uma da outra de polietileno glicol (PEG), poli-A/-(2-hidroxípropil)metacrílamida, poli-2(metacriloilóxi)etil fosforilcolinas, po!i(hidroxialquil L-asparagina), poli(2~ (metacriloilóxi)etil fosforilcolina), hidroxietilamido ou poli(hidroxialquil Lglutamina), em que a cadeia de polímero hidrofílico exibe um peso molecular de cerca de 1 kDa a cerca de 100 kDa, preferivelmente de cerca de 2 kDa a cerca de 25 kDa; ou mais preferivelmente de cerca de 2 kDa a cerca de 10 kDa, por exemplo, cerca de 5 kDa a cerca de 25 kDa ou kDa a cerca de 10 kDa;
P2 é um peptídeo ou proteína (poli-)catiônico, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 303/401
239/306 como definido acima para o carreador poHmérico formado por componentes catiônicos reticulados com dissulfeto, e preferivelmente tendo um comprimento de cerca de 3 a cerca de 100 aminoácidos, mais preferivelmente tendo um comprimento de cerca de 3 a cerca de 50 aminoácidos, ainda mais preferivelmente tendo um comprimento de cerca de 3 a cerca de 25 aminoácidos, por exemplo, um comprimento de cerca de 3 a 10, 5 a 15, 10 a 20 ou 15 a 25 aminoácidos, mais preferivelmente um comprimento de cerca de 5 a cerca de 20 e ainda mais preferivelmente um comprimento de cerca de 10 a cerca de 20; ou é um polímero (poli-)catiônico, por exemplo, como definido acima para o carreador polimérico formado por componentes catiônicos reticulados com dissulfeto, tipicamente tendo um peso molecular de cerca de 0,5 kDa a cerca de 30 kDa, incluindo um peso molecular de cerca de 1 kDa a cerca de 20 kDa, ainda mais preferivelmente de cerca de 1,5 kDa a cerca de 10 kDa ou tendo um peso molecular de cerca de 0,5 kDa a cerca de 100 kDa, incluindo um peso molecular de cerca de 10 kDa a cerca de 50 kDa, ainda mais preferivelmente de cerca de 10 kDa a cerca de 30 kDa;
cada P2 exibindo peto menos duas porções -SH capazes de formar uma ligação dissulfeto quando da condensação com componentes P2 adicionais ou componentes(s) P1 e/ou P3 ou alternativamente com componentes adicionais (por exemplo, (AA), (AA)X ou [(AAX]Z);
-S-S- é uma ligação dissulfeto (reversível) (os parênteses são omitidos para uma melhor capacidade de leitura), em que S representa preferivelmente enxofre ou uma porção de carreamento -SH, que formou uma ligação dissulfeto (reversível). A ligação dissulfeto (reversível) é preferivelmente formada através da condensação de porções SH de qualquer um dos componentes P1 e P2, P2 e P2 ou P2 e P3, ou opcionalmente de componentes adicionais como aqui definido (por exemplo, L, (AA), (AA)X, [(AA)X]Z, etc). A porção -SH pode ser parte da estrutura desses componentes ou adicionada por uma modificação
Petição 870190070557, de 24/07/2019, pág. 304/401
240/306 como definido abaixo;
L é um ligante ótimo, que pode estar presente ou não, e pode ser selecionado independente dos outros de RGD, Transferrina, Folato, um peptídeo de sinal ou sequência de sinal, um sinal ou sequência de localização, um sinal ou sequência de localização nuclear (NLS), um anticorpo, um peptídeo de penetração celular (por exemplo, TAT ou KALA), um ligante de um receptor (por exemplo, citocinas, hormônios, fatores de crescimento, etc.), moléculas pequenas (por exemplo, carboidratos tipo manose ou galactose ou ligantes sintéticos), agonistas de molécula pequena, inibidores ou antagonistas de receptores (por exemplo, análogos peptidomiméticos de RGD) ou qualquer proteína adicional como aqui definido, etc.;
n é um inteiro tipicamente selecionado de uma faixa de cerca de 1 a 50, preferivelmente de a uma faixa de cerca de 1,2 ou 3 a 30, mais preferivelmente de uma faixa de cerca de 1,2, 3, 4 ou 5 a 25 ou uma faixa de cerca de 1, 2, 3, 4, ou 5 a 20 ou uma faixa de cerca de 1, 2, 3, 4 ou 5 a 15 ou uma faixa de cerca de 1, 2, 3, 4 ou 5 a 10, incluindo, por exemplo, uma faixa de cerca de 4 a 9, 4 a 10, 3 a 20, 4 a 20, 5 a 20 ou 10 a 20 ou uma faixa de cerca de 3 a 15, 4 a 15, 5 a 15 ou 10 a 15 ou uma faixa de cerca de 6 a 11 ou 7 a 10. Sobretudo preferivelmente, n está em uma faixa de cerca de 1, 2, 3, 4, ou 5 a 10, mais preferivelmente em uma faixa de cerca de 1,2, 3 ou 4 a 9, em uma faixa de cerca de 1,2, 3 ou 4 a 8 ou em uma faixa de cerca de 1, 2 ou 3 a 7. [0448] Neste contexto, a descrição do WO2011/026641 é incorporada aqui a título de referência. Cada um dos polímeros hidrofílicos P1 e P3 exibe tipicamente pelo menos uma porção -SH, em que a pelo menos uma porção -SH é capaz de formar uma ligação dissulfeto quando da reação com componente P2 ou com componente (AA) ou (AA)x, se usada como um ligante entre P1 e P2 ou P3 e P2 como definido abaixo e opcionalmente com um componente adicional, por exemplo, L
Petição 870190070557, de 24/07/2019, pág. 305/401
241/306 e/ou (AA) ou (AA)x, por exemplo, se duas ou mais porções -SH estiverem contidas. As subfórmulas que seguem P1-S-S-P2 e P2-S-S-P3 dentro da fórmula genérica (IV) acima (os parênteses são omitidos para melhor capacidade de leitura), em que qualquer um de S, P1 e P3 é como aqui definido, tipicamente representam uma situação em que uma porção -SH de polímeros hidrofílicos P1 e P3 foi condensada com uma porção -SH de componente P2 de fórmula genérica (IV) acima, em que ambos enxofres dessas porções -SH formam uma ligação dissulfeto S-S- como aqui definido na fórmula (IV). Essas porções -SH são tipicamente providas por cada um dos polímeros hidrofílicos P1 e P3, por exemplo, através de uma cisteína interna ou qualquer aminoácido ou composto (modificado) adicional que carregue uma porção -SH. Desta maneira, as subfórmulas P1-S-S-P2 e P2-S-S-P3 podem ser também escritas como P1-Cys-Cys-P2 e P2~Cys~Cys~P3, se a porção -SH for provida por uma cisteína, em que o termo Cys-Cys representa duas cisternas acopladas através de uma ligação dissulfeto, não através de uma ligação peptídica. Neste caso, o termo -S-S- nessas fórmulas também podem ser escritos como -S-Cys, como -Cys-S ou como -Cys-Cys. Neste contexto, o termo -Cys-Cys- não representa uma ligação peptídica, mas uma ligação de duas cisteínas através de suas porções -SH para formar uma ligação dissulfeto. Desta maneira, o termo -Cys-Cys também pode ser compreendido geralmente como -(Cys-S)-(S-Cys), em que neste caso específico S indica o enxofre da porção -SH de cisteína. Da mesma maneira, os termos -S-Cys e -Cys-S indicam uma ligação dissulfeto entre uma porção contendo -SH e uma cisteína, que pode ser também escrita como -S-(S-Cys) e -(Cys-S)-S. Alternativamente, os polímeros hidrofílicos P1 e P3 podem ser modificados com uma porção -SH, preferivelmente através de uma reação química com um composto carregando uma porção -SH, de modo que cada um dos polímeros hidrofílicos P1 e P3 carrega pelo menos uma tal porção -SH.
Petição 870190070557, de 24/07/2019, pág. 306/401
242/306
Tal composto carregando uma porção -SH pode ser, por exemplo, uma cisteína (adicional) ou qualquer aminoácido adicional (modificado), que carregue uma porção -SH. Tal composto pode também ser qualquer composto ou porção nâo amino, que contenha ou permita introduzir uma porção -SH nos polímeros hidrofílicos P1 e P3 como aqui definido. Tais compostos não amino podem ser anexados aos polímeros hidrofílicos P1 e P3 de fórmula (IV) do carreador polimérico de acordo com a presente invenção através de reações químicas ou ligação de compostos, por exemplo, através de ligação de um ácido 3-tio propiônico ou tioimolano, através de formação de amida (por exemplo, ácidos carboxílicos, ácidos sulfônicos, aminas, etc.), através de adição Michael (por exemplo, porções de maleinimida, carbonilas α,β-insaturadas, etc.) através de química click (por exemplo, azidas ou alcinas), através de metátese de alceno/alcina (por exemplo, alcenos ou alcinas), formação de imina ou hidrozona (aldeídos ou cetonas, hidrazinas, hidroxilaminas, aminas), reações de complexação (avidina, biotina, proteína G) ou componentes que permitam reações de substituição do tipo Sn (por exemplo, halogenoalcanos, tióis, álcoois, aminas, hidrazinas, hidrazidas, ésteres de ácido sulfônico, sais de oxifosfônio) ou outras porções químicas que podem ser utilizadas na anexação de componentes adicionais. Um derivado de PEG particularmente preferido neste contexto é alfa-Metóxiomega-mercapto poli(etileno glicol). Em cada caso, a porção -SH, por exemplo, de uma cisteína ou de qualquer aminoácido ou composto adicional (modificado), pode estar presente nas extremidades terminais ou internamente em qualquer posição de polímeros hidrofílicos P1 e P3. Como definido aqui, cada um de polímeros hidrofílicos P1 e P3 tipicamente exibe pelo menos uma porção -SH preferivelmente em uma extremidade terminal, mas pode também conter duas ou até mesmo mais porções -SH, que podem ser usadas para adicionalmente anexar componentes adicionais como aqui definido, preferivelmente peptídeos ou
Petição 870190070557, de 24/07/2019, pág. 307/401
243/306 proteínas funcionais adicionais, por exemplo, um ligante, um componente de aminoácido (AA) ou (AA)X, anticorpos, peptídeos de penetração celular ou peptídeos aumentadores (por exemplo, TAT, KALA), etc. Razão em peso e razão N/P [0449] Em algumas modalidades da invenção, a molécula de ácido nucleico artificial, preferivelmente RNA (ou dito outro ácido nucleico), está associada com ou complexada com um composto (poli-)catiônico ou um carreador polimérico, opcionalmente em uma razão em peso selecionada de uma faixa de cerca de 6:1 (p/p) a cerca de 0,25:1 (p/p), mais preferivelmente de a partir de cerca de 5:1 (p/p) a cerca de 0,5:1 (p/p), ainda mais preferivelmente de cerca de 4:1 (p/p) a cerca de 1:1 (p/p) ou cerca de 3:1 (p/p) a cerca de 1:1 (p/p) e sobretudo preferivelmente uma razão de cerca de 3:1 (p/p) a cerca de 2:1 (p/p) de ácido nucleico para composto (poli)-catiônico e/ou carreador polimérico, ou opcionalmente em uma razão de nitrogenio/fosfato (N/P) de ácido nucleico para composto (poii-)catiônico e/ou carreador polimérico na faixa de cerca de 0,1-10, preferivelmente em uma faixa de cerca de 0,3-4 ou 0,3-1 e sobretudo preferivelmente na faixa de cerca de 0,5-1 ou 0,7-1 e ainda mais preferivelmente em uma faixa de cerca de 0,3-0,9 ou 0,50,9. Mais preferivelmente, a razão N/P da pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais policátlons está na faixa de cerca de 0,1 a 10, Incluindo uma faixa de cerca de 0,3 a 4, de cerca de 0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5. [0450] A molécula de ácido nucleico artificial, preferivelmente RNA, da invenção (ou qualquer outro ácido nucleico como aqui definido) pode ser também associada com um veículo, agente de transfecção ou complexação para aumento da eficiência de transfecção da dita molécula de ácido nucleico artificial, preferivelmente RNA.
[0451] Neste contexto, é particularmente preferido que a composi
Petição 870190070557, de 24/07/2019, pág. 308/401
244/306 ção (farmacêutica) da invenção compreenda a molécula de ácido nucleico artificial, preferivelmente RNA, que é complexada pelo menos parcialmente com um composto (poli-)catiônico e/ou um carreador poll· mérico, preferivelmente proteínas ou peptídeos catiônicos. Neste contexto, a descrição do WO 2010/037539 e WO 2012/113513 é incorporada aqui a título de referência. Parcialmente significa que apenas uma parte da dita molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um composto (poli-)catiônico e/ou carreador polimérico, enquanto o resto da dita molécula de ácido nucleico artificial, preferivelmente RNA, está presente em forma não complexada (livre).
[0452] Preferivelmente, a razão molar da molécula de ácido nucleico artificial complexada, preferivelmente RNA, para a molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma razão molar de cerca de 0,001:1 a cerca de 1:0,001, incluindo uma razão de cerca de 1:1. Mais preferivelmente a razão de molécula de ácido nucleico artificial complexada, preferivelmente RNA, para molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma faixa de cerca de 5:1 (p;p) a cerca de 1:10 (p/p), mais preferivelmente de uma faixa de cerca de 4:1 (p/p) a cerca de 1:8 (p/p), a inda mais preferivelmente de uma faixa de cerca de 3:1 (p/p) a cerca de 1:5 (p/p) ou 1:3 (p/p) e sobretudo preferivelmente a razão de molécula de ácido nucleico artificial complexada, preferivelmente RNA, para a molécula de ácido nucleico artificial livre, preferivelmente RNA, é selecionada de uma razão de cerca de 1:1 (p/p).
[0453] A molécula de ácido nucleico artificial complexada, preferivelmente RNA, da invenção é preferivelmente preparada de acordo com uma primeira etapa através da complexação da molécula de ácido nucleico artificial, preferivelmente RNA, com um composto (poli-)catiônico e/ou com um carreador polimérico, preferivelmente como aqui definido,
Petição 870190070557, de 24/07/2019, pág. 309/401
245/306 em uma razão específica para formar um complexo estável. Neste contexto, é altamente preferível que nenhum composto (poli-)catiônico livre ou carreador polimérico ou apenas uma quantidade insignificantemente pequena does mesmos permaneça na fração da molécula de ácido nucleico artificial complexada, preferivelmente RNA, após complexação da dita molécula de ácido nucleico artificial, preferivelmente RNA. Desta maneira, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, e o composto (poli-)catiônico e/ou o carreador polimérico na fração do RNA complexado é tipicamente selecionada em uma faixa de modo que a molécula de ácido nucleico artificial, preferivelmente RNA, é totalmente complexada e nenhum composto (polijcatiônico livre ou carreador polimérico ou apenas uma quantidade insignificantemente pequena permanece na dita fração.
[0454] Preferivelmente, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, para o composto (poli-)catiônico e/ou carreador polimérico, preferivelmente como aqui definido, é selecionada de uma faixa de cerca de 6:1 (p/p) a cerca de 0,25:1 (p/p), mais preferivelmente de a partir de cerca de 5:1 (p/p) a cerca de 0,5:1 (p/p), ainda mais preferivelmente de cerca de 4:1 (p/p) a cerca de 1:1 (p/p) ou de cerca de 3:1 (p/p) a cerca de 1:1 (p/p), e sobretudo preferivelmente uma razão de cerca de 3:1 (p/p) a cerca de 2:1 (p/p).
[0455] Alternativamente, a razão da molécula de ácido nucleico artificial, preferivelmente RNA, para o composto (poli-)catiônico e/ou o carreador polimérico pode ser também calculada com base na razão de nitrogênio/fosfato (razão N/P) do complexo inteiro. No contexto da presente invenção, uma razão N/P está preferivelmente na faixa de cerca de 0,1-10, preferivelmente na faixa de cerca de 0,3-4 e sobretudo preferivelmente em uma faixa de cerca de 0,5-2 ou 0,7-2 com relação à razão de molécula de ácido nucleico artificial, preferivelmente RNA, para composto (poli-)catiônico e/ou carreador polimérico, preferivelmente
Petição 870190070557, de 24/07/2019, pág. 310/401
246/306 como definido aqui, no complexo, e sobretudo preferivelmente em uma faixa de cerca de 0,7-1,5, 0,5-1 ou 0,7-1, e ainda mais preferivelmente em uma faixa de cerca de 0,3-0,9 ou 0,5-0,9, preferivelmente contanto que o composto (poli-)catiônico no complexo seja uma proteína ou peptídeo (poli-)catiônico e/ou o carreador polimérico como definido acima.
[0456] Em outras modalidades, molécula de ácido nucleico artificial, preferivelmente RNA, pode ser provida e usada em forma livre ou nua sem estar associada com qualquer veículo, agente de transfecção ou complexação adicional.
Administração direcionada [0457] Em aigumas modalidades, compostos (poli-)catiônicos, carreadores, lipossomas ou LNPs podem ser formulados para administração direcionada para atingir diversos órgãos e/ou tipos de célula. Como um exemplo não limitante, o composto (poli-jcatiônico, carreador, lipossoma ou LNP pode ser formulado para administração direcionada ao fígado. O composto (poH-)catiônico, carreador, lipossoma ou LNP usado para administração direcionada pode incluir, mas não é limitado a, composto (poli-)catiônico, carreador, lipossomas ou LNPs descritos aqui. Os RNAs da invenção podem codificar conjugados, por exemplo, proteínas terapêuticas ou fragmentos ou variantes das mesmas, covalentemente ligados a um carreador ou grupo de direcionamento.
[0458] Grupos de direcionamento podem ser proteínas, por exemplo, glicoproteínas, ou peptídeos, por exemplo, moléculas tendo uma afinidade específica com um coligante, ou anticorpo, por exemplo, um anticorpo que se liga a um tipo de célula especificado tal como uma célula epitelial, queratinócitos ou similar. Grupos de direcionamento podem também incluir hormônios e receptores de hormônio. Eles podem também incluir espécies não peptídicas, tais como lipídeos, lectinas, carboidratos, vitaminas, cofatores, lactose multivalente, galactose mul
Petição 870190070557, de 24/07/2019, pág. 311/401
247/306 tivalente, N-acetil-galactosamina, N-actil-glucosamina manose multivalente, fucose multivalente ou aptâmeros. O grupo de direcionamento pode ser qualquer ligante que seja capaz de direcionamento a um receptor específico.
[0459] Em algumas modalidades, as moléculas de ácido nucleico artificiais, preferivelmente RNA, e opcionalmente composições (farmacêuticas) ou kits compreendendo as mesmas, são adaptadas para direcionamento ao(para dentro do) fígado. Tais moléculas de ácido nucleico artificiais, preferivelmente RNAs, e opcionalmente composições (farmacêuticas) ou kits compreendendo as mesmas, podem ser particularmente adequados para tratamento, prevenção ou atenuação de doenças metabólicas, por exemplo, doença metabólica causada por erros genéticos inatos, por exemplo, doenças relacionadas à deficiência de ornitina transcarbamilase.
Composição (farmacêutica) [0460] Em um aspecto adicional, a presente invenção provê uma composição compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com a invenção, e pelo menos um carreador ou excipiente farmaceuticamente aceitável. A composição de acordo com a invenção é preferivelmente provida como uma composição farmacêutica.
[0461] A molécula de ácido nucleico artificial, preferivelmente RNA, pode ser provida como parte da composição (farmacêutica) em forma complexada ou livre como descrito em qualquer outro ponto aqui ou uma mistura das mesmas.
[0462] A composição (farmacêutica) de acordo com a invenção pode compreender ainda pelo menos um gRNA, ou um vetor provendo o mesmo, como definido em qualquer outro ponto aqui.
[0463] A composição (farmacêutica) de acordo com a invenção pode compreender ainda pelo menos um agente ativo adicional útil para
Petição 870190070557, de 24/07/2019, pág. 312/401
248/306 tratamento da doença ou condição que é submetida à terapia com a molécula de ácido nucleico artificial, preferivelmente RNA, ou composição (farmacêutica) compreendendo a mesma.
Excipientes e carreadores farmaceuticamente aceitáveis [0464] Preferivelmente, a composição (farmacêutica) de acordo com a invenção compreende pelo menos um carreador e/ou excipiente farmaceuticamente aceitável. O termo farmaceuticamente aceitável refere-se a um composto ou agente que é compatível com um ou mais agente(s) ativo(s) (aqui: molécula de ácido nucleico artificial, preferivelmente RNA) e não interfere com e/ou substancialmente reduz suas atividades farmacêuticas. Carreadores farmaceuticamente aceitáveis têm preferivelmente pureza suficientemente alta e toxidez suficientemente baixa para torna-los adequados para administração a um indivíduo a ser tratado.
Excipientes [0465] Excipientes farmaceuticamente aceitáveis podem exibir papéis funcionais diferentes e incluem, sem limitação, diluentes, cargas, agentes de volume, carreadores, deslntegrantes, ligantes, lubrificantes, glídantes, revestimentos, solventes e cossolventes, agentes de tamponamento, conservantes, adjuvantes, antioxidantes, agentes umectantes, agentes antiespumantes, agentes de espessamento, agentes adoçantes, agentes saborizantes e umectantes.
[0466] Para composições (farmacêuticas) em forma líquida, excipientes farmaceuticamente aceitáveis úteis em geral incluem solventes, diluentes ou carreadores tais como água (livre de pírógeno), soluções salinas (isotônicas) tal como solução salina tamponada com fosfato ou citrato, óleos fixos, óleos vegetais, tais como, por exemplo, óleo de amendoim, óleo de semente de algodão, óleo de sésamo, óleo de oliva, óleo de milho, etanol, polióis (por exemplo, glicerol, propileno glicol, polietileno glicol e similar); lecítina; tensoativos; conservantes tais como
Petição 870190070557, de 24/07/2019, pág. 313/401
249/306 álcool de benzila, parabenos, clorobutanol, fenol, ácido ascórbico, timerosal e similar; agentes isotônicos tais como açúcares, poliálcoois tal como manitol, sorbitol ou cloreto de sódio; monoestearato de alumínio ou gelatina; antioxidantes tal como ácido ascórbico ou bissulfito de sódio; agentes de quelaçâo tal como ácido etilenodiaminotetraacético (EDTA); tampões tais como acetatos, citratos ou fosfatos e agentes para o ajuste de tonicidade tal como cloreto de sódio ou dextrose. O pH pode ser ajustado com ácidos ou bases, tal como ácido clorídrico ou hidróxido de sódio. Tampões podem ser hipertônicos, isotônicos ou hipotônicos com referência ao meio de referência específico, isto é, o tampão pode ter um teor de sal maior, idêntico ou menor com referência ao meio de referência específico, em que preferivelmente tais concentrações dos sais mencionados acima podem ser usadas, que nâo levam a dano de células devido à osmose ou outros efeitos de concentração. Meios de referência são, por exemplo, líquidos ocorrendo em métodos in vivo, tais como sangue, linfa, líquidos citosólicos ou outros líquidos corporais ou, por exemplo, líquidos que podem ser usados como meios de referência em métodos in vitro, tais como tampões ou líquidos comuns. Tais tampões ou líquidos comuns são conhecidos de um versado na técnica. Solução de Ringer com lactato é particularmente preferida como uma base líquida.
[0467] Para composições (farmacêuticas) em forma (semi-)sólida, excipientes farmaceuticamente aceitáveis úteis incluem ligantes tais como celulose microcristalina, goma tragacanto ou gelatina; amido ou lactose; açúcares, tais como, por exemplo, lactose, glicose e sacarose; amidos, tais como, por exemplo, amido de milho ou amido de batata; celuloses e seus derivados, tais como, por exemplo, carboximetilcelulose de sódio, etilcelulose, acetato de celulose; desintegrantes tais como ácido algínico; lubrificantes tais como estearato de magnésio; glidantes
Petição 870190070557, de 24/07/2019, pág. 314/401
250/306 tais como ácido esteárico, estearato de magnésio; sulfato de cálcio, dióxido de silício coloidal e similar; agentes adoçantes tais como sacarose ou sacarina; e/ou agentes saborizantes tais como hortelã-pimenta, salioilato de metila ou aromatizante de laranja.
Carreadores [0468] Carreadores farmaceuticamente aceitáveis adequados são tipicamente escolhidos com base na formulação da composição (farmacêutica).
[0469] Composições (farmacêuticas) líquidas administradas através de injeção e em particular através de injeção i.v. devem ser estéreis e estáveis sob as condições de fabricação e armazenamento. Tais composições são tipicamente formuladas como soluções aquosas parenteralmente aceitáveis que são livres de pirógeno, têm pH aceitável, são isotônicas e mantêm estabilidade do(s) ingrediente(s) ativo(s).
[0470] Carreadores farmaceuticamente aceitáveis particularmente úteis para composições (farmacêuticas) líquidas de acordo com a invenção incluem água, tipicamente água livre de pirógeno; solução salina isotônica ou soluções (aquosas) tamponadas, por exemplo, fosfato, citrato, etc., soluções tamponadas. Particularmente para injeção das composições (farmacêuticas) da invenção, água ou preferivelmente um tampão, mais preferivelmente um tampão aquoso, pode ser usado, contendo um sal de sódio, preferivelmente pelo menos 50 mM de um sal de sódio, sal de cálcio, preferivelmente pelo menos 0,01 mM de um sal de cálcio, e opcionalmente um sal de potássio, preferivelmente pelo menos 3 mM de um sal de potássio.
[0471] De acordo com modalidades preferidas, os sais de sódio, cálcio e, opcionalmente, potássio, podem ocorrer na forma de suas halogenidas, por exemplo, cloretos, iodetos ou brometos, na forma de seus hidróxidos, carbonates, hidrogeno carbonates ou sulfates, etc. Sem ser limitado aos mesmos, exemplos de sais de sódio incluem, por exemplo,
Petição 870190070557, de 24/07/2019, pág. 315/401
251/306
NaCI, Nal, NaBr, Na2CO3, NaHCOs, NazSCri, exemplos dos sais de potássio opcionais incluem, por exemplo, KCI, Kl, KBr, K2CO3, KHCO3, K2SO4, e exemplos de sais de cálcio incluem, por exemplo, CaCb, Cab, CaBf2, CaCCh, CaSCu, Ca(OH)2. Ainda, ânions orgânicos dos cátions mencionados acima podem estar contidos no tampão.
[0472] De acordo com modalidades mais preferidas, o tampão adequado para propósitos de injeção como acima definido pode conter sais selecionados de cloreto de sódio (NaCI), cloreto de cálcio (CaCb) e opcionalmente cloreto de potássio (KCI), em que ânions adicionais podem estar presentes em adição aos cloretos. CaCb pode também ser substituído por um outro sal tal como KCI. Tipicamente, os sais no tampão de injeção estão presentes em uma concentração de pelo menos 50 mM de cloreto de sódio (NaCI), pelo menos 3 mM de cloreto de potássio (KCI) e pelo menos 0,01 mM de cloreto de cálcio (CaCb). O tampão de injeção pode ser hipertrófico, isotônico ou hipotônico com referência ao meio de referência específico, isto é, o tampão pode ter um teor de sal maior, idêntico ou menor com referência ao meio de referência específico, em que preferivelmente tais concentrações dos sais mencionados acima podem ser usadas, as quais não levem a dano de células devido à osmose e outros efeitos de concentração. Meios de referência são, por exemplo, líquidos de ocorrência em métodos in vivo” tais como sangue, linfa, líquidos citosóllcos ou outros líquidos corporais ou, por exemplo, líquidos que podem ser usados como meios de referência em métodos ’7n vitro, tais como tampões ou líquidos comuns. Tais tampões ou líquidos comuns são conhecidos de um versado na técnica. Solução de Ringer com Lactato é particularmente preferida como uma base líquida. Formulação [0473] Em geral, composições (farmacêuticas) para administração tópica podem ser formuladas como cremes, unguentos, géis, pastas ou pós. Composições (farmacêuticas) para administração oral podem ser
Petição 870190070557, de 24/07/2019, pág. 316/401
252/306 formuladas como comprimidos, cápsulas, líquidos, pós ou em um formato de liberação sustentada. No entanto, de acordo com modalidades preferidas, a composição (farmacêutica) da invenção é administrada parenteralmente, em particular através de injeção intradermal ou intramuscular, e é desta maneira formulada em forma líquida ou liofilizada para administração parenteral como discutido em um outro ponto aqui. Formulações parenterais são tipicamente armazenadas em frascos, bolsas IV, ampolas, cartuchos e seringas pré-cheias e podem ser administradas como injeções, Inalantes ou aerossóis, com injeções sendo preferidas.
Formulações liofilizadas [0474] Em modalidades preferidas adicionais, a composição (farmacêutica) é provida em forma liofilizada. Preferivelmente, a composição (farmacêutica) liofilizada é reconstituída em um tampão adequado, vantajosamente baseado em um carreador aquoso, antes da administração, por exemplo, solução de Ringer com Lactato, que é preferida, solução de Ringer, uma solução tampão de fosfato. Em algumas modalidades, a composição (farmacêutica) de acordo com a invenção contém pelo menos duas, três, quatro, cinco, seis ou mais moléculas de ácido nucleico artificiais, preferivelmente RNAs, que são providas separadamente em forma liofilizada (opcionalmente junto com pelo menos um aditivo adicional) e que são preferivelmente reconstituídas separadamente em um tampão adequado (tal como solução de Ringer com Lactato) antes do seu uso de modo a permitir administração individual de cada uma da dita molécula de ácido nucleico artificial, preferivelmente RNAs.
Formulações líquidas [0475] Em modalidades preferidas adicionais, a composição (farmacêutica) é provida na forma de uma solução salina ou uma formulação à base de lipídeo. Formulações à base de lipídeo podem compreender
Petição 870190070557, de 24/07/2019, pág. 317/401
253/306 lipossomas, Hpoptexos, nanolipossomas e nanopartículas de lipídeo que sâo descritos acima na seção intitulada Complexação.
Kit [0476] Em um aspecto adicional, a presente invenção refere-se a um kit de kit de partes compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, e/ou a composição (farmacêutica). O kit pode compreender ainda pelo menos um gRNA (ou vetor provendo o mesmo).
[0477] Os componentes mencionados acima podem ser, cada um, providos na forma de uma composição farmacêutica no kit de partes. Até agora, as definições e explicações providas acima para a composição (farmacêutica) são igualmente aplicáveis aos componentes individuais do kit de partes, mutatis mutandis.
[0478] Por exemplo, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, e opcionalmente o pelo menos um gRNA ou ácido nucleico codificando o mesmo, podem ser providos independentemente um do outro - em forma liofilizada ou líquida, opcionalmente junto com um ou mais carreador(es), excipientes ou agentes adicionais farmaceuticamente aceitáveis como descrito acima no contexto da composição farmacêutica.
[0479] Opcionalmente, o kit de partes pode compreender pelo menos um agente adicional como aqui definido no contexto da composição farmacêutica, agentes antimicrobianos, inibidores de RNase, agentes de solubilização ou similar.
[0480] O kit de partes pode ser um kit de duas ou mais partes e compreende tipicamente os componentes em recipientes adequados. Por exemplo, cada recipiente pode estar na forma de frascos, garrafas, garrafas para apertar, jarras, mangas vedadas, envelopes ou bolsas, tubos ou embalagens de blister ou qualquer outra forma adequada con
Petição 870190070557, de 24/07/2019, pág. 318/401
254/306 tanto que o recipiente seja configurado de modo a prevenir mistura imatura de componentes. Cada um dos componentes diferentes pode ser provido separadamente, ou alguns dos componentes diferentes podem ser providos juntos (isto é, no mesmo recipiente). Um recipiente pode ser também um compartimento ou uma câmara dentro de um frasco, um tubo, uma jarra ou um envelope ou uma manga ou uma embalagem de blister ou uma garrafa, contanto que os teores de um compartimento não sejam capazes de se associar fisicamente com os teores de um outro compartimento antes de sua mistura deliberada pelo farmacêutico ou médico.
[0481] O kit de partes pode conter ainda instruções técnicas com informação sobre a administração e dosagem de quaisquer um de seus componentes.
Uso médico e tratamento [0482] A molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes definido aqui pode ser usado para propósitos médicos humanos e também para veterinários, preferivelmente para propósitos médicos humanos.
[0483] De acordo com um aspecto adicional, a invenção refere-se então à molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes para uso como um medicamento.
[0484] A molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes sâo inter alia úteis para tratamento e/ou profilaxia de doenças condescendentes a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse. [0485] De acordo com um aspecto adicional, a invenção refere-se então à molécula de ácido nucleico artificial, preferivelmente RNA, ou à
Petição 870190070557, de 24/07/2019, pág. 319/401
255/306 composição (farmacêutica) ou kit de partes para uso em um método de terapia de gene e/ou para tratamento de uma doença condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse. Tais doenças podem ser selecionadas de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias, doenças infecciosas, doenças metabólicas, doenças neurais, doenças cardlovasculares ou outras doenças ou condições.
[0486] Terapia de gene envolve preferivelmente maturação (isto é, restauração, aumento, diminuição ou inibição) de expressão de gene em um indivíduo a fim de obter um efeito terapêutico. Para esta finalidade, terapia de gene tipicamente compreende a introdução de ácidos nucleicos em células. O termo refere-se em geral à manipulação de um genoma para propósitos terapêuticos e inclui o uso de tecnologias de edição de genoma para correção de mutações que podem causar doença, a adição de genes terapêuticos ao genoma, a remoção de genes ou sequências de genoma prejudiciais e a modulação de expressão de gene. Terapia de gene pode envolver transformação /n vivo ou ex vivo das células hospedeiras.
[0487] O termo tratamento ou tratando” de uma doença inclui prevenção ou proteção contra a doença (isto é, fazendo com que os sintomas clínicos não se desenvolvam); inibição da doença (isto é, parando ou suprimindo o desenvolvimento de sintomas clínicos; e/ou aliviando a doença (isto é, causando a regressão de sintomas clínicos). Como será compreendido, não é sempre possível distinguir entre prevenção e supressão de uma doença ou distúrbio uma vez que o evento ou eventos indutor(es) finais podem ser desconhecidos ou latentes. Desta maneira, o termo profilaxia será compreendido constituir um tipo de tratamento que compreende ambos prevenção e supressão. O termo
Petição 870190070557, de 24/07/2019, pág. 320/401
256/306 tratamento então inclui profilaxia.
[0488] O termo indivíduo ou paciente como aqui usado geralmente inclui humanos e animais não humanos e preferivelmente mamíferos (por exemplo, primatas não humanos, incluindo marmotas, micos, macacos-aranha, macacos-coruja, macacos-vervet, macacos-esquilo e babuínos, macacas, chimpanzés, orangotangos, gorilas; vacas; cavalos: ovelha; porcos; galinha; gatos; cachorros; camundongos; rato; coelhos; porquinhos-da-índia; etc.), incluindo animais e modelos de doença quiméricos e transgênicos. No contexto da presente invenção, o termo indivíduo refere-se preferivelmente a um primata não humano ou um humano, sobretudo preferivelmente um humano.
[0489] Desta maneira, a presente invenção provê ainda métodos de tratamento de doenças condescendentes a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através de ativação, inativação, manipulação ou modulação da expressão de um gene de interesse, através da administração a um indivíduo com necessidade de uma quantidade farmaceuticamente eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes. Tais métodos podem compreender uma primeira etapa opcional de preparação da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes, e uma segunda etapa compreendendo administração (de uma quantidade farmaceuticamente e/ou terapeuticamente eficaz da) dita molécula de ácido nucleico artificial, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes a um paciente/indivíduo com necessidade do mesmo.
[0490] Administração é preferivelmente realizada parenteralmente, por exemplo, através de injeção subcutânea, intramuscular ou intradermal, preferivelmente através de injeção intramuscular ou intradermal, mais preferivelmente através de injeção intradermal. Preferivelmente,
Petição 870190070557, de 24/07/2019, pág. 321/401
257/306 injeção é realizada usando injeção com agulha convenciona ou injeção de jato (sem agulha), preferivelmente usando injeção de jato (sem agulha).
[0491 ] A invenção refere-se também ao uso da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes, preferivelmente para ativação, inativação, manipulação ou modulação, preferivelmente para indução ou aumento, da expressão de um gene de interesse.
Vias de administração [0492] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes pode ser administrado, por exemplo, sistemicamente ou localmente.
[0493] Vias para administração sistêmica em geral incluem, por exemplo, vias transdermal, oral, parenteral, incluindo injeções subcutâneas, intravenosas, intramusculares, intra-arteriais, intradermais e intraperitoneais e/ou vias de administração intranasal.
[0494] Vias para administração local em geral incluem, por exemplo, vias de administração tópica, mas também injeções intradermais, transdermais, subcutâneas ou intramusculares ou injeções intralesionais, intratumorais, intracraniais, intrapulmonares, intracardiais e sublinguais.
[0495] É ainda concebível usar vias de administração diferentes para componentes diferentes da molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes, por exemplo, no caso da dita composição (farmacêutica) ou kit de partes compreender vários ácidos nucleicos diferentes (tal como pelo menos um ácido nucleico artificial codificando uma proteína associada a CRISPR e pelo menos um gRNA ou um vetor provendo o mesmo).
[0496] De acordo com modalidades preferidas, a molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica)
Petição 870190070557, de 24/07/2019, pág. 322/401
258/306 ou kit de partes é administrada através de uma via parenteral, preferivelmente através de vias intradermal, subcutânea ou intramuscular. Preferivelmente, a dita molécula de ácido nucleico artificial, preferivelmente RNA, ou a composição (farmacêutica) ou kit de partes é administrada através de injeção, por exemplo, injeção subcutânea, intramuscular ou intradermal, que pode ser injeção sem agulha e/ou com agulha. Desta maneira, em modalidades preferidas, o uso médico e/ou método de tratamento de acordo com a presente invenção envolve administração da dita molécula de ácido nucleico artificial, preferivelmente RNA, ou da composição (farmacêutica) ou kit de partes através de injeção subcutânea, intramuscular ou intradermal, preferivelmente através de injeção intramuscular ou intradermal, mais preferivelmente através de injeção intradermal. Tal injeção pode ser dada usando injeção com agulha convencional ou injeção de jato (sem agulha), preferivelmente usando injeção de jato (sem agulha).
Regime de administração [0497] Os componentes da composição (farmacêutica) ou kit de partes da invenção, isto é, a pelo menos uma molécula de ácido nucleico artificial, preferivelmente RNA, e opcionalmente pelo menos um outro ácido nucleico (por exemplo, gRNA ou vetor provendo o mesmo) podem ser administrados a um indivíduo com necessidade do mesmo várias vezes por dia, diariamente, dia sim dia não, semanalmente ou mensalmente; e pode ser administrada sequencialmente ou simultaneamente. Os ditos componentes podem ser administrados a um indivíduo com necessidade dos mesmos através de vias de administração diferentes como definido acima.
[0498] De acordo com algumas modalidades preferidas, os componentes da composição (farmacêutica) da invenção são administrados simultaneamente (isto é, ao mesmo tempo a traves das mesmas vias de administração ou diferentes).
Petição 870190070557, de 24/07/2019, pág. 323/401
259/306 [0499] De acordo com outras modalidades preferidas, os componentes da composição da invenção (farmacêutica) ou kits de parte são administrados separadamente (isto é, sequencialmente em pontos de tempo diferentes e/ou através de vias de administração diferentes). Tal esquema de administração sequencial é também referido como administração “escalonada no tempo. Administração escalonada no tempo pode significar que a molécula de ácido nucleico artificial, preferivelmente RNA, é administrada, por exemplo, antes, concomitante ou subsequente ao gRNA ou vetor provendo o mesmo, ou vice-versa.
Dose [0500] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit é preferivelmente administrado em uma quantidade segura e terapeuticamente eficaz.
[0501] Como aqui usado, quantidade segura e terapeuticamente eficaz significa uma quantidade do(s) agente(s) ativo(s) que é suficiente para elicitar uma resposta biológica ou medicinal desejada em um tecido, sistema, animal ou humano que está sendo acompanhado. Uma quantidade segura e terapeuticamente eficaz é preferivelmente suficiente para a indução de uma modificação positiva da doença a ser tratada, isto é, para alivio dos sintomas da doença sendo tratada, redução de progressão de doença ou profilaxia dos sintomas da doença sendo prevenida. Ao mesmo tempo, no entanto, uma quantidade segura e terapeuticamente eficaz é pequena o suficiente para evitar efeitos colaterais sérios, quer dizer permitir uma relação sensível entre vantagem e risco.
[0502] Uma quantidade segura e terapeuticamente eficaz variará ainda mais em relação à condição particular sendo tratada e também com a idade, condição física, peso corporal, sexo e dieta do paciente a ser tratado, a severidade da condição, a duração do tratamento, a natu
Petição 870190070557, de 24/07/2019, pág. 324/401
260/306 reza da terapia acompanhante, do carreador ou excipiente farmaceuticamente aceitável particular, do regime de tratamento e fatores similares. Uma quantidade segura e (terapeuticamente) eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, pode ser ainda selecionada dependendo do tipo de molécula de ácido nucleico artificial, preferivelmente RNA, por exemplo, RNA monocistrônico, bl·- ou até mesmo multicistrônico, uma vez que um RNA bi- ou até mesmo multicistrônico pode levar a uma expressão significantemente maior da(s) proteína(s) associada(s) a CRISPR codificada(s) do que o uso de uma quantidade igual de um RNA monocistrônico.
[0503] Eficácia terapêutica e toxidez da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes podem ser determinadas através de procedimentos farmacêuticos padrão em culturas de célula ou animais experimentais, por exemplo, para determinação da LD50 (a dose ietai para 50% da população) e da ED50 (a dose terapeuticamente eficaz em 50% da população). A razão de dose entre efeitos tóxicos e terapêuticos é o índice terapêutico e pode ser expressa como a razão LD50/ED50. Ácidos nucleicos artificiais, preferivelmente RNAs, composições (farmacêuticas) ou kits de partes que exibem índices terapêuticos grandes são geralmente preferidos. Os dados obtidos a partir dos ensaios de cultura de célula e estudos animais podem ser usados na formulação de uma faixa de dosagem para uso em humanos. A dosagem de tais compostos se encontra preferivelmente dentro de uma faixa de concentrações em circulação que incluem a ED50 com pouca ou nenhuma toxidez.
[0504] Por exemplo, doses terapeuticamente eficazes da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes descritos aqui podem variar de a partir de cerca de 0,001 mg a 10 mg, preferivelmente de a partir de cerca de 0,01 mg a 5 mg, mais preferivelmente de a partir de cerca de 0,1 mg
Petição 870190070557, de 24/07/2019, pág. 325/401
261/306 a 2 mg por unidade de dose ou de a partir de cerca de 0,01 nmol a 1 mmol por unidade de dose, em particular de a partir de 1 nmol a 1 mmol por unidade de dosagem, preferivelmente de a partir de 1 pmol a 1 mmol por unidade de dosagem. É também compreendido que a dose terapeuticamente eficaz da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode variar (por kg de peso corporal) de a partir de cerca de 0,01 mg/kg a 10 g/kg, preferivelmente de a partir de 0,05 mg/kg a 5 g/kg, mais preferivelmente de a partir de cerca de 0,1 mg/kg a 2,5 g/kg.
[0505] Quantidades seguras e terapeuticamente eficazes da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes a serem administradas podem ser determinadas através de experimentos de rotina, por exemplo, usando modelos animais. Tais modelos incluem, sem implicar nenhuma limitação, modelos de coelho, ovelha, camundongo, rato, cachorro e primata não humano.
Doenças [0506] Tecnologias CRISPR podem ser empregadas para uma variedade de propósitos, incluindo ínativação ou ativação funcional de genes, edição de gene ou ativação ou inibição de transcrição. A molécula de ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção pode então ser usada para tratamento de uma variedade de doenças. Ela é particularmente compreendida para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de uma proteína associada a CRISPR codificada por pelo menos uma sequência de codificação da molécula de ácido nucleico artificial.
[0507] Preferivelmente, a doença a ser tratada é condescendente a tratamento através de ativação, ínativação ou manipulação (por exemplo, introdução ou remoção de uma mutação) de um gene de interesse,
Petição 870190070557, de 24/07/2019, pág. 326/401
262/306 ou através da modulação (isto é, alteração, indução, aumento, redução, prevenção ou rompimento) de sua expressão.
[0508] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para induzir inativações de gene (isto é, tornar genes não funcionais ou remover genes do genoma). Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando proteínas associadas a CRISPR exibindo atividade de endonuclease podem ser utilizadas, as quais são capazes de introduzir DSBs no DNA genômico. Os ditos DSBs podem induzir união de extremidade não homologa (NHEJ), resultando na inserção ou deleção aleatória de extensões curtas de nudeotídeos levando ao rompimento da estrutura de leitura de códon (frameshifts), resultando em transcritos errôneos e ablação de expressão de gene (perda de função). Esta estratégia pode, por exemplo, ser útil para inativação de genes que fazem a mediação de proliferação e sobrevivência de célula de tumor ou para remoção viral integrada do genoma da célula hospedeira.
[0509] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para induzir ativações de gene (isto é, introduzir genes novos ou modificados no genoma). Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando proteínas associadas a CRISPR exibindo atividade de nickase podem ser utilizadas, as quais são então capazes de introduzir Nicks (isto é, hidrolise das ligações fosfodiéster de um filamento do DNA genômico de filamento duplo) no DNA genômico. Tais nicks preferivelmente induzem reparo direcionado à homologia (HDR), resultando na incorporação de um segmento de DNA com regiões tendo homologia com as sequências flanqueando ambos os lados da quebra de
Petição 870190070557, de 24/07/2019, pág. 327/401
263/306 filamento duplo de DNA. Usando HDR, qualquer sequência de DNA desejada pode ser inserida no DNA genômico para induzir, por exemplo, perda de função, ganho de função ou função (neomórfica) alterada ou para investigar variantes de estado funcional desconhecido. Para utilizar HDR para editar o genoma, o modelo de reparo de DNA com a sequência desejada é tipicamente provido junto com o ácido nucleico artificial da invenção (e o gRNA). Esta estratégia pode ser, por exemplo, útil para inativação de genes terapêuticos.
[0510] Moléculas de ácido nucleico artificiais, preferivelmente RNAs, de acordo com a invenção, ou composições (farmacêuticas) ou kits compreendendo as mesmas podem ser usados para modular expressão de gene, e em particular transcrição de gene. Desta maneira, moléculas de ácido nucleico artificiais, preferivelmente RNAs, codificando derivados de proteína associada a CRISPR compreendendo domínios efetores adequados podem ser utilizadas. Os domínios efetores podem interagir com um gene-alvo (ou uma sequência reguladora operavelmente ligada ao mesmo) para modular sua expressão. Esta abordagem pode ser útil para qualquer doença que esteja associada com uma expressão indesejada (presente ou ausente, aumentada ou diminuída) de um gene-alvo de interesse.
Câncer [0511] Em modalidades preferidas, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit é usado para tratamento ou profilaxia de câncer.
[0512] Como aqui usado, o termo câncer refere-se a um neoplasma caracterizado pela proliferação descontrolada e geralmente rápida de células que tendem a invadir tecido circundante e metastatizar para sítios distantes no corpo. O termo compreende neoplasmas benignos e malignos. Malignidade em câncer é tipicamente caracterizada por
Petição 870190070557, de 24/07/2019, pág. 328/401
264/306 anaplasia, invasividade e metástase; enquanto males benignos tipicamente não tem nenhuma dessas propriedades. Os termos incluem neoplasmas caracterizados por crescimento de tumor bem como cânceres do sangue e sistema linfático.
[0513] Em algumas modalidades, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção pode ser usado como um medicamento, em particular para tratamento de tumor ou doenças de câncer. Neste contexto, tratamento envolve preferivelmente aplicação intratumoral, especialmente através de injeção intratumoral. Desta maneira, o ácido nucleico artificial, preferivelmente RNA, composição (farmacêutica) ou kit de acordo com a invenção podem ser usados para preparação de um medicamento para tratamento de tumor ou doenças de câncer, o dito medicamento sendo particularmente adequado para aplicação intratumoral (administração) para tratamento de tumor ou doenças de câncer.
[0514] Preferivelmente, tumor e doenças de câncer como mencionado aqui são selecionados de tumor e doenças de câncer que incluem preferivelmente, por exemplo, Leucemia linfoblástica aguda, Leucemia mieloide aguda, Carcinoma adrenocortical, Cânceres relacionados à AIDS, Linfoma relacionado à AIDS, Câncer anal, Câncer de apêndice, Astrocitoma, Carcinoma de célula basal, Câncer do duto da bile, Câncer de bexiga, Câncer ósseo, Osteossarcoma/Histiocitoma fibroso maligno, Glioma do tronco cerebral, Tumor cerebral, Astrocitoma cerebelar, Astrocitoma cerebral/Glioma maligno, Ependimoma, Meduloblastoma, Tumores neuroectodermais primitivos supratentoriais, Glioma da via visual e hipotalâmico, Câncer de mama, Adenomas/carcinoides brônquicos, Linfoma de Burkitt, Tumor carcinoide da infância, Tumor carcinoide gastrintestinal, Carcinoma de primário desconhecido, Linfoma do sistema nervoso central primário, Astrocitoma cerebelar da infância, Astrocitoma
Petição 870190070557, de 24/07/2019, pág. 329/401
265/306 cerebral da infância/Glioma maligno, Câncer cervical, Cânceres da infância, Leucemia linfocítica crônica, Leucemia mielógena crônica, Distúrbios mieloproliferativos crônicos, Câncer de cólon, Linfoma cutâneo de célula T, Tumor desmoplástico de pequenas células redondas, Câncer endometrial, Ependimoma, Câncer esofageal, Sarcoma de Ewing na família Ewlng de tumores, Tumor de célula germinativa extracraniano da infância, Tumor de célula germinativa extragonadal, Câncer do duto da bile extraepático, Melanoma intraocular, Retinoblastoma, Câncer da vesícula biliar, Câncer gástrico (Estômago), Tumor carcinoide gastrintestinal, Tumor estromal gastrintestinal (GIST), Tumor de célula germinativa extracraniano, extragonadal ou ovariano, Tumor trofoblástlco gestacional, Glioma do tronco cerebral, Astrocitoma Cerebral da infância, Glioma da Via Visual da Infância e Hipotalâmico, Carcinoide gástrico, Lecemia de célula pilosa, Câncer de cabeça e pescoço, Câncer do coração, Câncer hepatocelular (fígado), Linfoma de Hodgkin, Câncer hipofaringeal, Glioma hipotalâmico e da via visual da infância, Melanoma intraocular, Carcinoma de célula ilhota (Pâncreas endócrino), Sarcoma de Kaposi, Câncer renal (câncer de célula renal), Câncer Laringeal, Leucemias, Leucemia linfoblástica aguda, Leucemia mieloide aguda, Leucemia linfocítica aguda, Leucemia mielógena crônica, Leucemia de célula pilosa, Câncer de Lábios e Cavidade Oral, Lipossarcoma, Câncer de Fígado, Câncer de Pulmão de não Pequenas Células, Câncer de Pulmão de Pequenas Células, Linfomas, Linfoma relacionada à AIDS, Linfoma de Burkitt, Linfoma de célula T cutâneo, Linfoma de Hodgkin, Linfomas não Hodgkin, Linfoma do Sistema Nervoso Central Primário, Macroglobulinemia de Waldenstrõn, Histiocitoma Fibroso Maligno de Osso/Osteossarooma, Meduloblastoma da Infância, Melanoma, Melanoma Intraocular (Olho), Carcinoma de célula de Merkel, Mesotelioma Maligno Adulto, Mesotelioma da Infância, Câncer de Pescoço Escamoso Metastático com Primário Oculto, Câncer de Boca, Síndrome da
Petição 870190070557, de 24/07/2019, pág. 330/401
266/306
Neoplasia Endócrina Múltipla da Infância, Mieloma Múltiplo/Neoplasma de Célula do Plasma, Micose Fungoide, Síndromes Mlelodisplásticas, Doenças Mielodisplásticas/Mieloproliferativas, Leucemia Mielógena Crônica, Leucemia Mieloide Aguda do Adulto, Leucemia Mieloide Aguda da Infância, Mieloma Múltiplo (Câncer da Medula-óssea), Distúrbios Mieloproliferativos Crônicos, Câncer da cavidade nasal e seio paranasal, Carcinoma nasofaringeal, Neuroblastoma, Câncer oral, Câncer orofaringeal, Osteossarcoma/histiocitoma fibroso maligno de osso, Câncer ovariano, Câncer epitelial ovariano (Tumores epiteliais-estromais da superficie), Tumor de célula germinativa ovariano, Tumor ovariano de potencial maligno baixo, Câncer pancreático, Câncer pancreático de célula ilhota, Câncer do seio paranasal e cavidade nasal, Câncer da paratireoide, Câncer de pênis, Câncer faringeal, Feocromocitoma, Astrocitoma pineal, Germinoma pineal, Pineoblastoma da infância e tumores neuroectodermais primitivos supratentoriais, Adenoma da pituitária, Neoplasia de célula do plasma/Mieloma múltiplo, Blastoma pleuropulmonar, Linfoma do sistema nervoso central primário, Câncer de próstata, Câncer retal, Carcinoma de célula renal (câncer de rim), Câncer da pélvis renal e ureter, Retinoblastoma, Rabdomiossarcoma da infância, Câncer da glândula salivar, Sarcoma da família Ewing de tumores, Sarcoma de Kaposi, Sarcoma de tecido mole, Sarcoma uterino, Sindrome de Sézary, Câncer de pele (não melanoma), câncer de pele (melanoma), Carcinoma de pele de célula de Merkel, Câncer do intestino delgado, Carcinoma de célula escamosa, Câncer de pescoço escamoso metastático com primário oculto, Tumor neuroectodermal primitivo supratentorial da infância, Câncer testicular, Câncer de garganta, Tlmoma da infância, Timoma e Câncer tímico, Câncer da tíreoide, Câncer da tireoide da infância, Câncer de célula transitório da pélvis renal e ureter, Tumor trofoblástico gestacional, Câncer uretral, Câncer uterino endometrial, Sarcoma uterino, Câncer vaginal, Glioma da via visual e hipotalâmico da
Petição 870190070557, de 24/07/2019, pág. 331/401
267/306 infância, Câncer vulvar, macroglobulinemia de Waldenstrom e tumor de Wilms da infância (câncer de rim).
[0515] Exemplos especialmente preferidos de tumores ou cânceres que são adequados para administração intratumoral são câncer de próstata, câncer de pulmão, câncer de mama, câncer de cérebro, câncer de cabeça e pescoço, câncer da tireoide, câncer de cólon, câncer de estômago, câncer de fígado, câncer de pâncreas, câncer ovariano, câncer de pele, bexiga urinária, útero e cérvice.
Doenças infecciosas [0516] A combinação da invenção, composição farmacêutica ou kit pode ser usado para tratamento de doenças infecciosas. O termo infecção ou doença infecciosa refere-se à invasão e multiplicação de micro-organismos tais como bactérias, vírus e parasitas que não estão normalmente presentes dentro do corpo. Uma infecção pode não causar quaisquer sintomas e ser subclínica ou ela pode causar sintomas e ser clinicamente aparente. Uma infecção pode permanecer localizada ou ela pode se espalhar através do sangue ou sistema linfático para se tomar sistêmica. Doenças infecciosas neste contexto incluem, preferivelmente, doenças Infecciosas virais, bacterianas, fúngicas ou protozoológicas.
[0517] Os ácidos nucleicos artificiais da invenção, preferivelmente RNAs, são considerados particularmente úteis para remoção de genomas virais integrados ao genoma da célula hospedeira. Erradicação de vírus das células hospedeiras por proteínas associadas a CRISPR codificadas pelos ácidos nucleicos artificiais, preferivelmente RNAs, da invenção é preferivelmente aplicável a qualquer vírus de DNA ou vírus de RNA que tenha um intermediário do e DNA em seu ciclo de vida. Desta maneira, os ácidos nucleicos artificiais, preferivelmente RNAs, composições (farmacêuticas) e kits de acordo com a invenção são particularmente compreendidos para tratamento de infeção por Papilomavírus
Petição 870190070557, de 24/07/2019, pág. 332/401
268/306
HPV16 e HPV18, infecção pelo vírus da Hepatite B (HBV), vírus EpsteinBarr (EBV), Infecção por HIV-1, infecção por Herpesvirus (incluindo infecção por herpesvirus associado a sarcoma de Kaposi (KSHV, HHV8)) e infecção por Poliomavirus (incluindo vírus de carcinoma de célula de Merkel (MCV), poliomavirus JC (JCV) e Infecção por poliomavirus BK (BKV) e doenças infecciosas associadas.
Terapia de combinação [0518] A molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser também usada em terapia de combinação. Qualquer outra terapia útil para tratamento ou prevenção das doenças e distúrbios definidos aqui pode ser combinada com os usos e métodos revelados aqui.
[0519] Por exemplo, o indivíduo recebendo a molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser um paciente com câncer, preferivelmente como definido aqui, ou uma condição relacionada, recebendo quimioterapia (por exemplo, quimioterapia de primeira linha ou segunda linha), radioterapia, quimiorradiação (combinação de quimioterapia e radioterapia), inibidores de tirosina cinase (por exemplo, inibidores de tirosina cinase EGFR), terapia de anticorpo e/ou moléculas de ponto de checagem inibidoras e/ou estimuladoras (por exemplo, inibidores de CTLA4) ou um paciente, que obteve resposta parcial ou doença estável após ter recebido um ou mais dos tratamentos especificados acima. Ou o indivíduo recebendo a molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser um paciente com uma doença infecciosa, preferivelmente como definido aqui, recebendo terapia com antibiótico, antifúngica ou antiviral.
[0520] Em um aspecto adicional, a presente invenção então referese também ao uso da molécula de ácido nucleico artificial da invenção,
Petição 870190070557, de 24/07/2019, pág. 333/401
269/306 preferivelmente RNA, composição (farmacêutica) ou kit de partes para suporte de uma outra terapia de câncer, uma doença infecciosa ou qualquer outra doença condescendente a tratamento com a dita molécula de ácido nucleico artificial, composição (farmacêutica) ou kit.
[0521 ] Apoio do tratamento ou profilaxia de câncer pode ser qualquer combinação de um método de terapia para câncer convencional tal como cirurgia, terapia de radiação, quimioterapia (por exemplo, quimioterapia de primeira linha ou segunda linha), quimiorradiação, tratamento com inibidores de tirosina cinase, tratamento com moléculas de ponto de checagem inibidoras e/ou estimuladoras, preferivelmente inibidores de CTLA4, terapia de anticorpo ou qualquer combinação dessas, e uma terapia usando uma molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes como aqui definido.
[0522] Administração da molécula de ácido nucleico artificial da invenção, preferivelmente RNA, composição (farmacêutica) ou kit de partes pode ser realizada antes da, simultaneamente e/ou subsequentemente à administração de um outro agente terapêutico ou submetendo o paciente a uma outra terapia que seja útil para tratamento da doença ou condição particular a ser tratada.
ITENS [0523] Em vista do acima, a invenção pode ser caracterizada pelos itens que seguem:
1. Uma molécula de ácido nucleico artificial compreendendo
a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISP;
b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 e NDUFA4; e
Petição 870190070557, de 24/07/2019, pág. 334/401
270/306
c. peto menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 e RPS9.
2. A molécula de ácido nucleico artificial, de acordo com o item 1, em que cada um dos ditos genes compreende a sequência de DNA de ocorrência natural e homólogos, variantes, fragmentos e sequências de RNA correspondentes da mesma.
3. A molécula de ácido nucleico artificial, de acordo com o item 1 ou 2, compreendendo
a. pelo menos um elemento de 5’ UTR derivado de um gene HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene GNAS ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo;
b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo; ou
c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e peto menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3
Petição 870190070557, de 24/07/2019, pág. 335/401
271/306 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3
Petição 870190070557, de 24/07/2019, pág. 336/401
272/306 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4, ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1, ou de um homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, fragmento ou variante do mesmo; ou
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1, ou de um homólogo, um fragmento ou variante da mesma; ou
Petição 870190070557, de 24/07/2019, pág. 337/401
273/306
n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou
o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo; ou
p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo; ou
q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou
r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante do mesmo; ou
s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9, ou de um homólogo, um fragmento ou variante do mesmo;
Petição 870190070557, de 24/07/2019, pág. 338/401
274/306
t. peto menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene, ou de um homólogo, fragmento ou uma variante do mesmo, e peto menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou
u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68, ou de um homólogo, um fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo.
4. A molécula de ácido nucleico artificial, de acordo com o item 3, compreendendo elementos de UTR de acordo com d, e, g ou I.
5. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 4, em que
- o dito elemento de 5’ UTR derivado de um gene de HSD17B4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 1 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou um fragmento ou uma variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 2, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 2 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de RPL32 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 21 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%,
Petição 870190070557, de 24/07/2019, pág. 339/401
275/306
97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 21, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 22, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 22 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de NDUFA4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 9, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 9 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 10, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de SLC7A3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 15, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 16, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico
Petição 870190070557, de 24/07/2019, pág. 340/401
276/306 de acordo com SEQ ID NO: 16 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de urn gene de NOSIP compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 11, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 12, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12 ou um fragmento ou uma variante da mesma;
- o dito elemento de 5’ UTR derivado de um gene de ATP5A1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 5, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 6, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de ASAH1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 3, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de
Petição 870190070557, de 24/07/2019, pág. 341/401
277/306 ácido nucleico de acordo com SEQ ID NO: 3 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 4, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de Mp68 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 7, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 7 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 8, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de Rpl31 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 13, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 14, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de TUBB4B
Petição 870190070557, de 24/07/2019, pág. 342/401
278/306 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 17, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 18, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18 ou um fragmento ou uma variante da mesma;
o dito elemento de 5’ UTR derivado de um gene de Ubqln2 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 19, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 19 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 20, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de GNAS compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29 ou um fragmento ou variante da mesma; uma sequência de RNA de acordo SEQ ID NO: 30, ou
Petição 870190070557, de 24/07/2019, pág. 343/401
279/306 uma sequência de RNA tendo, em ordem crescente de preferência, peto menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucieico de acordo com SEQ ID NO: 30 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de CASP1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25, ou uma sequência de DNA tendo, em ordem crescente de preferência, peto menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nudeico de acordo com SEQ ID NO: 25 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 26, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de PSMB3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 23, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 24, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24, ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de ALB compreende ou consiste em uma sequência de DNA de acordo com
Petição 870190070557, de 24/07/2019, pág. 344/401
280/306
SEQ ID NO: 35, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 35 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 36, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de RPS9 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 33, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 33 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 34, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34 ou um fragmento ou uma variante da mesma;
- o dito elemento de 3’ UTR derivado de um gene de COX6B1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 27, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO:
Petição 870190070557, de 24/07/2019, pág. 345/401
281/306
28, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28, ou um fragmento ou uma variante da mesma; ou
- o dito elemento de 3’ UTR derivado de um gene de Ndufal compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 31, ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 32, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 32 ou um fragmento ou uma variante da mesma.
6. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 5, em que a proteína associada a CRISPR compreende proteínas do tipo selvagem associadas a CRISPR, homólogos, variantes, fragmentos e derivados das mesmas.
7. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 6, em que a dita proteína associada a CRISPR é selecionada de
Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX ou CasY.
8. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 7, em que o dito ácido nucleico artificial compreendendo uma sequência de ácido nucleico codificando uma proteína associada a CRISPR compreendendo ou consistindo em uma sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441;
Petição 870190070557, de 24/07/2019, pág. 346/401
282/306
10999-11001; 442-1345, ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% identidade de sequência com a sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma variante ou fragmento de qualquer uma dessas sequências.
9. A molécula de ácido nucleico artificial, de acordo com o item 8, em que os ditos derivados da proteína associada a CRISPR compreendem pelo menos um domínio efetor adicional, opcionalmente selecionado de KRAB, CSD, WRPW, VP64, p65AD e Mxi.
10. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 9, em que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS), opcionalmente selecionado de um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964, e um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382: 384; 11957: 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou um NLS tendo uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de
Petição 870190070557, de 24/07/2019, pág. 347/401
283/306 acordo com: 12021-14274.
11. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 10, em que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando uma proteína ou marcador de peptídeo.
12. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 11, em que a pelo menos uma região de codificação da dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NO: 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 6020-6033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 11591-11593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714-4617; 4874-5777; 60346937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 46344647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 35063519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 36023615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 95149527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 23782391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 24742487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 97229735; 9834-9847; 9946-9959; 10058-10071; 10170-10183-1028210295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 58105823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 59065919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 60026015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 9994-10007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 6986-6999;
Petição 870190070557, de 24/07/2019, pág. 348/401
284/306
7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066-7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 10122-10135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 8162-8175; 81788191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 8258-8271; 82748287' 8290-8302' 8306-8319' 8322-8335' 9678-9591'9690-9703' 98029815; 9914-9927; 10026-10039; 10138-10151; 10250 -10263; 1036210375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
13. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 12, em que a dita molécula de ácido nucleico artificial compreende uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 10552; 3458-3459; 3460-3473; 22982299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259; 23002313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 34883489; 10396; 2328-2329; 10395; 4648-4649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 35203521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 36163617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 95289529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 23602361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456
Petição 870190070557, de 24/07/2019, pág. 349/401
285/306
2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 95129513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 46804681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 47764777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 95449545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 58405841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 59365937; 5952-5953; 5968-5969; 5984-5985; 6000-6001; 6016-6017; 95609561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 8160-8160; 8176-8177; 8192-8193; 82088209; 8224-8225; 8240-8241; 8256-8257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 10152-10153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 1057910580; 10585-10586; 10588-10589; 10591-10592; 10594-10595;
Petição 870190070557, de 24/07/2019, pág. 350/401
286/306
10597-· 10598; 10554-10574; 10601; 10602; 10615; 10616; 10629;
10630; 10643; 10644; 10657; 10658; 10671; 10672; 10685; 10686;
10699; 10700; 10713; 10714; 10727; 10728; 10741; 10742; 10755;
10756; 10769; 10770; 10783; 10784; 10797; 10798; 10811; 10812;
10825; 10826; 10839; 10840; 10853; 10854; 10867; 10868; 10881;
10882; 10603; 10604; 10617; 10618; 10631; 10632; 10645; 10646;
10659; 10660; 10673; 10674; 10687; 10688; 10701; 10702; 10715;
10716; 10729; 10730; 10743; 10744; 10757; 10758; 10771; 10772;
10785; 10786; 10799; 10800; 10813; 10814; 10827; 10828; 10841;
10842; 10855; 10856; 10869; 10870; 10883; 10884; 10605; 10606;
10619; 10620; 10633; 10634; 10647; 10648; 10661; 10662; 10675;
10676; 10689; 10690; 10703; 10704; 10717; 10718; 10731; 10732;
10745; 10746; 10759; 10760; 10773; 10774; 10787; 10788; 10801;
10802; 10815; 10816; 10829; 10830; 10843; 10844; 10857; 10858;
10871; 10872; 10885; 10886; 10607; 10608; 10621; 10622; 10635;
10636; 10649; 10650; 10663; 10664; 10677; 10678; 10691; 10692;
10705; 10706; 10719; 10720; 10733; 10734; 10747; 10748; 10761;
10762; 10775; 10776; 10789; 10790; 10803; 10804; 10817; 10818;
10831; 10832; 10845; 10846; 10859; 10860; 10873; 10874; 10887;
10888; 10609; 10610; 10623; 10624; 10637; 10638; 10651; 10652;
10665; 10666; 10679; 10680; 10693; 10694; 10707; 10708; 10721;
10722; 10735; 10736; 10749; 10750; 10763; 10764; 10777; 10778;
10791; 10792; 10805; 10806; 10819; 10820; 10833; 10834; 10847;
10848; 10861; 10862; 10875; 10876; 10889; 10890; 10611; 10612;
10625; 10626; 10639; 10640; 10653; 10654; 10667; 10668; 10681;
10682; 10695; 10696; 10709; 10710; 10723; 10724; 10737; 10738;
10751; 10752; 10765; 10766; 10779; 10780; 10793; 10794; 10807;
10808; 10821; 10822; 10835; 10836; 10849; 10850; 10863; 10864;
10877; 10878; 10891; 10892; 9304-9305; 9320-9321; 9336-9337; 93529353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448
Petição 870190070557, de 24/07/2019, pág. 351/401
287/306
9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 98329833; 9944-9945; 10056-10057; 10168-10169; 10280-10281; 1039210393; 10408; 10415; 10422; 10429; 10436; 10443; 10450: 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
14. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 13, em que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 11011-11042; 112491128011131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 11044-11116; 11282-11354: 1116411236; 11400-11472; 11518-11590; 11636-11708; 11754-11826;
11872-11944; 11011-11042; 11249-11280; 11044-11116; 1128211354; 11131-11162; 11367-11398; 11485-11516; 11603-11634;
11721-11752; 11839-11870; 11164-11236; 11400-11472; 1151811590; 11636-11708; 11754-11826; 11872-11944; 11120-11122;
11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712;
11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366; 11242-11248; 11478-11484; 11596-11602; 11714-11720; 1183211838; 11950-11956 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
15. A molécula de ácido nucleico artificial, de acordo com qualquer um dos itens 1 a 14, em que a dita molécula de ácido nucleico artificial é um RNA.
16. O RNA, de acordo com o item 15, em que o RNA é mono-, bí
Petição 870190070557, de 24/07/2019, pág. 352/401
288/306 ou multicistrônico.
17. O RNA, de acordo com o item 14 ou 15, em que o RNA é um mRNA, um RNA viral ou um RNA de replicou.
18. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 17, em que o dito ácido nucleico artificial é um ácido nucleico modificado, preferivelmente um ácido nucleico estabilizado.
19. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 18, em que
- o teor de G/C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que
- o teor de C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que
- os códons na pelo menos uma região de codificação do ácido nucleico artificial são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação do dito aácido nucleico artificial,
- em que a sequência de aminoácido codificada pelo ácido nucleico artificial preferivelmente não está sendo modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico artificial do tipo selvagem correspondente.
20. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 19, que compreende uma estrutura de 5’-CAP, preferivelmente m7GpppN ou Cap1.
21. O ácido nucleico artificial, preferivelmente RNA, de
Petição 870190070557, de 24/07/2019, pág. 353/401
289/306 acordo com qualquer um de 1 a 20, que compreende pelo menos um tronco-alça de histona.
22. O ácido nucleico artificial, preferivelmente RNA, de acordo com o item 21, em que o pelo menos um tronco-alça de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (I) ou (II) abaixo:
fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) [NÜ-2GN3-5] [No-4(U/T)No-4] [N3.5CN0.2J '-------v<----------V----------tronco 1 ajça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):
Ni-6 [N0-2GN3-5] [NO-4(U/T)No-4] [N3-5CN0-2] Ni-6
------V------y *—r—; * ¥ troncol troncol tronco2 tronco2 elemento limítrofe elemento limítrofe em que:
elementos Hmítrofes de troncol ou tronco2 Ni-s é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de 2 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C, ou um análogo de nucleotídeo do mesmo, troncol [N0-2GN3-5] é reverso complementar ou parcialmente reverso complementar com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotídeos;
em que Nwé uma sequência consecutiva de 0 a 2, preferi
Petição 870190070557, de 24/07/2019, pág. 354/401
290/306 velmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucieotídeo selecionado de A, U, T, G e C ou um análogo de nucieotídeo do mesmo;
em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucieotídeo selecionado de A, U, T, GeC ou um análogo de nucieotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma, contanto que sua nucieotídeo citidina complementar no tronco2 seja substituída por guanosina;
sequência de alça [No-4(U/T)No-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nudeotídeos;
em que cada No-4 é independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucieotídeo selecionada de A, U, T, G e C ou um análogo de nudeotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva de entre 5 a 7 nudeotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro seledonado de um nudeotídeo selecionado de A, U, T, G e C ou um análogo de nucieotídeo do mesmo;
em que No-zé uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nudeotídeo selecionado de
Petição 870190070557, de 24/07/2019, pág. 355/401
291/306
A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contendo que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;
em que o troncol e o tronco2 são capazes de emparelhamento de base um com o outro formando uma sequência reversa complementar, em que o emparelhamento de base pode ocorrer entre o troncol e o tronco2, ou formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre o troncol e tronco2.
24. O ácido nucleico artificial, preferivelmente RNA, de acordo com o item 19 ou 20, em que a pelo menos uma histona alçatronco compreende uma sequência de ácido nucleico de acordo com a fórmula (Ia) ou (Ha) abaixo:
fórmula (Ia) (sequência de alça-tronco sem elementos limítrofes de tronco) [N0.1GN3-5] [Ni-3(U/T)No-2] [N3-5CN0-1] <_____________________________/ X K, troncol a:3 tronco2 fórmula (Ha) (sequência de tronco-alça com elementos limítrofes de tronco):
N2-5 [N(mGN3-5] [NiXU/T)No-2] [N3-5CN0-1] N2-5 '—r'·' ''..............>·-.............' -----------yl y J ’V>
troncol troncol aa tronco2 tronco2 efements limítrofe elemento limítrofe
25. O ácido nucleico artificial, preferivelmente RNA, de
Petição 870190070557, de 24/07/2019, pág. 356/401
292/306 acordo com qualquer um dos itens 1 a 24, compreendendo opcionalmente uma sequência de poli(A), compreendendo preferivelmente 10 a 200, 10 a 11,40 a 80 ou 50 a 70 nucleotídeos de adenosina.
26. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 25, compreendendo opcionalmente uma sequência de poli(C), compreendendo preferivelmente 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos de citosina.
27. O ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 26, o qual compreende, preferivelmente na direção 5’ para 3!, os elementos que seguem:
a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1,
b) um elemento de 5!-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como definido em qualquer um dos itens 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma,
c) pelo menos uma sequência de codificação como definido em qualquer um dos itens 7 a 13,
d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3’-UTR como definido em qualquer um dos itens 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 15; 17; 19; 21; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,
e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina,
f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos
Petição 870190070557, de 24/07/2019, pág. 357/401
293/306 cisteína, e
g) opcionalmente um tronco-alça de histona (HSL).
28. Composição compreendendo a molécula de ácido nucleico artificial, preferivelmente um RNA, de acordo com qualquer um dos itens 1 a 26, e um carreador e/ou excipiente farmaceuticamente aceitável.
29. A composição, de acordo com o item 28, em que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais compostos catiônicos ou policatiônicos, preferivelmente com polímeros catiônicos ou policatiônicos, peptídeos ou proteínas catiônicos ou policatiônicos, por exemplo, protamina, polissacarídeos catiônicos ou policatiônicos e/ou lipídeos catiônicos ou policatiônicos.
30. A composição, de acordo com o item 29, em que a razão N/P da molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais peptídeos ou proteínas catiônicos ou policatiônicos está na faixa de cerca de 0,1 a 10, incluindo uma faixa de cerca de 0,3 a 4, de cerca de0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5.
31. A composição, de acordo com qualquer um dos itens 28 a 30, em que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais lipídeos, desta maneira formando lipossomas, nanopartículas de lipídeo e/ou lipoplexos.
32. A composição, de acordo com qualquer um dos itens 28 a 31, compreendendo ainda pelo menos um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionar a proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
33. Kit, preferivelmente kit de partes, compreendendo a molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27 ou a composição de acordo com qualquer
Petição 870190070557, de 24/07/2019, pág. 358/401
294/306 um dos itens 28 a 32, e opcionalmente um veículo líquido e/ou opcionalmente instruções técnicas com informação sobre a administração e dosagem da molécula de ácido nucleico artificial ou da composição.
34. O kit, de acordo com o item 33, em que o kit contém como uma parte solução de Ringer com Lactato.
35. O kit, de acordo com o item 33 ou 34, compreendendo ainda um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligada à mesma.
36. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso como um medicamento.
37. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com o item 33 a 35 para uso em terapia de gene.
38. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso em um método de modulação da expressão de um gene de interesse, compreendendo administração a um paciente com necessidade da mesma (a) a dita molécula de ácido nucleico artificial, preferivelmente RNA, a dita composição ou dito kit e (b) um RNAguia (gRNA) ou um ácido nucleico codificando o mesmo, o dito sgRNA sendo capaz de direcionar a proteína associada a CRISPR a um gene de interesse ou um elemento regulador operavelmente ligado ao mesmo.
39. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de
Petição 870190070557, de 24/07/2019, pág. 359/401
295/306 acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de proteína associada a CRISPR codificada por pelo menos uma sequência de codificação.
40. A molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com o item 33 a 35 para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente à ativação, inativação ou manipulação de um gene de interesse ou através da modulação da expressão de um gene de interesse.
41. A molécula de ácido nucleico artificial, preferivelmente RNA, composição ou kit para uso de acordo com o item 40, em que a dita doença, distúrbio ou condição é selecionado de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias e doenças infecciosas.
42. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para aumento da expressão da dita proteína associada a CRISPR, opcionalmente em terapia de gene.
43. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, a composição de acordo com qualquer um dos itens 28 a 32 ou o kit de acordo com os itens 33 a 35 para modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR codificada.
44. Um método para modulação da expressão de um gene de interesse compreendendo as etapas de:
Petição 870190070557, de 24/07/2019, pág. 360/401
296/306
a) provisão de uma molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27;
b) provisão de um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma,
c) contato de uma célula, tecido ou organismo com a dita molécula de ácido nucleico artificial, preferivelmente RNA, e dita gRNA ou ácido nucleico codificando o mesmo sob condições adequadas para modular eficácia de expressão do dito gene de interesse.
45. Um método de tratamento ou prevenção de um distúrbio, em que o método compreende administração a um indivíduo com necessidade do mesmo de uma quantidade eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 27, da composição de acordo com qualquer um dos itens 28 a 32 ou do kit de acordo com os itens 33 a 35, e um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
46. O método, de acordo com o item 45, em que o distúrbio é uma doença, distúrbio ou condição condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através da modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR.
47. O método, de acordo com o item 45 ou 46, em que o distúrbio é uma doença, distúrbio ou condição condescendente através da ativação, inativação ou através da mutação de um gene de interesse ou através da alteração da expressão de um gene de interesse.
48. Um método para aumento da eficácia de expressão de
Petição 870190070557, de 24/07/2019, pág. 361/401
297/306 uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo uma região de codificação codificando uma proteína associada a CRISPR, o dito método compreendendo (a) associação da dita região de codificação com pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP ou NDUFA4 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante da mesma;
(b) associação da dita região de codificação com pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB ou RPS9 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou uma variante da mesma; e (c) obtenção de uma molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer um dos itens 1 a 47. DESCRIÇÃO DAS FIGURAS [0524] A Figura 1 mostra o efeito de combinação de UTR diferentes sobre o nível de expressão de Cas9 em células HeLa como detalhado no Exemplo 1 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1.
[0525] A Figura 2 mostra o efeito de combinações de UTR diferentes sobre o nível de expressão de Cas9 em células Hek293T como detalhado no Exemplo 2 (ln~Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1.
[0526] A Figura 3 mostra o efeito de combinações de UTR diferentes sobre o nível de expressão de Cas9 em células HepG2 como detalhado no Exemplo 1 (Western blot). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0527] A Figura 4 mostra o nível de expressão de construtos de
Petição 870190070557, de 24/07/2019, pág. 362/401
298/306 mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 2 (Western blot). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0528] A Figura 5 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 2 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0529] A Figura 6 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 1 (In-Cell Western) em comparação com um mRNA de Cas9 comercialmente disponível. O eixo y é normalizado para mostrar um nível de expressão de 100% para o mRNA de Cas9 comercial.
[0530] A Figura 7 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HeLa como detalhado no Exemplo 1 (In-Cell Western). O eixo y é normalizado para mostrar um nível de expressão de 100% para a combinação de UTR RPL32/ALB7.1 [0531] A Figura 8 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células Hek293T como detalhado no Exemplo 2 (In-Cell Western) em comparação com um mRNA de Cas9 comercialmente disponível.
[0532] A Figura 9 mostra o nível de expressão de construtos de mRNA de spCas9 otimizados em células HepG2 como detalhado no Exemplo 2 (Western blot) em comparação com um mRNA de Cas9 comercialmente disponível. O eixo y é normalizado para mostrar um nível de expressão de 100% para o mRNA de Cas9 comercial.
[0533] A Figura 10 mostra atividade de edição de DNA de spCas9 expressa a partir de construtos de mRNA como detalhado no Exemplo 3 através do ensaio de nuclease de incompatibilidade/ensaio de detecção de incompatibilidade. A: amplificação por PCR, B: ensaio de detecção de incompatibilidade.
Petição 870190070557, de 24/07/2019, pág. 363/401
299/306 [0534] A Figura 11 mostra um nível de expressão de construtos de mRNA de Cpf1 otimizados em HepG2 em relação a RPL32/ALB7 em %. O eixo y é normalizado para mostrar um nível de expressão de 100% para mRNA de Cpf1 da combinação de UTR RPL32/ALB7.
[0535] A Figura 12 mostra o nível de expressão de construtos de mRNA de Cpf1 otimizados em HeLa em relação a RPL32/ALB7 em %. O eixo y é normalizado para mostrar um nível de expressão de 100% para mRNA de Cpf1 da combinação de UTR RPL32/ALB7.
Exemplos [0536] Abaixo são apresentados exemplos particulares ilustrando várias modalidades e aspectos da invenção. No entanto, a presente invenção não deve ser limitada em escopo pelas modalidades específicas descritas aqui. As preparações e exemplos que seguem são dados para permitir que aqueles versados na técnica compreendam mais claramente e pratiquem a presente invenção. A presente invenção, no entanto, não é limitada em escopo pelas modalidades exemplificadas, que são pretendidas como ilustração de aspectos únicos da invenção apenas, e métodos que são funcionalmente equivalentes estão dentro do escopo da invenção. Na verdade, várias modificações da invenção em adição àquelas descritas aqui se tornarão prontamente aparentes àqueles versados na técnica a partir da descrição acima, figuras acompanhantes e exemplos abaixo. Todas tais modificações se encaixam no escopo das reivindicações apensas.
Exemplo 1: detecção de expressão de Cas9 em células HeLa, Hek293T e HepG2 usando Análises In-Cell Western e Western Blot [0537] As células foram semeadas em placas de 96 poços (Microplaca Nunc Preta c/ Fundo Óptico Transparente; Thermo Fisher) com uma densidade de 10.000 células/poço para HeLa; 20.000 células/poço para Hek293T e HEPG2) em um meio celular completo compatível (200 μΙ). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da
Petição 870190070557, de 24/07/2019, pág. 364/401
300/306 transfecção, o meio completo foi substituído com 50 μΙ de meio Opti-MEM livre de soro (Thermo Físher). 100 ng de cada mRNA, isto é, SEQ ID NO: 14274 (RPL32/ALB7.1), SEQ ID NO: 14275 (HSD17B4/CASP1.1), SEQ ID NO: 14276 (SLC7A3.1/PSMB3.1), SEQ ID NO: 14277 (SLC7A3.1/CASP1.1), SEQ ID NO: 14278 (NOSIP.1/PSMB3.1), SEQ ID NO: 14279 (NDUFA4.1/RPS9.1), SEQ ID NO: 14280 (NDUFA4.1Z PSMB3.1), SEQ ID NO: 14281 (HSD17B4/PSMB3.1) e SEQ ID NO: 14282 (HSD17B4/RPS9.1) foram lipocomplexados usando Lipofectamine 3000 em 50 μί de Opti-MEM com uma razão de mRNA:Upofectamina 3000 de 1:1,5. mRNAs Hpocomplexados foram então adicionados a placas de 96 poços correspondentes. Três horas após a transfecção, o meio completo foi substituído com 100 μί de meio celular completo. As células foram mantidas ainda por 24 horas a 37° C, CO2 5% antes da realização de ln~Cell Western.
[0538] Para análise In-Cell Western (HeLa e Hek293T), as células foram lavadas duas vezes com PBS1X e fixadas com uma solução de metanol/acetona (1:1) por 10 minutos. Após a fixação, as células foram subsequentemente lavadas três vezes com PBS1X por 5 minutos cada uma. Para evitar ligações não específicas, as células foram bloqueadas por 1 hora em temperatura ambiente com tampão de bloqueio Odyssey (PBS, LI-COR) suplementado com Triton X100 0,01% e então incubadas por 1 hora e meia com anticorpos primários, isto é, anticorpos de coelho policlonais contra spCas9 (1/1000; #632606; Clontech/Takara). As células foram então lavadas 4 vezes com Tween-20 0,1 % em PBS1X por 5 minutos sob agitação suave (80 rpm).
[0539] Subsequentemente, anticorpos secundários, isto é, anticorpos policlonais anticoelho de cabra infrared dye® 800 CW (1/250; LICOR), foram misturados com Cell-Tag 700 Stain (1/5000; LI-COR) em tampão de bloqueio Odyssey e incubados no escuro por uma hora em temperatura ambiente. Uma etapa de lavagem foi realizada como acima
Petição 870190070557, de 24/07/2019, pág. 365/401
301/306 descrito antes da varredura usando o sistema de imagem Odyssey® CLx (LI-COR). Quantificação relativa (800/700) foi obtida usando Image Studio™ Life Software. Fluorescência de base obtida a partir de poços lipofectados com mRNA foi subtraída para medição e os resultados comparados com a expressão de um RNA de codificação de Cas9 comercialmente disponível (TriLink BioTechnologies, LLC, No. Cat. L-6125).
[0540] Para células HepG2, a análise foi realizada usando Western blot. As placas foram lavadas duas vezes em PBS1X e incubadas diretamente com 50 μί de tampão de carregamento de amostra 1X (Biorad) contendo Endonuclease de Benzonase (Mlllipore) por 20 minutos em temperatura ambiente. As placas foram então incubadas a 95° C por 5 minutos e centrifugadas.
[0541] 15 μΙ de lisatos foram processados em 10% de géis MiniProtean TGX (Biorad) e transferidos para membranas de nitrocelulose (100V; 90 minutos). As membranas foram lavadas três vezes com Triton X100 0,1 em PBS por dez minutos cada uma e saturadas com 100% de leite em PBS1C de um dia para o outro a 4o C.
[0542] Anticorpos de coelho policlonais spCas9 (1/1000; #632606; Clontech/Takara) e um anticorpo Anti-beta Actina monoclonal de camundongo controle (1/10000; ab6276; Abeam) em 5% de leite em PBS1X foram incubados por uma hora em temperatura ambiente. As membranas foram subsequentemente lavadas três vezes em Tween-20 0,1% em TBS1X. Anticorpos policlonal anticoelho de cabra Infrared dye® 800 CW e anticamundongo de cabra Infrared dye® (1/7500 e 1/10000, respectivamente, foram usados para detecção). A etapa de lavagem como descrito abaixo foi repetida três vezes antes da varredura usando sistema de imagem Odyssey® CLx (LI-COR). Intensidade da faixa e quantificação relativa foram realizadas usando Studio™ Lite Software (LI-COR).
[0543] mRNAs codificando Cas9 compreendendo as combinações
Petição 870190070557, de 24/07/2019, pág. 366/401
302/306 de UTR de acordo com a invenção exibem expressão aumentada (Figura 1, Figura 3, Figura 7) que é altamente superior comparado com mRNA de Cas9 comercialmente disponível (Figura 6).
Exemplo 2: detecção de expressão de Cas9 em células HeLa usando análise Western blot [0544] Células HeLa foram semeadas em placas de 12 poços (Nunc; Thermo Fisher) com uma densidade final de 200.000 células/poço para HeLa em meio celular completo (RPMI; Soro bovino fetal 10%; penicilina/estreptomicina 1% e L-Glutamina 1%; Lonza). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da transfecção, 0 meio completo foi substituído com 750 μΙ de meio Opti-MEM sem soro (Thermo Fisher). Um pg de mRNA codificando Cas9, isto é, SEQ ID NO: 14274 (RPL32/ALB7.1), SEQ ID NO: 14275 (HSD17B4/CASP1.1), SEQ ID NO: 14276 (SLC7A3.1/PSMB3.1), SEQ ID NO: 14277 (SLC7A3.1Z CASP1.1), SEQ ID NO: 14278 (NOSIP.1/PSMB3.1), SEQ ID NO: 14279 (NDUFA4.1/RPS9.1), SEQ ID NO: 14280 (NDUFA4.1/PSMB3.1), SEQ ID NO: 14281 (HSD17B4/PSIVIB3.1) e SEQ ID NO: 14282 (HSD17B4Z RPS9.1), compreendendo a combinação de UTR da invenção (cf. Legendas na Figura) foi Hpocomplexado usando Lipofectamina 3000 em 250 μΙ de Opti-MEM com uma razão de mRNA:Lipofectamina 3000 de 1:1,5. mRNAs lipocomplexados foram então adicionados a cada poço. Três horas após transfecção, 0 meio completo foi substituído com 1 ml de meio celular completo. As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização da extração de proteína.
[0545] Os poços foram lavados duas vezes em PBS1X e incubados diretamente com 100 μΙ de tampão de carregamento de amostra 1X (Biorad) contendo Endonuclease de Benzonase (Millipore) por 20 minutos em temperatura ambiente. As células foram raspadas e os lisatos transferidos para tubos Eppendorf. As amostras foram então desnaturadas a 95° C por 5 minutos, esfriadas em gelo por cinco minutos e centrifugadas em
Petição 870190070557, de 24/07/2019, pág. 367/401
303/306 uma velocidade máxima por dois minutos antes do carregamento.
[0546] 15 μΙ de lisatos foram processados em 10% de géis MiniProtean TGX (Biorad) e transferidos para membranas de nitrocelulose (100V; 90 minutos). As membranas foram lavadas três vezes com Triton X100 0,1 em PBS por dez minutos cada uma e saturadas com 100% de leite em PBS1C de um dia para o outro a 4o C.
[0542] Anticorpos de coelho policlonais spCas9 (1/1000; #632606; Clon-tech/Takara) e um anticorpo Anti-beta Actina monoclonal de camundongo (1/10000; ab6276; Abeam) em 5% de leite em PBS1X foram incubados por uma hora em temperatura ambiente. As membranas foram subsequentemente lavadas três vezes em Tween-20 0,1% em TBS1X. Anticorpos policlonal anticoelho de cabra Infrared dye® 800 CW e anticamundongo de cabra Infrared dye® (1/7500 e 1/10000, respectivamente, foram usados para detecção). A etapa de lavagem como descrito abaixo foi repetida três vezes antes da varredura usando sistema de imagem Odyssey® CLx (LI-COR). Intensidade da faixa e quantificação relativa foram realizadas usando Studio™ Lite Software (LI-COR).
[0543] Expressão de Cas9 a partir dos mRNAs da invenção foi comparada com a expressão a partir de um RNA codificando Cas9 comercialmente disponível (TriLink BioTechnologies, LLC, No. Cat. L-6125). mRNAs codificando Cas9 compreendendo as combinações de UTR de acordo com a invenção exibem expressão aumentada (Figura 2, Figura 4, Figura 5) que é altamente superior comparado com mRNA de Cas9 comercialmente disponível (Figuras 8, Figura 9).
Exemplo 3: determinação de atividade de spCas9 in vitro usando ensaio de detecção de incompatibilidade [0547] As células foram semeadas em placas de 96 poços com uma densidade de 50.000 células/poço para HeLa em um meio celular completo (200 μΙ de RPMI; soro bovino fetal 10%; penicilina/estreptomicina 1% e L-Glutamina 1%; Lonza). As células foram mantidas a 37° C, CO2
Petição 870190070557, de 24/07/2019, pág. 368/401
304/306
5% por 24 horas, No dia da transfecção, cem ng de mRNA de spCas9 (SEQ ID NO: 14274 = RPL32/ALB7.1, SEQ ID NO: 14281 = HSD17B4/PSMB3.1 - cada mRNA uma vez sem adição de poliadenilação enzimática e uma vez com poliadenilaçâo enzimática adicional; como referência RNA codificando Cas9 comercialmente disponível TriLink BioTechnologies, LLC, No. Cat. L-6125 foi usado) foram lipocomplexados com uma mistura de crRNA contra peptidilpropil isomerase B humana (PPIB, isto é, Ciclofilina B; Dharmacon; SO-2544646G) (25nM) e tracrRNA (25nM; Dharmacon; U-002000-20) usando transfecção de mRNA TranslT® (Mirus Bio). Como controles negativos mRNA de spCas9 ou RNAs-guia ou ambos foram omitidos na mistura de transfecção. Um volume final de 10 μΙ foi adicionado ao meio na placa de 96 poços. Três horas após a transfecção, o meio complexo foi substituído com 100 μΙ de meio celular completo. As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização da extração de células.
[0548] As cavidades foram lavadas uma vez com PBS1X e as células Usadas a 56° C por 30 minutos usando 100 μΙ de tampão Phusion HF 1X contendo 1 mg/ml de Proteinase K e 0,5 mg/ml de RNAse A (Thermo Fisher). Uma etapa de desnaturação a 95° C por 5 minutos foi adicionada no final da lise.
[0549] Cinco μΙ de lisatos de célula foram usados para amplificação por PCR de fragmento hPPIB usando primers específicos contra PPIB humano (Edit~R PPIB crRNA Control Kit; UK-007060; Dharmacon) e po~ limerase de DNA de alta fidelidade Phusion hot-start II (Thermo Fisher). Condições de PCR para amplificação foram 0 que segue:
1) etapa de desnaturação: 98° C por 3 min;
2) Reação cíclica de PCR touchdown 10x (desnaturação 98° C por 10 seg; anelamento de tochdown 72° C-1° C/ciclo por 15 seg; extensão 72° C por 30 seg);
3) reação cíclica de PCR normal 25x (desnaturação 98° C
Petição 870190070557, de 24/07/2019, pág. 369/401
305/306 por 10 seg; anelamento 62° C por 15 seg: extensão 72° C por 30 seg):
4) extensão final 72° C por 10 minutos.
[0550] Amostras de PCR foram então aquecidas a 95° C por 10 minutos e lentamente resfriadas para temperatura ambiente por mais de 15 minutos.
[0551] O ensaio de detecção de incompatibilidade foi feito usando 10 μΙ de reação de PCR, Tampão NEB 2 e endonuclease T7 (New Englang BioLabs) durante um período de incubação de 25 min a 37° C. O volume de reação todo foi imediatamente processado em gel de agarose 2%. A faixa esperada foi 505 pb (nenhuma edição) ou respectivamente 330 pb e 174 pb (com edição).
[0552] spCas9 expressa a partir dos mRNAs compreendendo a combinação de LJTR da invenção foi capaz de editar DNA-alvo e então funcional (Figuras 10A, B).
Exemplo 4: detecção de expressão de Cpf1 em células HeLa, Hek293T e HepG2 usando In-Cell Western [0553] As células foram semeadas em placas de 96 poços (Microplaca Nunc Preta c/ Fundo Óptico Transparente; Thermo Fisher) com uma densidade de 10.000 células/poço para HeLa; 20.000 células/poço para HEPG2 e Hek293T) em um meio celular completo compatível como usado antes (200 μΙ). As células foram mantidas a 37° C, CO2 5% por 24 horas. No dia da transfecção, 100 ng de mRNA, isto é, SEQ ID NO: 10549 (RPL32/ALB7), SEQ ID NO: 14289 (Mp68/Gnas.1), SEQ ID NO: 14290 (Ndufa4.1/PSMB3.1), SEQ ID NO: 14291 (HSD17B4/Gnas.1), SEQ ID NO: 14292 (HSD17B4/PSMB3.1) e SEQ ID NO: 14293 (Ndufa4.1/Alb7) (para transfecção de células HeLa e Hek293T) e 500 ng de mRNA, isto é, a SEQ ID NO idêntica (HepG2) foram lipocomplexados usando Lipofectamine Messenger Max em 50 ui de Opti-MEM com uma razão de mRNA:Lipofectamine Messenger Max de 1:1,5. mRNAs lipocomplexados foram então adicionados às placas de 96 poços correspondentes.
Petição 870190070557, de 24/07/2019, pág. 370/401
306/306
As células foram mantidas mais por 24 horas a 37° C, CO2 5% antes da realização de In-Cell Western.
[0554] Para análise In-Cell Western (HeLa, HepG2 e Hek293T), as células foram lavadas três vezes com PBS1X e fixadas com paraformaldeído 4% por 10 minutos. Após a fixação, as células foram subsequentemente lavadas três vezes com PBS1X por 5 minutos cada uma e permeabilizadas com Triton X100 2% em PBS por 15 minutos. Para evitar ligações não específicas, as células foram bloqueadas por 1 hora em temperatura ambiente com tampão de bloqueio Odyssey (PBS, LI-COR) e então incubadas por 1 hora e meia com anticorpos primários, isto é, anticorpos de coelho policlonais contra HA9 (1/1000; H6808; Sigma Aldrich). As células foram então lavadas 4 vezes com Tween-20 0,1% em PBS1X por 5 minutos sob agitação suave (80 rpm).
[0539] Subsequentemente, anticorpos secundários, isto é, anticorpos policlonais anticoelho de cabra Infrared dye® 800 CW (1/500; LICOR), foram misturados com Cell-Tag 700 Stain (1/5000; LI-COR) em tampão de bloqueio Odyssey e incubados no escuro por uma hora em temperatura ambiente. Uma etapa de lavagem foi realizada como acima descrito antes da varredura usando o sistema de imagem Odyssey® CLx (LI-COR). Quantificação relativa (800/700) foi obtida usando Image Studio™ Life Software. Fluorescência de base obtida a partir de poços lipofectados com mRNA foi subtraída para medição e os resultados comparados com a expressão de mRNA padrão da requerente.
[0555] mRNAs codificando Cpf1 compreendendo as combinações de UTR de acordo com a invenção exibem expressão fortemente aumentada que foi altamente superior comparado com um mRNA de Cpf1 de referência RPL32/Alb7. Expressão é dada com relação à RPL32/ALB7 em % como aparente a partir da Figura 11 e da Figura 12 (células HepG2 e HeLa).

Claims (47)

  1. REIVINDICAÇÕES
    1. Molécula de ácido nucleico artificial caracterizada pelo fato de que compreende
    a. pelo menos uma região de codificação codificando pelo menos uma proteína associada a CRISPR;
    b. pelo menos um elemento de região não traduzida 5’ (5’ UTR) derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em SLC7A3, ATP5A1, RPL32, HSD17B4, NOSIP, ASAH1, RPL31, TUBB4B, UBQLN2, MP68 e NDUFA4; e
    c. pelo menos um elemento de região não traduzida 3’ (3’ UTR) derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB, COX6B1, NDUFA1 e RPS9.
  2. 2. Molécula de ácido nucleico artificial, de acordo com a reivindicação 1, caracterizada pelo fato de que cada um dos ditos genes compreende a sequência de DNA de ocorrência natural e homólogos, variantes, fragmentos e sequências de RNA correspondentes da mesma.
  3. 3. Molécula de ácido nucleico artificial, de acordo com a reivindicação 1 ou 2, caracterizada pelo fato de que compreende
    a. pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene GNAS ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo;
    b. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS,
    Petição 870190070557, de 24/07/2019, pág. 23/401
    2/29 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante do mesmo; ou
    c. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    d. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    e. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    f. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL32 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de ALB ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    g. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1
    Petição 870190070557, de 24/07/2019, pág. 24/401
    3/29 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    h. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de CASP1 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    i. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de SLC7A3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    j. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de PSMB3 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    k. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    l. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de HSD17B4 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9
    Petição 870190070557, de 24/07/2019, pág. 25/401
  4. 4/29 ou de uma sequência de RNA correspondente, homólogo, fragmento ou variante do mesmo; ou
    m. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de ATP5A1 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou uma variante do mesmo; ou
    n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de COX6B1, ou de um homólogo, um fragmento ou variante do mesmo; ou
    n. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4, ou de um homólogo, fragmento ou uma variante do mesmo, e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS, ou de um homólogo, um fragmento ou variante do mesmo; ou
    o. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NDUFA4 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou uma variante do mesmo; ou
    p. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de NOSIP ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1 ou de um homólogo, um fragmento ou uma variante do mesmo; ou
    q. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de RPL31 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado
    Petição 870190070557, de 24/07/2019, pág. 26/401
  5. 5/29 de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou uma variante do mesmo; ou
    r. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de TUBB4B ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou uma variante do mesmo; ou
    s. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de UBQLN2 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de RPS9 ou de um homólogo, um fragmento ou uma variante do mesmo;
    t. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 gene ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de GNAS ou de um homólogo, um fragmento ou variante do mesmo; ou
    u. pelo menos um elemento de 5’ UTR derivado de uma 5’UTR de um gene de MP68 ou de um homólogo, um fragmento ou uma variante do mesmo e pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene de NDUFA1, ou de um homólogo, um fragmento ou variante do mesmo.
    4. Molécula de ácido nucleico artificial, de acordo com a reivindicação 3, caracterizada pelo fato de que compreendendo elementos de UTR de acordo com d, e, g ou I.
    5. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 4, caracterizada pelo fato de que
    -o dito elemento de 5’ UTR derivado de um gene de HSD17B4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 1 ou uma sequência de DNA tendo, em ordem
    Petição 870190070557, de 24/07/2019, pág. 27/401
  6. 6/29 crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 1 ou um fragmento ou uma variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 2, ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 2 ou um fragmento ou uma variante da mesma;
    - o dito elemento de 5’ UTR derivado de um gene de RPL32 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 21 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 21 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 22 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 22 ou um fragmento ou uma variante da mesma;
    -o dito elemento de 5’ UTR derivado de um gene de NDUFA4 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 9 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 9 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 10 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%
    Petição 870190070557, de 24/07/2019, pág. 28/401
  7. 7/29 ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 10 ou um fragmento ou uma variante da mesma;
    - o dito elemento de 5’ UTR derivado de urn gene de SLC7A3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 15 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 15, ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 16 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 16 ou um fragmento ou uma variante da mesma;
    - o dito elemento de 5’ UTR derivado de um gene de NOSIP compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 11 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 11 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 12 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 12 ou um fragmento ou uma variante da mesma;
    - o dito elemento de 5’ UTR derivado de um gene de ATP5A1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 5 ou uma sequência de DNA tendo, em ordem crescente
    Petição 870190070557, de 24/07/2019, pág. 29/401
  8. 8/29 de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 5 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 6 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 6 ou um fragmento ou uma variante da mesma;
    o dito elemento de 5’ UTR derivado de um gene de ASAH1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 3 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 3 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 4 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 4 ou um fragmento ou uma variante da mesma;
    o dito elemento de 5’ UTR derivado de um gene de Mp68 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 7 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 7 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 8 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 8 ou um fragmento ou uma variante da mesma;
    Petição 870190070557, de 24/07/2019, pág. 30/401
  9. 9/29 o dito elemento de 5’ UTR derivado de um gene de Rpl31 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 13 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 13 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 14 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 14 ou um fragmento ou uma variante da mesma;
    o dito elemento de 5’ UTR derivado de um gene de TUBB4B compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 17 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 17 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 18 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 18 ou um fragmento ou uma variante da mesma;
    o dito elemento de 5’ UTR derivado de um gene de Ubqln2 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 19 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de
    Petição 870190070557, de 24/07/2019, pág. 31/401
  10. 10/29 ácido nucleico de acordo com SEQ ID NO: 19 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 20 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 20 ou um fragmento ou uma variante da mesma;
    -o dito elemento de 3’ UTR derivado de um gene de GNAS compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 29 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 29 ou um fragmento ou variante da mesma; uma sequência de RNA de acordo SEQ ID NO: 30 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 30 ou um fragmento ou uma variante da mesma;
    - o dito elemento de 3’ UTR derivado de um gene de CASP1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 25 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 25 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 26 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 26 ou um fragmento ou uma variante da mesma;
    Petição 870190070557, de 24/07/2019, pág. 32/401
  11. 11/29
    - o dito elemento de 3’ UTR derivado de um gene de PSMB3 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 23 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 23 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 24 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 24, ou um fragmento ou uma variante da mesma;
    -o dito elemento de 3’ UTR derivado de um gene de ALB compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 35 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 35 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 36 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 36 ou um fragmento ou uma variante da mesma;
    -o dito elemento de 3’ UTR derivado de um gene de RPS9 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 33 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de
    Petição 870190070557, de 24/07/2019, pág. 33/401
  12. 12/29 ácido nucleico de acordo com SEQ ID NO: 33 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 34 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 34 ou um fragmento ou uma variante da mesma;
    - o dito elemento de 3’ UTR derivado de um gene de COX6B1 compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 27 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 27 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 28 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 28 ou um fragmento ou uma variante da mesma; ou
    - o dito elemento de 3’ UTR derivado de um gene de Ndufal compreende ou consiste em uma sequência de DNA de acordo com SEQ ID NO: 31 ou uma sequência de DNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 31 ou um fragmento ou variante da mesma; ou uma sequência de RNA de acordo com SEQ ID NO: 32 ou uma sequência de RNA tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de ácido nucleico de acordo com SEQ ID NO: 32 ou um fragmento ou uma variante da
    Petição 870190070557, de 24/07/2019, pág. 34/401
  13. 13/29 mesma.
    6. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 5, caracterizada pelo fato de que a proteína associada a CRISPR compreende proteínas do tipo selvagem associadas a CRISPR, homólogos, variantes, fragmentos e derivados das mesmas.
    7. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 6, caracterizada pelo fato de que a dita proteína associada a CRISPR é selecionada de Cas9, Cpf1 (Cas12), C2c1, C2c3, Cas13, CasX ou CasY.
    8. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 7, caracterizada pelo fato de que o dito ácido nucleico artificial compreende uma sequência de ácido nucleico codificando uma proteína associada a CRISPR compreendendo ou consistindo em uma sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com qualquer uma das SEQ ID NOs: 428-441; 10999-11001; 442-1345 ou uma variante ou fragmento de qualquer uma dessas sequências.
    9. Molécula de ácido nucleico artificial, de acordo com a reivindicação 8, caracterizada pelo fato de que os ditos derivados da proteína associada a CRISPR compreendem pelo menos um domínio efetor adicional, opcionalmente selecionado de KRAB, CSD, WRPW, VP64, p65AD e Mxi.
    10. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 9, caracterizada pelo fato de que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando um sinal de localização nuclear (NLS),
    Petição 870190070557, de 24/07/2019, pág. 35/401
  14. 14/29 opcionalmente selecionado de um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NOs: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964, e um NLS compreendendo ou consistindo em uma sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 1195811964 ou uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com SEQ ID NO: 426; 427; 10575; 381; 382; 384; 11957; 11958-11964 ou um NLS tendo uma sequência de aminoácido tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a sequência de aminoácido de acordo com: 12021-14274.
    11. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 10, caracterizada pelo fato de que o dito ácido nucleico artificial compreende ainda pelo menos uma sequência de ácido nucleico codificando uma proteína ou marcador de peptídeo.
    12. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 11, caracterizada pelo fato de que a pelo menos uma região de codificação da dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das 411; 2540-2553; 11117-11119; 11355-11357; 2554-3457; 1380-1393; 3700-3713; 4860-4873; 60206033; 7180-7193; 8340-8353; 11237-11239; 11473-11475; 1159111593; 11709-11711; 11827-11829; 11945-11947; 1394-2297; 3714
    Petição 870190070557, de 24/07/2019, pág. 36/401
  15. 15/29
    4617; 4874-5777; 6034-6937; 7194-8097; 8354-9257; 412; 3474-3887 2314-2327; 4634-4647; 5794-5807; 6954-6967; 8114-8127; 413-425; 3490-3503; 3506-3519; 3522-3535; 3538-3551; 3554-3567; 3570-3583; 3586-3599; 3602-3615; 3618-3631; 3634-3647; 3650-3663; 3666-3679; 3682-3695; 9514-9527; 9626-9639; 9738-9751; 9850-9863; 9962-9975, 10074-10087; 10186-10199; 10298-10311; 2330-2343; 2346-2359; 2362-2375; 2378-2391; 2394-2407; 2410-2423; 2426-2439; 2442-2455; 2458-2471; 2474-2487; 2490-2503; 2506-2519; 2522-2535; 9498-9511; 9610-9623; 9722-9735; 9834-9847; 9946-9959; 10058-10071; 10ΠΟΙ 0183-10282-10295; 4650-4663; 4666-4679; 4682-4695; 4698-4711; 4714-4727; 4730-4743; 4746-4759; 4762-4775; 4778-4791; 4794-4807; 4810-4823; 4826-4839; 4842-4855; 9530-9543; 9642-9655; 9754 -9767; 9866 -9879; 9978-9991; 10090-10103; 10202-10215; 10314-10327; 5810-5823; 5826-5839; 5842-5855; 5858-5871; 5874-5887; 5890-5903; 5906-5919; 5922-5935; 5938-5951; 5954-5967; 5970-5983, 5986-5999; 6002-6015; 9546-9559; 9658-9671; 9770-9783; 9882-9895; 999410007; 10106-10119; 10218-10231; 10330-10343; 6970-6983; 69866999; 7002-7015; 7018-7031; 7034-7047; 7050-7063; 7066 -7079; 7082-7095; 7098-7111; 7114-7127; 7130-7143; 7146-7159; 7162-7175; 9562-9575; 9674-9687; 9786-9799; 9898-9911; 10010-10023; 1012210135; 10234-10247; 10346-10359; 8130-8143; 8146-8159; 81628175; 8178-8191; 8194-8207; 8210-8223; 8226-8239; 8242-8255; 82588271; 8274-8287; 8290-8302; 8306-8319; 8322-8335; 9578-9591; 96909703; 9802-9815; 9914-9927; 10026-10039; 10138-10151; 10250 10263; 10362-10375; 9290-9303; 9306-9319; 9322-9335; 9338-9351; 9354-9367; 9370-9383; 9386-9399; 9402-9415; 9418-9431; 9434-9447; 9450-9463; 9466-9479; 9482-9495; 9594 -9607; 9706-9719; 9818-9831; 9930-9943; 10042-10055; 10154-10167; 10266-10279; 10378-10391; ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98%
    Petição 870190070557, de 24/07/2019, pág. 37/401
  16. 16/29 ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
    13. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 12, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial compreende uma sequência de ácido nucleico de acordo com qualquer uma das SEQ ID NOs: 10552; 3458-3459; 3460-3473; 2298-2299; 4618-4619; 5778-5779; 6938-6939; 8098-8099; 9258-9259 ; 2300-2313; 4620-4633; 5780-5793; 6940-6953; 8100-8113; 9260-9273; 3488-3489; 10396; 2328-2329; 10395; 46484649; 10397; 5808-5809; 10398; 6968-6969; 10399; 8128-8129; 10400; 9274-9287; 3504-3505; 3520-3521; 3536-3537; 3552-3553; 3568-3669; 3584-3585; 3600-3601; 3616-3617; 3632-3633; 3648-3649; 3664-3665; 3680-3681; 3696-3697; 9528-9529; 9640-9641; 9752-9753; 9864-9865; 9976-9977; 10088-10089; 10200-10201; 10312-10313; 10403; 10410; 10417; 10424; 10431; 10438; 10445; 10452; 10459; 10466; 10473; 10480; 10487; 10494; 10501; 10508; 10515; 10522; 10529; 10536; 10543; 2344-2345; 2360-2361; 2376-2377; 2392-2393; 2408-2409; 2424-2425; 2440-2441; 2456-2457; 2472-2473; 2489-2490; 2504-2505; 2520-2521; 2536-2537; 9512-9513; 9624-9625; 9736-9737; 9848-9849; 9960-9961; 10072-10073; 10184-10185; 10296-10297; 10402; 10409; 10416; 10423; 10430; 10437; 10444; 10451; 10458; 10465; 10472; 10479; 10486; 10493; 10500; 10507; 10514; 10521; 10528; 10535; 10542; 4664-4665; 4680-4681; 4696-4697; 4712-4713; 4728-4729; 4744-4745; 4760-4761; 4776-4777; 4792-4793; 4808-4809; 4824-4825; 4840-4841; 4856-4857; 9544-9545; 9656-9657; 9768-9769; 9880-9881; 9992-9993; 10104-10105; 10216-10217; 10328-10329; 10404; 10411; 10418; 10425; 10432; 10439; 10446; 10453; 10460; 10467; 10474; 10481; 10488; 10495; 10502; 10509; 10516; 10523; 10530; 10537; 10544; 5824-5825; 5840-5841; 5856-5857; 5872-5873; 5888-5889; 5904-5905; 5920-5921; 5936-5937; 5952-5953; 5968-5969; 5984-5985;
    Petição 870190070557, de 24/07/2019, pág. 38/401
  17. 17/29
    6000-6001; 6016-6017; 9560-9561; 9672-9673; 9784-9785; 9896-9897; 10008-10009; 10120-10121; 10232-10233; 10344-10345; 10405; 10412; 10419; 10426; 10433; 10440; 10447; 10454; 10461; 10468; 10475; 10482; 10489; 10496; 10503; 10510; 10517; 10524; 10531; 10538; 10545; 7033; 7048-7049; 7064-7065; 7080-7081; 7096-7097; 7112-7113; 7128-7129; 7144-7145; 7160-7161; 7176-7177; 9576-9577; 9688-9689; 9800-9801; 9912-9913; 10024-10025; 10136-10137; 10248-10249; 10360-10361; 10406; 10413; 10420; 10427; 10434; 10441; 10448; 10455; 10462; 10469; 10476; 10483; 10490; 10497; 10504; 10511; 10518; 10525; 10532; 10539; 10546; 8144-8145; 81608160; 8176-8177; 8192-8193; 8208-8209; 8224-8225; 8240-8241; 82568257; 8272-8273; 8288 -8289; 8304-8305; 8320-8321; 8336-8337; 9592-9593; 9704-9705; 9816-9817; 9928-9929; 10040-10041; 1015210153; 10264-10265; 10376-10377; 10407; 10414; 10421; 10428; 10435; 10442; 10449; 10456; 10463; 10470; 10477; 10484; 10491; 10498; 10505; 10512; 10519; 10526; 10533; 10540; 10547; 9288-9289; 10401; 10553; 10582-10583; 10579-10580; 10585-10586; 1058810589; 10591-10592; 10594-10595; 10597-10598; 10554-10574; 10601; 10602; 10615; 10616; 10629; 10630; 10643; 10644; 10657;
    10658; 10671; 10672; 10685; 10686; 10699; 10700; 10713; 10714;
    10727; 10728; 10741; 10742; 10755; 10756; 10769; 10770; 10783;
    10784; 10797; 10798; 10811; 10812; 10825; 10826; 10839; 10840;
    10853; 10854; 10867; 10868; 10881; 10882; 10603; 10604; 10617;
    10618; 10631; 10632; 10645; 10646; 10659; 10660; 10673; 10674;
    10687; 10688; 10701; 10702; 10715; 10716; 10729; 10730; 10743;
    10744; 10757; 10758; 10771; 10772; 10785; 10786; 10799; 10800;
    10813; 10814; 10827; 10828; 10841; 10842; 10855; 10856; 10869;
    10870; 10883; 10884; 10605; 10606; 10619; 10620; 10633; 10634;
    10647; 10648; 10661; 10662; 10675; 10676; 10689; 10690; 10703;
    10704; 10717; 10718; 10731; 10732; 10745; 10746; 10759; 10760;
    Petição 870190070557, de 24/07/2019, pág. 39/401
  18. 18/29
    10773; 10774; 10787; 10788; 10801; 10802; 10815; 10816; 10829;
    10830; 10843; 10844; 10857; 10858; 10871; 10872; 10885; 10886;
    10607; 10608; 10621; 10622; 10635; 10636; 10649; 10650; 10663;
    10664; 10677; 10678; 10691; 10692; 10705; 10706; 10719; 10720;
    10733; 10734; 10747; 10748; 10761; 10762; 10775; 10776; 10789;
    10790; 10803; 10804; 10817; 10818; 10831; 10832; 10845; 10846;
    10859; 10860; 10873; 10874; 10887; 10888; 10609; 10610; 10623;
    10624; 10637; 10638; 10651; 10652; 10665; 10666; 10679; 10680;
    10693; 10694; 10707; 10708; 10721; 10722; 10735; 10736; 10749;
    10750; 10763; 10764; 10777; 10778; 10791; 10792; 10805; 10806;
    10819; 10820; 10833; 10834; 10847; 10848; 10861; 10862; 10875;
    10876; 10889; 10890; 10611; 10612; 10625; 10626; 10639; 10640;
    10653; 10654; 10667; 10668; 10681; 10682; 10695; 10696; 10709;
    10710; 10723; 10724; 10737; 10738; 10751; 10752; 10765; 10766;
    10779; 10780; 10793; 10794; 10807; 10808; 10821; 10822; 10835;
    10836; 10849; 10850; 10863; 10864; 10877; 10878; 10891; 10892;
    9304-9305; 9320-9321; 9336-9337; 9352-9353; 9368-9369; 9384-9385; 9400-9401; 9416-9417; 9432-9433; 9448-9449; 9464-9465; 9480-9481; 9496-9497; 9608-9609; 9720-9721; 9832-9833; 9944-9945; 1005610057; 10168-10169; 10280-10281; 10392-10393; 10408; 10415; 10422; 10429; 10436; 10443; 10450; 10457; 10464; 10471; 10478; 10485; 10492; 10499; 10506; 10513; 10520; 10527; 10534; 10541; 10548 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
    14. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 13, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial compreende ou consiste em uma sequência de ácido nucleico de acordo com qualquer uma das SEQ
    Petição 870190070557, de 24/07/2019, pág. 40/401
  19. 19/29
    ID NOs: 11011-11042; 11249-1128011131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 1104411116; 11282-11354; 11164-11236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11011-11042; 1124911280; 11044-11116; 11282-11354; 11131-11162; 11367-11398; 11485- 11516; 11603-11634; 11721-11752; 11839-11870; 1116411236; 11400-11472; 11518-11590; 11636-11708; 11754-11826; 11872-11944; 11120-11122; 11240; 11241; 11358; 11359; 11476; 11477; 11594; 11595; 11712; 11713; 11830; 11831; 11948; 11949; 11123-11130; 11360-11366; 11242-11248; 11478-11484; 1159611602; 11714-11720; 11832-11838; 11950-11956 ou uma sequência de ácido nucleico tendo, em ordem crescente de preferência, pelo menos 50%, 60%, 70%, 80%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências de ácido nucleico.
    15. Molécula de ácido nucleico artificial, de acordo com qualquer uma das reivindicações 1 a 14, caracterizada pelo fato de que a dita molécula de ácido nucleico artificial é um RNA.
    16. RNA, de acordo com a reivindicação 15, caracterizado pelo fato de que o RNA é mono-, bi- ou multicistrônico.
    17. RNA, de acordo com a reivindicação 14 ou 15, caracterizado pelo fato de que o RNA é um mRNA, um RNA viral ou um RNA de replicon.
    18. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 17, caracterizado pelo fato de que o dito ácido nucleico artificial é um ácido nucleico modificado, preferivelmente um ácido nucleico estabilizado.
    19. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 18, caracterizado pelo fato de que
    Petição 870190070557, de 24/07/2019, pág. 41/401
  20. 20/29
    - o teor de G/C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de G/C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que
    - o teor de C da pelo menos uma região de codificação do ácido nucleico artificial é aumentado comparado com o teor de C da sequência de codificação correspondente do ácido nucleico artificial do tipo selvagem correspondente, e/ou em que
    - os códons na pelo menos uma região de codificação do ácido nucleico artificial são adaptados para uso de códon humano, em que o índice de adaptação de códon (CAI) é preferivelmente aumentado ou maximizado na pelo menos uma sequência de codificação do dito ácido nucleico artificial,
    -em que a sequência de aminoácido codificada pelo ácido nucleico artificial preferivelmente não está sendo modificada comparado com a sequência de aminoácido codificada pelo ácido nucleico artificial do tipo selvagem correspondente.
    20. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 19, caracterizado pelo fato de que compreende uma estrutura de 5’-CAP, preferivelmente m7GpppN ou Cap1.
  21. 21. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 20, caracterizado pelo fato de que compreende pelo menos um tronco-alça de histona.
  22. 22. Ácido nucleico artificial, preferivelmente RNA, de acordo com a reivindicação 21, caracterizado pelo fato de que o pelo menos um tronco-alça de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (I) ou (II) abaixo:
    fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco)
    Petição 870190070557, de 24/07/2019, pág. 42/401
    21/29 [N0.2GN3-5] [N0-4(U/T)hM [N3-5CN0.2] tronco1 alça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):
    Ni-6 [N0-2GN3-5] [N(m(U/T)N(m] [N -.sCNg-,·] Ni-b troncoi troncoí gjça tronco2 tronco2 elemento limítrofe elemento limítrofe em que elementos limítrofes de troncoí ou tronco2 N1-6 é uma sequência consecutiva de 1 a 6, preferivelmente de 2 a 6, mais preferivelmente de 2 a 5, ainda mais preferivelmente de 3 a 5, sobretudo preferivelmente de 4 a 5 ou 5 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, troncoí [N0-2GN3-5] é reverso complementar ou parcialmente reverso complementar com elemento de tronco2, e é uma sequência consecutiva entre 5 a 7 nucleotideos;
    em que Νο-2θ uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;
    em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo, e em que G é guanosina ou um análogo da mesma, e pode ser opcionalmente substituída por uma citidina ou um análogo da mesma,
    Petição 870190070557, de 24/07/2019, pág. 43/401
    22/29 contanto que sua nucleotídeo citidina complementar no tronco2 seja substituída por guanosina;
    sequência de alça [No-4(U/T)No-4] está localizada entre elementos de tronco 1 e tronco 2, e é uma sequência consecutiva de 3 a 5 nucleotídeos, mais preferivelmente de 4 nucleotídeos;
    em que cada Νο-4θ independentemente um do outro uma sequência consecutiva de 0 a 4, preferivelmente de 1 a 3, mais preferivelmente de 1 a 2 N, em que cada N é independentemente um do outro selecionado de uma sequência de nucleotídeo selecionada de A, U, T, G e C ou um análogo de nucleotídeo do mesmo; e em que U/T representa uridina ou opcionalmente timidina; tronco2 [N3-5CN0-2] é reverso complementar ou parcialmente reverso complementar com elemento troncol e é uma sequência consecutiva de entre 5 a 7 nucleotídeos em que N3-5 é uma sequência consecutiva de 3 a 5, preferivelmente de 4 a 5, mais preferivelmente de 4 N, em que cada N é independentemente um do outro selecionado de um nucleotídeo selecionado de A, U, T, G e C ou um análogo de nucleotídeo do mesmo;
    em que Νο-2θ uma sequência consecutiva de 0 a 2, preferivelmente de 0 a 1, mais preferivelmente de 1 N, em que cada N é independentemente do outro selecionado de um nucleotídeo selecionado de A, U, T, G ou C ou um análogo de nucleotídeo do mesmo; e em que C é citidina ou um análogo da mesma, e pode ser opcionalmente substituída por guanosina ou um análogo da mesma contanto que sua nucleosídeo guanosina complementar no troncol seja substituída por citidina;
    em que
    0 troncol e 0 tronco2 são capazes de emparelhamento de base um com 0 outro formando uma sequência reversa complementar, em que 0 emparelhamento de base pode ocorrer entre 0 troncol e 0
    Petição 870190070557, de 24/07/2019, pág. 44/401
  23. 23/29 tronco2, ou formando uma sequência complementar parcialmente reversa, em que um emparelhamento de base incompleto pode ocorrer entre o troncol e tronco2.
    23. Ácido nucleico artificial, preferivelmente RNA, de acordo com a reivindicação 21 ou 22, caracterizado pelo fato de que a pelo menos uma alça-tronco de histona compreende uma sequência de ácido nucleico de acordo com a fórmula (Ia) ou (IIa) abaixo:
    fórmula (I) (sequência de alça-tronco sem elementos limítrofes de tronco) [No-iGNm] [Ni-3(U/T)No-2] [Nj-sCNo-i] v
    troncol alça tronco2 fórmula (II) (sequência de tronco-alça com elementos limítrofes de tronco):
    N2-5 [N0-1GN3-5] [Ni-3(U/T)N0-2] [N3-5CN0-i] N2-s troncol tfOnCOl aiça tronco2 troncoZ elemento limítrofe elemento hmrtrofe
  24. 24. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 23, caracterizado pelo fato de que compreende opcionalmente uma sequência de poli(A), preferivelmente compreendendo 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina.
  25. 25. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 24, caracterizado pelo fato de que compreende opcionalmente uma sequência de poli(C), compreendendo preferivelmente 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos de citosina.
    Petição 870190070557, de 24/07/2019, pág. 45/401
    24/29
  26. 26. Ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 25, caracterizado pelo fato de que compreende, preferivelmente na direção 5’ para 3’, os elementos que seguem:
    a) uma estrutura 5’-CAP, preferivelmente m7GppN ou Cap1,
    b) um elemento de 5’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivada de uma 5’-UTR como definida em qualquer uma das reivindicações 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 1; 3; 5; 7; 9; 11; 13; 15; 17; 19; ou 21 ou um homólogo, fragmento ou variante da mesma,
    c) pelo menos uma sequência de codificação como definida em qualquer uma das reivindicações 7 a 13,
    d) um elemento de 3’-UTR, que compreende ou consiste em uma sequência de ácido nucleico, que é derivado de uma 3’-UTR como definida em qualquer uma das reivindicações 1 a 5, preferivelmente compreendendo uma sequência de ácido nucleico correspondendo à sequência de ácido nucleico de acordo com SEQ ID NO: 15; 17; 19; 21; 29; 31; 33 ou 35 ou um homólogo, um fragmento ou uma variante da mesma,
    e) opcionalmente uma cauda de poli(A), consistindo preferivelmente em 10 a 1000, 10 a 500, 10 a 300, 10 a 200, 10 a 100, 40 a 80 ou 50 a 70 nucleotídeos de adenosina,
    f) opcionalmente uma cauda de poli(C), preferivelmente consistindo em 10 a 200, 10 a 100, 20 a 70, 20 a 60 ou 10 a 40 nucleotídeos cisteína, e
    g) opcionalmente um tronco-alça de histona (HSL).
  27. 27. Composição caracterizada pelo fato de que compreende a molécula de ácido nucleico artificial, preferivelmente um RNA, como
    Petição 870190070557, de 24/07/2019, pág. 46/401
    25/29 definida em qualquer uma das reivindicações 1 a 26, e um carreador e/ou excipiente farmaceuticamente aceitável.
  28. 28. Composição, de acordo com a reivindicação 27, caracterizada pelo fato de que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais compostos catiônicos ou policatiônicos, preferivelmente com polímeros catiônicos ou policatiônicos, peptídeos ou proteínas catiônicos ou policatiônicos, por exemplo, protamina, polissacarídeos catiônicos ou policatiônicos e/ou lipídeos catiônicos ou policatiônicos.
  29. 29. Composição, de acordo com a reivindicação 28, caracterizada pelo fato de que a razão N/P da molécula de ácido nucleico artificial, preferivelmente RNA, para o um ou mais peptídeos ou proteínas catiônicos ou policatiônicos está na faixa de cerca de 0,1 a 10, incluindo uma faixa de cerca de 0,3 a 4, de cerca de0,5 a 2, de cerca de 0,7 a 2 e de cerca de 0,7 a 1,5.
  30. 30. Composição, de acordo com qualquer uma das reivindicações 27 a 29, caracterizada pelo fato de que a molécula de ácido nucleico artificial, preferivelmente RNA, é complexada com um ou mais lipídeos, desta maneira formando lipossomas, nanopartículas de lipídeo e/ou lipoplexos.
  31. 31. Composição, de acordo com qualquer uma das reivindicações 27 a 30, caracterizada pelo fato de que compreende ainda pelo menos um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionar a proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
  32. 32. Kit, preferivelmente kit de partes, caracterizado pelo fato de que compreende a molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, ou composição como definida em qualquer uma das reivindicações 27
    Petição 870190070557, de 24/07/2019, pág. 47/401
    26/29 a 31, e opcionalmente um veículo líquido e/ou opcionalmente instruções técnicas com informação sobre a administração e dosagem da molécula de ácido nucleico artificial ou da composição.
  33. 33. Kit, de acordo com a reivindicação 32, caracterizado pelo fato de que o kit contém como uma parte solução de Ringer com Lactato.
  34. 34. Kit, de acordo com a reivindicação 32 ou 33, caracterizado pelo fato de que compreende ainda um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNAalvo de interesse ou um elemento regulador operavelmente ligada à mesma.
  35. 35. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento.
  36. 36. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso em terapia de gene.
  37. 37. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso em um método de modulação da expressão de um gene de interesse, compreendendo administração a um paciente com necessidade da mesma (a) a dita molécula de ácido nucleico artificial, preferivelmente RNA, a dita composição ou dito kit e (b) um RNA-guia (gRNA)
    Petição 870190070557, de 24/07/2019, pág. 48/401
    27/29 ou um ácido nucleico codificando o mesmo, o dito sgRNA sendo capaz de direcionar a proteína associada a CRISPR a um gene de interesse ou um elemento regulador operavelmente ligado ao mesmo.
  38. 38. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, a composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente a tratamento através da expressão de proteína associada a CRISPR codificada pela pelo menos uma sequência de codificação.
  39. 39. Molécula de ácido nucleico artificial, preferivelmente RNA, de acordo com qualquer uma das reivindicações 1 a 26, composição de acordo com qualquer uma das reivindicações 27 a 31, ou kit de acordo com as reivindicações 32 a 34, caracterizados pelo fato de serem para uso como um medicamento ou para uso em terapia de gene em uma doença, distúrbio ou condição condescendente à ativação, inativação ou manipulação de um gene de interesse ou através da modulação da expressão de um gene de interesse.
  40. 40. Molécula de ácido nucleico artificial, preferivelmente RNA, composição ou kit para uso de acordo com a reivindicação 39, caracterizados pelo fato de que a dita doença, distúrbio ou condição é selecionado de doenças genéticas, câncer, doenças autoimunes, doenças inflamatórias e doenças infecciosas.
  41. 41. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, composição como definida em qualquer uma das reivindicações 27 a 31, ou kit como definido nas reivindicações 32 a 34, caracterizados pelo fato de serem para aumento da expressão da dita proteína associada a CRISPR, opcionalmente em terapia de gene.
    Petição 870190070557, de 24/07/2019, pág. 49/401
    28/29
  42. 42. Uso da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, composição como definida em qualquer uma das reivindicações 27 a 31, ou kit como definida nas reivindicações 32 a 34, caracterizados pelo fato de serem para modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR codificada.
  43. 43. Método para modulação da expressão de um gene de interesse caracterizado pelo fato de que compreende as etapas de:
    a) prover uma molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26;
    b) prover um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma,
    c) contatar uma célula, tecido ou organismo com a dita molécula de ácido nucleico artificial, preferivelmente RNA, e dito gRNA ou ácido nucleico codificando o mesmo sob condições adequadas para modular eficácia de expressão do dito gene de interesse.
  44. 44. Método de tratamento ou prevenção de um distúrbio caracterizado pelo fato de que compreende administração a um indivíduo com necessidade do mesmo de uma quantidade eficaz da molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 26, da composição como definida em qualquer uma das reivindicações 27 a 31, ou do kit como definido nas reivindicações 32 a 34, e um RNA-guia (gRNA) ou um ácido nucleico codificando o mesmo, o dito gRNA sendo capaz de direcionamento da proteína associada a CRISPR a uma sequência de DNA-alvo de interesse ou um elemento regulador operavelmente ligado à mesma.
  45. 45. Método, de acordo com a reivindicação 44, caracterizado
    Petição 870190070557, de 24/07/2019, pág. 50/401
    29/29 pelo fato de que o distúrbio é uma doença, distúrbio ou condição condescendente a tratamento através da expressão da proteína associada a CRISPR codificada, preferivelmente condescendente a tratamento através da modulação da expressão de um gene de interesse direcionado pela dita proteína associada a CRISPR.
  46. 46. Método, de acordo com a reivindicação 44 ou 45, caracterizado pelo fato de que o distúrbio é uma doença, distúrbio ou condição condescendente através da ativação, inativação ou através da mutação de um gene de interesse ou através da alteração da expressão de um gene de interesse.
  47. 47. Método para aumento da eficácia de expressão de uma molécula de ácido nucleico artificial, preferivelmente RNA, compreendendo uma região de codificação codificando uma proteína associada a CRISPR, caracterizado pelo fato de que compreende (a) associar a dita região de codificação com pelo menos um elemento de 5’ UTR derivado de uma 5’ UTR de um gene selecionado do grupo consistindo em ATP5A1, RPL32, HSD17B4, SLC7A3, NOSIP ou NDUFA4 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou variante da mesma;
    (b) associar a dita região de codificação com pelo menos um elemento de 3’ UTR derivado de uma 3’ UTR de um gene selecionado do grupo consistindo em GNAS, CASP1, PSMB3, ALB ou RPS9 ou de uma sequência de RNA correspondente, homólogo, um fragmento ou uma variante da mesma; e (c) obter uma molécula de ácido nucleico artificial, preferivelmente RNA, como definida em qualquer uma das reivindicações 1 a 46.
BR112019015244A 2017-03-24 2018-03-23 ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos BR112019015244A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP2017057110 2017-03-24
EP2017076775 2017-10-19
PCT/EP2018/057552 WO2018172556A1 (en) 2017-03-24 2018-03-23 Nucleic acids encoding crispr-associated proteins and uses thereof

Publications (1)

Publication Number Publication Date
BR112019015244A2 true BR112019015244A2 (pt) 2020-04-14

Family

ID=61801946

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112019015244A BR112019015244A2 (pt) 2017-03-24 2018-03-23 ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos

Country Status (11)

Country Link
US (2) US11739335B2 (pt)
EP (1) EP3601576A1 (pt)
JP (2) JP2020513824A (pt)
KR (1) KR20190133699A (pt)
CN (1) CN110914433A (pt)
AU (1) AU2018240515A1 (pt)
BR (1) BR112019015244A2 (pt)
CA (1) CA3050616A1 (pt)
MX (1) MX2019011215A (pt)
SG (2) SG10202110491PA (pt)
WO (1) WO2018172556A1 (pt)

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109045289A (zh) 2013-02-22 2018-12-21 库瑞瓦格股份公司 疫苗接种和抑制pd-1途径的组合
JP6896421B2 (ja) 2013-08-21 2021-06-30 キュアバック アーゲー 呼吸器合胞体ウイルス(rsv)ワクチン
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
DE202015010000U1 (de) 2014-12-12 2023-07-03 CureVac SE Artifizielle Nukleinsäuremoleküle für eine verbesserte Proteinexpression
EP3294885B1 (en) 2015-05-08 2020-07-01 CureVac Real Estate GmbH Method for producing rna
AU2016261358B2 (en) 2015-05-11 2021-09-16 Editas Medicine, Inc. Optimized CRISPR/Cas9 systems and methods for gene editing in stem cells
EP3744843A1 (en) 2015-05-29 2020-12-02 CureVac Real Estate GmbH A method for producing and purifying rna, comprising at least one step of tangential flow filtration
AU2016276702B2 (en) 2015-06-09 2022-07-28 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for improving transplantation
EP3786294A1 (en) 2015-09-24 2021-03-03 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
WO2017081110A1 (en) 2015-11-09 2017-05-18 Curevac Ag Rotavirus vaccines
EP3701963A1 (en) 2015-12-22 2020-09-02 CureVac AG Method for producing rna molecule compositions
SG11201806340YA (en) 2016-02-17 2018-09-27 Curevac Ag Zika virus vaccine
US11920174B2 (en) 2016-03-03 2024-03-05 CureVac SE RNA analysis by total hydrolysis and quantification of released nucleosides
US11597924B2 (en) 2016-03-25 2023-03-07 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2017180694A1 (en) 2016-04-13 2017-10-19 Editas Medicine, Inc. Cas9 fusion molecules gene editing systems, and methods of use thereof
US10337051B2 (en) * 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
US11293021B1 (en) 2016-06-23 2022-04-05 Inscripta, Inc. Automated cell processing methods, modules, instruments, and systems
JP2019532644A (ja) 2016-09-30 2019-11-14 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Rna誘導型核酸修飾酵素及びその使用方法
US11279923B2 (en) 2016-11-28 2022-03-22 Curevac Ag Method for purifying RNA
WO2018115507A2 (en) 2016-12-23 2018-06-28 Curevac Ag Henipavirus vaccine
WO2018115527A2 (en) 2016-12-23 2018-06-28 Curevac Ag Mers coronavirus vaccine
CA3084252A1 (en) 2017-03-28 2018-10-04 Caribou Biosciences, Inc. Crispr-associated (cas) protein
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
CN110997908A (zh) 2017-06-09 2020-04-10 爱迪塔斯医药公司 工程化的cas9核酸酶
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
KR20220104847A (ko) 2017-06-30 2022-07-26 인스크립타 인코포레이티드 자동 세포 처리 방법, 모듈, 기기 및 시스템
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US10476825B2 (en) 2017-08-22 2019-11-12 Salk Institue for Biological Studies RNA targeting methods and compositions
EP3673069A1 (en) 2017-08-22 2020-07-01 CureVac AG Bunyavirales vaccine
MX2020003995A (es) * 2017-10-19 2020-07-22 Curevac Ag Nuevas moleculas de acido nucleico artificiales.
CN117487776A (zh) 2017-11-01 2024-02-02 加利福尼亚大学董事会 Casz组合物和使用方法
US11692002B2 (en) 2017-11-08 2023-07-04 CureVac SE RNA sequence adaptation
US11931406B2 (en) 2017-12-13 2024-03-19 CureVac SE Flavivirus vaccine
SG11202005760PA (en) 2017-12-21 2020-07-29 Curevac Ag Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna
KR20200124702A (ko) * 2018-02-23 2020-11-03 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 신규한 cas9 오르소로그
US11795456B2 (en) * 2018-04-16 2023-10-24 Georgia Tech Research Corporation MRNA driven expression of RNA editors for treatment of pathologies
US10526598B2 (en) 2018-04-24 2020-01-07 Inscripta, Inc. Methods for identifying T-cell receptor antigens
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
AU2019292919A1 (en) 2018-06-30 2021-03-11 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
US11142740B2 (en) 2018-08-14 2021-10-12 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
RU2706298C1 (ru) * 2018-09-14 2019-11-15 Закрытое Акционерное Общество "Биокад" НУКЛЕАЗА PaCas9
WO2020081808A1 (en) * 2018-10-18 2020-04-23 Chan Zuckerberg Biohub, Inc. Methods and compositions involving thermostable cas9 protein variants
BR112021011372A2 (pt) 2018-12-14 2021-08-31 Pioneer Hi-Bred International, Inc. Novos sistemas crispr-cas para edição de genoma
WO2020142739A1 (en) * 2019-01-04 2020-07-09 Mammoth Biosciences, Inc. COMPOSITIONS AND METHODS FOR DETECTING MODIFIED NUCLEIC ACIDS AND AMPLIFYING ssDNA
WO2020161342A1 (en) 2019-02-08 2020-08-13 Curevac Ag Coding rna administered into the suprachoroidal space in the treatment of ophtalmic diseases
WO2020168234A1 (en) * 2019-02-14 2020-08-20 Metagenomi Ip Technologies, Llc Enzymes with ruvc domains
MX2021010559A (es) 2019-03-07 2021-12-15 Univ California Polipéptidos efectores de crispr-cas y métodos de uso de estos.
US10815467B2 (en) 2019-03-25 2020-10-27 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
US20220213456A1 (en) * 2019-04-30 2022-07-07 Emendobio Inc. Novel omni crispr nucleases
CN113939593A (zh) 2019-06-06 2022-01-14 因思科瑞普特公司 用于递归的核酸指导的细胞编辑的处治
GB2600274A (en) 2019-06-07 2022-04-27 Scribe Therapeutics Inc Engineered CasX systems
WO2021011504A1 (en) * 2019-07-12 2021-01-21 Duke University Nanoparticle systems for targeted delivery of crispr/cas13 and methods of using same
TW202120688A (zh) * 2019-08-12 2021-06-01 美商生命編輯公司 Rna導引之核酸酶及其活性片段及變體以及使用方法
WO2021102059A1 (en) 2019-11-19 2021-05-27 Inscripta, Inc. Methods for increasing observed editing in bacteria
WO2021118626A1 (en) * 2019-12-10 2021-06-17 Inscripta, Inc. Novel mad nucleases
AU2020408995A1 (en) * 2019-12-16 2022-06-23 BASF Agricultural Solutions Seed US LLC Codon-optimized Cas9 endonuclease encoding polynucleotide
AU2020407048A1 (en) 2019-12-18 2022-06-09 Inscripta, Inc. Cascade/dCas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells
AU2021213705A1 (en) 2020-01-27 2022-06-16 Inscripta, Inc. Electroporation modules and instrumentation
US11576966B2 (en) 2020-02-04 2023-02-14 CureVac SE Coronavirus vaccine
US11241493B2 (en) 2020-02-04 2022-02-08 Curevac Ag Coronavirus vaccine
KR20220161383A (ko) 2020-03-31 2022-12-06 메타지노미, 인크. 클래스 ii, 유형 ii crispr 시스템
WO2021211598A1 (en) * 2020-04-14 2021-10-21 University Of Massachusetts Dcas13-mediated therapeutic rna base editing for in vivo gene therapy
TW202208626A (zh) * 2020-04-24 2022-03-01 美商生命編輯公司 Rna引導核酸酶及其活性片段與變體,以及使用方法
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
US11946077B2 (en) 2020-06-04 2024-04-02 Emendobio Inc. OMNI-59, 61, 67, 76, 79, 80, 81, and 82 CRISPR nucleases
US11299731B1 (en) 2020-09-15 2022-04-12 Inscripta, Inc. CRISPR editing to embed nucleic acid landing pads into genomes of live cells
WO2022098681A2 (en) * 2020-11-03 2022-05-12 Caspr Biotech Corporation Novel class 2 crispr-cas rna-guided endonucleases
EP4240426A1 (en) * 2020-11-05 2023-09-13 New York University Enhancement of predictable and template-free gene editing by the association of cas with dna polymerase
US11512297B2 (en) 2020-11-09 2022-11-29 Inscripta, Inc. Affinity tag for recombination protein recruitment
AU2021405281A1 (en) 2020-12-22 2023-07-06 CureVac SE Rna vaccine against sars-cov-2 variants
CA3204158A1 (en) * 2021-01-04 2022-07-07 Juhan Kim Mad nucleases
JP2024502387A (ja) * 2021-01-05 2024-01-18 マーチ・セラピューティクス,インコーポレーテッド 核酸を検出するための方法
US11332742B1 (en) 2021-01-07 2022-05-17 Inscripta, Inc. Mad nucleases
IL305036A (en) * 2021-02-08 2023-10-01 Emendobio Inc A CRISPR nuclease called OMNI 103
US11884924B2 (en) 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
WO2022272294A1 (en) * 2021-06-23 2022-12-29 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for efficient retron recruitment to dna breaks
IL310732A (en) * 2021-08-13 2024-04-01 Emendobio Inc New CRSPR nucleases OMNI 115, 124, 127, 144-149, 159, 218, 237, 248, 251-253 and 251
IL309505A (en) 2021-09-03 2024-02-01 CureVac SE Lipid nanoparticles for nucleic acid delivery
WO2023102407A2 (en) * 2021-12-01 2023-06-08 Emendobio Inc. Engineered high activity omni-79 nuclease variants
WO2023114953A2 (en) * 2021-12-17 2023-06-22 Beam Therapeutics Inc. Novel crispr enzymes, methods, systems and uses thereof
WO2023139557A1 (en) * 2022-01-24 2023-07-27 LifeEDIT Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2023150637A1 (en) * 2022-02-02 2023-08-10 Inscripta, Inc. Nucleic acid-guided nickase fusion proteins
CN114807104B (zh) * 2022-04-11 2024-02-20 西南大学 肺炎克雷伯菌噬菌体裂解酶及其制备方法和应用
WO2024042165A2 (en) * 2022-08-26 2024-02-29 UCB Biopharma SRL Novel rna-guided nucleases and nucleic acid targeting systems comprising such rna-guided nucleases

Family Cites Families (163)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5534499A (en) 1994-05-19 1996-07-09 The University Of British Columbia Lipophilic drug derivatives for use in liposomes
US5820873A (en) 1994-09-30 1998-10-13 The University Of British Columbia Polyethylene glycol modified ceramide lipids and liposome uses thereof
US5885613A (en) 1994-09-30 1999-03-23 The University Of British Columbia Bilayer stabilizing components and their use in forming programmable fusogenic liposomes
US6320017B1 (en) 1997-12-23 2001-11-20 Inex Pharmaceuticals Corp. Polyamide oligomers
ES2340532T3 (es) 2001-06-05 2010-06-04 Curevac Gmbh Arnm con un contenido g/c aumentado que codifica para un antigeno bacteriano y utilizacion del mismo.
EP2428571B1 (en) 2001-09-28 2018-07-18 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. MicroRNA molecules
DE10162480A1 (de) 2001-12-19 2003-08-07 Ingmar Hoerr Die Applikation von mRNA für den Einsatz als Therapeutikum gegen Tumorerkrankungen
DE10229872A1 (de) 2002-07-03 2004-01-29 Curevac Gmbh Immunstimulation durch chemisch modifizierte RNA
CA2533701A1 (en) 2003-07-31 2005-02-17 Isis Pharmaceuticals, Inc. Oligomeric compounds and compositions for use in modulation of small non-coding rnas
DE10335833A1 (de) 2003-08-05 2005-03-03 Curevac Gmbh Transfektion von Blutzellen mit mRNA zur Immunstimulation und Gentherapie
DE102004042546A1 (de) 2004-09-02 2006-03-09 Curevac Gmbh Kombinationstherapie zur Immunstimulation
DE102005023170A1 (de) 2005-05-19 2006-11-23 Curevac Gmbh Optimierte Formulierung für mRNA
DE102006035618A1 (de) 2006-07-31 2008-02-07 Curevac Gmbh Nukleinsäure der Formel (I): GlXmGn, insbesondere als immunstimulierendes Adjuvanz
DE102006061015A1 (de) 2006-12-22 2008-06-26 Curevac Gmbh Verfahren zur Reinigung von RNA im präparativen Maßstab mittels HPLC
DE102007001370A1 (de) 2007-01-09 2008-07-10 Curevac Gmbh RNA-kodierte Antikörper
WO2009030254A1 (en) 2007-09-04 2009-03-12 Curevac Gmbh Complexes of rna and cationic peptides for transfection and for immunostimulation
WO2009046739A1 (en) 2007-10-09 2009-04-16 Curevac Gmbh Composition for treating prostate cancer (pca)
WO2009046738A1 (en) 2007-10-09 2009-04-16 Curevac Gmbh Composition for treating lung cancer, particularly of non-small lung cancers (nsclc)
JP5749494B2 (ja) 2008-01-02 2015-07-15 テクミラ ファーマシューティカルズ コーポレイション 核酸の送達のための改善された組成物および方法
CA2710534C (en) 2008-01-31 2018-09-04 Curevac Gmbh Nucleic acids of formula (i) (nuglxmgnnv)a and derivatives thereof as an immunostimulating agent/adjuvant
EP3112477A1 (en) 2008-02-28 2017-01-04 The Ohio State University Research Foundation Microrna-based methods and compositions for the diagnosis, prognosis and treatment of prostate related disorders
AU2009238175C1 (en) 2008-04-15 2023-11-30 Arbutus Biopharma Corporation Novel lipid formulations for nucleic acid delivery
WO2010037408A1 (en) 2008-09-30 2010-04-08 Curevac Gmbh Composition comprising a complexed (m)rna and a naked mrna for providing or enhancing an immunostimulatory response in a mammal and uses thereof
AU2009303345B2 (en) 2008-10-09 2015-08-20 Arbutus Biopharma Corporation Improved amino lipids and methods for the delivery of nucleic acids
WO2010048536A2 (en) 2008-10-23 2010-04-29 Alnylam Pharmaceuticals, Inc. Processes for preparing lipids
JP6087504B2 (ja) 2008-11-07 2017-03-01 マサチューセッツ インスティテュート オブ テクノロジー アミノアルコールリピドイドおよびその使用
HUE037082T2 (hu) 2008-11-10 2018-08-28 Arbutus Biopharma Corp Új lipidek és készítmények terápiás hatóanyagok szállítására
WO2010087791A1 (en) 2009-01-27 2010-08-05 Utc Power Corporation Distributively cooled, integrated water-gas shift reactor and vaporizer
US20120101148A1 (en) 2009-01-29 2012-04-26 Alnylam Pharmaceuticals, Inc. lipid formulation
JP5769701B2 (ja) 2009-05-05 2015-08-26 テクミラ ファーマシューティカルズ コーポレイションTekmira Pharmaceuticals Corporation 脂質組成物
DK2440183T3 (en) 2009-06-10 2018-10-01 Arbutus Biopharma Corp Improved lipid formulation
EP2459231B1 (de) 2009-07-31 2016-06-08 Ethris Gmbh Rna mit einer kombination aus unmodifizierten und modifizierten nucleotiden zur proteinexpression
US20110053829A1 (en) 2009-09-03 2011-03-03 Curevac Gmbh Disulfide-linked polyethyleneglycol/peptide conjugates for the transfection of nucleic acids
WO2011069529A1 (en) 2009-12-09 2011-06-16 Curevac Gmbh Mannose-containing solution for lyophilization, transfection and/or injection of nucleic acids
WO2011127456A2 (en) 2010-04-09 2011-10-13 Pacira Pharmaceuticals, Inc. Method for formulating large diameter synthetic membrane vesicles
NZ605079A (en) 2010-06-03 2015-08-28 Alnylam Pharmaceuticals Inc Biodegradable lipids for the delivery of active agents
NZ606591A (en) 2010-07-06 2015-02-27 Novartis Ag Cationic oil-in-water emulsions
US20130171241A1 (en) 2010-07-06 2013-07-04 Novartis Ag Liposomes with lipids having an advantageous pka-value for rna delivery
EP2449113B8 (en) 2010-07-30 2015-11-25 CureVac AG Complexation of nucleic acids with disulfide-crosslinked cationic components for transfection and immunostimulation
WO2012019630A1 (en) 2010-08-13 2012-02-16 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded protein
ES2918649T3 (es) 2010-08-31 2022-07-19 Glaxosmithkline Biologicals Sa Liposomas pegilados para el suministro de ARN que codifica un inmunógeno
RU2577983C2 (ru) 2010-08-31 2016-03-20 Новартис Аг Липиды, подходящие для липосомной доставки кодирующей белок рнк
MX341989B (es) 2010-08-31 2016-09-09 Novartis Ag * Liposomas pequeños para el suministro de arn que codifica el inmunogeno.
WO2012089225A1 (en) 2010-12-29 2012-07-05 Curevac Gmbh Combination of vaccination and inhibition of mhc class i restricted antigen presentation
WO2012116715A1 (en) 2011-03-02 2012-09-07 Curevac Gmbh Vaccination in newborns and infants
WO2012113413A1 (en) 2011-02-21 2012-08-30 Curevac Gmbh Vaccine composition comprising complexed immunostimulatory nucleic acids and antigens packaged with disulfide-linked polyethyleneglycol/peptide conjugates
WO2012116714A1 (en) 2011-03-02 2012-09-07 Curevac Gmbh Vaccination in elderly patients
ES2861428T3 (es) 2011-07-06 2021-10-06 Glaxosmithkline Biologicals Sa Liposomas que presentan una relación N:P útil para suministro de moléculas de ARN
WO2013113326A1 (en) 2012-01-31 2013-08-08 Curevac Gmbh Pharmaceutical composition comprising a polymeric carrier cargo complex and at least one protein or peptide antigen
EP2623121A1 (en) 2012-01-31 2013-08-07 Bayer Innovation GmbH Pharmaceutical composition comprising a polymeric carrier cargo complex and an antigen
WO2013113325A1 (en) 2012-01-31 2013-08-08 Curevac Gmbh Negatively charged nucleic acid comprising complexes for immunostimulation
WO2013120497A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded therapeutic protein
WO2013120500A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded tumour antigen
WO2013120499A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly (a) sequence or a polyadenylation signal for increasing the expression of an encoded pathogenic antigen
WO2013120498A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly(a) sequence or a polyadenylation signal for increasing the expression of an encoded allergenic antigen or an autoimmune self-antigen
US9352042B2 (en) 2012-02-24 2016-05-31 Protiva Biotherapeutics, Inc. Trialkyl cationic lipids and methods of use thereof
ES2660459T3 (es) 2012-03-27 2018-03-22 Curevac Ag Moléculas de ácido nucleico artificiales
AU2013242404B2 (en) 2012-03-27 2018-08-30 CureVac SE Artificial nucleic acid molecules for improved protein or peptide expression
EP2831240B1 (en) * 2012-03-27 2017-11-15 CureVac AG Artificial nucleic acid molecules comprising a 5'top utr
CN104321432B (zh) 2012-03-27 2018-08-10 库瑞瓦格股份公司 包含5′top utr的人工核酸分子
EA038924B1 (ru) 2012-05-25 2021-11-10 Те Риджентс Оф Те Юниверсити Оф Калифорния Способы и композиции рнк-специфической модификации днк-мишени и рнк-специфической модуляции транскрипции
US20150306249A1 (en) 2012-05-25 2015-10-29 Curevac Gmbh Reversible immobilization and/or controlled release of nucleic acid containing nanoparticles by (biodegradable) polymer coatings
CA2897941A1 (en) 2013-01-17 2014-07-24 Moderna Therapeutics, Inc. Signal-sensor polynucleotides for the alteration of cellular phenotypes
CN109045289A (zh) 2013-02-22 2018-12-21 库瑞瓦格股份公司 疫苗接种和抑制pd-1途径的组合
AU2014235794A1 (en) 2013-03-14 2015-10-22 Caribou Biosciences, Inc. Compositions and methods of nucleic acid-targeting nucleic acids
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
CA2915834A1 (en) 2013-06-17 2014-12-24 Massachusetts Institute Of Technology Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
DK3019619T3 (da) 2013-07-11 2021-10-11 Modernatx Inc Sammensætninger, der omfatter syntetiske polynukleotider, som koder for crispr-beslægtede proteiner, og syntetiske sgrna'er, og anvendelsesfremgangsmåder
JP6896421B2 (ja) 2013-08-21 2021-06-30 キュアバック アーゲー 呼吸器合胞体ウイルス(rsv)ワクチン
RU2016109938A (ru) 2013-08-21 2017-09-26 Куревак Аг Композиция и вакцина для лечения рака предстательной железы
WO2015024667A1 (en) 2013-08-21 2015-02-26 Curevac Gmbh Method for increasing expression of rna-encoded proteins
CA2915712A1 (en) 2013-08-21 2015-02-26 Margit SCHNEE Rabies vaccine
SG11201510748PA (en) 2013-08-21 2016-03-30 Curevac Ag Composition and vaccine for treating lung cancer
CA2915730A1 (en) 2013-08-21 2015-02-26 Karl-Josef Kallen A combination rsv/influenza a vaccine
ES2806575T3 (es) 2013-11-01 2021-02-18 Curevac Ag ARN modificado con propiedades inmunoestimuladoras disminuidas
AU2014348212C1 (en) 2013-11-18 2018-11-29 Arcturus Therapeutics, Inc. Ionizable cationic lipid for RNA delivery
US20170173128A1 (en) 2013-12-06 2017-06-22 Moderna TX, Inc. Targeted adaptive vaccines
WO2015101415A1 (en) 2013-12-30 2015-07-09 Curevac Gmbh Artificial nucleic acid molecules
SG11201603144QA (en) 2013-12-30 2016-07-28 Curevac Ag Artificial nucleic acid molecules
AU2014375404C1 (en) 2013-12-30 2020-11-19 CureVac Manufacturing GmbH Methods for RNA analysis
CA2935878C (en) 2014-03-12 2023-05-02 Curevac Ag Combination of vaccination and ox40 agonists
CA2936286A1 (en) 2014-04-01 2015-10-08 Curevac Ag Polymeric carrier cargo complex for use as an immunostimulating agent or as an adjuvant
MX2016016170A (es) 2014-06-10 2017-03-28 Curevac Ag Metodos y medios para aumentar la produccion de arn.
SI3766916T1 (sl) 2014-06-25 2023-01-31 Acuitas Therapeutics Inc. Formulacije novih lipidov in lipidnih nanodelcev za dostavo nukleinskih kislin
DE202015010000U1 (de) 2014-12-12 2023-07-03 CureVac SE Artifizielle Nukleinsäuremoleküle für eine verbesserte Proteinexpression
EP3233113A1 (en) 2014-12-16 2017-10-25 CureVac AG Ebolavirus and marburgvirus vaccines
EP3233132A4 (en) 2014-12-19 2018-06-27 Modernatx, Inc. Terminal modifications of polynucleotides
AU2015373404B2 (en) * 2014-12-30 2021-09-09 CureVac SE Artificial nucleic acid molecules
WO2016165825A1 (en) 2015-04-13 2016-10-20 Curevac Ag Method for producing rna compositions
WO2016165831A1 (en) 2015-04-17 2016-10-20 Curevac Ag Lyophilization of rna
JP6912384B2 (ja) 2015-04-22 2021-08-04 キュアバック アーゲー 癌疾患の処置のための、rna含有組成物
SG11201708867UA (en) 2015-04-30 2017-11-29 Curevac Ag Immobilized poly(n)polymerase
SG11201708681SA (en) 2015-04-30 2017-11-29 Curevac Ag Method for in vitro transcription using an immobilized restriction enzyme
US10179918B2 (en) * 2015-05-07 2019-01-15 Sangamo Therapeutics, Inc. Methods and compositions for increasing transgene activity
EP3294885B1 (en) 2015-05-08 2020-07-01 CureVac Real Estate GmbH Method for producing rna
US11559570B2 (en) 2015-05-15 2023-01-24 CureVac SE Prime-boost regimens involving administration of at least one mRNA construct
WO2016184575A1 (en) 2015-05-20 2016-11-24 Curevac Ag Dry powder composition comprising long-chain rna
EP3297682B1 (en) 2015-05-20 2021-07-14 CureVac AG Dry powder composition comprising long-chain rna
EP4098743A1 (en) 2015-05-29 2022-12-07 CureVac AG Method for adding cap structures to rna using immobilized enzymes
EP3744843A1 (en) 2015-05-29 2020-12-02 CureVac Real Estate GmbH A method for producing and purifying rna, comprising at least one step of tangential flow filtration
US20180245074A1 (en) 2015-06-04 2018-08-30 Protiva Biotherapeutics, Inc. Treating hepatitis b virus infection using crispr
WO2016203025A1 (en) 2015-06-17 2016-12-22 Curevac Ag Vaccine composition
EP4239080A3 (en) 2015-07-01 2023-11-01 CureVac Manufacturing GmbH Method for analysis of an rna molecule
US10501768B2 (en) 2015-07-13 2019-12-10 Curevac Ag Method of producing RNA from circular DNA and corresponding template DNA
US20200085852A1 (en) 2015-08-05 2020-03-19 Curevac Ag Epidermal mrna vaccine
EP3332019B1 (en) 2015-08-07 2019-12-18 CureVac AG Process for the in vivo production of rna in a host cell
CN108138187B (zh) 2015-08-10 2022-07-19 库瑞瓦格房地产有限公司 增加环状dna分子复制的方法
CN108026537B (zh) * 2015-08-28 2022-02-08 库瑞瓦格股份公司 人工核酸分子
EP4276189A3 (en) 2015-09-21 2024-01-17 TriLink BioTechnologies, LLC Initiating capped oligonucleotide primers for synthesizing 5'-capped rnas
EP3362576A1 (en) 2015-10-12 2018-08-22 CureVac AG Automated method for isolation, selection and/or detection of microorganisms or cells comprised in a solution
CN113636947A (zh) 2015-10-28 2021-11-12 爱康泰生治疗公司 用于递送核酸的新型脂质和脂质纳米颗粒制剂
US20180312545A1 (en) 2015-11-09 2018-11-01 Curevac Ag Optimized nucleic acid molecules
WO2017081110A1 (en) 2015-11-09 2017-05-18 Curevac Ag Rotavirus vaccines
WO2017108087A1 (en) 2015-12-21 2017-06-29 Curevac Ag Inlay for a culture plate and corresponding method for preparing a culture plate system with such inlay
EP3701963A1 (en) 2015-12-22 2020-09-02 CureVac AG Method for producing rna molecule compositions
WO2017109161A1 (en) 2015-12-23 2017-06-29 Curevac Ag Method of rna in vitro transcription using a buffer containing a dicarboxylic acid or tricarboxylic acid or a salt thereof
EP3414340B1 (en) 2016-02-12 2023-08-09 CureVac SE Method for analyzing rna
EP3417069A1 (en) 2016-02-15 2018-12-26 CureVac AG Method for analyzing by-products of rna in vitro transcription
SG11201806340YA (en) 2016-02-17 2018-09-27 Curevac Ag Zika virus vaccine
US11920174B2 (en) 2016-03-03 2024-03-05 CureVac SE RNA analysis by total hydrolysis and quantification of released nucleosides
WO2017162297A1 (en) 2016-03-24 2017-09-28 Curevac Ag Immobilized inorganic pyrophosphatase (ppase)
EP3445392A1 (en) 2016-04-22 2019-02-27 CureVac AG Rna encoding a tumor antigen
EP3448427A1 (en) 2016-04-29 2019-03-06 CureVac AG Rna encoding an antibody
EP3452086A1 (en) 2016-05-04 2019-03-13 CureVac AG Influenza mrna vaccines
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
WO2017191264A1 (en) 2016-05-04 2017-11-09 Curevac Ag Nucleic acid molecules and uses thereof
US20180126003A1 (en) 2016-05-04 2018-05-10 Curevac Ag New targets for rna therapeutics
US20190275170A1 (en) 2016-05-18 2019-09-12 Modernatx, Inc. Polynucleotides encoding jagged1 for the treatment of alagille syndrome
MA45053A (fr) 2016-05-18 2019-03-27 Modernatx Inc Polynucléotides codant pour un régulateur de conductance transmembranaire de fibrose kystique pour le traitement de la fibrose kystique
JP7210287B2 (ja) 2016-05-18 2023-01-23 モダーナティエックス・インコーポレイテッド Ii型シトルリン血症の治療のためのシトリンをコードするポリヌクレオチド
CA3024624A1 (en) 2016-05-18 2017-11-23 Modernatx, Inc. Polynucleotides encoding porphobilinogen deaminase for the treatment of acute intermittent porphyria
WO2017201348A1 (en) 2016-05-18 2017-11-23 Modernatx, Inc. Polynucleotides encoding galactose-1-phosphate uridylyltransferase for the treatment of galactosemia type 1
WO2017201332A1 (en) 2016-05-18 2017-11-23 Modernatx, Inc. Polynucleotides encoding acyl-coa dehydrogenase, very long-chain for the treatment of very long-chain acyl-coa dehydrogenase deficiency
EP3458590B9 (en) 2016-05-18 2021-08-18 ModernaTX, Inc. Polynucleotides encoding -galactosidase a for the treatment of fabry disease
EP3464619A1 (en) 2016-05-25 2019-04-10 CureVac AG Novel biomarkers
US20190336611A1 (en) 2016-06-09 2019-11-07 Curevac Ag Hybrid carriers for nucleic acid cargo
EP3468609A1 (en) 2016-06-09 2019-04-17 CureVac AG Cationic carriers for nucleic acid delivery
WO2017212009A1 (en) 2016-06-09 2017-12-14 Curevac Ag Hybrid carriers for nucleic acid cargo
US20190381180A1 (en) 2016-06-09 2019-12-19 Curevac Ag Hybrid carriers for nucleic acid cargo
SG10201913631TA (en) 2016-08-19 2020-03-30 Curevac Ag Rna for cancer therapy
BR112019008481A2 (pt) 2016-10-26 2020-03-03 Curevac Ag Vacinas de mrna de nanopartículas lipídicas
US11279923B2 (en) 2016-11-28 2022-03-22 Curevac Ag Method for purifying RNA
WO2018104540A1 (en) 2016-12-08 2018-06-14 Curevac Ag Rnas for wound healing
CN110582304A (zh) 2016-12-08 2019-12-17 库尔维科公司 用于治疗或预防肝脏疾病的rna
WO2018115507A2 (en) 2016-12-23 2018-06-28 Curevac Ag Henipavirus vaccine
WO2018115525A1 (en) 2016-12-23 2018-06-28 Curevac Ag Lassa virus vaccine
WO2018115527A2 (en) 2016-12-23 2018-06-28 Curevac Ag Mers coronavirus vaccine
EP3595715A1 (en) 2017-03-17 2020-01-22 CureVac AG Rna vaccine and immune checkpoint inhibitors for combined anticancer therapy
US20230064106A1 (en) 2017-05-17 2023-03-02 Curevac Real Estate Gmbh Method for determining at least one quality parameter of an rna sample
BR112019028280A2 (pt) 2017-07-04 2020-07-14 Curevac Ag moléculas de ácido nucleico
EP3673069A1 (en) 2017-08-22 2020-07-01 CureVac AG Bunyavirales vaccine
JP2021500863A (ja) 2017-09-29 2021-01-14 インテリア セラピューティクス,インコーポレイテッド ゲノム編集用のポリヌクレオチド、組成物および方法
MX2020003995A (es) 2017-10-19 2020-07-22 Curevac Ag Nuevas moleculas de acido nucleico artificiales.
US11692002B2 (en) 2017-11-08 2023-07-04 CureVac SE RNA sequence adaptation
US11931406B2 (en) 2017-12-13 2024-03-19 CureVac SE Flavivirus vaccine
SG11202005760PA (en) 2017-12-21 2020-07-29 Curevac Ag Linear double stranded dna coupled to a single support or a tag and methods for producing said linear double stranded dna
EP3773702A2 (en) 2018-04-05 2021-02-17 CureVac AG Novel yellow fever nucleic acid molecules for vaccination
SG11202008225PA (en) 2018-04-17 2020-11-27 Curevac Ag Novel rsv rna molecules and compositions for vaccination
WO2020002525A1 (en) 2018-06-27 2020-01-02 Curevac Ag Novel lassa virus rna molecules and compositions for vaccination
MX2020013148A (es) 2018-06-28 2021-03-02 CureVac RNA Printer GmbH Biorreactor para la transcripcion in vitro de arn.
TW202039534A (zh) 2018-12-14 2020-11-01 美商美國禮來大藥廠 KRAS變體mRNA分子
SG11202106666UA (en) 2018-12-21 2021-07-29 Curevac Ag Methods for rna analysis
CN113453707A (zh) 2018-12-21 2021-09-28 库瑞瓦格股份公司 用于疟疾疫苗的rna

Also Published As

Publication number Publication date
CN110914433A (zh) 2020-03-24
EP3601576A1 (en) 2020-02-05
RU2019132890A (ru) 2021-04-26
SG11201906297QA (en) 2019-10-30
MX2019011215A (es) 2020-02-12
US20210403925A1 (en) 2021-12-30
JP2024038121A (ja) 2024-03-19
US20230332163A1 (en) 2023-10-19
RU2019132890A3 (pt) 2021-07-14
SG10202110491PA (en) 2021-11-29
CA3050616A1 (en) 2018-09-27
AU2018240515A1 (en) 2019-08-01
WO2018172556A1 (en) 2018-09-27
KR20190133699A (ko) 2019-12-03
US11739335B2 (en) 2023-08-29
JP2020513824A (ja) 2020-05-21

Similar Documents

Publication Publication Date Title
BR112019015244A2 (pt) ácidos nucleicos codificando proteínas associadas a crispr e usos dos mesmos
US20230158126A1 (en) Rna for treatment or prophylaxis of a liver disease
JP6666391B2 (ja) 化学修飾mRNA
US20220296628A1 (en) Rna combinations and compositions with decreased immunostimulatory properties
US20220340886A1 (en) Therapeutics for glycogen storage disease type iii
WO2016011306A2 (en) Terminal modifications of polynucleotides
WO2016022914A1 (en) Compositions and methods for the treatment of ophthalmic diseases and conditions
WO2016100812A1 (en) Terminal modifications of polynucleotides
WO2013056670A1 (zh) 小干扰RNA及其应用和抑制plk1基因表达的方法
CA3184474A1 (en) Phenylalanine hydroxylase variants and uses thereof
CA3171750A1 (en) Mrnas for treatment or prophylaxis of liver diseases
WO2023219933A1 (en) Compositions and methods for delivery of nucleic acid therapeutics

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]